iconv je unixový nástroj (a stejnojmenná knihovna ) pro převod textu z jednoho kódování do druhého. Také portován na Windows.
Nástroj iconv převádí text z jednoho kódování do druhého. Vstupní kódování se nastavuje klávesou -f a kódování výstupu klávesou -t. Každé z těchto kódování je výchozí pro národní prostředí systému. Všechny vstupní soubory se čtou postupně, pokud není zadán parametr vstupního souboru, použije se standardní vstup a převedený text je vydán na standardní výstup .
Když je zadána volba -c, znaky, které nelze převést, jsou jednoduše vyřazeny. V opačném případě, když dojde k takové chybě, program spadne .
Když je zadána volba -s, nevytisknou se žádné chybové zprávy.
Přepínač -l zobrazí seznam dostupných kódování.
Následující skript najde všechny soubory v aktuálním adresáři s příponou *.java, překóduje je na UTF-8 a zkopíruje výsledek do adresáře res:
mkdir res find -maxdepth 1 -iname "*.java" -type f -exec bash -c "iconv -c -f WINDOWS-1251 -t UTF-8 {} > ./res/{}" \;Překódování všech souborů v adresáři s jejich nahrazením:
pro i v * ; do iconv -f WINDOWS-1251 -t UTF-8 " $i " >tmp ; mv tmp " $i " ; HotovoRekurzivní překódování všech souborů požadovaného typu (v příkladu - txt):
nalézt. -name '*.txt' | při čtení i ; do iconv -f WINDOWS-1251 -t UTF-8 " $i " >tmp ; mv tmp " $i " ; HotovoRekurzivně překódování všech html souborů:
# !/bin/sh najít . -type f -name '*.htm' -o -name '*.html' | při čtení echo $i iconv -f WINDOWS-1251 -t UTF-8 " $i " > tmp mv -f tmp " $i " hotovoNásledující sada skriptů najde všechny soubory v aktuálním adresáři s příponou *.txt, překóduje se na CP1251 z KOI8-R :
all.cmd:
pro / R %% i v ( . ) zavolejte txt.cmd %% itxt.cmd:
nastavit cd2 = %cd% cd %1 pro %% j v ( *.txt ) zavolat %cd2% \iconv2.cmd %% j cd % cd2%iconv2.cmd:
iconv -c -f KOI8-R -t CP1251 %1 > vyhrát. %1 del %1 přejmenovat win. %1 %1Jiný způsob (přes cmd):
Před provedením tohoto příkazu musíte přidat cestu k programu iconv.exe do proměnné prostředí Path:
pro %% i v ( *.txt ) proveďte iconv -f cp1251 -t utf-8 " %% i" > utf8/ %% iPříkaz překóduje všechny soubory s příponou „txt“ a uloží překódované soubory do předem vytvořené složky utf8.
Kódování znaků | |
---|---|
Historická kódování | doplňková komp. semafor (Makarov) morse Bodo MTK-2 komp. 6bitový SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
moderní 8bitová reprezentace | symboly ASCII non-ASCII 8bitové kódové stránky cyrilice KOI-8 Základní kódování MacCyrillic ISO 8859 1 (lat.) 2 3 čtyři 5 (kir.) 6 7 osm 9 deset jedenáct 12 13 čtrnáct 15 (€) 16 Okna 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM a DOS 437 850 852 855 866 "alternativní" MIC |
Vícebajtové | tradiční DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 seznam postav cyrilice |
uživatelské rozhraní rozložení klávesnice národní prostředí překlad řádků písmo přepis vlastní písma utility iconv záznam |