недеља, јануар 18, 2015

Konverzija u UTF-8

Recimo da imamo tekstualnu datoteku sa našim slovima po Vindouzovom (zastarelom) kodnom rasporedu CP1250 i želimo da je konvertujemo u UTF-8 kodni raspored. Čest slučaj kada su u pitanju titlovi koje smo skinuli sa sajta titlovi.com . Pod Linuksom možemo iz komandne linije da izvršimo konverziju programom iconv:

iconv -f WINDOWS-1250 -t UTF-8 < input.txt > output.txt

Ukoliko niste ljubitelj komandne linije, možete koristiti neki tekst editor koji ima mogućnost promene kodnog rasporeda: učitate originalni tekst, podesite kodni raspored tako da se naša slova vide kako treba, kopirate tekst, otvorite novi (prazan) dokument, postavite kodni raspored na UTF-8, upastujete kopirani tekst i sačuvate novi dokument. Ovo radi pod Linuksom, verujem da radi i pod Vindouzom u odgovarajućem programu. Pod Vindouzom možete koristiti i minijaturni besplatni portabilni namenski program UTF-8 Converter koji će umesto vas sve odraditi kako treba ali koji na žalost ne podržava drag and drop.

Нема коментара:

Постави коментар