Kódovanie textu v súboroch digitálnych dokumentov sa týka spôsobu, akým sú sekvencie bajtov mapované na znaky v jazyku. Existuje veľa rôznych kódovaní pre rôzne jazyky. Kódovanie textového súboru môžete určiť pomocou mnohých softvérových nástrojov.
Je to nevyhnutné
- - Microsoft Office Word;
- - KWrite;
- - Mozilla Firefox;
- - enca.
Inštrukcie
Krok 1
Na určenie kódovania textového súboru použite program Microsoft Office Word, ak je nainštalovaný na vašom počítači. Spustite túto aplikáciu. V hlavnej ponuke vyberte položky „Súbor“a „Otvoriť …“alebo stlačte klávesovú skratku Ctrl + O. V zobrazenom dialógovom okne prejdite do požadovaného adresára a vyberte súbor. Kliknite na tlačidlo „Otvoriť“. Ak sa kódovanie textu líši od kódovania CP1251, automaticky sa otvorí dialógové okno „Previesť súbor“. Aktivujte v ňom možnosť „Iné“a vyberte kódovanie pomocou zoznamu vpravo. Ak je vybrané správne kódovanie, v poli „Ukážka“sa zobrazí čitateľný text.
Krok 2
Použite textové editory, ktoré umožňujú výber kódovania zdrojového textu. Dobrým príkladom takejto aplikácie je KWrite (beží na KDE v systémoch podobných systému UNIX). Vložte textový súbor do editora. Potom iba iterujte kódovaním, až kým sa nezobrazí čitateľný text (v KWrite sa to deje pomocou sekcie Kódovanie v ponuke Nástroje).
Krok 3
Podobne ako v textovom editore môžete na určenie kódovania súboru použiť prehliadač. Použite Mozilla Firefox. Spustite túto aplikáciu. Ak nie je nainštalovaný, stiahnite si príslušnú distribúciu z mozilla.org a nainštalujte ju. Vo svojom prehliadači otvorte textový súbor. Ak to chcete urobiť, v hlavnej ponuke vyberte položky „Súbor“a „Otvoriť súbor …“alebo stlačte kombináciu klávesov Ctrl + O. Ak sa načítaný text zobrazuje správne, rozbaľte sekciu „Kódovanie“v ponuke „Zobraziť“a vyhľadajte kódovanie z názvu položky, na ktorej je značka nastavená. V opačnom prípade vyberte tento parameter výberom rôznych položiek tej istej ponuky, ako aj jej sekcie „Ďalšie“.
Krok 4
Na určenie kódovania textových súborov použite špecializované pomocné programy. V systémoch podobných systému UNIX môžete použiť príkaz enca. V prípade potreby nainštalujte tento program pomocou dostupných správcov balíkov. Zoznam dostupných jazykov zobrazíte spustením príkazu:
enca - zoznam jazykov
Určte kódovanie textového súboru zadaním jeho názvu s voľbou -g a jazyka dokumentu s voľbou -L. Napríklad:
enca -L ruština -g /home/vic/tmp/aaa.txt.