- Расширения:
- текстовых файлов: * . txt, * .rtf, *. doc, * .docx, *.odt, *.pdf,
- файлов со шрифтами: * .fon, * .ttf, * .otf.
- ASCII – международный стандарт, 7-битная кодировка для латинского алфавита, всего 128 символа с кодами от 0 до 127 (0 – 7F).
- Однобайтовые кодировки позволяют закодировать 28 = 256 символов (0...127 – символы стандарты ASCII, 128...255 – национальные алфавиты расширение ASCII).
- Каждый символ заменяется на 8‑разрядное целое положительное двоичное число, которое хранится в 1 байте памяти (Windows-1251, KOI8 и др.).
- Кодировки Unicode – уникальный код для любого языка и программы, используется больше 8 бит на символ, одна большая таблица для всех алфавитов.
- Стандарты Unicode:
- UTF-8 (от 1 до 4 байт на символ для ОС Unix и большинства сайтов);
- UTF-16 (2 или 4 байта на символ для ОС Windows).
- Информационный объем текста
I – длина двоичного кода, которым текст закодирован:
I =
где