Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Пробка (также известный как T1 или EC ) , кодирующая является кодировка символов используется для кодирования глифов в шрифтах . [1] Он назван в честь города Корк в Ирландии , где во время конференции TeX Users Group (TUG) в 1990 году была представлена ​​новая кодировка для LaTeX . [1] Он содержит 256 символов, поддерживающих большинство западных и восточноевропейских языков с латинским алфавитом . [2]

Подробности [ править ]

В 8-битных движках TeX кодировка шрифта должна соответствовать кодировке шаблонов переносов, где эта кодировка используется чаще всего. [3] В LaTeX можно переключиться на эту кодировку с помощью \usepackage[T1]{fontenc}, а в ConTeXt MkII это уже кодировка по умолчанию. В современных движках, таких как XeTeX и LuaTeX, Unicode полностью поддерживается, а 8-битные кодировки шрифтов устарели.

Набор символов [ править ]

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Заметки [ править ]

  • Шестнадцатеричные значения под символами в таблице являются кодами символов Юникода.
  • Первые 12 символов часто используются как объединяющие символы .
  1. ^ 0x18 - это просто «конечный ноль», используемый для составления ‰ или ‱ (или любых меньших величин) вне знака процента (%).
  2. ^ a b Без точки i и без точки j можно использовать варианты с ударением, такие как i, с макроном (ī) .
  3. ^ 0x7F - это символ переноса (на самом деле это не мягкий перенос).
  4. ^ 0xD0 используется как Eth (Ð, U + 00D0) и как D с обводкой (Đ, U + 0110), что в некоторых случаях может быть проблемой (например, копирование текста из PDF, расстановка переносов, ...)
  5. ^ 0xDF содержит SS (две буквы S ). Это позволяет TeX автоматически преобразовывать немецкие строчные буквы ß в прописные.

Поддерживаемые языки [ править ]

Кодировка поддерживает большинство европейских языков, написанных латиницей. Примечательные исключения:

  • Эсперанто (с использованием IL3)
  • Латышский язык и литовский язык (с использованием L7X)
  • Уэльский язык

Языки с несколько неоптимальной поддержкой включают:

  • Галисийский язык , португальский язык и испанский язык - из-за отсутствия символов ª и º , которые не являются надстрочными версиями строчных «a» и «o» (надстрочные индексы тоньше), и они часто подчеркнуты
  • Хорватский язык , боснийский язык , сербский язык - из-за совместного использования слота для Đ
  • Турецкий язык - из-за того, что i без точки имеет разные комбинации верхнего и нижнего регистра, чем в других языках
  • Румынский язык - из-за отсутствия S и T с запятой ниже (т. Е. Не соединены), однако они есть с седилем (соединены).

Ссылки [ править ]

  1. ^ a b Петрлик, Лукас (19.06.1996). «Объяснение путаницы в кодировке чешских и словацких символов» . cs-encodings-faq . 1.10. Архивировано 21 июня 2016 года . Проверено 21 июня 2016 .
  2. ^ Фергюсон, Майкл (1990), «Отчет о многоязычной деятельности» (PDF) , TUGboat , 11 (4): 514–516
  3. ^ Шаблоны переносов TeX

Внешние ссылки [ править ]

  • Кодировка файла
  • Обзор кодировок в LaTeX