Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

ISO основных латинский алфавит является латинским алфавитом-сценария и состоит из двух наборов 26 букв, кодифицированных в [1] различных национальных и международных стандартах и широко используемые в международном сообщении. Это те же буквы, что составляют английский алфавит .

Каждый из двух наборов содержит следующие 26 букв: [1]

История [ править ]

К 1960-м годам для компьютерной и телекоммуникационной промышленности в странах Первого мира стало очевидно, что необходим непатентованный метод кодирования символов. Международная организация по стандартизации (ISO) инкапсулированные латиницы в их ( ISO / IEC 646 7-разрядного стандарта кодировки символов). Чтобы добиться широкого признания, эта инкапсуляция была основана на популярном использовании. Стандарт был основан на уже опубликованном Американском стандартном коде обмена информацией , более известном как ASCII , который включал в набор символов 26 × 2 букв английского алфавита.. Более поздние стандарты, выпущенные ISO, например ISO / IEC 8859 (8-битная кодировка символов) и ISO / IEC 10646 ( Unicode Latin ), продолжали определять буквы английского алфавита 26 × 2 в качестве основного латинского алфавита с расширениями. для обработки других букв на других языках. [1]

Терминология [ править ]

Блок Unicode , содержащий алфавит, называется « C0 Controls and Basic Latin ». Существует два подзаголовка: [2]

  • «Прописные буквы латинского алфавита»: буквы начинаются с U + 0041 и содержат в своем описании строку LATIN CAPITAL LETTER.
  • «Строчный латинский алфавит»: буквы начинаются с U + 0061 и содержат в своем описании строку LATIN SMALL LETTER.

Также есть еще два набора в блоке Halfwidth и Fullwidth Forms : [3]

  • Прописные буквы: буквы начинаются с U + FF21 и содержат в своем описании строку ПОЛНАЯ ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА.
  • Строчные: буквы начинаются с U + FF41 и содержат в своем описании строку ПОЛНАЯ ШИРИНА ЛАТИНСКАЯ СТРОЧНАЯ БУКВА.

Временная шкала стандартов кодирования [ править ]

  • 1865 г. Международный код Морзе был стандартизирован на Международном телеграфном конгрессе в Париже, а позже стал стандартом Международным союзом электросвязи (ITU).
  • Орфографический алфавит радиотелефонной связи 1950-х годов , ИКАО [4]

Временная шкала для широко используемых компьютерных кодов, поддерживающих алфавит [ править ]

  • 1963: ASCII (7-битный стандарт кодировки символов от Американской ассоциации стандартов , который в 1969 году стал ANSI )
  • 1963/1964: EBCDIC (разработан IBM и поддерживает те же буквенные символы, что и ASCII, но с другими кодовыми значениями)
  • 1965-04-30: Ратифицирован ECMA как ECMA-6 [5] на основании работы, которую Технический комитет ECMA TC1 проводил с декабря 1960 года. [5]
  • 1972: ISO 646 ( стандарт ISO 7-битного кодирования символов, использующий те же значения буквенного кода, что и ASCII, пересмотрен во втором издании ISO 646: 1983 и третьем издании ISO / IEC 646: 1991 как совместный стандарт ISO / IEC )
  • 1983: Рек. МСЭ-Т. T.51 | ISO / IEC 6937 (многобайтовое расширение ASCII)
  • 1987: ISO / IEC 8859-1 : 1987 (8-битная кодировка символов)
    • Впоследствии были опубликованы другие версии и части ISO / IEC 8859.
  • Середина-конец 1980-х: Windows-1250 , Windows-1252 и другие кодировки, используемые в Microsoft Windows (некоторые примерно похожи на ISO / IEC 8859-1)
  • 1990: Unicode 1.0 (разработанный Консорциумом Unicode ), [6] [7], содержащийся в блоке « C0 Controls and Basic Latin » с использованием тех же значений буквенного кода, что и ASCII и ISO / IEC 646.
    • Впоследствии были опубликованы другие версии Unicode, и позже он также стал совместным стандартом ISO / IEC , как указано ниже.
  • 1993: ISO / IEC 10646-1 : 1993, стандарт ISO / IEC для символов в Unicode 1.1
    • Впоследствии были опубликованы другие версии ISO / IEC 10646-1 и одна из ISO / IEC 10646-2. С 2003 года стандарты публикуются под названием «ISO / IEC 10646» без разделения на две части.
  • 1997: Windows Glyph List 4

Представление [ править ]

Буквы основного латинского алфавита ISO на 16-сегментном дисплее (плюс арабские цифры ).

В ASCII буквы относятся к печатаемым символам, а в Unicode, начиная с версии 1.0, они принадлежат блоку « C0 Controls and Basic Latin ». В обоих случаях, а также в ISO / IEC 646 , ISO / IEC 8859 и ISO / IEC 10646 они занимают позиции в шестнадцатеричной системе счисления от 41 до 5A для прописных букв и от 61 до 7A для строчных.

Без учета регистра, все буквы имеют кодовые слова в орфографическом алфавите ИКАО и могут быть представлены кодом Морзе .

Использование [ править ]

Все строчные буквы используются в Международном фонетическом алфавите (IPA). В X-SAMPA и SAMPA эти буквы имеют такое же звуковое значение, как и в IPA.

Алфавиты, содержащие одинаковый набор букв [ править ]

В приведенный ниже список включены только алфавиты, в которых отсутствуют:

  • буквы, диакритические знаки которых делают их отдельными буквами.
  • мультиграфы, составляющие отдельные буквы.

Английский - один из немногих современных европейских языков, не требующих диакритических знаков для родных слов (хотя диаэрезис используется некоторыми американскими издателями в таких словах, как «сотрудничество»). [c] [8]

Сконструированный язык интерлингва никогда не использует диакритические знаки, кроме неусвояемых заимствованных слов. Однако их можно удалить, если они не используются для изменения гласной (например, cafe , от французского : cafe ). [9]

Малайский и индонезийский (на основе малайского) - единственные языки за пределами Европы, которые используют весь латинский алфавит и не требуют диакритических знаков и лигатур. [d] Многие из более чем 700 языков Индонезии также используют индонезийский алфавит для написания своих языков, некоторые, например, яванский с добавлением диакритических знаков é и è, а некоторые опускают q, x и z.

Нумерация столбцов [ править ]

Латинский (латинский) алфавит обычно используется для нумерации столбцов в таблице или диаграмме. Это позволяет избежать путаницы с номерами строк, использующими арабские цифры . Например, таблица 3 на 3 будет содержать столбцы A, B и C, установленные для строк 1, 2 и 3. Если требуется больше столбцов помимо Z (обычно последняя буква алфавита), столбец немедленно после Z стоит AA, за ним AB и т. д. (см. биективную систему с основанием 26 ). Это можно увидеть, прокрутив страницу вправо в программе для работы с электронными таблицами, например Microsoft Excel или LibreOffice Calc .

Это двузначные «буквы» для столбцов таблицы, точно так же, как числа от 10 до 99 - это двузначные числа. Греческий алфавит имеет аналогичную вытянутую форму , которая использует такие двузначные буквы , если это необходимо, но оно используется для глав в братстве , в отличие от столбцов таблицы.

Такие двузначные буквы для маркированного списка - это AA, BB, CC и т. Д., В отличие от числовой системы значений, описанной выше для столбцов таблицы.

См. Также [ править ]

  • Еврейский алфавит
  • Греческий алфавит
  • Латинский алфавит
    • Латинский алфавит для звукового соответствия
    • Список алфавитов латинского алфавита
  • Ранняя кириллица , кириллица
  • Кодовые страницы Windows

Заметки [ править ]

  1. ^ Итальянский алфавит традиционно считается состоящим из 21 буквы, исключая j , k , w , x , y . Однако на практике эти буквы встречаются в ряде заимствований. J также встречается в некоторых итальянских собственных именах как вариант написания полуслова i .
  2. ^ Примечание для португальского: k и y (но не w ) были частью алфавита до нескольких реформ правописания в течение 20 века, целью которых было изменение этимологического правописания португальского языка на более простое фонетическое правописание. Эти письма были заменены другими буквамиимеюттот же звук: таким образом psychologia стал Psicologia , kioske стал quiosque , мч стал Мартир и т.д.настоящее время K , W , и у можно найти только в иностранных словах и их производных терминов и в научных аббревиатур (например , км, быронизм ). Эти буквы снова считаются частью алфавита после Соглашения об орфографии на португальском языке 1990 года , которое вступило в силу 1 января 2009 года в Бразилии. См. Реформы португальской орфографии .
  3. ^ В качестве примера статьи, содержащей диэрезис в слове «coöperate», а также акценты на заимствованных словах в английском языке, таких как седилья в «фасадах» и циркумфлекс в слове «креп», см. Grafton, Anthony (23 октября , 2006). «Книги: Чокнутые профессора, История академической харизмы» . Житель Нью-Йорка .
  4. ^ Однако малайский и индонезийский учебные материалы могут использовать é⟩ (E с острым ударением) для уточнения произношения буквы E; в этом случае e⟩ произносится / ə /, в то время как ⟨é⟩ произносится / e /, а (è) произносится / ɛ /.

Ссылки [ править ]

  1. ^ a b c «Интернационализация стандартизации 7-битных кодов, ISO 646» . Трансъевропейская исследовательская и образовательная сетевая ассоциация (TERENA) . Проверено 3 октября 2010 года .
  2. ^ "C0 Controls и Basic Latin" (PDF) . Unicode.org . Проверено 8 августа 2016 года .
  3. ^ «Формы половинной и полной ширины» (PDF) . Unicode.org . Проверено 8 августа 2016 года .
  4. ^ "Почтовая история ИКАО" . www.icao.int . Проверено 17 февраля 2019 года .
  5. ^ a b Стандартный ECMA-6: набор 7-битных кодированных символов (PDF) (5-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Март 1985 г. Архивировано 29 мая 2016 г. (PDF) из оригинала . Проверено 29 мая 2016 года . Технический комитет TC1 ECMA впервые встретился в декабре 1960 года, чтобы подготовить стандартные коды для целей ввода / вывода. 30 апреля 1965 года стандарт ECMA-6 был принят Генеральной ассамблеей ECMA.
  6. ^ "База данных символов Юникода" . Стандарт Юникода . Проверено 22 марта 2013 года .
  7. ^ Стандартная версия Unicode 1.0, том 1 . Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
  8. ^ "Странный знак Нью-Йорка - диэрезис" . 16 декабря 2010 года Архивировано из оригинала 16 декабря 2010 года.
  9. ^ "Введение в IED (по углам)" . www.interlingua.com . Проверено 21 сентября 2020 года .