ISO основных латинский алфавит является латинским алфавитом-сценария и состоит из двух наборов 26 букв, кодифицированных в [1] различных национальных и международных стандартах и широко используемые в международном сообщении. Это те же буквы, что составляют английский алфавит .
Каждый из двух наборов содержит следующие 26 букв: [1]
Прописные буквы латинского алфавита | А | B | C | D | E | F | грамм | ЧАС | я | J | K | L | M | N | О | п | Q | р | S | Т | U | V | W | Икс | Y | Z |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Строчный латинский алфавит | а | б | c | d | е | ж | грамм | час | я | j | k | л | м | п | о | п | q | р | s | т | ты | v | ш | Икс | y | z |
История [ править ]
К 1960-м годам для компьютерной и телекоммуникационной промышленности в странах Первого мира стало очевидно, что необходим непатентованный метод кодирования символов. Международная организация по стандартизации (ISO) инкапсулированные латиницы в их ( ISO / IEC 646 7-разрядного стандарта кодировки символов). Чтобы добиться широкого признания, эта инкапсуляция была основана на популярном использовании. Стандарт был основан на уже опубликованном Американском стандартном коде обмена информацией , более известном как ASCII , который включал в набор символов 26 × 2 букв английского алфавита.. Более поздние стандарты, выпущенные ISO, например ISO / IEC 8859 (8-битная кодировка символов) и ISO / IEC 10646 ( Unicode Latin ), продолжали определять буквы английского алфавита 26 × 2 в качестве основного латинского алфавита с расширениями. для обработки других букв на других языках. [1]
Терминология [ править ]
Блок Unicode , содержащий алфавит, называется « C0 Controls and Basic Latin ». Существует два подзаголовка: [2]
- «Прописные буквы латинского алфавита»: буквы начинаются с U + 0041 и содержат в своем описании строку LATIN CAPITAL LETTER.
- «Строчный латинский алфавит»: буквы начинаются с U + 0061 и содержат в своем описании строку LATIN SMALL LETTER.
Также есть еще два набора в блоке Halfwidth и Fullwidth Forms : [3]
- Прописные буквы: буквы начинаются с U + FF21 и содержат в своем описании строку ПОЛНАЯ ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА.
- Строчные: буквы начинаются с U + FF41 и содержат в своем описании строку ПОЛНАЯ ШИРИНА ЛАТИНСКАЯ СТРОЧНАЯ БУКВА.
Временная шкала стандартов кодирования [ править ]
- 1865 г. Международный код Морзе был стандартизирован на Международном телеграфном конгрессе в Париже, а позже стал стандартом Международным союзом электросвязи (ITU).
- Орфографический алфавит радиотелефонной связи 1950-х годов , ИКАО [4]
Временная шкала для широко используемых компьютерных кодов, поддерживающих алфавит [ править ]
- 1963: ASCII (7-битный стандарт кодировки символов от Американской ассоциации стандартов , который в 1969 году стал ANSI )
- 1963/1964: EBCDIC (разработан IBM и поддерживает те же буквенные символы, что и ASCII, но с другими кодовыми значениями)
- 1965-04-30: Ратифицирован ECMA как ECMA-6 [5] на основании работы, которую Технический комитет ECMA TC1 проводил с декабря 1960 года. [5]
- 1972: ISO 646 ( стандарт ISO 7-битного кодирования символов, использующий те же значения буквенного кода, что и ASCII, пересмотрен во втором издании ISO 646: 1983 и третьем издании ISO / IEC 646: 1991 как совместный стандарт ISO / IEC )
- 1983: Рек. МСЭ-Т. T.51 | ISO / IEC 6937 (многобайтовое расширение ASCII)
- 1987: ISO / IEC 8859-1 : 1987 (8-битная кодировка символов)
- Впоследствии были опубликованы другие версии и части ISO / IEC 8859.
- Середина-конец 1980-х: Windows-1250 , Windows-1252 и другие кодировки, используемые в Microsoft Windows (некоторые примерно похожи на ISO / IEC 8859-1)
- 1990: Unicode 1.0 (разработанный Консорциумом Unicode ), [6] [7], содержащийся в блоке « C0 Controls and Basic Latin » с использованием тех же значений буквенного кода, что и ASCII и ISO / IEC 646.
- Впоследствии были опубликованы другие версии Unicode, и позже он также стал совместным стандартом ISO / IEC , как указано ниже.
- 1993: ISO / IEC 10646-1 : 1993, стандарт ISO / IEC для символов в Unicode 1.1
- Впоследствии были опубликованы другие версии ISO / IEC 10646-1 и одна из ISO / IEC 10646-2. С 2003 года стандарты публикуются под названием «ISO / IEC 10646» без разделения на две части.
- 1997: Windows Glyph List 4
Представление [ править ]
В ASCII буквы относятся к печатаемым символам, а в Unicode, начиная с версии 1.0, они принадлежат блоку « C0 Controls and Basic Latin ». В обоих случаях, а также в ISO / IEC 646 , ISO / IEC 8859 и ISO / IEC 10646 они занимают позиции в шестнадцатеричной системе счисления от 41 до 5A для прописных букв и от 61 до 7A для строчных.
Без учета регистра, все буквы имеют кодовые слова в орфографическом алфавите ИКАО и могут быть представлены кодом Морзе .
Использование [ править ]
Все строчные буквы используются в Международном фонетическом алфавите (IPA). В X-SAMPA и SAMPA эти буквы имеют такое же звуковое значение, как и в IPA.
Алфавиты, содержащие одинаковый набор букв [ править ]
В приведенный ниже список включены только алфавиты, в которых отсутствуют:
- буквы, диакритические знаки которых делают их отдельными буквами.
- мультиграфы, составляющие отдельные буквы.
Алфавит | Диакритический | Мультиграфы (не составляющие отдельные буквы) | Лигатуры |
---|---|---|---|
Африкаанс алфавит | á , é , è , ê , ë , í , î , ï , ó , ô , ú , û , ý | ||
Каталонский алфавит | à , é , è , í , ï , ó , ò , ú , ü , ç , lꞏl | ⟨ Гу ⟩, ⟨ мкг ⟩, ⟨ IX ⟩, ⟨ LL ⟩, ⟨ пу ⟩, ⟨ Qu ⟩, ⟨ р - р ⟩, ⟨ сс ⟩ | |
Голландский алфавит | ä , é , è , ë , ï , ö , ü | Диграф ⟨ IJ ⟩ иногда считается отдельное письмо. В этом случае он обычно заменяет или смешивается с y⟩. Другие орграфы: ⟨ аа ⟩, ⟨ ая ⟩, ⟨ д.в. ⟩, ⟨ а.е. ⟩, ⟨ ч ⟩, ⟨ й ⟩, ⟨ е ⟩, ⟨ ес ⟩, ⟨ т.е. ⟩, ⟨ ая ⟩, ⟨ О.И. ⟩, ⟨ оо ⟩ , ⟨ НУ ⟩, ⟨ щ ⟩, ⟨ уу ⟩ | |
английский алфавит | только в заимствованных словах (см. ниже) | ⟨ Ш ⟩, ⟨ ч ⟩, ⟨ еа ⟩, ⟨ НУ ⟩, ⟨ - й ⟩, ⟨ тел ⟩, ⟨ нг ⟩ | æ , œ (архаичный) |
Французский алфавит | à , â , ç , é , è , ê , ë , î , ï , ô , ù , û , ü , ÿ | ⟨ Д.в. ⟩, ⟨ а.е. ⟩, ⟨ е ⟩, ⟨ ес ⟩, ⟨ О.И. ⟩, ⟨ НУ ⟩, ⟨ Eau ⟩, ⟨ ч ⟩, ⟨ тел ⟩, ⟨ дп ⟩, ⟨ ⟩, ⟨ утра ⟩, ⟨ ан ⟩, ⟨ ет ⟩, ⟨ в ⟩, ⟨ им ⟩, ⟨ на ⟩, ⟨ ом ⟩, ⟨ ип ⟩, ⟨ мкм ⟩, ⟨ уп ⟩, ⟨ ут ⟩, ⟨ Ain ⟩, ⟨ цель ⟩, ⟨ Ein ⟩, ⟨ ойн ⟩, ⟨Ài ⟩, ⟨ Ei ⟩ | æ , œ |
Немецкий алфавит [ необходима ссылка ] | ä , ö , ü | ⟨ СЧ ⟩, ⟨ Qu ⟩, ⟨ ч ⟩, ⟨ тел ⟩, ⟨ нг ⟩, ⟨ т.е. ⟩, ⟨ ск ⟩, ⟨ й ⟩, ⟨ ес ⟩, ⟨ AÜ ⟩ | ß (иногда считается буквой) |
Итальянский алфавит (расширенный) [a] | à , è , é , ì , ò , ù | ⟨ Ч ⟩, ⟨ CI ⟩, ⟨ GH ⟩, ⟨ ги ⟩, ⟨ Г.Л. ⟩, ⟨ циклооксигеназы ⟩, ⟨ дп ⟩, ⟨ подкожно ⟩, ⟨ научно ⟩ | |
Идо алфавит | никто | ⟨ Цюй ⟩, ⟨ ч ⟩, ⟨ ш ⟩ | никто |
Индонезийский алфавит | только в учебных материалах (см. ниже) | ⟨ Кч ⟩, ⟨ нг ⟩, ⟨ пу ⟩, ⟨ SY ⟩, дифтонги: аи, аи, эи, О.И. | |
Алфавит интерлингва | только в неассимилированных заимствованных словах (см. ниже) | ⟨ Ч ⟩, ⟨ тел ⟩, ⟨ Цюй ⟩, ⟨ отн ⟩, ⟨ ш ⟩ | никто |
Яванский латинский алфавит | é , è | ⟨ Дк ⟩, ⟨ кч ⟩, ⟨ нг ⟩, ⟨ пу ⟩, ⟨ SY ⟩, ⟨ - й ⟩ | никто |
Люксембургский алфавит | ä , é , ë | ||
Малайский алфавит | только в учебных материалах (см. ниже) | ⟨ GH ⟩, ⟨ кч ⟩, ⟨ нг ⟩, ⟨ пу ⟩, ⟨ SY ⟩ | никто |
Португальский алфавит [b] | ã , õ , á , é , í , ó , ú , â , ê , ô , à , ç | ⟨ Ч ⟩, ⟨ ЛХ ⟩, ⟨ пН ⟩, ⟨ р - р ⟩, ⟨ сс ⟩, ⟨ утра ⟩, ⟨ эм ⟩, ⟨ им ⟩, ⟨ ом ⟩, ⟨ мкм ⟩, ⟨ Ae ⟩, ⟨ Ao ⟩, ⟨ О.Е. ⟩ | никто |
Сунданский латинский алфавит | é | ⟨ Ес ⟩, ⟨ нг ⟩, ⟨ пу ⟩ | никто |
Английский - один из немногих современных европейских языков, не требующих диакритических знаков для родных слов (хотя диаэрезис используется некоторыми американскими издателями в таких словах, как «сотрудничество»). [c] [8]
Сконструированный язык интерлингва никогда не использует диакритические знаки, кроме неусвояемых заимствованных слов. Однако их можно удалить, если они не используются для изменения гласной (например, cafe , от французского : cafe ). [9]
Малайский и индонезийский (на основе малайского) - единственные языки за пределами Европы, которые используют весь латинский алфавит и не требуют диакритических знаков и лигатур. [d] Многие из более чем 700 языков Индонезии также используют индонезийский алфавит для написания своих языков, некоторые, например, яванский с добавлением диакритических знаков é и è, а некоторые опускают q, x и z.
Нумерация столбцов [ править ]
Латинский (латинский) алфавит обычно используется для нумерации столбцов в таблице или диаграмме. Это позволяет избежать путаницы с номерами строк, использующими арабские цифры . Например, таблица 3 на 3 будет содержать столбцы A, B и C, установленные для строк 1, 2 и 3. Если требуется больше столбцов помимо Z (обычно последняя буква алфавита), столбец немедленно после Z стоит AA, за ним AB и т. д. (см. биективную систему с основанием 26 ). Это можно увидеть, прокрутив страницу вправо в программе для работы с электронными таблицами, например Microsoft Excel или LibreOffice Calc .
Это двузначные «буквы» для столбцов таблицы, точно так же, как числа от 10 до 99 - это двузначные числа. Греческий алфавит имеет аналогичную вытянутую форму , которая использует такие двузначные буквы , если это необходимо, но оно используется для глав в братстве , в отличие от столбцов таблицы.
Такие двузначные буквы для маркированного списка - это AA, BB, CC и т. Д., В отличие от числовой системы значений, описанной выше для столбцов таблицы.
См. Также [ править ]
- Еврейский алфавит
- Греческий алфавит
- Латинский алфавит
- Латинский алфавит для звукового соответствия
- Список алфавитов латинского алфавита
- Ранняя кириллица , кириллица
- Кодовые страницы Windows
Заметки [ править ]
- ^ Итальянский алфавит традиционно считается состоящим из 21 буквы, исключая j , k , w , x , y . Однако на практике эти буквы встречаются в ряде заимствований. J также встречается в некоторых итальянских собственных именах как вариант написания полуслова i .
- ^ Примечание для португальского: k и y (но не w ) были частью алфавита до нескольких реформ правописания в течение 20 века, целью которых было изменение этимологического правописания португальского языка на более простое фонетическое правописание. Эти письма были заменены другими буквамиимеюттот же звук: таким образом psychologia стал Psicologia , kioske стал quiosque , мч стал Мартир и т.д.настоящее время K , W , и у можно найти только в иностранных словах и их производных терминов и в научных аббревиатур (например , км, быронизм ). Эти буквы снова считаются частью алфавита после Соглашения об орфографии на португальском языке 1990 года , которое вступило в силу 1 января 2009 года в Бразилии. См. Реформы португальской орфографии .
- ^ В качестве примера статьи, содержащей диэрезис в слове «coöperate», а также акценты на заимствованных словах в английском языке, таких как седилья в «фасадах» и циркумфлекс в слове «креп», см. Grafton, Anthony (23 октября , 2006). «Книги: Чокнутые профессора, История академической харизмы» . Житель Нью-Йорка .
- ^ Однако малайский и индонезийский учебные материалы могут использовать é⟩ (E с острым ударением) для уточнения произношения буквы E; в этом случае e⟩ произносится / ə /, в то время как ⟨é⟩ произносится / e /, а (è) произносится / ɛ /.
Ссылки [ править ]
- ^ a b c «Интернационализация стандартизации 7-битных кодов, ISO 646» . Трансъевропейская исследовательская и образовательная сетевая ассоциация (TERENA) . Проверено 3 октября 2010 года .
- ^ "C0 Controls и Basic Latin" (PDF) . Unicode.org . Проверено 8 августа 2016 года .
- ^ «Формы половинной и полной ширины» (PDF) . Unicode.org . Проверено 8 августа 2016 года .
- ^ "Почтовая история ИКАО" . www.icao.int . Проверено 17 февраля 2019 года .
- ^ a b Стандартный ECMA-6: набор 7-битных кодированных символов (PDF) (5-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Март 1985 г. Архивировано 29 мая 2016 г. (PDF) из оригинала . Проверено 29 мая 2016 года .
Технический комитет TC1
ECMA впервые
встретился в декабре 1960 года, чтобы подготовить стандартные коды для целей ввода / вывода.
30 апреля 1965 года стандарт ECMA-6 был принят Генеральной ассамблеей ECMA.
- ^ "База данных символов Юникода" . Стандарт Юникода . Проверено 22 марта 2013 года .
- ^ Стандартная версия Unicode 1.0, том 1 . Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
- ^ "Странный знак Нью-Йорка - диэрезис" . 16 декабря 2010 года Архивировано из оригинала 16 декабря 2010 года.
- ^ "Введение в IED (по углам)" . www.interlingua.com . Проверено 21 сентября 2020 года .