Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Алфавитный порядок - это система, в которой строки символов размещаются в порядке, основанном на положении символов в обычном порядке алфавита . Это один из методов сопоставления . В математике лексикографический порядок - это обобщение алфавитного порядка на другие типы данных, такие как последовательности цифр или чисел.

При применении к строкам или последовательностям, которые могут содержать цифры, числа или элементы более сложного типа, помимо буквенных символов, алфавитный порядок обычно называется лексикографическим порядком .

Чтобы определить, какая из двух строк символов будет первой при расположении в алфавитном порядке, сравниваются их первые буквы . Если они различаются, то строка, первая буква которой идет раньше в алфавите, идет раньше другой строки. Если первые буквы совпадают, то сравниваются вторые буквы и так далее. Если достигнута позиция, в которой у одной строки больше нет букв для сравнения, а у другой нет, то первая (более короткая) строка считается первой в алфавитном порядке.

Заглавные буквы (верхний регистр) обычно считаются идентичными соответствующим строчным буквам для целей алфавитного упорядочивания, хотя могут быть приняты соглашения для обработки ситуаций, когда две строки отличаются только заглавными буквами. Также существуют различные соглашения для обработки строк, содержащих пробелы , модифицированные буквы (например, с диакритическими знаками ) и небуквенные символы, такие как знаки препинания .

В результате размещения набора слов или строк в алфавитном порядке все строки, начинающиеся с одной и той же буквы, сгруппированы вместе; внутри этой группы все слова, начинающиеся с одной и той же двухбуквенной последовательности, сгруппированы вместе; и так далее. Таким образом, система стремится максимизировать количество общих начальных букв между соседними словами.

История [ править ]

Алфавитный порядок был впервые использован в 1-м тысячелетии до нашей эры семитскими писцами Северо-Запада, использующими систему Абджад . [1] Однако ряд других методов классификации и упорядочивания материала, включая географический, хронологический , иерархический и по категориям , на протяжении столетий предпочитался алфавитному порядку. [2]

Библия датируется BCE шестых-7th вв. В Книге Иеремии пророк использует замещающий шифр Атбаша , основанный на алфавитном порядке. Точно так же библейские авторы использовали акростихи, основанные на (упорядоченном) еврейском алфавите . [3]

Первое эффективное использование алфавитного порядка в качестве инструмента каталогизации среди ученых, возможно, было в древней Александрии [4], в Великой Александрийской библиотеке , которая была основана около 300 г. до н. Э. Поэт и ученый Каллимах , который работал там, как полагают, создал первый в мире библиотечный каталог , известный как Пинакес , со свитками, разложенными на полках в алфавитном порядке по первым буквам имен авторов. [2]

В I веке до нашей эры римский писатель Варрон составил алфавитные списки авторов и названий. [5] Во 2 веке н.э. Секст Помпей Фест написал энциклопедическое воплощение произведений Верриуса Флакка , De verborum Mongatu , с записями в алфавитном порядке. [6] В III веке нашей эры Гарпократ написал гомеровский лексикон, отсортированный по всем буквам. [7] В 10 веке автор Суды использовал алфавитный порядок с фонетическими вариациями.

Алфавитный порядок в качестве вспомогательного средства для консультации начал входить в мейнстрим интеллектуальной жизни Западной Европы во второй половине XII века, когда были разработаны алфавитные инструменты, помогающие проповедникам анализировать библейский словарный запас. Это привело к составлению алфавитных соответствий Библии доминиканскими монахами в Париже в 13 веке при Хью де Сен-Шер . Старые справочные работы, такие как " Толкование еврейских имен Св. Иеронима "были упорядочены в алфавитном порядке для облегчения консультации. Ученые изначально сопротивлялись использованию алфавитного порядка, ожидая, что их ученики овладеют своей областью обучения в соответствии с его собственными рациональными структурами; его успех был обусловлен такими инструментами, как указатель Роберта Килвардби к произведениям Св. Августина , который помог читателям получить доступ к полному оригинальному тексту, а не зависеть от компиляций отрывков, которые стали заметными в схоластике 12 века . Принятие алфавитного порядка было частью перехода от приматов памяти к письменным произведениям. [8]Идея упорядочения информации по алфавиту также встретила сопротивление составителей энциклопедий в XII и XIII веках, которые все были набожными церковниками. Они предпочли организовать свой материал теологически - в порядке творения Бога, начиная с Деуса (имеется в виду Бог). [2]

В 1604 году Роберту Каудри пришлось объяснить в Table Alphabeticall , первом одноязычном словаре английского языка : «Теперь, если слово, которое вы хотите найти, начинается с (а), то посмотрите в начале этой таблицы, но если с (v) посмотри ближе к концу ». [9] Хотя еще в 1803 году Сэмюэл Тейлор Кольридж осуждал энциклопедии за «расположение, определяемое случайностью начальных букв» [10] , сегодня многие списки основаны на этом принципе.

Упорядочение в алфавитном порядке можно рассматривать как фактор демократизации доступа к информации, так как не требуется обширных предварительных знаний, чтобы найти то, что было необходимо. [2]

Заказ латиницей [ править ]

Основной порядок и пример [ править ]

Стандартный порядок современного базового латинского алфавита ISO :

АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЫЭЮЯ

Ниже приводится пример простого алфавитного упорядочения:

  • В качестве; Астра; Астролябия; Астрономия; Астрофизика; В; Атаман; Атака; Баа

Другой пример:

  • Ракушка; Быть; Был; Выгода; Согнутый

Вышеупомянутые слова расположены в алфавитном порядке. Как идет перед Aster , потому что они начинаются с тех же двух букв и , как не имеет больше букв , после что в то время как Aster делает. Следующие три слова идут после астры, потому что их четвертая буква (первая, которая отличается) - это r , которая идет после е (четвертая буква астры ) в алфавите. Сами слова упорядочены по их шестым буквам ( l , n и p соответственно). Затем идет At , который отличается от предыдущих слов второй буквой ( tидет после s ). Атаман идет после Ат по той же причине, по которой Астер пришел после Ас . Атака следует за атаманом на основе сравнения их третьих букв, а Баа следует за всеми остальными, потому что у него другая первая буква.

Обработка многословных строк [ править ]

Когда некоторые из упорядочиваемых строк состоят из более чем одного слова, т. Е. Содержат пробелы или другие разделители, такие как дефисы , можно использовать два основных подхода. В первом подходе все строки сначала упорядочиваются в соответствии с их первым словом, как в последовательности:

  • Дуб; Дубовый холм; Oak Ridge; Окли Парк; Oakley River
    где все строки, начинающиеся с отдельного слова Oak, предшествуют всем строкам, начинающимся с Oakley , поскольку Oak предшествует Oakley в алфавитном порядке.

Во втором подходе строки располагаются в алфавитном порядке, как если бы в них не было пробелов, что дает последовательность:

  • Дуб; Дубовый холм; Окли Парк; Река Окли; Oak Ridge
    где Oak Ridge теперь идет после струнных Oakley , как если бы это было написано "Oakridge".

Второй подход обычно используется в словарях [ необходима ссылка ] , и поэтому издатели часто называют его упорядочением по словарям . Первый подход часто использовался в книжных указателях , хотя каждый издатель традиционно устанавливал свои собственные стандарты для того, какой подход использовать в них; До 1975 года не существовало стандарта ISO для указателей книг ( ISO 999 ).

Особые случаи [ править ]

Измененные буквы [ править ]

Во французском языке измененные буквы (например, с диакритическими знаками ) обрабатываются так же, как базовая буква для целей алфавитного порядка. Например, между роком и розой идет роль , как если бы это была написанная роль . Однако языки, которые используют такие буквы систематически, обычно имеют свои собственные правила упорядочивания. См. Условные обозначения для конкретных языков ниже.

Сортировка по фамилии [ править ]

В большинстве культур, где фамилии пишутся после имен , все же желательно сначала сортировать списки имен (как в телефонных справочниках) по фамилии. В этом случае необходимо изменить порядок имен для правильной сортировки. Например, Хуана Эрнандеса и Брайана О'Лири следует отсортировать как «Эрнандес, Хуан» и «О'Лири, Брайан», даже если они написаны иначе. Уловить это правило в компьютерном алгоритме сопоставления сложно, и простые попытки обязательно потерпят неудачу. Например, если в распоряжении алгоритма нет обширного списка фамилий, невозможно определить, является ли «Джиллиан Люсиль ван дер Ваал» «Ван дер Ваал, Джиллиан Люсиль», «Ваал, Джиллиан Люсиль ван дер», или даже "Люсиль ван дер Ваал, Джиллиан ".

Упорядочивание по фамилии часто встречается в академическом контексте. В рамках одной статьи с несколькими авторами упорядочивание авторов в алфавитном порядке по фамилии, а не с помощью других методов, таких как обратный стаж или субъективная степень вклада в статью, рассматривается как способ «признательности за аналогичный вклад» или «избежать [ing] дисгармония в сотрудничающих группах ». [11] Было обнаружено, что практика в некоторых областях упорядочивания ссылок в библиографиях по фамилиям их авторов создает предвзятость в пользу авторов с фамилиями, которые появляются раньше в алфавите, в то время как этот эффект не проявляется в полях, в которых библиографии упорядочены в хронологическом порядке. [12]

Те и другие общеупотребительные слова [ править ]

Если фраза начинается с очень распространенного слова (например, «the», «a» или «an», которое в грамматике называется артиклем), это слово иногда игнорируется или перемещается в конец фразы, но это не всегда дело. Например, книга « Сияние » может трактоваться как «Сияние» или «Сияние» и, следовательно, перед названием книги « Лето Сэма », хотя ее также можно рассматривать как просто «Сияние» и после « Лето Сэма ». Точно так же « Морщинка во времени » может трактоваться как «Морщинка во времени», «Морщинка во времени, A» или «Морщинка во времени». Все три метода алфавита довольно легко создать с помощью алгоритма,но многие программы вместо этого полагаются на простой лексикографический порядок . Статьи обычно игнорируются при расположении по алфавиту.

Префиксы Mac [ править ]

Префиксы M ' и Mc в ирландских и шотландских фамилиях являются аббревиатурами для Mac и иногда располагаются в алфавитном порядке, как будто написано Mac полностью. Таким образом, Мак-Кинли мог быть указан перед Макинтошем (как если бы он был написан как «Мак-Кинли»). С появлением компьютерно-сортированных списков этот тип алфавита встречается реже, хотя он все еще используется в британских телефонных справочниках.

Лигатуры [ править ]

Лигатуры (две или более буквы, объединенные в один символ), которые не считаются отдельными буквами, такие как Æ и Œ в английском языке, обычно сопоставляются, как если бы буквы были отдельными - «эфир» и «эфир» были бы упорядочены одинаково относительно все остальные слова. Это верно даже в том случае, если лигатура не является чисто стилистической, например, в заимствованных словах и торговых марках.

Для сортировки строк могут потребоваться специальные правила, которые различаются только в зависимости от того, соединены ли две буквы лигатурой.

Обработка цифр [ править ]

Когда некоторые строки содержат цифры (или другие небуквенные символы), возможны различные подходы. Иногда такие символы обрабатываются так, как если бы они стояли до или после всех букв алфавита. Другой метод заключается в сортировке чисел в алфавитном порядке, как если бы они были написаны: например, 1776 год будет отсортирован, как если бы он был записан как «семнадцать семьдесят шесть», а 24 heures du Mans как если бы написано «vingt-quatre ...» (французский язык) на «двадцать четыре»). Когда цифры или другие символы используются в качестве специальных графических форм букв, как 1337 для leet или фильм Seven (который был стилизован под Se7en ), они могут быть отсортированы, как если бы они были этими буквами.Естественный порядок сортировки упорядочивает строки в алфавитном порядке, за исключением того, что многозначные числа обрабатываются как один символ и упорядочиваются по значению числа, закодированного цифрами.

Соглашения, связанные с языком [ править ]

Языки, в которых используется расширенный латинский алфавит, обычно имеют свои собственные правила обработки дополнительных букв. Также в некоторых языках определенные орграфы обрабатываются как отдельные буквы для целей сопоставления. Например, 29-буквенный алфавит испанского языка рассматривает ñ как базовую букву, следующую за n , и раньше рассматривал орграфы ch и ll как базовые буквы, следующие за c и l , соответственно. Ch и ll по-прежнему считаются буквами, но теперь они расположены по алфавиту как двухбуквенные комбинации. (Новое правило алфавитизации было изданоКоролевская испанская академия в 1994 году.) С другой стороны, орграф rr следует за rqu, как и ожидалось, и сделал это даже до правила алфавитности 1994 года.

В некоторых случаях, таких как Kiowa , алфавит был полностью изменен.

Правила алфавита, применяемые к различным языкам, перечислены ниже.

  • В азербайджанском к стандартному латинскому алфавиту есть восемь дополнительных букв. Пять из них - гласные: i, ı, ö, ü, ə и три - согласные: ç, ş, ğ. Алфавит такой же, как и турецкий , с теми же звуками, написанными теми же буквами, за исключением трех дополнительных букв: q, x и ə для звуков, которых нет в турецком языке. Хотя все «турецкие буквы» расположены в их «нормальном» алфавитном порядке, как и в турецком, три дополнительных буквы сопоставляются произвольно после букв, звуки которых близки к их. Итак, q сопоставляется сразу после k, x (произносится как немецкое ch ) сопоставлено сразу после h, а ə (произносится примерно как английское сокращение a ) сопоставлено сразу после e.
  • В бретонском языке нет «c», «q», «x», но есть орграфы «ch» и «c'h», которые сопоставляются между «b» и «d». Например: «buzhugenn, chug, c'hoar, daeraouenn» (дождевой червь, сок, сестра, слеза).
  • В боснийском , хорватском и сербском и других родственных языков южнославянских, пять акцентированных символов и трех соединенных символов сортируются после оригиналов: ..., C, C, C, D, DZ, Диджей, E, ..., L , LJ, M, N, NJ, O, ..., S, Š, T, ..., Z, Ž.
  • В чешском и словацком языках гласные с ударением имеют вторичный вес при сопоставлении - по сравнению с другими буквами они рассматриваются как их формы без ударения (A-Á, E-É-Ě, I-Í, O-Ó-Ô, U-Ú-Ů , Y-Ý), но затем они сортируются после букв без ударения (например, правильный лексикографический порядок: baa, baá, báa, bab, báb, bac, bác, bač, báč). Согласные с ударением (те, что с кароном ) имеют первичный упорядочивающий вес и размещаются сразу после их аналогов без ударения, за исключением Ď, Ň и Ť, которые снова имеют вторичный вес. CH считается отдельным письмом и идет между H и I . На словацком, DZ и DŽтакже считаются отдельными буквами и располагаются между Ď и E (A-Á-Ä-BC-Č-D-Ď-DZ-DŽ-E-É ...).
  • В датском и норвежском алфавитах также присутствуют те же дополнительные гласные, что и в шведском (см. Ниже), но в другом порядке и с разными знаками (..., X, Y, Z, Æ , Ø , Å ). Кроме того, «Aa» сравнивается как эквивалент «Å». В датском алфавите "W" традиционно рассматривается как вариант "V", но сегодня "W" считается отдельной буквой.
  • В голландском сочетании И.Я. (представляющий IJ ) ранее был быть собран , как Y (или иногда, в виде отдельной буквы Y <И.Я. <Z), но в настоящее время в основном собран в виде 2 букв (II <И.Я. <IK). Исключение составляют телефонные справочники; IJ всегда сопоставляется здесь как Y, потому что во многих голландских фамилиях Y используется там, где современное написание требует IJ. Обратите внимание, что слово, начинающееся с ij, которое пишется с большой буквы, также пишется с большой буквы J, например, город Эймёйден , река Эйссел и страна Эйсланд ( Исландия ).
  • В эсперанто согласные с акцентами с циркумфлексом ( ĉ , ĝ , ĥ , ĵ , ŝ ), а также ŭ (u с breve ) считаются отдельными буквами и сопоставляются отдельно (c, ĉ, d, e, f, g, ĝ, h, ĥ, i, j, ĵ ... s, ŝ, t, u, ŭ, v, z).
  • В эстонском языке õ , ä , ö и ü считаются отдельными буквами и сопоставляются после w . Буквы š , z и ž появляются только в заимствованных словах и иностранных именах собственных и следуют за буквой s в эстонском алфавите , который в остальном не отличается от основного латинского алфавита.
  • В фарерском алфавите также есть некоторые дополнительные буквы датского, норвежского и шведского языков, а именно Æ и Ø . Кроме того, Фарерская алфавит использует исландский ETH, который следует за D . Пять из шести гласных A , I , O , U и Y могут иметь ударение и после этого считаются отдельными буквами. Согласные C , Q , X , W и Z не встречаются. Следовательно, первые пять букв - это A , Á , B, D и Ð , а последние пять - это V , Y , Ý , Æ , Ø
  • В филиппинском (тагальском) и других филиппинских языках буква Ng рассматривается как отдельная буква. Оно произносится как пинг, пинг-понг и т. Д. Само по себе оно произносится как нанг , но в общей филиппинской орфографии оно пишется так, как если бы это были две отдельные буквы (п и г). Кроме того, производные от букв (например, Ñ ) следуют сразу за базовой буквой. Филиппинский также пишется с диакритическими знаками, но они используются очень редко (кроме тильды ). (Филиппинская орфография также включает орфографию.)
  • В Финском алфавите и сопоставление правило такие же , как и шведский.
  • Во французском языке последний акцент в данном слове определяет порядок. [13] Например, во французском языке следующие четыре слова будут отсортированы таким образом: cote <côte <coté <côté.
  • В немецком языке буквы с умлаутом ( Ä , Ö , Ü ) обрабатываются, как правило, так же, как их версии без умлаута; ß всегда сортируется как ss. Это составляет алфавитный порядок Ärgerlich, Arg, Arm, Assistant, Aßlar, Assoziation. Для телефонных справочников и аналогичных списков имен умлауты должны быть сопоставлены как буквенные комбинации «ae», «oe», «ue», потому что ряд немецких фамилий появляется как с умлаутом, так и в неавторизованной форме с «e». "(Мюллер / Мюллер). Это составляет алфавитный порядок Udet, Übelacker, Uell, Ülle, Ueve, Üxküll, Uffenbach.
  • В Hungarian гласные есть акценты, умляуты и двойные акценты, в то время как согласные написаны с одно-, двух- (орграфами) или тройными (триграф) символы. При сопоставлении гласные с акцентом эквивалентны своим аналогам без ударения, а двойные и тройные символы следуют за их одиночными оригиналами. Венгерский алфавитный порядок: A = Á , B, C, Cs , D, Dz , Dzs , E = É , F, G, Gy , H, I = Í , J, K, L, Ly , M, N, Ny. , O = Ó , Ö = Ő , P, Q, R, S, Sz , T, Ty , U = Ú ,Ü = Ű , V, W, X, Y, Z, Zs . (До 1984 года dz и dzs не считались отдельными буквами для сопоставления, а по две буквы каждая, вместо этого d + z и d + zs.) Это означает, что, например, nádcukor должен предшествовать nádcsomó (даже если s обычно предшествует u ), поскольку c предшествует cs в сопоставлении. Разницу в длине гласных следует учитывать только в том случае, если два слова идентичны в остальном (например, egér, éger ). Пробелы и дефисы внутри фраз при сопоставлении игнорируются. Ch также встречается как орграф в определенных словах, но не рассматривается как графема сама по себе с точки зрения сопоставления.
    Особенность венгерской сортировки является то , что по контракту форма двойного ди- и триграфов (например, GGY от г + Gy или ddzs из ДЗСА + ДЗСА ) должно быть составлено так , как будто они были написаны в полном объеме (независимо от факта сокращения и элементы ди- или триграфов). Например, kaszinó должно предшествовать kassza (даже если 4-й символ z обычно идет после s в алфавите), потому что четвертый «символ» ( графема ) слова kassza считается вторым sz (разложение ssz наsz + sz ), который следует за ikaszinó ).
  • В исландском , Þ добавляется, и D следует Ð . За каждой гласной (A, E, I, O, U, Y) следует соответствующий ей с ударением : Á, É, Í, Ó, Ú, Ý. Z нет, поэтому алфавит заканчивается: ... X, Y, Ý, Þ , Æ , Ö.
    • Обе буквы также использовались англосаксонскими писцами, которые также использовали руническую букву Wynn для обозначения / w /.
    • Þ (называемый шипом; строчная) также является рунической буквой.
    • Ð (называемый eth; нижний регистр ð) - это буква D с добавленным штрихом.
  • Kiowa упорядочивается по фонетическим принципам, как и брахмические сценарии , а не по историческому латинскому порядку. Сначала идут гласные, затем останавливаются согласные, расположенные от передней части к задней части рта и от отрицательного к положительному времени начала голоса , затем аффрикаты, фрикативные, жидкие и носовые:
A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N
  • В литовском языке , особенно литовские буквы, идут после их латинских оригиналов. Другое изменение состоит в том, что Y стоит непосредственно перед J : ... G, H, I, Į, Y, J, K ...
  • В польском языке специально польские буквы, полученные из латинского алфавита, сортируются после их оригиналов: A, Ą, B, C, Ć, D, E, Ę, ..., L, Ł, M, N, Ń, O, Ó , P, ..., S, Ś, T, ..., Z, Ź, Ż. Орграфы для целей сопоставления обрабатываются так, как если бы они были двумя отдельными буквами.
  • В португальском языке порядок сортировки такой же, как в английском: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Диграфы и буквы с диакритическими знаками в алфавит не входят.
  • В румынском языке специальные символы, полученные из латинского алфавита, сортируются после их оригиналов: A, Ă, Â, ..., I, Î, ..., S, Ș, T, Ț, ..., Z.
  • Испанский не лечить (до 1994 года) «CH» и «LL» , как отдельные буквы, давая упорядоченность Синко , кредо , Chispa и лом , Лузы , лама . Это уже не так, поскольку в 1994 году RAE перешла на более традиционное использование, и теперь LL сопоставляется между LK и LM, а CH - между CG и CI. Шесть символов с диакритическими знаками Á, É, Í, Ó, Ú, Ü рассматриваются как оригинальные буквы A, E, I, O, U, например: radio , ráfaga , rana , rápido , rastrillo . Единственный вопрос сопоставления, относящийся к испанскому языку:Ñ ( eñe ) как другая буква, сопоставленная после N.
  • В шведском алфавите есть три дополнительных гласных, помещенных в его конец (..., X, Y, Z, Å , Ä , Ö ), аналогично датскому и норвежскому алфавиту, но с другими глифами и другим порядком сопоставления. Буква «W» рассматривалась как вариант «V», но в 13-м издании Svenska Akademiens ordlista (2006 г.) «W» считалась отдельной буквой.
  • В турецком алфавите есть 6 дополнительных букв: ç, ğ, ı, ö, ş и ü (но без q, w и x). Они сопоставляются с ç после c, ğ после g, ı до i, ö после o, ş после s и ü после u. Первоначально, когда в 1928 году был введен алфавит, ı был сопоставлен после i, но порядок был изменен позже, так что буквы, имеющие форму, содержащую точки, седили или другие украшающие знаки, всегда следовали за буквами с соответствующими голыми формами. Обратите внимание, что в турецкой орфографии буква I - это большая буква без точки ı, тогда как İ - это большая точка с точкой i.
  • Во многих тюркских языках (например, азербайджанский или Jaꞑalif орфографию для татарских ), раньше было письмо ГСГ (Ƣƣ), вступивший между G и H . Сейчас он не используется.
  • Во вьетнамском языке есть 7 дополнительных букв: ă , â , đ , ê , ô , ơ , ư, а f , j , w , z отсутствуют, хотя они все еще используются (например, адрес в Интернете, иностранный заимствованный язык). . «f» заменяется комбинацией «ph». То же, что и для «w», это «qu».
  • В Volapük ä , ö и ü считаются отдельными буквами и сопоставляются отдельно (a, ä, b ... o, ö, p ... u, ü, v), а q и w отсутствуют. [14]
  • В валлийском языке орграфы CH, DD, FF, NG, LL, PH, RH и TH рассматриваются как отдельные буквы, и каждый перечисляется после первого символа пары (за исключением NG, который указан после G), что дает порядок A, B, C, CH, D, DD, E, F, FF, G, NG, H и так далее. Однако иногда бывает, что сложение слов приводит к сопоставлению двух букв, которые не совпадают.образуют орграф. Примером может служить слово LLONGYFARCH (составлено из LLON + GYFARCH). Это приводит к такому упорядочению, как, например, LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH (NG - это орграф в LLONG, но не в LLONGYFARCH). Комбинация букв R + H (в отличие от орграфа RH) может аналогичным образом возникать в результате сопоставления в составных словах, хотя это, как правило, не приводит к появлению пар, в которых неправильная идентификация может повлиять на порядок. Для других потенциально вводящих в заблуждение комбинаций букв, которые могут возникнуть, а именно D + D и L + L, в написании используется дефис (например, AD-DAL, CHWIL-LYS).

Автоматизация [ править ]

Алгоритмы сопоставления (в сочетании с алгоритмами сортировки ) используются в компьютерном программировании для размещения строк в алфавитном порядке. Стандартный пример - алгоритм сортировки Unicode , который можно использовать для размещения строк, содержащих любые символы Unicode, в алфавитном порядке (расширении). [13] Его можно сделать так, чтобы он соответствовал большинству языковых соглашений, описанных выше, настроив его таблицу сопоставления по умолчанию. Несколько таких настроек собраны в Common Locale Data Repository .

Подобные заказы [ править ]

Принцип, лежащий в основе алфавитного порядка, все еще может применяться к языкам, которые, строго говоря, не используют алфавит - например, они могут быть написаны с использованием слоговой записи или abugida - при условии, что используемые символы имеют установленный порядок.

Для систем логографического письма, таких как китайский ханзи или японские иероглифы , метод сортировки по радикалам и штрихам часто используется как способ определения порядка символов. В японском языке иногда используется порядок произношения, чаще всего с порядком Годзюон , но иногда с более старым порядком Ироха .

В математике лексикографический порядок - это средство упорядочивания последовательностей способом, аналогичным тому, который используется для создания алфавитного порядка. [15]

Некоторые компьютерные приложения используют вариант алфавитного порядка, который может быть достигнут с помощью очень простого алгоритма , основанного исключительно на кодах ASCII или Unicode для символов. Это может иметь нестандартные эффекты, такие как размещение всех заглавных букв перед строчными. См. ASCIIбетический порядок .

Словарь рифм основан на сортировку слов в алфавитном порядке , начиная от последнего к первой букве слова.

См. Также [ править ]

  • Сопоставление
  • Справка: в алфавитном порядке
  • Сортировка

Ссылки [ править ]

  1. ^ Рейнхард Г. Леманн: «27-30-22-26. Сколько букв требует алфавита? Случай семитского языка», в: Идея письма: Письмо через границы , под редакцией Алекса де Вугта и Иоахима Фридриха Кряка, Лейден : Brill 2012, стр. 11–52.
  2. ^ a b c d Street, Джули (10 июня 2020 г.). «От А до Я - удивительная история алфавитного порядка» (текст и аудио) . ABC News (ABC Radio National) . Австралийская радиовещательная корпорация . Дата обращения 6 июля 2020 .
  3. ^ например, Псалмы 25, 34, 37, 111, 112, 119 и 145 еврейской Библии
  4. ^ Дейли, Ллойд. Вклады в историю алфавита в древности и средневековье . Брюссель, 1967. стр. 25.
  5. О'Хара, Джеймс (1989). "Мессап, Цикн и Алфавитный порядок Каталог итальянских героев Вергилия". Феникс . 43 (1): 35–38. DOI : 10.2307 / 1088539 . JSTOR 1088539 . 
  6. ^ LIVRE XI - латинский текст - перевод + комментарии .
  7. ^ Гибсон, Крейг (2002). Интерпретация классики: Демосфен и его древние комментаторы .
  8. ^ Роуз, Мэри А .; Роуз, Ричард М. (1991), « Statim invenire : школы, проповедники и новое отношение к странице», « Подлинные свидетели: подходы к средневековым текстам и рукописям» , University of Notre Dame Press, стр. 201–219, ISBN 0-268-00622-9
  9. ^ Cawdrey, Роберт (1604). Таблица по алфавиту . Лондон. п. [A4] v.
  10. ^ Письма Кольриджа, No.507 .
  11. ^ Tscharntke, Тея; Хохберг, Майкл Э; Рэнд, Татьяна А; Реш, Винсент Х; Краусс, Йохен (январь 2007 г.). «Последовательность авторов и заслуги за вклад в публикации с несколькими авторами» . PLOS Biol . 5 (1): e18. DOI : 10.1371 / journal.pbio.0050018 . PMC 1769438 . PMID 17227141 .  
  12. ^ Стивенс, Джеффри Р .; Дуке, Хуан Ф. (2018). «Порядок имеет значение: упорядочение цитирования в алфавитном порядке снижает частоту цитирования» (PDF) . Психономический бюллетень и обзор . 26 (3): 1020–1026. DOI : 10,3758 / s13423-018-1532-8 . PMID 30288671 . S2CID 52922399 . Краткое содержание - Inside Higher Ed (22 октября 2018 г.).   
  13. ^ a b «Технический стандарт Unicode № 10: алгоритм сортировки Unicode» . Unicode, Inc. (unicode.org). 20 марта 2008 . Проверено 27 августа 2008 года .
  14. ^ Мидгли, Ральф. «Волапюк к английскому словарю» (PDF) . Архивировано 1 сентября 2012 года из оригинального (PDF) . Проверено 24 сентября 2019 года .
  15. ^ Франц Баадер; Тобиас Нипков (1999). Перезапись терминов и все такое . Издательство Кембриджского университета. С. 18–19. ISBN 978-0-521-77920-3.

Дальнейшее чтение [ править ]

  • Шовен, Ивонн. Pratique du classement alphabétique . 4e éd. Париж: Борда, 1977 г. ISBN 2-04-010155-1 

Внешние ссылки [ править ]

  • Упорядочьте любой список в алфавитном порядке с помощью Alphabetizer
  • Списки онлайн-сортировки в алфавитном порядке с алфавитным указателем