Эта статья требует дополнительных ссылок для проверки . ( декабрь 2009 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
Триграммы представляют собой частный случай n -граммы , где n равно 3. Они часто используются при обработке естественного языка для выполнения статистического анализа текстов и в криптографии для управления и использования шифров и кодов .
Частота [ править ]
Контекст очень важен, различные рейтинги и процентные соотношения в анализе легко вычисляются на основе выборки разных размеров, разных авторов; или различные типы документов: поэзия, научная фантастика, техническая документация; и уровни письма: сказки для детей и взрослых, военные приказы и рецепты.
Типичный криптоаналитический частотный анализ показывает, что 16 наиболее распространенных триграмм на уровне символов в английском языке: [1] [2]
Ранг [1] | Триграмма | Частота [3] (другой источник) |
---|---|---|
1 | в | 1,81% |
2 | а также | 0,73% |
3 | тха | 0,33% |
4 | Ent | 0,42% |
5 | ing | 0,72% |
6 | ион | 0,42% |
7 | тио | 0,31% |
8 | для | 0,34% |
9 | нде | |
10 | имеет | |
11 | NCE | |
12 | летнее североамериканское восточное время | |
13 | это | |
14 | часто | 0,22% |
15 | что-то | 0,21% |
16 | люди |
Поскольку в зашифрованных сообщениях, отправляемых по телеграфу, часто отсутствуют знаки препинания и пробелы, криптографический частотный анализ таких сообщений включает триграммы, которые пересекают границы слов. Это приводит к тому, что триграммы, такие как «edt», часто встречаются, даже если они никогда не встречаются ни в одном слове этих сообщений.[4]
Примеры [ править ]
В предложении «быстрая рыжая лиса перепрыгивает через ленивую коричневую собаку» есть следующие триграммы на уровне слов:
быстрый красныйбыстрая рыжая лисицарыжая лиса прыгаетлиса перепрыгиваетперепрыгивает черезнад ленивымленивый коричневыйленивая коричневая собака
А триграмма на уровне слов "быстрое красное" имеет следующие триграммы на уровне символа (где символ подчеркивания "_" обозначает пробел):
вон_e_q_ququiuicickck_к_р_reкрасный
Ссылки [ править ]
- ^ a b Леванд, Роберт (2000). Криптологическая математика . Математическая ассоциация Америки . п. 37. ISBN 978-0-88385-719-9.
- ^ Линтон, Том (2001). "Относительные частоты букв в обычном английском обычном тексте" . Центральный колледж . Криптография (Весенний ред.). Архивировано из оригинала 22 января 2007 года.
- ^ "Частоты английских букв" . Практическая криптография .
- ^ "Голосовой поиск SEO" . Fuelonline .