Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
AbiWord проверяет грамматику английского языка с помощью Link Grammar .

Проверки грамматики , в компьютерных терминах, это программа или часть программы, что попытки проверить написанный текст для грамматической правильности . Программы проверки грамматики чаще всего реализуются как функция более крупной программы, такой как текстовый процессор , но также доступны как автономное приложение, которое можно активировать из программ, работающих с редактируемым текстом.

Реализация средства проверки грамматики использует обработку естественного языка . [1] [2]

История [ править ]

Самыми ранними «проверщиками грамматики» были программы, которые проверяли несоответствие пунктуации и стиля, а не полный спектр возможных грамматических ошибок. Первая система называлась Writer's Workbench и представляла собой набор инструментов для письма, включенных в системы Unix еще в 1970-х годах. [3] [4] Все инструменты Writer's WorkbenchПакет включал несколько отдельных инструментов для проверки различных проблем с записью. Инструмент "дикция" проверяет в тексте многословные, банальные, клишированные или неправильно используемые фразы. Инструмент выведет список сомнительных фраз и предоставит предложения по улучшению написания. Инструмент «стиль» анализирует стиль написания данного текста. Он выполнил ряд тестов на удобочитаемость текста и вывел результаты, а также предоставил некоторую статистическую информацию о предложениях текста.

Компания Aspen Software из Альбукерке, штат Нью-Мексико, выпустила самую раннюю версию программы проверки дикции и стиля для персональных компьютеров, Grammatik , в 1981 году. Впервые Grammatik был доступен для Radio Shack - TRS-80 , и вскоре появились версии для CP / M и IBM. ПК . Компания Reference Software из Сан-Франциско, штат Калифорния, приобрела Grammatik в 1985 году. Разработка Grammatik продолжалась, и она превратилась в настоящую программу проверки грамматики, которая могла обнаруживать ошибки письма помимо простой проверки стиля.

Другие ранние программы проверки дикции и стиля включали Пунктуацию и стиль , Правильную грамматику , RightWriter и PowerEdit . [5] Хотя все самые ранние программы начинались как простые средства проверки дикции и стиля, все в конечном итоге добавляли различные уровни языковой обработки и развили некоторый уровень истинных возможностей проверки грамматики.

До 1992 года программы проверки грамматики продавались как дополнительные программы. В то время было доступно большое количество различных текстовых редакторов, среди которых WordPerfect и Microsoft Word занимали лидирующие позиции на рынке. В 1992 году Microsoft решила добавить проверку грамматики как функцию Word и лицензировала CorrecText, средство проверки грамматики от Houghton Mifflin, которое еще не продавалось как отдельный продукт. WordPerfect ответил на шаг Microsoft, приобретя Reference Software, и прямой потомок Grammatik по-прежнему включен в WordPerfect.

С 2019 года средства проверки грамматики встроены в такие системы, как Google Docs и Sapling.ai, [6] расширения браузера, такие как Grammarly и Qordoba , настольные приложения, такие как Ginger , бесплатное программное обеспечение с открытым исходным кодом, такое как LanguageTool , [7] и плагины текстовых редакторов, такие как те, которые доступны в ПО WebSpellChecker.

Технические проблемы [ править ]

Самые ранние программы стиля письма проверяли в тексте многословные, банальные , клишированные или неправильно используемые фразы. Этот процесс был основан на простом сопоставлении с образцом . В основе программы лежал список из многих сотен или тысяч фраз, которые многие эксперты считают плохо написанными. В список сомнительных фраз включены альтернативные формулировки каждой фразы. Программа проверки просто разбивает текст на предложения, проверяет любые совпадения в словаре фраз, помечает подозрительные фразы и показывает альтернативу. Эти программы также могут выполнять некоторые механические проверки. Например, они обычно помечают удвоенные слова, удвоенную пунктуацию, некоторые ошибки с заглавными буквами и другие простые механические ошибки.

Проверка истинной грамматики более сложна. В то время как язык компьютерного программирования имеет очень специфический синтаксис и грамматику, это не так для естественных языков . Можно написать до некоторой степени полную формальную грамматику для естественного языка, но в реальном использовании обычно бывает так много исключений, что формальная грамматика практически не помогает при написании средства проверки грамматики. Одна из наиболее важных частей средства проверки грамматики естественного языка - это словарь всех слов на языке, а также части речи каждого слова. Тот факт, что естественное слово может использоваться в качестве любой из нескольких различных частей речи (например, «свободный» используется как прилагательное, наречие, существительное или глагол), значительно увеличивает сложность любого средства проверки грамматики.

Грамматика проверка будет найти каждое предложение в тексте, искать каждое слово в словаре, а затем попытаться разобрать фразу в форму , которая соответствует грамматике. Затем, используя различные правила, программа может обнаруживать различные ошибки, такие как согласие по времени , числу, порядку слов и т. Д. Также можно обнаружить некоторые стилистические проблемы с текстом. Например, в некоторых популярных руководствах по стилю, таких как «Элементы стиля», не рекомендуется чрезмерное использование пассивного залога . Программа проверки грамматики может попытаться определить пассивные предложения и предложить альтернативу с активным голосом.

Элементы программного обеспечения, необходимые для проверки грамматики, тесно связаны с некоторыми проблемами разработки, которые необходимо решить для программного обеспечения для распознавания голоса . В распознавании голоса синтаксический анализ может использоваться, чтобы помочь предсказать, какое слово наиболее вероятно подразумевается, на основе части речи и положения в предложении. При проверке грамматики синтаксический анализ используется для обнаружения слов, которые не соответствуют принятой грамматике.

Недавно [ когда? ] исследования были сосредоточены на разработке алгоритмов, которые могут распознавать грамматические ошибки на основе контекста окружающих слов. [ требуется разъяснение ]

Критика [ править ]

Программы проверки грамматики считаются одним из видов вспомогательных средств для письма на иностранном языке, которые люди, не являющиеся носителями языка, могут использовать для проверки своих сочинений, поскольку такие программы пытаются выявлять синтаксические ошибки. [8] Однако, как и в случае с другими компьютеризированными средствами письма, такими как средства проверки правописания , популярные средства проверки грамматики часто подвергаются критике, когда они не могут обнаружить ошибки и неправильно помечают правильный текст как ошибочный. Лингвист Джеффри К. Пуллум утверждал в 2007 году, что они, как правило, настолько неточны, что приносят больше вреда, чем пользы: «по большей части принятие совета компьютерной программы проверки грамматики в отношении вашей прозы сделает ее намного хуже, иногда до смешного бессвязной. " [9]

См. Также [ править ]

  • Программа проверки орфографии
  • Грамматика ссылок

Ссылки [ править ]

  1. ^ Викрант Бхатеджа; Жоао Мануэль Р.С. Таварес; Б. Падмаджа Рани; В. Камакши Прасад; К. Сруджан Раджу (23 июля 2018 г.). Труды Второй Международной конференции по вычислительному интеллекту и информатике: ICCII 2017 . Springer. ISBN 978-981-10-8228-3.
  2. ^ Роберт Дейл; Герман Мойсл; Гарольд Сомерс (25 июля 2000 г.). Справочник по обработке естественного языка . CRC Press. ISBN 978-0-8247-9000-4.
  3. ^ «Идеи - O'Reilly Media» . www.linuxdevcenter.com .
  4. ^ А. Уокер: Поваренная книга Linux
  5. ^ Inc, InfoWorld Media Group (28 октября 1991 г.). InfoWorld . InfoWorld Media Group, Inc. стр. 68 - через Интернет-архив.
  6. ^ Программа проверки грамматики Sapling AI
  7. ^ Как проверка грамматики Документов Google сравнивается с ее альтернативами
  8. Перейти ↑ Bustamante, FR, & León, FS, (1996). GramCheck: средство проверки грамматики и стиля . Труды 16-й конференции по компьютерной лингвистике , 05–09 августа, Копенгаген, Дания. Проверено 19 марта 2012 года.
  9. Джеффри К. Пуллум (26 октября 2007 г.). «Обезьяны проверят вашу грамматику» . Журнал языков . Проверено 8 марта 2010 года .