Компьютерная лингвистика — это междисциплинарная область, связанная с компьютерным моделированием естественного языка , а также изучением соответствующих вычислительных подходов к лингвистическим вопросам. В целом компьютерная лингвистика опирается на лингвистику , информатику , искусственный интеллект , математику , логику , философию , когнитивную науку , когнитивную психологию , психолингвистику , антропологию и нейробиологию , среди прочих.
Традиционно компьютерная лингвистика возникла как область искусственного интеллекта , которой занимались ученые-компьютерщики , специализирующиеся на применении компьютеров для обработки естественного языка . С образованием Ассоциации компьютерной лингвистики (ACL) [1] и созданием серии независимых конференций эта область консолидировалась в 1970-х и 1980-х годах.
...научное изучение языка с вычислительной точки зрения. Компьютерные лингвисты заинтересованы в создании вычислительных моделей различных видов языковых явлений. [2]
Термин «вычислительная лингвистика» в настоящее время (2020 г.) считается почти синонимом обработки естественного языка (NLP) и технологии (человеческого) языка . Эти термины делают больший акцент на аспектах практического применения, а не на теоретических исследованиях, а с 2000-х годов. На практике они в значительной степени заменили термин «вычислительная лингвистика» в сообществе NLP/ACL, [3] , хотя конкретно относятся только к подразделу прикладной вычислительной лингвистики.
Компьютерная лингвистика имеет как теоретическую, так и прикладную составляющие. Теоретическая компьютерная лингвистика фокусируется на вопросах теоретической лингвистики и когнитивистики. [4] Прикладная компьютерная лингвистика фокусируется на практических результатах моделирования использования человеческого языка. [4]
Теоретическая компьютерная лингвистика включает разработку формальных теорий грамматики ( синтаксический анализ ) и семантики , часто основанных на формальной логике и символических ( основанных на знаниях ) подходах. Области исследований, которые изучает теоретическая компьютерная лингвистика, включают: