Лексикостатистика

Лексикостати́стика (от «лексика» и «статистика») — статистический метод, используемый в лингвистике для определения степени родства языков. Заключается в сравнении наиболее устойчивой части лексического фонда и определении количества слов, имеющих в родственных языках общее происхождение. Лексикостатистика является одним из основных методов построения генетической классификации языков^[1]^[2].

Для установления степени лексических схождений и расхождений между языками в процентном отношении используется стословный список Сводеша^[1]. В этот список входят слова, относящиеся к так называемой базисной лексике, которая наиболее устойчива к историческим изменениям во всех языках мира. Чем выше процент совпадающих слов у языков, тем они оказываются более близкими по степени родства. Так, например, анализ списков слов славянских языков даёт порядка 80—85 % совпадений^[3].

Данные лексикостатистики используются в глоттохронологии как основа для определения времени разделения родственных языков^[1]^[3]. Употребляемый в широком смысле термин «лексикостатистика» синонимичен термину «глоттохронология» (более точно — «лексикостатистическая глоттохронология»)^[2]^[4]^[5].