Воянт Инструменты


Voyant Tools — это веб-приложение с открытым исходным кодом для анализа текста. Он поддерживает научное чтение и интерпретацию текстов или корпусов, особенно учеными в области цифровых гуманитарных наук , а также студентами и широкой публикой. Его можно использовать для анализа онлайн-текстов или текстов, загруженных пользователями. [1] Voyant имеет большую международную базу пользователей: только в октябре 2016 года на главном сервере Voyant было 81 686 просмотров страниц из 156 стран, при этом инструмент был запущен 1 173 252 раза. [2]

Voyant «был задуман для улучшения чтения с помощью упрощенной текстовой аналитики, такой как списки частотности слов, графики частотного распределения и дисплеи KWIC». [3] Его интерфейс состоит из панелей, которые выполняют различные аналитические задачи. Эти панели также могут быть встроены во внешние веб-тексты (например, веб-статья может включать панель Voyant, которая создает из нее облако слов). Книга Hermeneutica: Computer-Assisted Interpretation in the Humanities демонстрирует различные подходы к анализу текста с помощью Voyant. [4]

Инструменты Voyant были разработаны Stéfan Sinclair ( McGill ) и Geoffrey Rockwell ( University of Alberta ) и продолжают обновляться. Он разработан на основе более ранних инструментов анализа текста, включая HyperPo, Taporware и TACT. Среди участников были Эндрю Макдональд, Сирил Брике, Лиза Годдард и Марк Туркато. [1]

Исследователи использовали инструменты Voyant для анализа текстов в широком диапазоне контекстов, включая литературу, [5] преподавание языков, [6] здравоохранение, [7] [8] и системную архитектуру. [9] Описывая подходы к изучению Интернета с помощью парсинга веб-страниц, Блэк отметил, что «проект Voyant Tools является отличным источником для изучения видов данных, которые гуманитарии могут извлекать из интернет-источников, поскольку он уже поддерживает извлечение текста с веб-страниц». [10]

Ряд международных цифровых гуманитарных проектов запускают Voyant на своих серверах. К ним относятся французский проект Huma-Num , итальянский CNR ILC и немецкий проект DARIAH-DE . [2]