Катпак


Catpac — это компьютерная программа, которая анализирует образцы текста для определения ключевых понятий, содержащихся в образце. Он был задуман главным образом Ричардом Холмсом, компьютерным программистом из штата Мичиган, и доктором Джозефом Вельфелем , социологом из Университета Олбани и Университета Буффало . для анализа формирования и изменения отношения в социологическом контексте. Вклад Роба Зиммельмана, студента и аспиранта Университета Олбани, в период с 1981 по 1984 год по мэйнфрейму Univac 1100 включал в себя включение программного обеспечения CATPAC в систему Galileo*Telegal, маркировку текста и портирование выходных данных CATPAC для Система парного сравнения Galileo концептуальной визуализации. CATPAC и система Galileo до сих пор используются в коммерческих целях, а благодаря недавнему вкладу в сбор и визуализацию данных они продолжают расти. Вклад других студентов университета привел к созданию программного обеспечения, которое до сих пор используется в коммерческих целях. Он использует текстовые файлы в качестве входных данных и производит выходные данные, такие как частоты слов и алфавитов, а также различные типы кластерного анализа. [1]

Catpac — это самоорганизующаяся , т. е. неконтролируемая, интерактивная искусственная нейронная сеть активации и конкуренции (IAC) , используемая для анализа текста. [2] [3] Программа генерирует многомерный скалярный вывод, упорядочивающий слова по всему тексту путем создания взвешенной пословной матрицы , которая устанавливает центральность понятий по собственным векторам . [4] Пословная матрица представляет отношение между одним словом и появлением другого. [5] Catpac идентифицирует важные слова и шаблоны на основе организации текста. [2]Этот процесс имитирует связи между нейронами в человеческом мозгу, укрепляя связи посредством кондиционирования, чтобы создать образец сходства между всеми словами в тексте. [2]

Catpac использовался в коммерческих исследованиях, в академической науке для исследования массивных наборов текстовых данных, [6] [7] как мощный инструмент анализа семантической сети, [4] [5] [8] для продольного анализа, [4] [8 ]. ] [9] [10] [11] для многоязычного анализа, [12] [13] в качестве предиктора использования медиа [14] и в качестве мощного инструмента анализа контента. [15] [16]

Catpac, задуманный как усовершенствование простого программного обеспечения для подсчета слов более 30 лет назад, в настоящее время доступен в 32-битном формате Windows. [2]