Джерард А. «Джерри» Солтон (8 марта 1927 г. в Нюрнберге - 28 августа 1995 г.) был профессором компьютерных наук в Корнельском университете . Солтон был, возможно, ведущим компьютерным ученым, работавшим в области поиска информации в свое время, и «отцом поиска информации». [1] Его группа в Корнелле разработала систему поиска информации SMART , которую он инициировал, когда учился в Гарварде. Это была первая система, в которой использовалась популярная ныне модель векторного пространства для поиска информации.
Джерард Солтон | |
---|---|
Родившийся | |
Умер | 28 августа 1995 г. | (68 лет)
Альма-матер | Гарвардский университет |
Известен | отец информационного поиска [1] Gerard Salton Award |
Научная карьера | |
Поля | поиск информации |
Учреждения | Cornell University |
Тезис | Система автоматической обработки данных для учета доходов коммунальных предприятий (1958 г.) |
Докторант | Говард Эйкен |
Докторанты |
Салтон родился Герхард Антон Зальманн 8 марта 1927 года в Нюрнберге, Германия . Он получил степень бакалавра (1950 г.) и магистра (1952 г.) по математике в Бруклинском колледже и степень доктора философии. окончил Гарвард по специальности прикладная математика в 1958 году, последний из докторантов Говарда Эйкена , и преподавал там до 1965 года, когда он присоединился к Корнельскому университету и стал соучредителем его факультета компьютерных наук.
Солтон был, пожалуй, наиболее известен разработкой широко используемой в настоящее время модели векторного пространства для информационного поиска. [2] В этой модели и документы, и запросы представлены как векторы количества терминов, а сходство между документом и запросом определяется косинусом между вектором терминов и вектором документа. В этой статье он также представил TF-IDF , или частоту термина-обратная частота документа, модель, в которой оценка термина в документе представляет собой отношение количества терминов в этом документе, деленное на частоту количество документов, в которых встречается этот термин. (Концепция обратной частоты документов, мера специфичности, была введена в 1972 году Карен Спарк-Джонс . [3] ) Позже он заинтересовался автоматическим обобщением и анализом текста [4], а также автоматическим гипертекстом. поколение. [5] За свою жизнь он опубликовал более 150 научных статей и 5 книг.
Солтон был главным редактором Коммуникаций ACM и Журнала ACM , а также возглавлял Специальную группу по поиску информации (SIGIR). Он был младшим редактором журнала ACM Transactions по информационным системам . Он был членом ACM (избран в 1995 г.), [6] получил Почетную премию Американского общества информационных наук (1989 г.) и был первым лауреатом премии SIGIR за выдающийся вклад в исследования информационного поиска (1983 г.) - - теперь называется Премией Джерарда Солтона .
Библиография
- Солтон, Автоматическая организация информации и поиск , 1968.
- Джерард Солтон (1975). Теория индексации . Общество промышленной и прикладной математики. п. 56 .
- --- и Майкл Дж. МакГилл, Введение в современный поиск информации , 1983. ISBN 0-07-054484-0
- Джерард Солтон (1989). Автоматическая обработка текста . Издательство Эддисон-Уэсли. п. 530 . ISBN 978-0-201-12227-5.
- Джерард Салтон на сервере библиографии DBLP
- Г. Солтон, А. Вонг и К. С. Янг (1975), " Модель векторного пространства для автоматического индексирования ", Сообщения ACM , вып. 18, н. 11, страницы 613–620. (Статья, в которой была представлена модель векторного пространства)
Смотрите также
Рекомендации
- ^ а б «Отец информационного поиска» (PDF) . cs.cornell.edu . Проверено 10 марта 2015 года .
член-основатель отдела и отец информационного поиска.
- ^ Salton, G .; Вонг, А .; Ян, CS (1975). «Модель векторного пространства для автоматического индексирования». Коммуникации ACM . 18 (11): 613. DOI : 10,1145 / 361219,361220 . ЛВП : 1813/6057 . S2CID 6473756 .
- ^ Спэрк Джонс, К. (1972). «Статистическая интерпретация специфики термина и его применение при поиске». Журнал документации . 28 : 11–21. CiteSeerX 10.1.1.115.8343 . DOI : 10,1108 / eb026526 .
- ^ Salton, G .; Allan, J .; Бакли, С .; Сингхал, А. (1994). «Автоматический анализ, создание тем и обобщение машиночитаемых текстов». Наука . 264 (5164): 1421–1426. Bibcode : 1994Sci ... 264.1421S . DOI : 10.1126 / science.264.5164.1421 . PMID 17838425 . S2CID 32296317 .
- ^ «Джерард Солтон» . Cs.cornell.edu . Проверено 14 сентября 2013 .
- ^ «Жерар Солтон ACM Fellows 1995» . acm.org . Проверено 10 марта 2015 года .
вклад более 30 лет в организацию и поиск информации
Внешние ссылки
- В память
- Фракталы перемен: поиски переулка памяти
- Самая влиятельная статья, которую никогда не писал Джерард Салтон - эта статья Дэвида Дубина о тенденциях в библиотеке 2004 года служит историческим обзором метаморфозы термина модели значения дискриминации (TDV) в модель векторного пространства в качестве модели поиска информации (VSM в качестве модели IR ). Эта статья ставит под сомнение то, что, по мнению исследовательского сообщества по информационному поиску, модель векторного пространства Солтона была изначально предназначена для моделирования. То, что намного позже стало моделью поиска информации, изначально было ориентированной на данные математико-вычислительной моделью, используемой в качестве объяснительного устройства. Кроме того, в статье Дубина указывается, что часто цитируемая статья Солтона 1975 года не существует, но, вероятно, представляет собой комбинацию двух других статей, ни одна из которых на самом деле не относится к VSM как к модели IR.