Обучение, основанное на объяснении

Эта статья может нуждаться в реорганизации, чтобы соответствовать рекомендациям Википедии по разметке . Пожалуйста, помогите, отредактировав статью, чтобы внести улучшения в общую структуру. ( Декабрь 2012 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Обучение на основе объяснений ( EBL ) - это форма машинного обучения, которая использует очень сильную или даже совершенную теорию предметной области (то есть формальную теорию предметной области, сродни модели предметной области в онтологической инженерии , не путать с предметной областью Скотта. теория ), чтобы сделать обобщения или сформировать концепции из обучающих примеров. ^[1]

Подробности [ править ]

Примером EBL, использующего идеальную теорию предметной области, является программа, которая учится играть в шахматы на примере. Конкретная шахматная позиция, которая содержит важную особенность, такую как «Принудительная потеря черного ферзя за два хода», включает в себя множество нерелевантных особенностей, таких как особая разбросанность пешек на доске. EBL может взять один обучающий пример и определить, какие функции являются важными, чтобы сформировать обобщение. ^[2]

Теория предметной области является совершенной или полной, если она в принципе содержит всю информацию, необходимую для решения любого вопроса о предметной области. Например, теория предметной области для шахмат - это просто правила шахмат. В принципе, зная правила, можно в любой ситуации выбрать лучший ход. Однако на практике сделать такой вывод невозможно из-за комбинаторного взрыва . EBL использует обучающие примеры, чтобы сделать поиск дедуктивных следствий теории предметной области эффективным на практике.

По сути, система EBL работает, находя способ вывести каждый обучающий пример из существующей базы данных теории предметной области. Краткое доказательство обучающего примера расширяет базу данных теории предметной области, позволяя системе EBL очень быстро находить и классифицировать будущие примеры, подобные обучающему примеру. ^[3] Главный недостаток метода - стоимость применения изученных макросов доказательства, поскольку их становится много, - был проанализирован Минтоном. ^[4]

Основная формулировка [ править ]

Программное обеспечение EBL имеет четыре входа:

пространство гипотез (совокупность всех возможных выводов)
теория предметной области (аксиомы об интересующей предметной области)
обучающие примеры (конкретные факты, исключающие возможные гипотезы)
критерии функциональности (критерии для определения того, какие особенности в домене можно эффективно распознать, например, какие особенности можно непосредственно обнаружить с помощью датчиков) ^[5]

Заявление [ править ]

Особенно хорошей областью применения EBL является обработка естественного языка (NLP). Здесь богатая теория предметной области, т. Е. Грамматика естественного языка, хотя и не идеальна и не полна, настраивается на конкретное приложение или конкретное использование языка с помощью банка деревьев (обучающих примеров). Райнер был пионером в этой работе. ^[6] Первым успешным промышленным приложением был коммерческий NL-интерфейс для реляционных баз данных. ^[7] Метод был успешно применен к нескольким крупномасштабным системам синтаксического анализа естественного языка, ^[8]где проблема полезности была решена путем отказа от исходной грамматики (теории предметной области) и использования специализированных методов LR-синтаксического анализа, что привело к огромному ускорению, за счет затрат на охват, но с выигрышем в устранении неоднозначности. Методы, подобные EBL, также применялись для генерации поверхностей, в противоположность синтаксическому анализу. ^[9]

При применении EBL к NLP критерии функциональности могут быть созданы вручную ^[10] или могут быть выведены из банка дерева с использованием энтропии его or-узлов ^[11] или компромисса целевого охвата / устранения неоднозначности (= отзыв / компромисс точности = f-оценка). ^[12] EBL может также использоваться для компиляции основанных на грамматике языковых моделей для распознавания речи из общих грамматик унификации. ^[13] Обратите внимание, как проблема полезности, впервые выявленная Минтоном, была решена путем отказа от исходной теории грамматики / предметной области и что цитируемые статьи, как правило, содержат словосочетание « специализация грамматики» - полная противоположность первоначальному термину « обобщение, основанное на объяснении».Возможно, лучшим названием для этого метода было бы сокращение пространства поиска на основе данных. Среди других людей, которые работали над EBL для НЛП, были Гюнтер Нойман, Аравинд Джоши, Шринивас Бангалор и Халил Сима'ан.

См. Также [ править ]

Одноразовое обучение

Ссылки [ править ]

^ «Специальный выпуск по объяснению в рассуждениях по случаям». Обзор искусственного интеллекта . 24 (2). Октябрь 2005 г.
^ Пример черной королевы из Митчелла, Том (1997). Машинное обучение . Макгроу-Хилл. стр. 308 -309. ISBN 0-07-042807-7.
^ Митчелл, Том (1997). Машинное обучение . Макгроу-Хилл. С. 320 . ISBN 0-07-042807-7. В чистом виде EBL включает переформулировку теории предметной области для выработки общих правил, которые классифицируют примеры за один шаг вывода.
^ Минтон, Стивен (1990). «Количественные результаты, касающиеся проблемы полезности в обучении, основанном на объяснении». Искусственный интеллект . 42 (2–3): 363–392. DOI : 10.1016 / 0004-3702 (90) 90059-9 .
^ Келлер, Ричард (1988). «Определение оперативности для обучения на основе объяснений» (PDF) . Искусственный интеллект . 35 (2): 227–241. DOI : 10.1016 / 0004-3702 (88) 90013-6 . Проверено 22 февраля 2009 . Current Operationality Defn .: Описание концепции является работоспособным, если его можно эффективно использовать для распознавания экземпляров концепции, которую оно обозначает. После изложения общего определения в статье фактически выступает против него в пользу более точных критериев.
^ Райнер, Мэнни (1988). «Применение обобщения на основе объяснения к обработке естественного языка». Procs. Международная конференция по вычислениям пятого поколения, Киото. С. 1267–1274.
^ Самуэльссон, Кристер; Мэнни Рейнер (1991). «Количественная оценка обучения, основанного на объяснении, как инструмент оптимизации для крупномасштабной системы естественного языка». Procs. 12-я международная совместная конференция по искусственному интеллекту, Сидней. С. 609–615.CS1 maint: location ( ссылка )
^ Самуэльссон, Кристер (1994). Быстрый анализ естественного языка с использованием обучения на основе объяснений . Стокгольм: докторская диссертация, Королевский технологический институт.
^ Самуэльссон, Кристер (1996). «Оптимизация таблиц генерации поверхностей на основе примеров». в Р. Митков и Н. Николов (ред.) "Последние достижения в обработке естественного языка", т. 136 из «Текущих проблем лингвистической теории»: Джон Бенджаминс, Амстердам.CS1 maint: location ( ссылка )
^ Райнер, Мэнни; Дэвид Картер (1996). «Быстрый синтаксический анализ с использованием сокращения и грамматической специализации» . Procs. ACL, Санта-Крус.
^ Самуэльссон, Кристер (1994). «Специализация грамматики через пороги энтропии» . Procs. ACL, Лас-Крусес. С. 188–195.
^ Cancedda, Никола; Кристер Самуэльссон (2000). "Корпоративная грамматическая специализация". Материалы 4-го вычислительного семинара по изучению естественного языка.CS1 maint: location ( ссылка )
^ Райнер, Мэнни; Бет Энн Хоккей; Пьеретта Бульон (nd). Включение лингвистики в распознавание речи: компилятор грамматики Regulus . ISBN 1-57586-526-2.

[1] «Специальный выпуск по объяснению в рассуждениях по случаям». Обзор искусственного интеллекта . 24 (2). Октябрь 2005 г.

[2] Пример черной королевы из Митчелла, Том (1997). Машинное обучение . Макгроу-Хилл. стр. 308 -309. ISBN 0-07-042807-7.

[3] Митчелл, Том (1997). Машинное обучение . Макгроу-Хилл. С. 320 . ISBN 0-07-042807-7. В чистом виде EBL включает переформулировку теории предметной области для выработки общих правил, которые классифицируют примеры за один шаг вывода.

[4] Минтон, Стивен (1990). «Количественные результаты, касающиеся проблемы полезности в обучении, основанном на объяснении». Искусственный интеллект . 42 (2–3): 363–392. DOI : 10.1016 / 0004-3702 (90) 90059-9 .

[5] Келлер, Ричард (1988). «Определение оперативности для обучения на основе объяснений» (PDF) . Искусственный интеллект . 35 (2): 227–241. DOI : 10.1016 / 0004-3702 (88) 90013-6 . Проверено 22 февраля 2009 . Current Operationality Defn .: Описание концепции является работоспособным, если его можно эффективно использовать для распознавания экземпляров концепции, которую оно обозначает. После изложения общего определения в статье фактически выступает против него в пользу более точных критериев.

[6] Райнер, Мэнни (1988). «Применение обобщения на основе объяснения к обработке естественного языка». Procs. Международная конференция по вычислениям пятого поколения, Киото. С. 1267–1274.

[7] Самуэльссон, Кристер; Мэнни Рейнер (1991). «Количественная оценка обучения, основанного на объяснении, как инструмент оптимизации для крупномасштабной системы естественного языка». Procs. 12-я международная совместная конференция по искусственному интеллекту, Сидней. С. 609–615.CS1 maint: location ( ссылка )

[8] Самуэльссон, Кристер (1994). Быстрый анализ естественного языка с использованием обучения на основе объяснений . Стокгольм: докторская диссертация, Королевский технологический институт.

[9] Самуэльссон, Кристер (1996). «Оптимизация таблиц генерации поверхностей на основе примеров». в Р. Митков и Н. Николов (ред.) "Последние достижения в обработке естественного языка", т. 136 из «Текущих проблем лингвистической теории»: Джон Бенджаминс, Амстердам.CS1 maint: location ( ссылка )

[10] Райнер, Мэнни; Дэвид Картер (1996). «Быстрый синтаксический анализ с использованием сокращения и грамматической специализации» . Procs. ACL, Санта-Крус.

[11] Самуэльссон, Кристер (1994). «Специализация грамматики через пороги энтропии» . Procs. ACL, Лас-Крусес. С. 188–195.

[12] Cancedda, Никола; Кристер Самуэльссон (2000). "Корпоративная грамматическая специализация". Материалы 4-го вычислительного семинара по изучению естественного языка.CS1 maint: location ( ссылка )

[13] Райнер, Мэнни; Бет Энн Хоккей; Пьеретта Бульон (nd). Включение лингвистики в распознавание речи: компилятор грамматики Regulus . ISBN 1-57586-526-2.

[1]