PropBank - это корпус, который аннотируется устными предложениями и их аргументами - «банк предложений». Хотя «PropBank» относится к конкретному корпусу, созданному Martha Palmer et al. , [1] термин propbank также начинает использоваться как нарицательное существительное, относящееся к любому корпусу, который был аннотирован предложениями и их аргументами.
Проект PropBank сыграл свою роль в недавнем [ когда? ] исследования в области обработки естественного языка , [ цитата необходима ] и использовалась для обозначения семантической роли .
Сравнение
PropBank отличается от FrameNet , ресурса, с которым его чаще всего сравнивают, несколькими способами.
PropBank - это ресурс, ориентированный на глаголы, в то время как FrameNet сосредоточен на более абстрактном понятии фреймов, которое обобщает описания похожих глаголов (например, «описать» и «характеризовать»), а также существительных и других слов (например, «описание»). PropBank не аннотирует события или положения дел, описанные с помощью существительных. PropBank обязуется аннотировать все глаголы в корпусе, тогда как проект FrameNet выбирает наборы примеров предложений из большого корпуса и только в некоторых случаях аннотирует более длинные непрерывные фрагменты текста.
Аннотации в стиле PropBank часто остаются близкими к синтаксическому уровню, в то время как аннотации в стиле FrameNet иногда более семантически мотивированы. С самого начала PropBank разрабатывался с целью использования в качестве обучающих данных для систем семантической маркировки ролей на основе машинного обучения . Он требует, чтобы все аргументы глагола были синтаксическими составляющими, а разные значения слова выделялись только в том случае, если различия касаются аргументов. [2] Из-за таких различий присвоение меток семантической роли в отношении PropBank часто оказывается несколько более простой задачей, чем создание аннотаций в стиле FrameNet.
Смотрите также
Рекомендации
- ^ Palmer M, P Kingsbury, Gildea D (2005). «Банк предложений: аннотированный корпус семантических ролей». Компьютерная лингвистика . 31 (1): 71–106. CiteSeerX 10.1.1.136.8985 . DOI : 10.1162 / 0891201053630264 . S2CID 2486369 .
- ^ Эдвард Лопер; Су-тинг Йи и Марта Палмер (2007). «Объединение лексических ресурсов: отображение между PropBank и VerbNet» (PDF) . Материалы 7-го международного семинара по компьютерной лингвистике .