Теория риторической структуры ( RST ) - это теория организации текста, которая описывает отношения, которые существуют между частями текста. Первоначально он был разработан Уильямом Манна и Сандра Томпсон из Университета Южной Калифорнии «s наука Института информационного (ISI) и определен в 1988 году работы. [1] [2] Теория была разработана в рамках исследований компьютерной генерации текста . Позже исследователи естественного языка начали использовать RST в реферировании текста и других приложениях. Он объясняет последовательность , постулируя иерархическую, связанную структуру текстов. [3] В 2000 году Даниэль Марку, также из ISI, продемонстрировал, что практический синтаксический анализ дискурса и резюмирование текста также могут быть достигнуты с помощью RST. [4] [5] [6]
Риторические отношения [ править ]
Риторические отношения или отношения когерентности или дискурсивные отношения представляют собой паратактические (координатные) или гипотактические (подчиненные) отношения, которые сохраняются в двух или более промежутках текста. [7] Широко признано, что понятие согласованности возникает через такие текстовые отношения. RST, использующий риторические отношения, предоставляет аналитику систематический способ анализа текста. Анализ обычно строится путем чтения текста и построения дерева с использованием отношений. Следующий пример - заголовок и резюме, которые появляются в верхней части статьи в журнале Scientific American (Рамачандран и Анстис, 1986). Исходный текст, разбитый на пронумерованные блоки, выглядит так: [3]
- [Название:] Восприятие видимого движения
- [Аннотация:] Когда движение периодически видимого объекта неоднозначно
- зрительная система устраняет путаницу
- применяя некоторые приемы, которые отражают встроенное знание свойств физического мира
На рисунке числами 1,2,3,4 показаны соответствующие блоки, как объяснено выше. Четвертая единица и третья единица образуют отношение «Средство». Четвертая единица является существенной частью этого отношения, поэтому она называется ядром отношения, а третья единица называется спутником отношения. Точно так же второй блок с третьим и четвертым блоком формирует отношение «Состояние». Все блоки также являются пролетами, и пролеты могут состоять более чем из одной единицы.
Ядерность в дискурсе [ править ]
RST устанавливает два разных типа единиц. Ядра считаются наиболее важными частями текста, тогда как сателлиты вносят вклад в ядра и являются вторичными. Ядро содержит основную информацию, а спутник - дополнительную информацию о ядре. Спутник часто непонятен без ядра, тогда как текст, в котором спутники были удалены, можно понять до определенной степени.
Иерархия в анализе [ править ]
Отношения RST рекурсивно применяются в тексте до тех пор, пока все единицы в этом тексте не станут составляющими в отношении RST. Результатом такого анализа является то, что структура RST обычно представлена в виде деревьев с одним отношением верхнего уровня, которое охватывает другие отношения на более низких уровнях.
Почему RST? [ редактировать ]
- С лингвистической точки зрения RST предлагает иной взгляд на организацию текста, чем большинство лингвистических теорий .
- RST указывает на тесную связь между отношениями и связностью в тексте.
- С вычислительной точки зрения, он обеспечивает характеристику текстовых отношений, которые были реализованы в различных системах и для приложений, таких как генерация текста [8] и резюмирование . [9]
В обосновании дизайна [ править ]
Специалисты по информатике Ана Кристина Бичарра Гарсия и Кларисс Сикениус де Соуз использовали RST в качестве основы системы обоснования дизайна под названием ADD +. [10] [11] В ADD + RST используется в качестве основы для риторической организации базы знаний способом, сравнимым с другими системами представления знаний, такими как информационная система на основе проблем (IBIS). [11] Точно так же RST использовался в схемах представления для аргументации . [12] [13] [14]
См. Также [ править ]
- Анализ аргументов
- Дерево синтаксического анализа
Ссылки [ править ]
- ^ Манн, Уильям С .; Томпсон, Сандра А. (1988). "Теория риторической структуры: к функциональной теории организации текста" (PDF) . Текст: Междисциплинарный журнал по изучению дискурса . 8 (3): 243–281. DOI : 10,1515 / text.1.1988.8.3.243 . S2CID 60514661 . Проверено 1 ноября 2017 года .
- ^ Matthiessen, Christian MIM (июнь 2005). «Вспоминая Билла Манна» . Компьютерная лингвистика . 31 (2): 161–171. DOI : 10.1162 / 0891201054224002 . S2CID 19688915 . Проверено 1 ноября 2017 года .
- ^ а б Табоада, Майте; Манн, Уильям К. (июнь 2006 г.). «Теория риторической структуры: оглядываясь назад и двигаясь вперед» (PDF) . Дискурсивные исследования . 8 (3): 423–459. CiteSeerX 10.1.1.216.381 . DOI : 10.1177 / 1461445606061881 . S2CID 2386531 .
- ^ Марку, Даниэль (2000). Теория и практика разбора и реферирования дискурса . Кембридж, Массачусетс: MIT Press . ISBN 978-0262133722. OCLC 43811223 .
- ^ Карлсон, Линн; Марку, Даниэль; Окуровски, Мэри Эллен (2003) [2001]. «Создание корпуса с тегами дискурса в рамках теории риторической структуры» (PDF) . В Куппевельте, Ян ван; Смит, Ронни В. (ред.). Актуальные и новые направления в дискурсе и диалоге . Текстовые, речевые и языковые технологии. 22 . Дордрехт; Бостон: Kluwer Academic Publishers . С. 85–112. DOI : 10.1007 / 978-94-010-0019-2_5 . ISBN 978-1402016141. OCLC 53097055 .
- ^ «Хронология» . isi.edu . Институт информационных наук . Проверено 1 ноября 2017 года .
- ^ Taboada, Майте (2009). «Неявные и явные отношения когерентности» (PDF) . В Ренкема, Ян (ред.). Дискурс, конечно: обзор исследований дискурса . Амстердам; Филадельфия: Издательство Джона Бенджамина . С. 127–140. DOI : 10.1075 / z.148.13tab . ISBN 9789027232588. OCLC 276996573 .
- ^ "RST и генерация текста" . ccl.pku.edu.cn . Проверено 1 ноября 2017 года .
- ^ Узеда, Винисиус Родригес; Пардо, Тьяго Александр Салгейро; Нуньес, Мария дас Грасас Вольпе (ноябрь 2008 г.). «Оценка методов автоматического реферирования текста на основе теории риторической структуры» (PDF) . Восьмая Международная конференция по интеллектуальных систем проектирования и применения: Гаосюн, Тайвань, 26-28 ноября 2008 . ISDA'08. 2 . Пискатауэй, Нью-Джерси: IEEE . С. 389–394. DOI : 10.1109 / ISDA.2008.289 . ISBN 978-0-7695-3382-7. S2CID 16331006 . Проверено 1 ноября 2017 года .
- ^ Гарсия, Ана Кристина Бичарра; Союз, Кларисса Зикениус де (апрель 1997 г.). «ДОБАВИТЬ +: включение риторических структур в активные документы» (PDF) . AI EDAM: Искусственный интеллект для инженерного проектирования, анализа и производства . 11 (2): 109–124. DOI : 10.1017 / S0890060400001906 .
- ^ a b Regli, Уильям С .; Ху, Сяочунь; Этвуд, Майкл; Солнце, Вэй (декабрь 2000 г.). «Обзор систем обоснования дизайна: подходы, представление, захват и поиск» (PDF) . Инжиниринг с компьютерами . 16 (3–4): 209–235. DOI : 10.1007 / PL00013715 . S2CID 6394458 .
- ^ Грин, Нэнси Л. (август 2009 г.). «Представление аргументации в тексте с помощью теории риторической структуры». Аргументация . 24 (2): 181–196. DOI : 10.1007 / s10503-009-9169-4 . S2CID 145388742 .
- ^ Грин, Нэнси Л. (ноябрь 2015 г.). «Аннотирование доказательной аргументации в биомедицинском тексте». 2015 IEEE Международная конференция по биоинформатике и биомедицине (BIBM), Вашингтон, округ Колумбия, США, 9-12 ноября 2015 . Пискатауэй, Нью-Джерси: IEEE . С. 922–929. DOI : 10.1109 / BIBM.2015.7359807 . ISBN 978-1-4673-6799-8. OCLC 972619754 . S2CID 7821394 .
- ^ Митрович, Елена; О'Рейли, Клифф; Младенович, Миляна; Хандшу, Зигфрид (январь 2017 г.). «Онтологические представления риторических фигур для интеллектуального анализа аргументов» . Аргументы и вычисления . 8 (3): 267–287. DOI : 10,3233 / AAC-170027 .