На вики , инфобокс является таблица используется для сбора и представить подмножество информации о ее предмете, таких как документ . Это структурированный документ , содержащий набор пар атрибут-значение , [1] и в Википедии представляет собой краткую информацию о предмете в статье . [2] Таким образом, в некоторых аспектах они сопоставимы с таблицами данных . Когда он представлен в более крупном документе, в котором он резюмируется, информационное окно часто представляется в формате боковой панели .
Информационное окно может быть реализовано в другом документе, включив его в этот документ и указав некоторые или все пары атрибут-значение, связанные с этим информационным блоком, что называется параметризацией .
Википедия
Информационное окно можно использовать для резюмирования информации статьи в Википедии . [3] Они используются в похожих статьях, чтобы обеспечить единообразие изложения за счет использования общего формата. [4] [2] Изначально инфобоксы (и шаблоны в целом) использовались для макетов страниц . [2] Информационное окно можно включить в статью, указав значение для некоторых или всех его параметров . [5] Используемое имя параметра должно быть таким же, как указано в шаблоне информационного окна, но с ним может быть связано любое значение. [5] Имя отделяется от значения знаком равенства . [5] Название параметра можно рассматривать как атрибут темы статьи. [6]
{{Infobox готовые блюда| имя =| изображение =| imagesize =| caption =| альтернативное_имя =| страна =| регион =| создатель =| конечно =| type =| обслужено =| main_ingredient =| варианты =| калории =| другое =}} | {{Infobox готовые блюда| name = Crostata| image = Crostata limone e zenzero 3.jpg| imagesize =| caption = Crostata с начинкой из лимона и имбиря| альтернативное_имя =| страна = [[Италия]]
| регион = [[Ломбардия]]| создатель =| конечно = [[Десерт]]
| type = [[Tart]]| обслужено =| main_ingredient = Тесто, [[джем]] или [[рикотта]] , фрукты| варианты = ' Crostata di frutta ' , ' crostata di ricotta ' , многие другие сладкие или соленые варианты| калории =| другое =}} |
Инфобокс Инфобокс приготовил еду, используемый в статьях Википедии о еде, без указания значений для его параметров (атрибутов). | Тот же информационный блок, что и в статье crostata . Обратите внимание, что значения находятся справа от знака равенства (=) и что имена параметров такие же, как и в спецификации для шаблона информационного окна. Значения указаны в вики-разметке : записи, заключенные в квадратные скобки (например, [[Tart]]), будут отображаться как ссылка на соответствующую статью Википедии (например, Tart ), а связанный файл будет включен в статью вместо своей разметка. |
В Википедии информационное окно включается в статью, заключая его имя и пары атрибут-значение в двойные фигурные скобки . Программное обеспечение MediaWiki, на котором работает Википедия, затем анализирует документ, для которого информационное окно и другие шаблоны обрабатываются процессором шаблонов . Это шаблонизатор, который создает веб-документ и таблицу стилей, используемую для представления документа. Это позволяет отделить дизайн информационного окна от содержимого, которым он управляет; [2] то есть дизайн шаблона может быть обновлен, не затрагивая содержащуюся в нем информацию, и новый дизайн будет автоматически распространяться на все статьи, которые включают информационное окно. [4] Обычно информационные окна форматируются так, чтобы отображаться в правом верхнем углу статьи Википедии на рабочем столе [3] или вверху в мобильной версии.
Размещение информационного окна в викитексте статьи важно для доступности . [7] лучшая практика , чтобы поместить их следующие многозначные , шаблоны (те , которые направляют читатели на статьи о темах с похожими названиями) и шаблоны обслуживания (например, что маркировка статьи как без ссылок), но перед всем другим содержанием . [8] [9]
Баеза-Йейтс и Кинг говорят, что некоторые редакторы считают такие шаблоны, как информационные блоки, сложными [10], поскольку шаблон может скрывать текст о свойстве или ресурсе, которые редактор хочет изменить; это усугубляется связанными шаблонами, то есть шаблонами, включенными в другие шаблоны. [10]
По состоянию на август 2009 года английская Википедия использовала около 3000 шаблонов информационных ящиков, которые в совокупности использовали более 20 000 атрибутов. [11] С тех пор многие из них были объединены, чтобы уменьшить избыточность. По состоянию на июнь 2013 года , было по крайней мере 1,345,446 этого включения | родительский шаблона Infobox , [12] , используемого некоторыми, но не все, infoboxes, на 4,251,127 статей.
Имя информационного окна обычно - «Информационное окно [жанр]»; тем не менее, широко используемым информационным ящикам могут быть присвоены более короткие имена, такие как «taxobox» для таксономии. [8]
Машинное обучение
Около 44,2% статей Википедии содержали информационные блоки в 2008 году [13] и около 33% в 2010 году. [14] Автоматическое извлечение семантических знаний с использованием алгоритмов машинного обучения используется для «извлечения машинно-обрабатываемой информации при относительно низкой стоимости сложности». [1] Однако низкий уровень охвата затрудняет эту задачу, хотя это можно частично преодолеть, добавив данные о статьях в категории, в которые они включены. [13] Французская Википедия инициировал проект Infobox Version 2 в мае 2011 года [15] [16]
Знания, полученные с помощью машинного обучения, можно использовать для улучшения статьи, например, с помощью автоматизированных программных предложений редакторам для добавления данных в информационный ящик. [13] Проект iPopulator создал систему для добавления значения к параметру информационного окна статьи посредством автоматического анализа текста этой статьи. [11]
DBpedia использует структурированный контент, извлеченный из информационных ящиков [2] алгоритмами машинного обучения, для создания ресурса связанных данных в семантической сети ; Тим Бернерс-Ли описал его как «один из наиболее известных» компонентов проекта связанных данных. [17]
Машинное извлечение создает тройку, состоящую из субъекта, предиката или отношения и объекта. [1] Каждая пара атрибут-значение информационного окна используется для создания оператора RDF с использованием онтологии . [18] Этому способствует более узкий разрыв между Википедией и онтологией, чем существует между неструктурированным или свободным текстом и онтологией. [19]
Семантическое отношение между субъектом и объектом устанавливается предикатом. [1] В примере инфобокса тройка («кростата», тип, «пирог») указывает, что кростата является разновидностью пирога . Тема статьи используется в качестве темы, имя параметра используется в качестве предиката, а значение параметра - в качестве объекта. [18] [1] Каждый тип информационного блока отображается в класс онтологии, и каждое свойство (параметр) в информационном блоке отображается на свойство онтологии. [20] Эти сопоставления используются при анализе статьи Википедии для извлечения данных.
Заметки
- ^ а б в г д Баеза-Йейтс и Кинг 2009 , стр. 31.
- ^ а б в г д Лиянг 2011 , стр. 385.
- ^ a b Бротон 2008 , стр. 357.
- ^ a b Бротон 2008 , стр. 17.
- ^ a b c Бротон 2008 , стр. 18.
- Перейти ↑ Baeza-Yates & King 2009 , p. 30.
- Перейти ↑ Broughton 2008 , p. 234.
- ^ a b Бротон 2008 , стр. 235.
- ^ Политика английской Википедии в отношении доступности указана в Википедии: Руководство по стилю / доступности . Политика в отношениимакета вики-текста указана в разделах Википедия: Руководство по стилю / макету и Википедия: Руководство по стилю / руководству .
- ^ a b Баеза-Йейтс и Кинг 2009 , стр. 345.
- ^ a b Lange, Böhm & Naumann 2010 , стр. 7.
- ^ «Инструменты сервера инструментов Jarry1250 - количество включений шаблонов» . Список проектов Викимедиа . 7 июня 2013 . Проверено 7 июня 2013 года .
- ^ a b c Баеза-Йейтс и Кинг 2009 , стр. 28.
- Перейти ↑ Lange, Böhm & Naumann 2010 , p. 5.
- ^ Geertman, Reinhardt & Toppen 2011 , стр. 493.
- ^ Проект размещен на французской странице Википедии Infobox / V2 .
- Перейти ↑ Miller 2008 .
- ^ а б Лиянг 2011 , стр. 387.
- ^ Virvou & Мацуура 2012 , стр. 315.
- ^ Лиян 2011 , стр. 395.
Рекомендации
- Баеза-Йейтс, Рикардо; Кинг, Ирвин, ред. (2009). Службы ткачества и люди во всемирной паутине . Springer. ISBN 9783642005695. LCCN 2009926100 .
- Бротон, Джон (14 июля 2008 г.). Парикмахер, Нан; Мейерс, Питер (ред.). Википедия - Пропавшее руководство . O'Reilly Media . ISBN 9780596553777.
- Гиртман, Стэн; Рейнхардт, Вольфганг; Топпен, Фред, ред. (2011). Развитие геоинформатики в меняющемся мире . Конспект лекций по геоинформации и картографии. 1 . Springer. DOI : 10.1007 / 978-3-642-19789-5 . ISBN 9783642197888. ISSN 1863-2246 . LCCN 2011925152 .
- Ланге, Дастин; Бём, Кристоф; Науманн, Феликс (2010). Извлечение структурированной информации из статей Википедии для заполнения информационных ящиков . Technische Berichte des Hasso-Plattner-Instituts für Softwaresystemtechnik an der Universität Potsdam, Hasso-Plattner-Institut für Softwaresystemtechnik Potsdam . Universitätsverlag Potsdam. ISBN 9783869560816.
- Ю, Лиянг (2011). Руководство разработчика по семантической сети . Springer. DOI : 10.1007 / 978-3-642-15970-1 . ISBN 9783642159695.
- Миллер, Пол (7 февраля 2008 г.). «Сэр Тим Бернерс-Ли беседует с Талис о семантической сети» . Транскрипция от CastingWords. Талис Групп. Архивировано из оригинала на 2013-05-10 . Проверено 2 июня 2013 .
- Вирву, Мария; Мацуура, Саэко, ред. (2012). Программная инженерия, основанная на знаниях: материалы десятой совместной конференции по разработке программного обеспечения, основанной на знаниях . Границы и искусственный интеллект и приложения . 240 . IOS Press. ISBN 9781614990932. LCCN 2012943674 .
дальнейшее чтение
- Kiran, Kumar N .; Сантош, GSK; Варма, Васудева (июнь 2011 г.). «Кластеризация многоязычных документов с использованием Википедии как внешнего знания» . Междисциплинарный поиск информации . Конспект лекций по информатике. Springer Berlin Heidelberg. 6653 . DOI : 10.1007 / 978-3-642-21353-3 . ISBN 9783642213533. ISSN 0302-9743 . S2CID 9901886 .
- Чутипорн, Анутария; Домингу, Джон, ред. (2008). Семантическая сеть: 3-я Азиатская конференция по семантической паутине, ASWC 2008, Бангкок, Таиланд, 8-11 декабря 2008 г. Материалы . Конспект лекций по информатике . 5367 . Springer. ISBN 9783540897033. ISSN 0302-9743 .
- Ву, Фэй; Хоффманн, Ральф; Weld, Daniel s. (2008). «Извлечение информации из Википедии: спуск по длинному хвосту». Материалы 14-й Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных . Ассоциация вычислительной техники : 731–739. DOI : 10.1145 / 1401890.1401978 . ISBN 9781605581934. S2CID 7781746 .