Семантический HTML

Семантический HTML - это использование разметки HTML для усиления семантики или значения информации на веб-страницах и веб-приложениях, а не просто для определения ее представления или внешнего вида . Семантический HTML обрабатывается традиционными веб-браузерами, а также многими другими пользовательскими агентами . CSS используется, чтобы предложить его представление пользователям-людям.

История [ править ]

HTML включает семантическую разметку с самого начала. ^[1] В документе HTML автор может, среди прочего, «начинать с заголовка; добавлять заголовки и абзацы; делать акцент на [текст]; добавлять изображения; добавлять ссылки на другие страницы; [и] использовать различные виды списков ». ^[2]

Различные версии стандарта HTML включают презентационную разметку, такую как <font>(добавлено в HTML 3.2; удалено в HTML 4.0 Strict), <i>(все версии) и <center>(добавлено в HTML 3.2). Есть также семантически нейтральные элементы span и div . С конца 1990-х годов, когда каскадные таблицы стилей начали работать в большинстве браузеров, веб-авторов поощряли избегать использования презентационной разметки HTML с целью разделения представления и содержимого . ^[3]

В 2001 году Тим Бернерс-Ли участвовал в обсуждении семантической сети , где было показано, что интеллектуальные программные «агенты» могут однажды автоматически сканировать сеть и находить, фильтровать и сопоставлять ранее не связанные, опубликованные факты в интересах конечных пользователей. . ^[4] Такие агенты не являются обычным явлением даже сейчас, но некоторые идеи Web 2.0 , гибридных веб-сайтов и сайтов сравнения цен могут быть близки. Основное различие между этими гибридами веб-приложений и семантическими агентами Бернерса-Ли заключается в том, что текущая агрегацияа гибридизация информации обычно разрабатывается веб-разработчиками, которые уже знают расположение в Интернете и семантику API конкретных данных, которые они хотят объединить, сравнить и объединить.

Важным типом веб-агента, который выполняет сканирование и чтение веб-страниц автоматически, без предварительного знания того, что он может найти, является веб-сканер или паук поисковой машины. Эти программные агенты зависят от семантической ясности веб-страниц, которые они находят, поскольку они используют различные методы и алгоритмы для чтения и индексации миллионов веб-страниц в день и предоставляют веб-пользователям средства поиска .

Чтобы пауки поисковых систем могли оценивать значимость фрагментов текста, которые они находят в документах HTML, а также для тех, кто создает гибридные приложения и другие гибриды, а также для более автоматизированных агентов по мере их разработки, семантические структуры, которые Существуют в HTML, необходимо широко и единообразно применять, чтобы выявить смысл публикуемой информации. ^[5]

Хотя истинная семантическая сеть может зависеть от сложных онтологий и метаданных RDF , каждый документ HTML вносит свой вклад в осмысленность сети за счет правильного использования заголовков, списков, заголовков и другой семантической разметки везде, где это возможно. Такое «простое» использование HTML получило название «Обычный старый семантический HTML» или POSH. ^[6] Правильное использование «тегов» в Web 2.0 создает фольксономию, которая может быть одинаково или даже более значимой для многих. ^[5] HTML 5 введены новые семантические элементы , такие как , , , , , , , и . ^[7] В целом цель W3C sectionarticlefooterprogressnavasidemarktime состоит в том, чтобы постепенно вводить больше способов для браузеров, разработчиков и поисковых роботов лучше различать разные типы данных, обеспечивая такие преимущества, как лучшее отображение в браузерах на разных устройствах.

Презентационные элементы формально не считались устаревшими в рекомендациях HTML 4.01 и XHTML, но не были рекомендованы. В HTML 5 некоторые из этих элементов, такие как i^[8] и b^[9] , по-прежнему указаны, поскольку их значение было четко определено «как стилистически смещенное от обычной прозы, но без дополнительной важности». ^{[ Эта цитата требует цитирования ]}

Соображения [ править ]

В случаях, когда документ требует более точной семантики, чем выраженная только в HTML, фрагменты документа могут быть заключены внутри spanили в divэлементы со значимыми именами классов ^[10], такими как <span class="author">и <div class="invoice">. Если эти имена классов также являются идентификатором фрагмента в схеме или онтологии, они могут ссылаться на более определенное значение. Микроформаты формализуют такой подход к семантике в HTML.

Одним из важных ограничений этого подхода является то, что такая разметка, основанная на включении элементов, должна соответствовать условиям корректности. Поскольку эти документы имеют широкую древовидную структуру, это означает, что таким способом могут быть размечены только сбалансированные фрагменты поддерева. ^[11] Для разметки любого произвольного раздела HTML потребуется механизм, не зависящий от самой структуры разметки, такой как XPointer .

Хороший семантический HTML также улучшает доступность веб-документов (см. Также Руководство по доступности веб-контента ). ^{[ необходима цитата ]} Например, когда программа чтения с экрана или аудиобраузер может правильно определить структуру документа, она не будет тратить время пользователя с ослабленным зрением на чтение повторяющейся или нерелевантной информации, если она была правильно размечена.

"Расширенные описания веб-страниц" Google [ править ]

В 2010 году Google определил три формы структурированных метаданных, которые их системы будут использовать для поиска структурированного семантического содержания на веб-страницах. Такая информация, связанная с отзывами, профилями людей, списками компаний и событиями, будет использоваться Google для улучшения «фрагмента» или короткого фрагмента цитируемого текста, который отображается, когда страница появляется в списках результатов поиска. Google указывает, что эти данные могут быть предоставлены с использованием микроданных , микроформатов или RDFa . ^[12] Микроданные указываются внутри, itemtypeа itempropатрибуты добавляются к существующим элементам HTML; ключевые слова микроформата добавляются внутри classатрибутов, как описано выше; и RDFa полагается rel, typeofиpropertyатрибуты добавлены к существующим элементам. ^[13]

См. Также [ править ]

RDFa
Микроформаты
Семантическая сеть
Семантика (информатика)
XML
Микроданные (HTML)
HTML-элементы (полный список)

Ссылки [ править ]

^ Бернерс-Ли, Тим ; Фишетти, Марк (2000). Плетение сети: оригинальный дизайн и конечная судьба всемирной паутины его изобретателем . Сан-Франциско: Харпер. ISBN 978-0062515872.
^ Раггетт, Дэйв (24 апреля 2005). «Начало работы с HTML» . Консорциум World Wide Web . Проверено 8 декабря 2010 года .
^ Раггетт, Дэйв (8 апреля 2002). «Добавление нотки стиля» . Консорциум World Wide Web . Проверено 8 декабря 2010 года .В этой статье отмечается, что презентационная разметка HTML может быть полезна при нацеливании на браузеры «до Netscape 4.0 и Internet Explorer 4.0 », которые были выпущены в 1997 году.
^ Бернерс-Ли, Тим; Хендлер, Джеймс; Лассила, Ора (2001). «Семантическая сеть» . Scientific American . Проверено 2 октября 2009 .
^ a b Шедболт, Найджел; Бернерс-Ли, Тим; Холл, Венди (май – июнь 2006 г.). «Возвращение к семантической паутине» (PDF) . Интеллектуальные системы IEEE . Проверено 8 декабря 2010 года .
^ "Обычный старый семантический HTML (POSH)" . Микроформаты вики . сообщество микроформатов. 20 апреля 2007 . Проверено 4 мая 2013 года .
^ Робинсон, Майк. «Поговорим о семантике» . HTML 5 Доктор . Проверено 26 октября 2015 года .
^ "HTML5" . Консорциум World Wide Web. Раздел 4.5.17: Элемент i.
^ "HTML5" . Консорциум World Wide Web. Раздел 4.5.18: Элемент b.
^ Эти имена классов в лучшем случае предполагают, а не формально значимы, если только они ранее не использовались как создателем, так и потребителем контента.
^ «Хорошо оформленные XML-документы» . Расширяемый язык разметки (XML) 1.1 . W3C .
^ "Rich snippets" . Центр веб-мастеров . Проверено 26 мая 2010 года .
^ «Предприятия и организации - Информация об организации» . Центр веб-мастеров . Проверено 26 мая 2010 года .

Внешние ссылки [ править ]

schema.org - это инициатива, запущенная 2 июня 2011 года компаниями Bing , Google и Yahoo!

[1] Бернерс-Ли, Тим ; Фишетти, Марк (2000). Плетение сети: оригинальный дизайн и конечная судьба всемирной паутины его изобретателем . Сан-Франциско: Харпер. ISBN 978-0062515872.

[2] Раггетт, Дэйв (24 апреля 2005). «Начало работы с HTML» . Консорциум World Wide Web . Проверено 8 декабря 2010 года .

[3] Раггетт, Дэйв (8 апреля 2002). «Добавление нотки стиля» . Консорциум World Wide Web . Проверено 8 декабря 2010 года .В этой статье отмечается, что презентационная разметка HTML может быть полезна при нацеливании на браузеры «до Netscape 4.0 и Internet Explorer 4.0 », которые были выпущены в 1997 году.

[4] Бернерс-Ли, Тим; Хендлер, Джеймс; Лассила, Ора (2001). «Семантическая сеть» . Scientific American . Проверено 2 октября 2009 .

[Semantic_Web_Revisted-5] Шедболт, Найджел; Бернерс-Ли, Тим; Холл, Венди (май – июнь 2006 г.). «Возвращение к семантической паутине» (PDF) . Интеллектуальные системы IEEE . Проверено 8 декабря 2010 года .

[6] "Обычный старый семантический HTML (POSH)" . Микроформаты вики . сообщество микроформатов. 20 апреля 2007 . Проверено 4 мая 2013 года .

[7] Робинсон, Майк. «Поговорим о семантике» . HTML 5 Доктор . Проверено 26 октября 2015 года .

[8] "HTML5" . Консорциум World Wide Web. Раздел 4.5.17: Элемент i.

[9] "HTML5" . Консорциум World Wide Web. Раздел 4.5.18: Элемент b.

[10] Эти имена классов в лучшем случае предполагают, а не формально значимы, если только они ранее не использовались как создателем, так и потребителем контента.

[11] «Хорошо оформленные XML-документы» . Расширяемый язык разметки (XML) 1.1 . W3C .

[12] "Rich snippets" . Центр веб-мастеров . Проверено 26 мая 2010 года .

[13] «Предприятия и организации - Информация об организации» . Центр веб-мастеров . Проверено 26 мая 2010 года .

[1]