Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Анализаторы HTML - это программное обеспечение для автоматического анализа языка гипертекстовой разметки (HTML) . У них две основные цели:

  • Обход HTML: предлагает программистам интерфейс для легкого доступа и изменения «строкового кода HTML». Канонический пример: парсеры DOM .
  • Чистый HTML: исправить неверный HTML и улучшить макет и стиль отступа итоговой разметки. Канонический пример: HTML Tidy .
* Дата последнего выпуска (с существенными изменениями).
** санирование (создание стандартных веб-страниц, уменьшение спама и т. д.) и очистка (удаление лишних презентационных тегов, удаление кода XSS и т. д.) HTML-кода.
*** Обновляет HTML4.X до XHTML или HTML5, преобразуя устаревшие теги (например, CENTER) в допустимые (например, DIV с style = "text-align: center;" ).

Ссылки [ править ]

  1. ^ 12.2 Анализ HTML-документов - Стандарт HTML, заархивированный 16 января 2013 г. на Wayback Machine
  2. ^ HTML Tidy, выпуск 5.4.0
  3. ^ a b Что такое приборка?
  4. ^ HtmlUnit версии 2.36.0
  5. ^ Выпуски libxml2