Правильно сформированный документ в XML - это документ, который «придерживается правил синтаксиса, указанных в спецификации XML 1.0, в том смысле, что он должен удовлетворять как физической, так и логической структуре». [1]
Требования [ править ]
На базовом уровне правильно оформленные документы требуют, чтобы:
- Содержание должно быть определено.
- Контент должен быть разделен начальным и конечным тегами
- Содержимое должно быть правильно вложено (родители внутри корней, дети внутри родителей)
Чтобы документ был правильно оформлен, необходимо установить правила декларирования юридических лиц и обращения с ними. Метки являются чувствителен к регистру с атрибутами разделителей кавычки. Для пустых элементов установлены правила. Перекрывающиеся теги делают документ недействительным. В идеале правильно сформированный документ соответствует целям разработки XML. Другие ключевые правила синтаксиса, представленные в спецификации, включают:
- Он содержит только правильно закодированные допустимые символы Unicode.
- Ни один из специальных синтаксических символов, таких как
<
и, не&
появляется, кроме как при выполнении их ролей разметки и разметки. - Теги начала, конца и пустого элемента, разделяющие элементы, правильно вложены, ни один из них не пропущен и не перекрывается.
- Теги элементов чувствительны к регистру; начальный и конечный теги должны точно совпадать. Имена тегов не могут содержать любые символы
!"#$%&'()*+,/;<=>?@[\]^`{|}~
, ни пробела, и не могут начинаться с-
,.
или числовой цифрой. - Есть единственный «корневой» элемент, который содержит все остальные элементы.
Допустимый XML-документ определяется в спецификации XML как правильно сформированный XML-документ, который также соответствует правилам определения типа документа (DTD). Согласно руководству JavaCommerce.com XML, «Хорошо сформированные XML-документы просто размечают страницы с помощью описательных тегов. Вам не нужно описывать или объяснять, что означают эти теги. Другими словами, хорошо сформированный XML-документ не нуждается в DTD, но он должен соответствовать правилам синтаксиса XML. Если все теги в документе сформированы правильно и соответствуют рекомендациям XML, документ считается правильно сформированным ". [2] [3]
Обработчик XML, обнаруживший нарушение правил корректности, должен сообщить о таких ошибках и прекратить нормальную обработку. Эта политика, иногда называют Draconian , [4] стоит заметного контраста с поведением программ, процесс HTML , которые предназначены для получения разумного результата даже при наличии серьезных ошибок разметки [5] в духе закона Постел («Будьте консервативны в том, что вы посылаете; будьте либеральны в том, что вы принимаете»). [6] [4]
Важность [ править ]
Концепция правильно сформированного документа позволяет лучше понять фундаментальную конструкцию XML. Это помогает прояснить XML за пределами его обычного смысла. Например, хотя в большинстве определений типов XML- документов в качестве разделителей содержимого используются левая и правая угловые скобки, строго говоря, в этом нет необходимости (хотя разделитель должен быть кратким и лаконичным). Коды левой и правой угловых скобок - это соглашение, хотя и четкое и четкое, но не абсолютное требование.
Концепция правильно сформированного документа также позволяет понять абстрактную природу XML. На самом деле XML не существует. [ необходима цитата ] Скорее, XML - это принцип, который представляет собой набор поведения и практик. Можно обсуждать типы XML, выраженные в определении типа документа (DTD).
Правильно сформированные документы также обращают внимание на проблему правильного и правильного XML. Согласно W3 Organization, действительными документами являются те, которые подтверждаются DTD. Правила действительности означают, что документ соответствует ограничениям, установленным в DTD. Таким образом, теги или объекты должны соответствовать правилам и отношениям, установленным в DTD. Однако нет никакого контроля над правильностью тега или объекта. Таким образом, тег заголовка первого уровня может быть применен к объекту заголовка второго уровня и быть действительным, хотя и неправильным.
Акцент на правильно оформленные документы получил развитие в издательской индустрии, где использование информации, разделенной левыми и правыми угловыми скобками, стало проблематичным. [ необходима цитата ] Акцент на правильно сформированный документ позволяет управлять определением, разграничением и вложением контента в программах, которые сами по себе не являются XML, но обладают характеристиками или потенциалом для правильного формирования.
Инструменты проверки [ править ]
Существует несколько инструментов, позволяющих определить, правильно ли сформирован данный XML-документ. Один из примеров:
См. Также [ править ]
Ссылки [ править ]
- ^ «XML: документ» . Британская компания веб-дизайна . Проверено 11 августа 2013 года .[ мертвая ссылка ]
- ^ «Правильно сформированные XML-документы» . Сеть разработчиков JCommerce . Архивировано из оригинального 22 августа 2009 года.
- ^ «Нет никаких исключений из Закона Постела» . Погрузитесь в Марка . Интернет-архив. Архивировано из оригинального 10 мая 2013 года . Проверено 11 августа 2013 года .
- ^ a b "Дракон и Постел" , 2003/08/19, Тим Брей
- ^ «История драконовской обработки ошибок в XML» . Погрузитесь в Марка . Интернет-архив. Архивировано из оригинального 18 августа 2013 года . Проверено 11 августа 2013 года .
- ^ "Закон Постела не имеет исключений" , 18 августа 2003 г. Аарон Шварц