Форматированный текст , стилизованный текст или форматированный текст , в отличие от обычного текста , содержит информацию о стилях, выходящую за рамки минимума семантических элементов: цвета, стили (полужирный, курсив), размеры и специальные функции в HTML (например, гиперссылки ).
Терминология
Форматированный текст нельзя правильно идентифицировать с двоичными файлами или отличать от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, он может быть только текстом, например HTML , RTF или расширенными текстовыми файлами, и он может быть только ASCII. И наоборот, простой текстовый файл может быть не-ASCII (в такой кодировке, как Unicode UTF-8 ). [ требуется дальнейшее объяснение ] Текст, форматированный только для текста, достигается с помощью разметки, которая также является текстовой, в то время как некоторые редакторы форматированного текста, такие как Microsoft Word, сохраняют в двоичном формате.
Начало форматированного текста
Форматированный текст берет свое начало в докомпьютерном использовании подчеркивания для придания смелости отрывкам в машинописных рукописях . В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи восполняли этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве заменителей. Акцент, например, может быть достигнут в ASCII несколькими способами:
- Использование заглавных букв: Я НЕ придумываю это.
- Окружение подчеркиванием: Я _не_ выдумываю.
- Обводка звездочками: Я * не * выдумываю.
- Интервал: Я не выдумываю.
Знаки подчеркивания также использовались для названий книг: Посмотрите это на _The_C_Programming_Language_.
Языки разметки
Форматирование может быть отмечено тегами, которые отличаются от основного текста специальными символами, такими как угловые скобки в HTML . Например, такой текст:
- В таксономии собака классифицируется как Canis lupus knownis.
размечен в HTML таким образом:
< p > В таксономии собака классифицируется как < i > Canis lupus familis i > . p >
Текст, выделенный курсивом, заключен в открывающий и закрывающий теги курсивом. В LaTeX текст был бы размечен следующим образом:
В таксономии собака классифицируется как \ textit { Canis lupus knownis } .
Большинство языков разметки можно редактировать с помощью любого текстового редактора без специального программного обеспечения . Многие языки разметки также можно редактировать с помощью специального программного обеспечения, предназначенного для автоматизации некоторых функций или представления вывода как WYSIWYG .
Файлы отформатированных документов
С момента изобретения MacWrite , первого текстового процессора WYSIWYG , в котором машинист кодирует форматирование визуально, а не вставляя текстовую разметку, текстовые процессоры имеют тенденцию сохранять в двоичных файлах . Открытие таких файлов в текстовом редакторе показывает, что они встроены в различные двоичные символы либо вокруг форматированного текста (например, в WordPerfect ), либо отдельно от него, в начале или в конце файла (например, в Microsoft Word ).
Однако отформатированные текстовые документы в двоичных файлах имеют недостатки, связанные с объемом форматирования и секретностью. В то время как степень форматирования точно обозначена на языках разметки, форматирование WYSIWYG основано на памяти, то есть, например, удерживая нажатие жирной кнопки до отмены. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматы файлов с форматированными текстовыми документами, как правило, являются собственностью и недокументированы, что приводит к трудностям с совместимостью кодирования третьими сторонами, а также к ненужным обновлениям из-за изменений версии.
WordStar был популярным текстовым процессором, в котором не использовались двоичные файлы со скрытыми символами.
OpenOffice.org Writer сохраняет файлы в формате XML . Однако результирующий файл является двоичным, поскольку он сжат ( эквивалент tarball ).
PDF - это еще один форматированный текстовый формат файла, который обычно является двоичным (с использованием сжатия текста и хранения графики и шрифтов в двоичном формате). Как правило, это формат конечного пользователя, написанный из приложения, такого как Microsoft Word или OpenOffice.org Writer, и не редактируемый пользователем после завершения.
Смотрите также
Внешние ссылки
- Текстовые процессоры: глупые и неэффективные , Аллин Коттрелл (авторское мнение) [1]
- ^ Коттрелл, Аллин (1999-06-29). «Текстовые процессоры: глупые и неэффективные» . ricardo.ecn.wfu.edu . Архивировано 4 мая 2021 года . Проверено 12 мая 20 .