Форматированный текст , стилизованный текст или форматированный текст , в отличие от обычного текста , содержит информацию о стилях, выходящую за рамки минимума семантических элементов: цвета, стили (полужирный, курсив), размеры и специальные функции в HTML (например, гиперссылки ).
Терминология [ править ]
Форматированный текст нельзя правильно идентифицировать с двоичными файлами или отличать от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, он может быть только текстовым, например HTML , RTF или расширенными текстовыми файлами, и он может быть только ASCII. И наоборот, простой текстовый файл может быть не-ASCII (в такой кодировке, как Unicode UTF-8 ). [ требуется дальнейшее объяснение ] Текст в формате только текста достигается с помощью разметки, которая также является текстовой, в то время как некоторые редакторы форматированного текста, такие как Microsoft Word, сохраняют в двоичном формате.
Начало форматированного текста [ править ]
Форматированный текст берет свое начало в докомпьютерном использовании подчеркивания для придания смелости отрывкам в машинописных рукописях . В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи восполняли этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве заменителей. Акцент, например, может быть достигнут в ASCII несколькими способами:
- Использование заглавных букв: Я НЕ придумываю это.
- Обрамление подчеркиванием: я _не_ выдумываю это.
- Обводка звездочками: Я * не * выдумываю.
- Интервал: я не придумываю.
Символы подчеркивания также использовались для названий книг: поищите в _The_C_Programming_Language_.
Языки разметки [ править ]
Форматирование может быть отмечено тегами, которые отличаются от основного текста специальными символами, такими как угловые скобки в HTML . Например, этот текст:
- В таксономии собака классифицируется как Canis lupus knownis.
размечен в HTML таким образом:
< p > В таксономии собака классифицируется как < i > Canis lupus familis </ i > . </ p >
Текст, выделенный курсивом, заключен в открывающий и закрывающий теги курсивом. В LaTeX текст был бы размечен следующим образом:
В таксономии собака классифицируется как \ textit { Canis lupus knownis } .
Большинство языков разметки можно редактировать с помощью любого текстового редактора без специального программного обеспечения . Многие языки разметки также можно редактировать с помощью специального программного обеспечения, предназначенного для автоматизации некоторых функций или представления вывода как WYSIWYG .
Файлы отформатированных документов [ править ]
С момента изобретения MacWrite , первого текстового процессора WYSIWYG , в котором машинист кодирует форматирование визуально, а не вставляя текстовую разметку, текстовые процессоры имеют тенденцию сохранять в двоичных файлах . Открытие таких файлов в текстовом редакторе показывает, что они встроены в различные двоичные символы либо вокруг форматированного текста (например, в WordPerfect ), либо отдельно от него, в начале или в конце файла (например, в Microsoft Word ).
Однако отформатированные текстовые документы в двоичных файлах имеют недостатки, связанные с объемом форматирования и секретностью. В то время как степень форматирования точно обозначена на языках разметки, форматирование WYSIWYG основано на памяти, то есть, например, удерживая нажатие жирной кнопки до отмены. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматы файлов с форматированными текстовыми документами, как правило, являются собственностью и недокументированы, что приводит к трудностям с совместимостью кодирования третьими сторонами, а также к ненужным обновлениям из-за изменений версии.
WordStar был популярным текстовым процессором, в котором не использовались двоичные файлы со скрытыми символами.
OpenOffice.org Writer сохраняет файлы в формате XML . Однако результирующий файл является двоичным, поскольку он сжат ( эквивалент tarball ).
PDF - это еще один форматированный текстовый формат файла, который обычно является двоичным (с использованием сжатия текста и хранения графики и шрифтов в двоичном формате). Как правило, это формат конечного пользователя, написанный из приложения, такого как Microsoft Word или OpenOffice.org Writer, и не редактируемый пользователем после завершения.
См. Также [ править ]
- Кодировка текста
- Онлайн-редактор форматированного текста
- Допечатная подготовка
Внешние ссылки [ править ]
- Текстовые процессоры: глупо и неэффективно , Аллин Коттрелл (авторское мнение)