Из Википедии, бесплатной энциклопедии
  (Перенаправлено из Rich text )
Перейти к навигации Перейти к поиску

Форматированный текст , стилизованный текст или форматированный текст , в отличие от обычного текста , содержит информацию о стилях, выходящую за рамки минимума семантических элементов: цвета, стили (полужирный, курсив), размеры и специальные функции в HTML (например, гиперссылки ).

Терминология [ править ]

Форматированный текст нельзя правильно идентифицировать с двоичными файлами или отличать от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, он может быть только текстовым, например HTML , RTF или расширенными текстовыми файлами, и он может быть только ASCII. И наоборот, простой текстовый файл может быть не-ASCII (в такой кодировке, как Unicode UTF-8 ). [ требуется дальнейшее объяснение ] Текст в формате только текста достигается с помощью разметки, которая также является текстовой, в то время как некоторые редакторы форматированного текста, такие как Microsoft Word, сохраняют в двоичном формате.

Начало форматированного текста [ править ]

Форматированный текст берет свое начало в докомпьютерном использовании подчеркивания для придания смелости отрывкам в машинописных рукописях . В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи восполняли этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве заменителей. Акцент, например, может быть достигнут в ASCII несколькими способами:

  • Использование заглавных букв: Я НЕ придумываю это.
  • Обрамление подчеркиванием: я _не_ выдумываю это.
  • Обводка звездочками: Я * не * выдумываю.
  • Интервал: я не придумываю.

Символы подчеркивания также использовались для названий книг: поищите в _The_C_Programming_Language_.

Языки разметки [ править ]

Форматирование может быть отмечено тегами, которые отличаются от основного текста специальными символами, такими как угловые скобки в HTML . Например, этот текст:

В таксономии собака классифицируется как Canis lupus knownis.

размечен в HTML таким образом:

< p > В таксономии собака классифицируется как < i > Canis lupus familis </ i > . </ p >

Текст, выделенный курсивом, заключен в открывающий и закрывающий теги курсивом. В LaTeX текст был бы размечен следующим образом:

В таксономии собака классифицируется как \ textit { Canis lupus knownis } .

Большинство языков разметки можно редактировать с помощью любого текстового редактора без специального программного обеспечения . Многие языки разметки также можно редактировать с помощью специального программного обеспечения, предназначенного для автоматизации некоторых функций или представления вывода как WYSIWYG .

Файлы отформатированных документов [ править ]

С момента изобретения MacWrite , первого текстового процессора WYSIWYG , в котором машинист кодирует форматирование визуально, а не вставляя текстовую разметку, текстовые процессоры имеют тенденцию сохранять в двоичных файлах . Открытие таких файлов в текстовом редакторе показывает, что они встроены в различные двоичные символы либо вокруг форматированного текста (например, в WordPerfect ), либо отдельно от него, в начале или в конце файла (например, в Microsoft Word ).

Однако отформатированные текстовые документы в двоичных файлах имеют недостатки, связанные с объемом форматирования и секретностью. В то время как степень форматирования точно обозначена на языках разметки, форматирование WYSIWYG основано на памяти, то есть, например, удерживая нажатие жирной кнопки до отмены. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматы файлов с форматированными текстовыми документами, как правило, являются собственностью и недокументированы, что приводит к трудностям с совместимостью кодирования третьими сторонами, а также к ненужным обновлениям из-за изменений версии.

WordStar был популярным текстовым процессором, в котором не использовались двоичные файлы со скрытыми символами.

OpenOffice.org Writer сохраняет файлы в формате XML . Однако результирующий файл является двоичным, поскольку он сжат ( эквивалент tarball ).

PDF - это еще один форматированный текстовый формат файла, который обычно является двоичным (с использованием сжатия текста и хранения графики и шрифтов в двоичном формате). Как правило, это формат конечного пользователя, написанный из приложения, такого как Microsoft Word или OpenOffice.org Writer, и не редактируемый пользователем после завершения.

См. Также [ править ]

  • Кодировка текста
  • Онлайн-редактор форматированного текста
  • Допечатная подготовка

Внешние ссылки [ править ]

  • Текстовые процессоры: глупо и неэффективно , Аллин Коттрелл (авторское мнение)