Из Википедии, бесплатной энциклопедии
  (Перенаправлено с .doc )
Перейти к навигации Перейти к поиску

Формат doc - это компьютерный формат файла для текстовых документов.

Формат двоичного файла Microsoft Word [ править ]

Двоичные файлы DOC часто содержат больше информации о форматировании текста (а также скрипты и информацию об отмене), чем некоторые другие форматы файлов документов, такие как Rich Text Format и Hypertext Markup Language , но обычно менее широко совместимы .

Файлы DOC, созданные с помощью версий Microsoft Word, различаются. Версии Microsoft Word до Word 97 («8.0») использовали формат, отличный от формата Microsoft Word 97 - 2003 на основе OLE / CFBF.

В Microsoft Word 2007 и более поздних версиях двоичный формат файла был заменен в качестве формата по умолчанию на формат Office Open XML , хотя Microsoft Word все еще может создавать файлы DOC.

Поддержка приложений [ править ]

Формат DOC является родным для Microsoft Word. Другие текстовые процессоры , такие как OpenOffice.org Writer , IBM Lotus Symphony , Apple Pages и AbiWord , также могут создавать и читать файлы DOC, хотя и с некоторыми ограничениями. Программы командной строки для Unix-подобных операционных систем, которые могут конвертировать файлы из формата DOC в обычный текст или другие стандартные форматы, включают библиотеку wv , которая сама используется непосредственно AbiWord .

Спецификация [ править ]

Поскольку формат файла DOC был закрытой спецификацией в течение многих лет, непоследовательная обработка формата сохраняется и может вызвать некоторую потерю информации о форматировании при обработке одного и того же файла несколькими программами обработки текста. Некоторые спецификации для форматов двоичных файлов Microsoft Office 97 были опубликованы в 1997 году под ограничительной лицензией, но эти спецификации были удалены из онлайн-загрузки в 1999 году. [1] [2] [3] [4] Спецификации более поздних версий двоичного файла Microsoft Office форматы не были общедоступными. Спецификация формата DOC была доступна от Microsoft по запросу [5] с 2006 года [6] на ограничительных условиях RAND-Z до февраля 2008 года. Sun Microsystemsи OpenOffice.org реконструировал формат файла. [7] 15 февраля 2008 г. Microsoft выпустила спецификацию формата .DOC [8] [9] [10] в рамках обещания открытой спецификации Microsoft . [11] [12] Однако эта спецификация не описывает все функции, используемые форматом DOC, и работа по обратному проектированию остается необходимой. [13] С 2008 года спецификация несколько раз обновлялась; последнее изменение было внесено в ноябре 2019 года.

Формат, использовавшийся в более ранних версиях Word до 97 (с "1.0" 1989 по "7.0" 1995), менее известен, но и OpenOffice, и LibreOffice содержат код с открытым исходным кодом для чтения этих форматов. Этот формат, вероятно, связан с форматом «Stream», который есть в аналогичных версиях Excel. [14] Word 95, похоже, также имеет OLE-упакованную форму.

Другие форматы файлов [ править ]

В некоторых исторических документах может использоваться расширение имени файла DOC для текстового формата файла. Расширение имени файла DOC также использовалось в исторических версиях WordPerfect для его проприетарного формата.

Некоторые программные приложения используют имя DOC в сочетании с другими словами (такими как название производителя программного обеспечения) для различных форматов файлов. В качестве примера, на Palm OS , DOC представляет собой сокращенную PalmDoc , совершенно не связаны формат (обычно используя расширение файла PDB) , используемый для кодирования текстовых файлов , таких как электронные книги .

См. Также [ править ]

  • Стандарт де-факто
  • Доминирующий дизайн

Ссылки [ править ]

  1. ^ «Сравнение ODF и OOXML» (pdf) . 2006 . Проверено 23 мая 2011 .
  2. Beware of Geeks Bearing Gifts , 2006 , получено 23 мая 2011 г.
  3. ^ "Конвертер Word 8 для Unix" . Проверено 23 мая 2011 .
  4. ^ «Формат двоичного файла Microsoft Word 97» . Проверено 23 мая 2011 .
  5. ^ «Бесплатные спецификации для двоичных форматов файлов Microsoft Office» . Проверено 23 мая 2011 .
  6. ^ «Преобразование документов в двоичном формате (.doc; .xls; .ppt) в формат Open XML» . 2008-01-16 . Проверено 23 мая 2011 .
  7. ^ «Microsoft Compound Document Format» (PDF) . OpenOffice.org . 2007-08-07.
  8. ^ MS-DOC: Формат двоичного файла Word (.doc) , 19 ноября 2019 г. , получено 25 февраля 2020 г.
  9. ^ Двоичные форматы файлов Microsoft Office (doc, xls, ppt), 15 февраля 2008 г., заархивировано из оригинала 18 февраля 2008 г.
  10. ^ "Microsoft Office Word 97 - 2007 Спецификация формата двоичного файла (* .doc)" (PDF) . Корпорация Microsoft . 2008 г.
  11. ^ «Обещание открытой спецификации Microsoft» . Корпорация Microsoft . 23 марта 2009 г.
  12. ^ «Как извлечь информацию из файлов Office с помощью форматов и схем файлов Office» . Проверено 23 мая 2011 .
  13. Джоэл Спольски. «Почему форматы файлов Microsoft Office такие сложные? (И некоторые обходные пути)» . Архивировано из оригинала на 2013-10-14 . Проверено 23 мая 2011 .
  14. ^ "LibreOffice / ядро" . GitHub .

Внешние ссылки [ править ]

  • Спецификации DOC , XLS и PPT
  • Формат составных документов Microsoft - OpenOffice.org