Формат doc - это компьютерный формат файла для текстовых документов.
Формат двоичного файла Microsoft Word [ править ]
Двоичные файлы DOC часто содержат больше информации о форматировании текста (а также скрипты и информацию об отмене), чем некоторые другие форматы файлов документов, такие как Rich Text Format и Hypertext Markup Language , но обычно менее широко совместимы .
Файлы DOC, созданные с помощью версий Microsoft Word, различаются. Версии Microsoft Word до Word 97 («8.0») использовали формат, отличный от формата Microsoft Word 97 - 2003 на основе OLE / CFBF.
В Microsoft Word 2007 и более поздних версиях двоичный формат файла был заменен в качестве формата по умолчанию на формат Office Open XML , хотя Microsoft Word все еще может создавать файлы DOC.
Поддержка приложений [ править ]
Формат DOC является родным для Microsoft Word. Другие текстовые процессоры , такие как OpenOffice.org Writer , IBM Lotus Symphony , Apple Pages и AbiWord , также могут создавать и читать файлы DOC, хотя и с некоторыми ограничениями. Программы командной строки для Unix-подобных операционных систем, которые могут конвертировать файлы из формата DOC в обычный текст или другие стандартные форматы, включают библиотеку wv , которая сама используется непосредственно AbiWord .
Спецификация [ править ]
Поскольку формат файла DOC был закрытой спецификацией в течение многих лет, непоследовательная обработка формата сохраняется и может вызвать некоторую потерю информации о форматировании при обработке одного и того же файла несколькими программами обработки текста. Некоторые спецификации для форматов двоичных файлов Microsoft Office 97 были опубликованы в 1997 году под ограничительной лицензией, но эти спецификации были удалены из онлайн-загрузки в 1999 году. [1] [2] [3] [4] Спецификации более поздних версий двоичного файла Microsoft Office форматы не были общедоступными. Спецификация формата DOC была доступна от Microsoft по запросу [5] с 2006 года [6] на ограничительных условиях RAND-Z до февраля 2008 года. Sun Microsystemsи OpenOffice.org реконструировал формат файла. [7] 15 февраля 2008 г. Microsoft выпустила спецификацию формата .DOC [8] [9] [10] в рамках обещания открытой спецификации Microsoft . [11] [12] Однако эта спецификация не описывает все функции, используемые форматом DOC, и работа по обратному проектированию остается необходимой. [13] С 2008 года спецификация несколько раз обновлялась; последнее изменение было внесено в ноябре 2019 года.
Формат, использовавшийся в более ранних версиях Word до 97 (с "1.0" 1989 по "7.0" 1995), менее известен, но и OpenOffice, и LibreOffice содержат код с открытым исходным кодом для чтения этих форматов. Этот формат, вероятно, связан с форматом «Stream», который есть в аналогичных версиях Excel. [14] Word 95, похоже, также имеет OLE-упакованную форму.
Другие форматы файлов [ править ]
В некоторых исторических документах может использоваться расширение имени файла DOC для текстового формата файла. Расширение имени файла DOC также использовалось в исторических версиях WordPerfect для его проприетарного формата.
Некоторые программные приложения используют имя DOC в сочетании с другими словами (такими как название производителя программного обеспечения) для различных форматов файлов. В качестве примера, на Palm OS , DOC представляет собой сокращенную PalmDoc , совершенно не связаны формат (обычно используя расширение файла PDB) , используемый для кодирования текстовых файлов , таких как электронные книги .
См. Также [ править ]
- Стандарт де-факто
- Доминирующий дизайн
Ссылки [ править ]
- ^ «Сравнение ODF и OOXML» (pdf) . 2006 . Проверено 23 мая 2011 .
- ↑ Beware of Geeks Bearing Gifts , 2006 , получено 23 мая 2011 г.
- ^ "Конвертер Word 8 для Unix" . Проверено 23 мая 2011 .
- ^ «Формат двоичного файла Microsoft Word 97» . Проверено 23 мая 2011 .
- ^ «Бесплатные спецификации для двоичных форматов файлов Microsoft Office» . Проверено 23 мая 2011 .
- ^ «Преобразование документов в двоичном формате (.doc; .xls; .ppt) в формат Open XML» . 2008-01-16 . Проверено 23 мая 2011 .
- ^ «Microsoft Compound Document Format» (PDF) . OpenOffice.org . 2007-08-07.
- ^ MS-DOC: Формат двоичного файла Word (.doc) , 19 ноября 2019 г. , получено 25 февраля 2020 г.
- ^ Двоичные форматы файлов Microsoft Office (doc, xls, ppt), 15 февраля 2008 г., заархивировано из оригинала 18 февраля 2008 г.
- ^ "Microsoft Office Word 97 - 2007 Спецификация формата двоичного файла (* .doc)" (PDF) . Корпорация Microsoft . 2008 г.
- ^ «Обещание открытой спецификации Microsoft» . Корпорация Microsoft . 23 марта 2009 г.
- ^ «Как извлечь информацию из файлов Office с помощью форматов и схем файлов Office» . Проверено 23 мая 2011 .
- ↑ Джоэл Спольски. «Почему форматы файлов Microsoft Office такие сложные? (И некоторые обходные пути)» . Архивировано из оригинала на 2013-10-14 . Проверено 23 мая 2011 .
- ^ "LibreOffice / ядро" . GitHub .
Внешние ссылки [ править ]
- Спецификации DOC , XLS и PPT
- Формат составных документов Microsoft - OpenOffice.org