Двоичный формат составного файла


Двоичный формат составного файла (CFBF), также называемый составным файлом , форматом составного документа , [1] или составным файлом документа V2 [2] (CDF), представляет собой формат составного файла документа для хранения многочисленных файлов и потоков в одном файле на диск. CFBF разработан Microsoft и является реализацией Microsoft COM Structured Storage . [3] [4] [5]

Microsoft открыла формат для использования другими, и теперь он используется в различных программах от Microsoft Word и Microsoft Access до Business Objects. [ Править ] Он также формирует основу Advanced Authoring Format . [6]

В самом простом случае двоичный формат составного файла представляет собой контейнер с небольшими ограничениями на то, что может храниться в нем.

Файловая структура CFBF во многом напоминает файловую систему FAT . Файл разделен на секторы , которые объединены в цепочку с таблицей размещения файлов (не путать с файловой системой с тем же именем), которая содержит цепочки секторов, связанных с каждым файлом, а каталог содержит информацию для содержащихся файлов с идентификатором сектора. (SID) для начального сектора цепочки и так далее.

Файл CFBF состоит из 512-байтовой записи заголовка, за которой следует ряд секторов, размер которых определяется в заголовке. В литературе длина секторов определяется как 512 или 4096 байт, хотя формат потенциально способен поддерживать сектора размером от 128 байт и выше в степени 2 (128, 256, 512, 1024 и т. д.). Нижний предел 128 — это минимум, необходимый для размещения одной записи каталога в секторе каталога. [ актуально? ]

Заголовок CFBF занимает первые 512 байт файла и информацию, необходимую для интерпретации остальной части файла. Объявление структуры C-Style ниже (извлеченное из спецификации низкоуровневого контейнера AAFA) показывает элементы заголовка CFBF и их назначение: