PDF / A является ISO -standardized версии Portable Document Format (PDF) специализированной для использования в архивном и долгосрочном хранении в электронных документах . PDF / A отличается от PDF тем, что запрещает функции, непригодные для долгосрочного архивирования, такие как связывание шрифтов (в отличие от встраивания шрифтов ) и шифрование. [1] Требования ISO для средств просмотра файлов PDF / A включают руководство по управлению цветом , поддержку встроенных шрифтов и пользовательский интерфейс для чтения встроенных аннотаций .
Расширение имени файла | .pdf |
---|---|
Тип интернет-СМИ | application / pdf |
Типовой код | 'PDF' (включая одиночный пробел) |
Единый идентификатор типа (UTI) | com.adobe.pdf |
Магическое число | %PDF |
Разработано | ISO |
Первый выпуск | 1 октября 2005 г . |
Расширен с | |
Стандарт | ISO 19005 |
Стандарты
Сокр. | Подзаголовок | Опубликовано | Стандарт | На основе | Ref. |
---|---|---|---|---|---|
PDF / A-1 | Часть 1: Использование PDF 1.4 | 2005-09-28 | ISO 19005-1 | PDF 1.4 ( Adobe Systems , справочник PDF , третье издание) | [2] |
PDF / A-2 | Часть 2: Использование ISO 32000-1 | 2011-06-20 | ISO 19005-2 | PDF 1.7 (ISO 32000-1: 2008) | [3] |
PDF / A-3 | Часть 3: Использование ISO 32000-1 с поддержкой встроенных файлов | 2012-10-15 | ISO 19005-3 | PDF 1.7 (ISO 32000-1: 2008) | [4] |
PDF / A-4 | Часть 4: Использование ISO 32000-2 | 2020-11 | ISO 19005-4 | PDF 2.0 (ISO 32000-2: 2020) | [5] |
Задний план
PDF - это стандарт кодирования документов в распечатанном виде, который можно переносить между системами. Однако пригодность файла PDF для архивного хранения зависит от параметров, выбранных при создании PDF: в первую очередь, от того, нужно ли встраивать необходимые шрифты для визуализации документа; использовать ли шифрование; и следует ли сохранять дополнительную информацию из исходного документа помимо той, которая необходима для его печати.
PDF / A изначально был новым совместным мероприятием Ассоциации поставщиков технологий печати, публикации и преобразования ( NPES ) и Ассоциации по управлению информацией и изображениями для разработки международного стандарта, определяющего использование формата переносимых документов (PDF) для архивирования. документы. [6] Цель состояла в том, чтобы удовлетворить растущую потребность в электронном архивировании документов таким образом, чтобы обеспечить сохранность их содержимого в течение длительного периода времени и гарантировать, что эти документы можно будет найти и отобразить с последовательным и предсказуемым результатом. в будущем. [7] Эта потребность существует во многих государственных, промышленных и академических сферах по всему миру, включая правовые системы, библиотеки, газеты и регулируемые отрасли. [8]
Описание
Стандарт PDF / A не определяет стратегию архивирования или цели архивной системы. Он определяет «профиль» электронных документов, который гарантирует, что документы могут быть воспроизведены точно так же с использованием различного программного обеспечения в ближайшие годы. Ключевым элементом этой воспроизводимости является требование, чтобы документы PDF / A были на 100% автономными. Вся информация, необходимая для отображения документа таким же образом, встроена в файл. Это включает, но не ограничивается, все содержимое (текст, растровые изображения и векторная графика), шрифты и информацию о цвете. Документу PDF / A не разрешается полагаться на информацию из внешних источников (например, программы шрифтов и потоки данных), но он может включать аннотации (например, гипертекстовые ссылки), которые ссылаются на внешние документы. [9]
Другие ключевые элементы соответствия PDF / A включают: [10] [11] [12]
- Аудио и видео контент запрещен.
- Запрещены запуски JavaScript и исполняемых файлов.
- Все шрифты должны быть встроены, а также должны быть встраиваемыми на законных основаниях для неограниченного универсального рендеринга. Это также относится к так называемым стандартным шрифтам PostScript, таким как Times или Helvetica .
- Цветовые пространства указаны независимо от устройства.
- Шифрование запрещено.
- Требуется использование стандартных метаданных.
- Ссылки на внешний контент запрещены.
- LZW запрещен из-за ограничений интеллектуальной собственности. Модели сжатия изображений JPEG 2000 не допускаются в PDF / A-1 (на основе PDF 1.4), поскольку это было впервые представлено в PDF 1.5. Сжатие JPEG 2000 разрешено в PDF / A-2 и PDF / A-3.
- Прозрачные объекты и слои (необязательные группы содержимого) запрещены в PDF / A-1, но разрешены в PDF / A-2.
- Положения для цифровых подписей в соответствии со стандартом PAdES ( расширенные электронные подписи PDF ) поддерживаются в PDF / A-2.
- Встроенные файлы запрещены в PDF / A-1, но PDF / A-2 позволяет встраивать файлы PDF / A, облегчая архивирование наборов документов PDF / A в один файл. PDF / A-3 позволяет встраивать файлы любого формата, такие как XML, CAD и другие, в документы PDF / A.
- Использование форм XML Forms Architecture (XFA) на основе XML запрещено в PDF / A. (Данные формы XFA могут быть сохранены в файле PDF / A-2 путем перехода от ключа XFA к дереву имен, которое само является значением ключа XFAResources словаря имен словаря каталога документов.)
- Поля интерактивной формы PDF должны иметь словарь внешнего вида, связанный с данными поля. При визуализации поля следует использовать словарь внешнего вида.
Уровни соответствия и версии
PDF / A-1
Часть 1 стандарта была впервые опубликована 28 сентября 2005 г. [2] и определяет два уровня соответствия для файлов PDF: [13]
- PDF / A-1b - соответствие уровню B (базовый)
- PDF / A-1a - соответствие уровню A (доступный)
Соответствие уровню B требует только соблюдения стандартов, необходимых для надежного воспроизведения внешнего вида документа, в то время как соответствие уровню A включает все требования уровня B в дополнение к функциям, предназначенным для улучшения доступности документа .
Дополнительные требования уровня А:
- Спецификация языка
- Иерархическая структура документа
- Отмеченные фрагменты текста и описательный текст для изображений и символов
- Отображение символов в Unicode
Соответствие уровня A было предназначено для повышения доступности соответствующих файлов для пользователей с физическими недостатками, позволяя вспомогательному программному обеспечению, например программам чтения с экрана , более точно извлекать и интерпретировать содержимое файла. [13] Более поздний стандарт, PDF / UA , был разработан для устранения того, что считалось некоторыми недостатками PDF / A, заменив многие из его общих рекомендаций более подробными техническими спецификациями. [14]
PDF / A-2
Часть 2 стандарта, опубликованная 20 июня 2011 г. [3], касается некоторых новых функций, добавленных в версиях 1.5, 1.6 и 1.7 Справочника PDF. Файлы PDF / A-1 не обязательно будут соответствовать PDF / A-2, а файлы, совместимые с PDF / A-2, не обязательно будут соответствовать PDF / A-1.
Часть 2 стандарта PDF / A основана на PDF 1.7 (ISO 32000-1), а не на PDF 1.4, и предлагает ряд новых функций:
- Сжатие изображений JPEG 2000
- поддержка эффектов прозрачности и слоев
- встраивание шрифтов OpenType
- положения о цифровых подписях в соответствии со стандартом PDF Advanced Electronic Signatures - PAdES
- возможность встраивания файлов PDF / A для облегчения архивирования наборов документов в один файл. [11]
Часть 2 определяет три уровня соответствия. PDF / A-2a и PDF / A-2b соответствуют уровням соответствия a и b в PDF / A-1. Новый уровень соответствия, PDF / A-2u, представляет собой соответствие Уровню B (PDF / A-2b) с дополнительным требованием, чтобы весь текст в документе имел отображение Unicode. [13] [15]
PDF / A-3
Часть 3 стандарта, опубликованная 15 октября 2012 г. [4], отличается от PDF / A-2 только в одном отношении: она позволяет встраивать файлы произвольных форматов (например, XML, CSV, CAD, текстовые документы, электронные таблицы). документы и другие) в документы, соответствующие формату PDF / A. [16]
PDF / A-4
Часть 4 стандарта, основанная на PDF 2.0, была опубликована в конце 2020 года [17].
Как создать файл PDF / A
Архивы иногда запрашивают у своих пользователей отправку файлов PDF / A. Таким образом, они предоставляют своим пользователям информацию о том, как конвертировать их файлы в формат PDF / A. Существует несколько методов с использованием стандартного программного обеспечения, которые отличаются временем вычислений, а также сохранением ссылок, уравнений, векторных графиков и специальных символов. [18]
При преобразовании документов в формат PDF / A требуется визуальная проверка, поскольку ошибки в визуальном содержании являются обычным явлением. В тестовой выборке 11 процентов созданного документа PDF / A-1b содержали визуальные артефакты. Эти ошибки воспроизводимости включали проблемы с векторной графикой (прозрачные объекты), потерю ссылок, потерю другого содержимого документа (нечитаемые символы, отсутствующий текст, отсутствие части документа), обновленные поля (отражающие время или папку преобразования) и орфографические ошибки. [19] Таким образом, архивы обычно не конвертируются в PDF / A. Вместо этого некоторые архивы просят своих пользователей предоставить документ PDF / A. Типичные настройки компьютера предусматривают несколько методов преобразования документов в формат PDF / A с различными плюсами и минусами. [20]
Преобразование простого PDF (до версии 1.4) в PDF / A-2 обычно работает должным образом, за исключением проблем с глифами . По данным ассоциации PDF Association, «Проблемы могут возникать до и / или во время создания PDF-файлов. Файл PDF / A может быть формально правильным, но все еще содержать неправильные глифы. Только тщательная визуальная проверка может выявить эту проблему. Поскольку проблемы с генерацией также влияют на Отображение Unicode, проблема привлекает внимание, когда выполняется визуальная проверка извлеченного текста. В PDF / A использование текста / шрифта указывается достаточно однозначно, чтобы гарантировать, что он не может быть неправильным. Если средства просмотра или принтеры не предлагают полную поддержку для систем кодирования это может привести к проблемам с PDF / A ". [21] Это означает, что для того, чтобы документ полностью соответствовал стандарту, он будет правильным внутри, в то время как система, используемая для просмотра или печати документа, может дать нежелательные результаты.
Документ, созданный с помощью преобразования оптического распознавания символов (OCR) в PDF / A-2 или PDF / A-3, не поддерживает этот notdefglyph
флаг. Следовательно, этот тип преобразования может привести к необработанному содержимому.
Стандартные документы PDF / A можно создавать с помощью следующего программного обеспечения: SoftMaker Office 2021 [22] [ круговая ссылка ] , MS Word 2010 и новее, Adobe Acrobat Distiller, PDF Creator, OpenOffice или LibreOffice с версии 3.0, LaTeX с надстройками pdfx или pdfTeX или с помощью виртуального принтера PDF (Adobe Acrobat Pro, PDF24, FreePDF + Ghostscript). [23]
Идентификация
Документ PDF / A может быть идентифицирован как таковой с помощью специфичных для PDF / A метаданных, расположенных в пространстве имен "http://www.aiim.org/pdfa/ns/id/". Эти метаданные представляют собой заявление о соответствии; сам по себе он не гарантирует соответствия:
- PDF-документ может быть PDF / A-совместимым, за исключением отсутствия метаданных PDF / A. Это может произойти, например, с документами, которые были созданы до определения стандарта PDF / A авторами, осведомленными о функциях, которые представляют проблемы с долгосрочным сохранением.
- документ PDF может быть идентифицирован как PDF / A, но может неправильно содержать функции PDF, не разрешенные в PDF / A; следовательно, документы, которые заявляют, что они соответствуют требованиям PDF / A, должны быть проверены на соответствие PDF / A. [24]
Проверка
Проверка документов PDF / A предпринимается, чтобы выявить, действительно ли созданный файл является файлом PDF / A или нет. К сожалению, валидаторы PDF / A часто не соглашаются с этим, поскольку интерпретация стандартов PDF / A не всегда ясна. [19]
Набор тестов Isartor
Отраслевое сотрудничество в рамках оригинального центра компетенции PDF / A привело к разработке Isartor Test Suite в 2007 и 2008 годах. Набор тестов состоит из 204 файлов PDF, специально созданных для систематического несоблюдения каждого из требований соответствия PDF / A-1b, что позволяет разработчики должны проверить способность своего программного обеспечения проверять соответствие самому базовому уровню соответствия стандарту. [25] [26] К середине 2009 года набор тестов уже заметно изменил общее качество программного обеспечения для проверки PDF / A. [27]
veraPDF
Консорциум veraPDF, возглавляемый Open Preservation Foundation [28] и PDF Association, был создан в ответ на задачу PREFORMA [29] Европейской комиссии по разработке валидатора с открытым исходным кодом для формата PDF / A. PDF Association создала техническую рабочую группу по валидации PDF в ноябре 2014 года, чтобы сформулировать план разработки поддерживаемого отраслью валидатора PDF / A. [30] [ неудачная проверка ]
Консорциум veraPDF впоследствии выиграл этап 2 контракта PREFORMA в апреле 2015 года. [31] Разработка продолжалась в течение 2016 года [32], причем этап 2 был завершен по графику к декабрю 2016 года. Период тестирования и приемки этапа 3 завершился в июле 2017 года. veraPDF теперь охватывает все части (1, 2 и 3) и уровни соответствия (a, b, u) PDF / A.
veraPDF доступен для установки в Windows, macOS или Linux с помощью парсера PDF на основе PDFBox или "Greenfields". [33]
Программы просмотра PDF / A
Спецификация PDF / A также устанавливает некоторые требования к соответствующей программе просмотра PDF / A, которая должна
- игнорировать любые данные, не описанные стандартами PDF и PDF / A;
- игнорировать любую информацию о линеаризации, предоставленную файлом;
- используйте только встроенные шрифты (а не любые локально доступные, замененные или смоделированные шрифты);
- отображение только с использованием встроенного цветового профиля;
- убедитесь, что поля формы не изменяют визуализированное представление и отображаются без учета данных формы;
- убедитесь, что аннотации отображаются единообразно.
При обнаружении файла, который заявляет о соответствии PDF / A, некоторые программы просмотра PDF по умолчанию переходят в специальный «режим просмотра PDF / A», чтобы выполнить соответствующие требования читателя. Например, Adobe Acrobat и Adobe Reader 9 включают предупреждение, чтобы сообщить пользователю, что режим просмотра PDF / A активирован. Некоторые программы просмотра PDF позволяют пользователям отключать режим просмотра PDF / A или удалять информацию PDF / A из файла. [34] [35]
Прием
Документ PDF / A должен включать все используемые шрифты; соответственно, файл PDF / A часто будет больше, чем эквивалентный файл PDF, не содержащий встроенных шрифтов.
Использование прозрачности запрещено в PDF / A-1. Большинство инструментов создания PDF-файлов, которые обеспечивают соответствие документа PDF / A, например экспорт PDF в OpenOffice.org или инструмент экспорта PDF в пакетах Microsoft Office 2007, также делают любые прозрачные изображения в данном документе непрозрачными. Это ограничение было снято в PDF / A-2. [10]
Некоторые архивисты выразили опасения, что PDF / A-3, который позволяет встраивать произвольные файлы в документы PDF / A, может привести к обходу процедур учреждения памяти и ограничениям на архивные форматы. [36]
Ассоциация PDF рассмотрела различные заблуждения [37] относительно PDF / A в своей публикации «PDF / A in a Nutshell 2.0». [38]
Смотрите также
- Цифровой темный век
- PDF / E - для инженерно-технической документации
- PDF / X - еще одно подмножество стандарта PDF, оптимизированное для печатной продукции.
- PDF / VT - для переменной и транзакционной печати
Рекомендации
- ^ Oettler Александра (2013-02-07). «Факты PDF / A - введение в стандарт» . PDF Association . Проверено 11 июля 2014 .
- ^ а б «ISO 19005-1: 2005» . ISO . Проверено 27 июля 2016 .
- ^ а б «ISO 19005-2: 2011» . ISO . Проверено 27 июля 2016 .
- ^ а б «ISO 19005-3: 2012» . ISO . Проверено 27 июля 2016 .
- ^ «ISO 19005-4: 2020» . ISO . Проверено 2021 февраля .
- ^ «Краткая история PDF / A» . PDF Association . 2013-02-07 . Проверено 11 июля 2014 .
- ^ Эттлер, Александра (07.02.2013). «Наиболее важные причины для использования PDF / A» . PDF Association . Проверено 11 июля 2014 .
- ^ Эттлер, Александра (07.02.2013). «Типичное использование PDF / A» . PDF Association . Проверено 11 июля 2014 .
- ^ Эттлер, Александра (07.02.2013). «Техническая сторона стандарта PDF / A» . PDF Association . Архивировано 2 июля 2015 года . Проверено 7 августа 2017 .CS1 maint: bot: исходный статус URL неизвестен ( ссылка )
- ^ а б «PDF / A - Взгляд на техническую сторону» . Архивировано из оригинала на 2011-07-26 . Проверено 6 июля 2011 .
- ^ а б «Стандарт PDF / A-2, опубликованный ISO! Новый стандарт включает значительные технические усовершенствования» . 2011-07-01 . Проверено 6 июля 2011 .
- ^ Часто задаваемые вопросы (FAQ) - ISO 19005-1: 2005 - PDF / A-1, Дата: 10 июля 2006 г. (PDF) , 2006-07-10, заархивировано из исходного (PDF) 18 января 2012 г. , извлечено 2011-07-06
- ^ а б в «Улучшенный PDF / A-1b» . PDF Association . 2011-08-05. Архивировано из оригинала на 2012-09-15 . Проверено 26 сентября 2012 .
- ^ Эттлер, Александра (07.02.2013). «PDF / A и другие стандарты PDF» . PDF Association . Архивировано из оригинала на 2014-07-14 . Проверено 12 июля 2014 .
- ^ PDF / A-2, PDF для долгосрочного хранения, Использование ISO 32000-1 (PDF 1.7) , Библиотека Конгресса , извлечено 2012-09-26
- ^ «Ассоциация PDF проводит свой первый семинар по PDF / A, чтобы включить стандарты 1–3» . PDF Association . 2012-03-29. Архивировано из оригинала на 2012-09-15.
- ^ Новый PDF 2.0 и подмножество стандартов (PDF Association)
- ^ "Как мне создать файл PDF / A?" . Инновации @ ETH-Bibliothek . 2017-02-15 . Проверено 29 апреля 2020 .
- ^ а б Сури, Роланд Эрвин; Эль-Саад, Мохамед (6 июня 2018 г.). «Потеряно при миграции: качество документа для пакетного преобразования в PDF / A». Библиотека Hi Tech (опережающая печать): LHT – 10–2017-0220. DOI : 10,1108 / LHT-10-2017-0220 . ЛВП : 20.500.11850 / 269199 . ISSN 0737-8831 .
- ^ Сури, Роланд (15 февраля 2017 г.). «Как мне создать файл PDF / A?». DOI : 10,16911 / ETHZ-IB-2722-де . Цитировать журнал требует
|journal=
( помощь ) - ^ PDF / A - Взгляд на техническую сторону , получено 14 августа 2015 г.
- ^ SoftMaker Office
- ^ ИНСТРУКЦИИ ПО СОЗДАНИЮ ФАЙЛОВ, СООТВЕТСТВУЮЩИМ PDF / A, ДЛЯ ОНЛАЙН-ПУБЛИКАЦИИ В ТУ БЕРЛИН
- ^ Эттлер, Александра (07.02.2013). «Проверка: действительно ли это PDF / A?» . PDF Association . Проверено 11 июля 2014 .
- ^ Isartor Test Suite (PDF) . PDF / A Центр компетенции. 2008-08-12 . Проверено 23 сентября 2016 .
- ^ "Isartor Test Suite" . PDF Association . 2011-08-03 . Проверено 23 сентября 2016 .
- ^ «Отчет Баварии» . PDFlib . 2009. Архивировано 21 апреля 2015 года . Проверено 30 апреля 2015 .CS1 maint: неподходящий URL ( ссылка )
- ^ «Проект veraPDF Фонда Открытого Сохранения» . Фонд «Открытое сохранение» . Проверено 30 апреля 2015 .
- ^ PREFORMA, проект, финансируемый Комиссией ЕС
- ^ «Консорциум, включающий PDF Association, выигрывает фазу 1 тендера Комиссии ЕС на создание валидатора PDF / A с открытым исходным кодом» . PDF Association . 2014-11-13. Архивировано из оригинала на 2015-04-21 . Проверено 30 апреля 2015 .
- ^ PREFORMA начинает фазу прототипирования , получено 30 апреля 2015 г.
- ^ "Выпущен veraPDF 0.22" . Проверено 23 сентября 2016 года .
- ^ «Программное обеспечение» . veraPDF . 30 июня 2015 . Проверено 15 марта 2017 . Страница для загрузки установщика для конкретной платформы.
- ^ «Как удалить информацию PDF / A из файла» . Проверено 10 апреля 2014 .
- ^ «Изменить режим просмотра PDF / A» . Проверено 10 апреля 2014 .
- ^ Архивисты: Нет цветов для PDF / A-3 , получено 12 июля 2014 г.
- ^ Мифы и легенды, окружающие PDF / A , получено 15 февраля 2018 г.
- ^ «PDF / A в двух словах 2.0» .
дальнейшее чтение
- PDF / A in a Nutshell 2.0 - опубликовано Ассоциацией PDF (2013 г.)
- PDF / A 101: Введение - презентация с Первой международной конференции PDF / A (2008 г.)
- Официальный документ: PDF / A - Основы - от PDF Tools AG (2009 г.)
- Описание формата для PDF / A-1 - на digitalpreservation.gov
Внешние ссылки
- PDF Ассоциация
- PDF / A Центр компетенций
- veraPDF - программное обеспечение для проверки PDF / A