Форматирование диска - это процесс подготовки устройства хранения данных, например жесткого диска , твердотельного накопителя , гибкого диска или флэш-накопителя USB, к первоначальному использованию. В некоторых случаях операция форматирования может также создать одну или несколько новых файловых систем . Первая часть процесса форматирования, которая выполняет базовую подготовку носителя, часто называется «низкоуровневым форматированием». [1] Разделение - это общий термин для второй части процесса, разделение устройства на несколько подустройств и, в некоторых случаях, запись информации на устройство, позволяющая загружать с него операционную систему . [1][2] Третья часть процесса, обычно называемая «высокоуровневым форматированием», чаще всего относится к процессу создания новой файловой системы. [1] В некоторых операционных системах все или части этих трех процессов могут быть объединены или повторены на разных уровнях [3], и термин «формат» понимается как означающий операцию, при которой новый дисковый носитель полностью подготовлен для хранения файлов . Некоторые утилиты форматирования позволяют различать быстрое форматирование, при котором не стираются все существующие данные, и длинный вариант, при котором стираются все существующие данные.
Как правило, [nb 1] форматирование диска по умолчанию оставляет большую часть, если не все существующие данные на носителе; некоторые или большинство из них можно восстановить с помощью привилегированных [nb 2] или специальных инструментов. [6] Специальные инструменты позволяют удалять пользовательские данные путем однократной перезаписи всех файлов и свободного места. [7]
Блок , смежное число байт, является минимальной единицей хранения, которая считывается и записана на диск с помощью драйвера диска. Самые ранние дисковые накопители имели фиксированные размеры блоков (например, размер блока дискового накопителя IBM 350 (конец 1950-х) составлял 100 шестибитных символов), но начиная с 1301 [8], продаваемых IBM подсистем, которые имели переменные размеры блоков: трек мог иметь блоки разного размера. Дисковые подсистемы и другие устройства хранения с прямым доступом в IBM System / 360 расширили эту концепцию в форме подсчета ключевых данных (CKD) и более поздних версий расширенных ключевых данных подсчета.(ECKD); однако использование блоков переменного размера в жестких дисках перестало использоваться в 1990-х годах; одним из последних жестких дисков, поддерживающих переменный размер блока, был IBM 3390 Model 9, анонсированный в мае 1993 года. [9]
Современные жесткие диски, такие как диски с последовательным интерфейсом SCSI (SAS) [nb 3] и Serial ATA (SATA) [10] , отображаются на своих интерфейсах как непрерывный набор блоков фиксированного размера; В течение многих лет длина 512 байт, но начиная с 2009 г. и ускоряясь до 2011 г., все основные производители жестких дисков начали выпускать платформы жестких дисков, использующие расширенный формат 4096-байтовых логических блоков. [11] [12]
На гибких дисках обычно использовались только блоки фиксированного размера, но эти размеры зависели от ОС хоста и ее взаимодействия с контроллером, так что конкретный тип носителя (например, 5¼-дюймовый DSDD) будет иметь разные размеры блоков в зависимости от ОС хоста и контроллер.
На оптических дисках обычно используются блоки только фиксированного размера.
Форматирование диска для использования операционной системой и ее приложениями обычно включает три разных процесса. [№ 4]
Низкоуровневое форматирование гибких дисков (и ранних жестких дисков) выполняется контроллером дисковода.
Для стандартной дискеты 1,44 МБ при низкоуровневом форматировании обычно записывается 18 секторов по 512 байт на каждую из 160 дорожек (по 80 с каждой стороны) дискеты, обеспечивая 1 474 560 байт памяти на диске.
Физические секторы на самом деле больше 512 байтов, так как в дополнение к 512-байтовому полю данных они включают поле идентификатора сектора, байты CRC (в некоторых случаях байты исправления ошибок ) и промежутки между полями. Эти дополнительные байты обычно не включаются в приведенную цифру для общей емкости хранения на диске.
На одном носителе могут использоваться разные низкоуровневые форматы ; например, записи большого размера могут использоваться для уменьшения размера промежутков между записями.
Несколько бесплатных , условно-бесплатных и условно- бесплатных программ (например, GParted , FDFORMAT , NFORMAT, VGA-Copy и 2M ) предоставили значительно больший контроль над форматированием, позволяя форматировать 3,5-дюймовые диски высокой плотности емкостью до 2 МБ.
Используемые методы включают:
Linux поддерживает секторы различного размера [13], а DOS и Windows поддерживают формат гибких дисков большого размера, отформатированный в формате DMF . [14]
Жесткие диски до 1990-х годов обычно имели отдельный контроллер диска, который определял, как данные кодировались на носителе. С носителями, приводом и / или контроллером, возможно, закупаемыми у разных поставщиков, пользователи часто могли выполнять низкоуровневое форматирование. Раздельная закупка также потенциально несовместима между отдельными компонентами, так что подсистема не может надежно хранить данные. [№ 5]
Спровоцированное пользователем низкоуровневое форматирование (LLF) жестких дисков было обычным явлением для миникомпьютеров и персональных компьютеров до 1990-х годов. IBM и другие поставщики систем мэйнфреймов обычно поставляли свои жесткие диски (или носители в случае жестких дисков со съемными носителями) с низкоуровневым форматом. Обычно это включает разделение каждой дорожки на диске на один или несколько блоков, которые будут содержать пользовательские данные и связанную с ними управляющую информацию. В разных компьютерах использовались блоки разных размеров, и IBM, в частности, использовала блоки переменного размера, но популярность IBM PC вынудила отрасль к середине 1980-х годов принять стандарт 512 байтов пользовательских данных на блок.
В зависимости от системы низкоуровневое форматирование обычно выполнялось служебной программой операционной системы. IBM-совместимые ПК использовали BIOS, который вызывается с помощью программы отладки MS-DOS , для передачи управления подпрограмме, скрытой по разным адресам в разных BIOS. [15]
Начиная с конца 1980-х годов, из-за увеличения количества IBM-совместимых ПК, жесткие диски стали доступны, как правило, предварительно отформатированными в совместимом низкоуровневом формате. В то же время отрасль перешла от традиционных (немых) битовых последовательных интерфейсов к современным (интеллектуальным) битовым последовательным интерфейсам и последовательным интерфейсам word, в которых низкоуровневое форматирование выполнялось на заводе. [16] [17] Соответственно, конечный пользователь не может выполнить низкоуровневое форматирование современного жесткого диска.
Этот раздел требует дополнительных ссылок для проверки . ( Июль 2009 г. ) |
Хотя это , как правило , невозможно выполнить полный LLF на большинстве современных жестких дисков (с середины 1990-х годов) за пределами завода, [18] термин «низкоуровневое форматирование» все еще используется для того, что можно было бы назвать переинициализация из жесткого в заводскую конфигурацию (и даже эти термины могут быть неправильно поняты).
Существующая в настоящее время двусмысленность в термине « низкоуровневый формат» , по-видимому, связана как с несогласованностью документации на веб-сайтах, так и с убеждением многих пользователей, что любой процесс ниже высокоуровневого формата (файловой системы) должен называться низкоуровневым форматом. Поскольку большая часть процесса низкоуровневого форматирования сегодня может выполняться только на заводе, различные производители приводов описывают на своих веб-сайтах программное обеспечение для повторной инициализации как служебные программы LLF. Поскольку у пользователей обычно нет возможности определить разницу между полным LLF и повторной инициализацией (они просто наблюдают, как запуск программного обеспечения приводит к высокоуровневому форматированию жесткого диска), как дезинформированный пользователь, так и смешанные сигналыот различных производителей приводов увековечили эту ошибку. Примечание: какое бы возможное неправильное использование таких терминов ни могло иметь место, многие сайты предоставляют такие утилиты повторной инициализации (возможно, как загрузочные дискеты или файлы образов компакт-дисков), чтобы перезаписывать каждый байт и проверять наличие поврежденных секторов на жестком диске.
Повторная инициализация должна включать в себя идентификацию (и, если возможно, резервирование) любых секторов, которые не могут быть записаны и считаны с диска, правильно. Этот термин, однако, использовался некоторыми для обозначения только части этого процесса, в котором выполняется запись в каждый сектор диска; обычно путем записи определенного значения в каждое адресуемое место на диске.
Традиционно физические секторы инициализировались значением заполнения 0xF6
согласно Таблице параметров диска INT 1Eh (DPT) во время форматирования на IBM-совместимых машинах. Это значение также используется в портфолио Atari . 8-дюймовые дискеты CP / M обычно поставлялись предварительно отформатированными со значением 0xE5
, [19], и посредством Digital Research это значение также использовалось на Atari ST и некоторых дискетах, отформатированных Amstrad . [nb 6] Amstrad иначе используется 0xF4
как значение заполнения. Некоторые современные программы форматирования стирают жесткие диски, используя 0x00
вместо этого значение , иногда также называемое заполнением нулями , тогда как значение0xFF
используется на флеш-дисках для уменьшения износа . Последнее значение обычно также является значением по умолчанию, используемым на дисках ROM (которые не могут быть переформатированы). Некоторые расширенные инструменты форматирования позволяют настраивать значение заливки. [№ 7]
Одним из популярных методов выполнения только операции заполнения нулями на жестком диске является запись байтов с нулевым значением на диск с помощью утилиты Unix dd с потоком / dev / zero в качестве входного файла и самого диска (или определенного раздела). ) в качестве выходного файла. [20] Выполнение этой команды может занять много часов и стереть все файлы и файловые системы.
Другой метод для дисков SCSI может заключаться в использовании команды sg_format [21] для выдачи низкоуровневой команды формата SCSI .
Обнуление диска не обязательно является безопасным методом стирания конфиденциальных данных [ неудачная проверка ] или подготовки диска к использованию с зашифрованной файловой системой. [22] Нулевое заполнение аннулирует правдоподобное отрицание этого процесса .
Разделение - это процесс записи информации в блоки устройства хранения или носителя для разделения устройства на несколько подустройств, каждое из которых обрабатывается операционной системой как отдельное устройство и, в некоторых случаях, позволяет операционной системе загрузиться с устройства.
В операционных системах MS-DOS , Microsoft Windows и UNIX (таких как BSD , Linux и Mac OS X ) это обычно делается с помощью редактора разделов , такого как fdisk , GNU Parted или Disk Utility . Эти операционные системы поддерживают несколько разделов.
Дискеты не разбиты на разделы; однако в зависимости от ОС им может потребоваться информация о томе для доступа ОС.
Сегодня редакторы разделов и ICKDSF не выполняют низкоуровневых функций для жестких дисков и оптических дисководов, таких как запись временных меток, и не могут повторно инициализировать современный диск, который был размагничен или иным образом потерял заводское форматирование.
Операционные системы IBM, унаследованные от CP-67 , например z / VM , поддерживают информацию о разделах для минидисков за пределами накопителя.
Форматирование высокого уровня - это процесс настройки пустой файловой системы на разделе диска или логического тома, а для ПК - установка загрузочного сектора . [1] Это часто быстрая операция, которую иногда называют быстрым форматированием .
При форматировании всего логического диска или раздела можно дополнительно выполнить сканирование на наличие дефектов, что может занять значительное время.
В случае гибких дисков, как высокоуровневое, так и низкоуровневое форматирование обычно выполняется программным обеспечением форматирования диска за один проход. Восьмидюймовые дискеты обычно поставлялись с низкоуровневым форматированием и были заполнены значением заполнителя формата 0xE5
. [19] [nb 6] С 1990-х годов большинство 5,25-дюймовых и 3,5-дюймовых дискет поставлялись предварительно отформатированными с завода как дискеты DOS FAT12 .
В современных операционных системах для мэйнфреймов IBM, производных от OS / 360 и DOS / 360 , таких как z / OS и z / VSE , форматирование дисков выполняется командой INIT утилиты ICKDSF . [23] Эти ОС поддерживают только один раздел на устройство, называемый томом. Функции ICKDSF включают запись записи 0 на каждую дорожку, запись текста IPL , создание метки тома, создание таблицы содержания тома.(VTOC) и, при желании, создание индекса VTOC (VTOCIX); высокоуровневое форматирование также может выполняться как часть выделения файла, специальной утилитой для файловой системы или, в некоторых старых методах доступа, «на лету» по мере записи новых данных. В z / OS Unix System Services существует три различных уровня высокоуровневого форматирования:
В операционных системах IBM, производных от CP-67 , при форматировании тома инициализируется дорожка 0 и фиктивный VTOC. Гостевые операционные системы отвечают за форматирование мини-дисков ; команда CMS FORMAT форматирует файловую систему CMS на минидиске CMS.
Защищенная область хоста, иногда называемая скрытой защищенной областью, представляет собой область жесткого диска, которая отформатирована на высоком уровне, так что эта область обычно не видна его операционной системе (ОС).
Переформатирование - это высокоуровневое форматирование, выполняемое на работающем диске, чтобы освободить носитель от его содержимого. Переформатирование уникально для каждой операционной системы, потому что то, что на самом деле делается с существующими данными, зависит от ОС. Наиболее важным аспектом процесса является освобождение дискового пространства для использования другими данными. Чтобы «стереть» все, необходимо перезаписать каждый блок данных на носителе; то, что не делают многие утилиты форматирования высокого уровня.
Переформатирование часто подразумевает, что операционная система и все другое программное обеспечение будут переустановлены после завершения форматирования. Вместо того, чтобы исправлять установку, страдающую от сбоя или нарушения безопасности, может потребоваться просто переформатировать все и начать с нуля. Для этого процесса существуют различные разговорные выражения, такие как «стереть и перезагрузить», «уничтожить и оставить», «переформатировать» и т. Д. Однако переформатирование диска, содержащего только пользовательские данные, не требует переустановки ОС.
Команда форматирования : В MS-DOS , PC DOS , OS / 2 и Microsoft Windows форматирование диска можно выполнить с помощью format
команды . format
Программа обычно запрашивает подтверждение заранее , чтобы предотвратить случайное удаление данных, но некоторые версии DOS имеют недокументированные /AUTOTEST
опции; если используется, обычное подтверждение пропускается, и форматирование начинается сразу. WM / FormatC макровирус использует эту команду в формат диск C: как только открывается документ.
Безусловное форматирование : существует также /U
параметр, который выполняет безусловное форматирование, которое в большинстве случаев перезаписывает весь раздел [24], предотвращая восстановление данных с помощью программного обеспечения. Однако обратите внимание, что /U
переключатель надежно работает только с гибкими дискетами (см. Изображение справа). Технически, потому что, если /Q
не используется, дискеты всегда форматируются на низком уровне в дополнение к форматированию высокого уровня. Однако при определенных обстоятельствах с разделами жесткого диска /U
переключатель просто предотвращает созданиеunformat
информация в разделе, который будет отформатирован, в противном случае содержимое раздела останется полностью нетронутым (все еще на диске, но помечено как удаленное). В таких случаях данные пользователя остаются готовыми для восстановления с помощью специальных инструментов, таких как EnCase или дисковые редакторы . Поэтому полагаться /U
на безопасную перезапись разделов жесткого диска не рекомендуется, и вместо этого следует рассмотреть специальные инструменты, такие как DBAN .
Перезапись : в Windows Vista и более поздних версиях небыстрое форматирование будет перезаписываться по мере выполнения. Не так в Windows XP и более ранних версиях. [25]
OS / 2 : В OS / 2 форматирование перезапишет весь раздел или логический диск, если используется /L
параметр, указывающий на длинный формат. Это расширяет возможности CHKDSK для восстановления файлов.
Форматирование дисков высокого уровня в этих системах традиционно выполняется с помощью mkfs
команды. В Linux (и, возможно, в других системах), mkfs
как правило, это оболочка для команд, специфичных для файловой системы, которые имеют имя , где fsname - это имя файловой системы, в которой нужно отформатировать диск. [26] Некоторые файловые системы, которые не поддерживаются некоторыми реализациями, имеют свои собственные инструменты управления; например, Ntfsprogs предоставляет утилиту форматирования для файловой системы NTFS .mkfs.fsname
mkfs
Некоторые Unix и Unix-подобные операционные системы имеют инструменты форматирования более высокого уровня, обычно с целью упрощения форматирования диска и / или предоставления пользователю возможности разбивать диск на разделы с помощью того же инструмента. Примеры включают в себя GNU Parted (и его различные GUI фронтэндов , такие как GParted и Partition Manager KDE ) и Disk Utility приложения на Mac OS X .
Этот раздел, возможно, содержит оригинальные исследования . ( Март 2011 г. ) |
Как и при удалении файлов операционной системой, данные на диске не стираются полностью во время каждого [27] высокоуровневого форматирования. Вместо этого область на диске, содержащая данные, просто помечается как доступная и сохраняет старые данные до тех пор, пока они не будут перезаписаны. Если диск отформатирован в файловой системе, отличной от той, которая ранее существовала в разделе, некоторые данные могут быть перезаписаны, чего не было бы, если бы использовалась та же файловая система. Однако в некоторых файловых системах (например, NTFS, но не FAT) индексы файлов (например, $ MFT в NTFS, inode в ext2 / 3 и т. Д.) Не могут быть записаны в одни и те же точные места. И если размер раздела увеличивается, даже файловые системы FAT перезаписывают больше данных в начале этого нового раздела.
С точки зрения предотвращения восстановления конфиденциальных данных с помощью инструментов восстановления, данные должны быть либо полностью перезаписаны (каждый сектор) случайными данными перед форматированием, либо сама программа форматирования должна выполнить эту перезапись, как команда DOS FORMAT
сделала с дискетами. , заполняя каждый сектор данных значением байта заполнителя формата (обычно 0xF6
).
Однако существуют приложения и инструменты, особенно используемые в судебно-информационных технологиях, которые могут восстанавливать данные, которые были стерты традиционным способом. Чтобы избежать восстановления конфиденциальных данных, правительственные организации или крупные компании используют методы уничтожения информации, такие как метод Гутмана . [28] Для обычных пользователей также существуют специальные приложения, которые могут выполнять полное уничтожение данных путем перезаписи предыдущей информации. Хотя существуют приложения, которые выполняют несколько операций записи, чтобы гарантировать стирание данных, любая однократная запись поверх старых данных, как правило, - это все, что требуется на современных жестких дисках. ATA Secure Erase можно выполнять дисковые утилиты быстро и тщательно протирать диски. [29][30] Размагничивание - еще один вариант; однако это может сделать диск непригодным для использования . [29]
0xE5
является причиной того, почему значение 0xE5
имеет особое значение в записях каталогов в файловых системах FAT12 , FAT16 и FAT32 . Это позволило 86-DOS использовать 8-дюймовые дискеты из коробки или с инициализированной только файловой системой FAT./W:246
(для значения заполнения0xF6
). В отличие от другихутилит FDISK , DR-DOS FDISK является не только инструментом для создания разделов, но также может форматировать только что созданные разделы как FAT12 , FAT16 или FAT32 . Это снижает риск случайного форматирования неправильного тома.Если вы не укажете параметр RECOMP или LABEL, область диска инициализируется запись зависящего от устройства количества записей (содержащих двоичные нули) на каждую дорожку.
Все предыдущие данные на диске удаляются.
прямого доступа, на которых хранятся наборы данных виртуальной организации TSS / 360, имеют блоки данных фиксированной длины и размера страницы.
Ключевое поле не требуется.
Функция переполнения записи используется для того, чтобы блоки данных могли занимать треки по мере необходимости.
Весь том, за исключением части первого цилиндра, которая используется для идентификации, форматируется в блоки размером страницы.
В Windows Vista изменилось поведение команды форматирования.
По умолчанию в Windows Vista команда форматирования записывает нули на весь диск при выполнении полного форматирования.
В Windows XP и более ранних версиях операционной системы Windows команда форматирования не записывает нули на весь диск при выполнении полного форматирования.