Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Прогнозирующий анализ отказов ( PFA ) относится к методам, предназначенным для прогнозирования неизбежного отказа систем или компонентов (программного или аппаратного), и потенциально позволяет механизмам избегать или противодействовать проблемам отказов или рекомендовать обслуживание систем до отказа.

Например, компьютерные механизмы, которые анализируют тенденции исправленных ошибок для прогнозирования будущих отказов оборудования / компонентов памяти и активно активируют механизмы для их предотвращения. Predictive Failure Analysis первоначально использовался как термин для патентованной технологии IBM для мониторинга вероятности выхода из строя жестких дисков , хотя сейчас этот термин используется в целом для различных технологий для оценки неизбежного отказа ЦП, памяти и устройств ввода-вывода. . [1] См. Также сбор данных о первом отказе .

Диски [ править ]

IBM представила термин PFA и его технологию в 1992 году со ссылкой на свой диск 0662-S1x (диск Fast-Wide SCSI-2 на 1052 МБ, который работал со скоростью 5400 об / мин ).

Технология основана на измерении нескольких ключевых (в основном механических) параметров привода, например, высоты полета голов . Встроенное ПО привода сравнивает измеренные параметры с предварительно заданными пороговыми значениями и оценивает состояние привода. Если появится вероятность того, что диск скоро выйдет из строя, система отправит уведомление на контроллер диска.

К основным недостаткам технологии можно отнести:

  • бинарный результат - единственное состояние, видимое хосту, было наличие или отсутствие уведомления
  • однонаправленная связь - микропрограмма привода отправляет уведомление

Эта технология объединилась с IntelliSafe и образовала технологию самоконтроля, анализа и отчетности (SMART).

Процессор и память [ править ]

Высокие отсчеты исправленных ошибок ОЗУ прерывистых по ECC могут прогнозировать будущие DIMM неудач [2] и так автоматического offlining для памяти и процессора кэшей может быть использовано для ошибок в будущем избежать, [3] , например , под Linux операционной системы mcelog демон будет автоматически удаляет из использования страницы памяти, показывающие чрезмерные исправления, и удаляет из использования ядра процессора, показывающие чрезмерные ошибки памяти, исправляемые кешем. [4]

Оптические носители [ править ]

На оптических носителях ( CD , DVD и Blu-ray ) сбои, вызванные ухудшением качества носителей, могут быть предсказаны, а носители низкого качества изготовления могут быть обнаружены до потери данных путем измерения скорости исправляемых ошибок данных с помощью программного обеспечения, такого как QpxTool или Nero DiscSpeed . Однако не все производители и модели оптических приводов допускают сканирование ошибок. [5]

Ссылки [ править ]

  1. ^ Intel Corp (2011). «Семейство процессоров Intel Xeon E7: поддержка серверов RAS нового поколения. Официальный документ» . Проверено 9 мая 2012 года . CS1 maint: discouraged parameter (link)
  2. ^ Бьянка Шредер; Эдуардо Пиньейру; Вольф-Дитрих Вебер (2009). «Ошибки DRAM в дикой природе: крупномасштабное полевое исследование. Труды SIGMETRICS, 2009» .
  3. ^ Тан, Arruthers, Totari, Шапиро (2006). " " Оценка влияния списания страниц памяти на системы РАН при сбоях оборудования ", Труды Международной конференции 2006 г. по надежным системам и сетям".CS1 maint: multiple names: authors list (link)
  4. ^ «mcelog - обработка ошибок памяти в пользовательском пространстве. Linux Kongress 2010» (PDF) . 2010 г.
  5. ^ Список устройств, поддерживаемых программой сканирования качества dosc QPxTool '

См. Также [ править ]

  • MCELog - демон Linux для обработки проверок компьютеров x86 для прогнозируемого анализа сбоев.