Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Прерывистый ошибка , которую часто называют просто «прерывистым», неисправность устройства или системы , которое происходит с интервалом, как правило , нерегулярно, в устройстве или системе , которая функционирует нормально в другое время. Периодические сбои присущи всем отраслям техники , включая компьютерное программное обеспечение . Периодическая неисправность вызывается несколькими факторами, некоторые из которых могут быть случайными и происходить одновременно. Чем сложнее задействованная система или механизм, тем выше вероятность периодической неисправности.

Периодические сбои нелегко повторить из-за их сложных поведенческих паттернов. Их также иногда называют «мягкими» отказами, поскольку они не проявляются постоянно и исчезают непредсказуемым образом. Напротив, «серьезные» отказы - это постоянные отказы, которые происходят в течение определенного периода времени (или иногда бывают мгновенными). У них есть конкретное место сбоя (место сбоя), режим (как проявляется сбой) и механизм, и для отказавшей системы нет непредсказуемого восстановления. Поскольку периодические сбои нелегко повторить, для них труднее провести анализ отказов, понять их основные причины или изолировать место их отказа, чем для постоянных отказов. [1]

Периодические сбои могут быть причиной отсутствия неисправностей.(NFF) в электронных продуктах и ​​системах. NFF означает, что отказ (сбой) произошел или, как сообщалось, произошел во время использования продукта. Продукт был проанализирован или протестирован, чтобы подтвердить отказ, но «отказ или неисправность» обнаружить не удалось. Типичный пример феномена NFF возникает, когда ваш компьютер «зависает». Ясно, что произошел «сбой». Однако, если компьютер перезагружается, он часто снова работает. Влияние NFF и периодических сбоев может быть серьезным. Из-за своих характеристик производители могут предполагать причину (ы), а не тратить время и деньги на определение первопричины. Например, поставщик жестких дисков заявил, что NFF не является неисправностью, и разрешил возвращать все продукты NFF на места. Позже было установлено, что у этих продуктов была значительно более высокая доходность,предполагая, что состояние NFF на самом деле было результатом периодических сбоев в продукте. В результате увеличились затраты на техническое обслуживание, снизилась доступность оборудования, увеличилось неудобство для клиентов, снизилось доверие клиентов, нанесен ущерб репутации компании, а в некоторых случаях - потенциальные угрозы безопасности.[2]

Простым примером фактически случайной причины в физической системе является пограничное электрическое соединение в проводке или компоненте цепи , где ( причина 1 , причина, которая должна быть идентифицирована и устранена) два проводника могут соприкасаться с объектом ( причина 2 , который не нужно идентифицировать) незначительное изменение температуры, вибрации, ориентации, напряжения и т. д. (Иногда это описывается как «прерывистое соединение», а не «сбой».) В компьютерном программном обеспечении программа может ( причина 1 ) сбой для инициализации переменной, которая должна быть изначально равна нулю; если программа запускается в таких обстоятельствах, что память почтивсегда очищать перед запуском, он будет работать неправильно в тех редких случаях, когда ( причина 2 ) память, в которой хранится переменная, заранее не равна нулю.

Прерывистые неисправности, как известно, сложно идентифицировать и устранять (« устранять неисправности »), потому что каждый отдельный фактор не создает проблему сам по себе, поэтому факторы могут быть идентифицированы только тогда, когда неисправность действительно возникает. Человек, способный определить и решить проблему, редко бывает обычным оператором. Поскольку время сбоя непредсказуемо, а время простоя устройства или системы и время инженеров связаны с затратами , сбой часто просто терпят, если не слишком часто, если он не вызывает неприемлемых проблем или опасностей. Например, некоторые периодические неисправности в критически важном оборудовании, таком как медицинское жизнеобеспечение. оборудование может привести к смерти пациента или в авиации может привести к прерыванию полета или, в некоторых случаях, к аварии.

Если периодическая неисправность возникает достаточно долго во время поиска и устранения неисправностей, ее можно выявить и устранить обычным способом.

Методы устранения неполадок [ править ]

Вот некоторые методы устранения периодически возникающих неисправностей:

  • Может помочь автоматическая регистрация соответствующих параметров в течение достаточно длительного времени для выявления неисправности; значения параметров во время неисправности могут определить причину, чтобы можно было предпринять соответствующие действия по исправлению.
  • Изменение условий эксплуатации при наличии неисправности, чтобы увидеть, исчезнет ли неисправность или изменится ли она временно. Например, постучать по компонентам, охладить их морозильной струей, нагреть. Удар по шкафу может временно устранить неисправность.
  • база данных аналогичных неисправностей, которые были устранены в идентичном или подобном оборудовании [3]
  • предупредительные изменения, не пытаясь точно определить неисправность. Например, электролитические конденсаторы, подверженные высоким токам пульсаций, можно заменить в обычном порядке, вообще не беспокоясь об устранении неисправности. Разъемы можно отсоединить и переустановить. Иногда это мера отчаяния; все меняется до тех пор, пока неисправность не перестанет происходить, и есть надежда, что она действительно устранена, а не бездействует.
  • В электрических системах и кабельных системах могут использоваться методы рефлектометрии во временной области: импульсы посылаются по электропроводке, и отраженные обратно импульсы исследуются на наличие аномалий, например прерывистой утечки во время нагрузок при эксплуатации самолета; это можно сделать только для одного тестового канала за раз и обычно ограничивается периодическими ошибками> 100 миллисекунд. [4]
  • В сложных многоканальных системах, где неисправность может быть связана с межсоединением, идеальный метод обнаружения прерывистой неисправности - это возможность непрерывно и одновременно отслеживать, обнаруживать и изолировать все каналы или электрические пути. Эта методология позволяет тестируемой системе извлекать выгоду из непрерывного и полного тестового покрытия при любых воздействиях окружающей среды на систему. Этот тип не может быть выполнен с помощью технологии сканирования сканирования, но должен иметь какую-либо электронную нейронную сеть, которая может выполнять этот тест без необходимости какого-либо сканирования и / или цифрового усреднения; этот режим тестирования охвачен Министерством обороны США MIL-PRF-32516опубликовано в марте 2015 года, и в нем содержится призыв к испытательной технологии для работы в категории 1 класса для эффективной борьбы с периодически возникающими неисправностями. [5]
  • Три основных метода смягчения неустойчивого поведения в интегральных схемах - это динамическая задержка инструкций, масштабирование частоты ядра и миграция потоков. Когда процессор затрачивает на выполнение процесса больше ожидаемого времени, возникают временная задержка и нарушение синхронизации. Этой ошибки можно избежать, используя такие методы, как динамическая задержка команд. Это тип алгоритма, который вычисляет приоритеты планирования во время работы системы. Цель состоит в том, чтобы динамически реагировать на меняющиеся условия и формировать самодостаточную оптимизированную конфигурацию. Другой подход к уменьшению задержки - масштабирование частоты ядра, которое снижает производительность ЦП до более низкой частоты, когда требуется меньше, и масштабирует ее до более высокой частоты, когда требуется больше.Миграция потоков - еще один метод, используемый для преодоления периодических сбоев. Поток - это упорядоченный набор инструкций, который точно сообщает компьютеру, что делать. Когда конкретный поток сталкивается с ошибками, содержимое потока в неисправном ядре компьютера передается другому потоку в неактивном ядре, где проблема решается и решается.[1]

Ссылки [ править ]

  1. ^ а б Бахши, Рузбех; Кунче, Сурья; Печт, Майкл (18 февраля 2014 г.). «Периодические сбои аппаратного и программного обеспечения». Журнал электронной упаковки . 136 (1): 011014. DOI : 10,1115 / 1,4026639 . ISSN  1043-7398 .
  2. ^ Qi, H .; Ganesan, S .; Печт, М. (май 2008 г.). «Неисправности, которые не были обнаружены, и периодические отказы в электронных изделиях». Надежность микроэлектроники . 48 (5): 663–674. DOI : 10.1016 / j.microrel.2008.02.003 .
  3. ^ Пример периодической неисправности ТВ в базе данных «Архивная копия» . Архивировано из оригинала на 2009-04-13 . Проверено 19 июля 2010 . CS1 maint: discouraged parameter (link) CS1 maint: archived copy as title (link): "ШАССИ Z3T - НЕТ ЗАПУСКА - ПРЕРЫВНЫЙ. D1124 (5,1 В) ZENER LEAKY"
  4. ^ «Рефлектометрия во временной области с расширенным спектром для обнаружения периодически возникающих неисправностей. Архивировано 01 мая2010 г. в archive.today » Фурс, Синтия; Смит, Пол; ЖУРНАЛ IEEE SENSORS, ТОМ. 5, № 6 ДЕКАБРЯ 2005 г. "
  5. ^ «Ошибка не обнаружена, повторный тест в порядке, дублирование невозможно или ошибка не обнаружена? - К стандартизированной таксономии [1] « Самир Хан, Пол Филлипс, Крис Хокли, Ян Дженнионс »

Внешние ссылки [ править ]

  • Обсуждение отладки программного обеспечения
  • Sci.electronics.repair FAQ, см. Раздел «Устранение периодически возникающих проблем»