Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В инженерных систем , надежность является мерой системы доступности , надежности , и его ремонтопригодности и технического обслуживания объекта поддержки , а также , в некоторых случаях, другие характеристики , такие как долговечность , безопасность и безопасность . [1] В разработке программного обеспечения , надежность является способность предоставлять услуги , которые defensibly можно доверять в течение периода времени. [ необходима цитата ]Это также может включать механизмы, предназначенные для повышения и поддержания надежности системы или программного обеспечения. [2]

Международная электротехническая комиссия (МЭК), через его Технический комитет ТК 56 разрабатывает и поддерживает международные стандарты , которые обеспечивают систематические методы и инструменты для оценки надежности и управления оборудования, услуг и систем на протяжении всего их жизненного цикла.

Надежность можно разбить на три элемента:

  • Атрибуты - способ оценки надежности системы
  • Угрозы - понимание того, что может повлиять на надежность системы.
  • Средства - способы повышения надежности системы

История [ править ]

Некоторые источники считают, что это слово было придумано девятнадцатилетними подростками в автомобильной печатной рекламе Dodge Brothers. Но это слово появилось еще до того периода, когда Оксфордский словарь английского языка впервые использовал его в 1901 году.

По мере роста интереса к отказоустойчивости и надежности системы в 1960-х и 1970-х годах надежность стала мерой [x], поскольку меры надежности стали включать в себя дополнительные меры, такие как безопасность и целостность. [3] В начале 1980-х Жан-Клод Лапри, таким образом, выбрал термин « надежность» для охвата исследований отказоустойчивости и надежности системы без расширения смысла, присущего надежности . [4]

С тех пор область надежности превратилась в международно-активную область исследований, чему способствовал ряд известных международных конференций, в частности, Международная конференция по надежным системам и сетям , Международный симпозиум по надежным распределенным системам и Международный симпозиум по надежности программного обеспечения. Инженерное дело .

Традиционно надежность системы включает доступность , надежность и ремонтопригодность, но с 1980-х годов к мерам надежности добавляются безопасность и защищенность . [5]

Элементы надежности [ править ]

Атрибуты [ править ]

Таксономия, показывающая взаимосвязь между надежностью и безопасностью и атрибутами, угрозами и средствами (по Лапри и др.)

Атрибуты - это качества системы. Их можно оценить для определения его общей надежности с помощью качественных или количественных показателей. Avizienis et al. определить следующие атрибуты надежности:

Как следует из этих определений, только доступность и надежность поддаются количественной оценке прямыми измерениями, в то время как другие являются более субъективными. Например, безопасность нельзя измерить напрямую с помощью показателей, но это субъективная оценка, которая требует применения оценочной информации для определения уровня уверенности, в то время как надежность может быть измерена как отказы с течением времени.

Конфиденциальность , то есть отсутствие несанкционированного раскрытия информации , также используется при решении вопросов безопасности. Безопасность - это сочетание конфиденциальности , целостности и доступности . Безопасность иногда классифицируют как атрибут [6], но текущее представление состоит в том, чтобы объединить его вместе с надежностью и рассматривать надежность как составной термин, называемый надежностью и безопасностью. [2]

На практике применение мер безопасности к устройствам системы обычно повышает надежность за счет ограничения количества ошибок внешнего происхождения.

Угрозы [ править ]

Угрозы - это вещи, которые могут повлиять на систему и вызвать снижение надежности. Следует четко понимать три основных термина:

  • Ошибка: ошибка (которая обычно называется ошибкой по историческим причинам) - это дефект в системе. Наличие неисправности в системе может или не может привести к отказу. Например, хотя система может содержать ошибку, условия ее входа и состояния могут никогда не привести к выполнению этой ошибки, что приведет к возникновению ошибки; и поэтому эта конкретная ошибка никогда не проявляется как сбой.
  • Ошибка: ошибка - это несоответствие между предполагаемым поведением системы и ее фактическим поведением внутри границ системы. Ошибки возникают во время выполнения, когда некоторая часть системы входит в непредвиденное состояние из-за активации ошибки. Поскольку ошибки генерируются из недопустимых состояний, их трудно наблюдать без специальных механизмов, таких как отладчики или отладочный вывод в журналы.
  • Отказ: отказ - это случай во времени, когда система демонстрирует поведение, противоречащее ее спецификации. Ошибка не обязательно может вызвать сбой, например, система может вызвать исключение, но это может быть обнаружено и обработано с использованием методов обеспечения отказоустойчивости, чтобы общая работа системы соответствовала спецификации.

Важно отметить, что отказы регистрируются на границе системы. По сути, это Ошибки, которые распространились до границы системы и стали наблюдаемыми. Неисправности, ошибки и отказы действуют по механизму. Этот механизм иногда называют цепочкой сбоев-ошибок-сбоев. [7] Как правило, сбой при активации может привести к ошибке (что является недопустимым состоянием), а недопустимое состояние, сгенерированное ошибкой, может привести к другой ошибке или отказу (что является наблюдаемым отклонением от указанного поведение на границе системы). [8]

После активации неисправности создается ошибка. Ошибка может действовать так же, как и сбой, в том смысле, что она может создавать дополнительные условия ошибки, поэтому ошибка может многократно распространяться в пределах границы системы, не вызывая наблюдаемого сбоя. Если ошибка распространяется за пределы системы, считается, что произошел сбой. Сбой - это в основном момент, когда можно сказать, что служба не соответствует своей спецификации. Поскольку выходные данные из одной службы могут передаваться в другую, сбой в одной службе может распространяться на другую службу как сбой, поэтому цепочка может быть сформирована в форме: сбой, ведущий к ошибке, ведущий к сбою, ведущему к ошибке, и т. Д.

Средства [ править ]

Поскольку механизм цепочки сбоев-ошибок понятен, можно сконструировать средства для разрыва этих цепочек и, таким образом, повышения надежности системы. На данный момент определены четыре средства:

  1. Профилактика
  2. Удаление
  3. Прогнозирование
  4. Толерантность

Предотвращение отказов занимается предотвращением ошибок, которые могут быть встроены в систему. Этого можно достичь, используя методологии разработки и хорошие методы реализации.

Устранение неисправностей можно подразделить на две подкатегории: устранение во время разработки и удаление во время использования.
Удаление во время разработки требует проверки, чтобы можно было обнаружить и устранить неисправности до того, как система будет запущена в производство. После того, как системы запущены в производство, необходима система для регистрации отказов и их устранения с помощью цикла обслуживания.

Прогнозирование неисправностей предсказывает вероятные неисправности, чтобы их можно было устранить или обойти их последствия. [9] [10]

Отказоустойчивость связана с внедрением механизмов, которые позволят системе по-прежнему предоставлять требуемую услугу при наличии сбоев, хотя эта услуга может быть на пониженном уровне.

Средства надежности предназначены для уменьшения количества отказов, представленных пользователю системы. Сбои традиционно регистрируются с течением времени, и полезно понимать, как измеряется их частота, чтобы можно было оценить эффективность средств11.

Надежность информационных систем и живучесть [ править ]

В некоторых работах по надежности [11] используются структурированные информационные системы , например, с SOA , чтобы ввести атрибут живучести , таким образом, принимая во внимание ухудшенные услуги, которые информационная система поддерживает или возобновляет после немаскированного отказа.

Гибкость текущих структур побуждает системных архитекторов задействовать механизмы реконфигурации, которые переориентируют доступные безопасные ресурсы на поддержку наиболее важных сервисов, а не на избыточное выделение ресурсов для построения отказоустойчивой системы.

С распространением сетевых информационных систем была введена доступность, чтобы придать большее значение опыту пользователей.

Чтобы принять во внимание уровень производительности, измерение производительности определяется как «количественная оценка того, насколько хорошо объектная система работает при наличии сбоев в течение определенного периода времени». [12]

См. Также [ править ]

  • Международная конференция по надежным системам и сетям  - Конференция по компьютерным сетям
  • Внедрение неисправности
  • Отказоустойчивость  - устойчивость систем к отказам или ошибкам компонентов.
  • Формальные методы
  • Список атрибутов качества системы  - нефункциональные требования для оценки системы
  • RAMS
  • Инженерия надежности  - Поддисциплина системной инженерии, которая подчеркивает надежность в управлении жизненным циклом продукта или системы.
  • Техника безопасности  - инженерная дисциплина, которая гарантирует, что спроектированные системы обеспечивают приемлемый уровень безопасности.

Дальнейшее чтение [ править ]

Статьи [ править ]

  • Вильфредо Торрес-Помалес: Отказоустойчивость программного обеспечения: Учебное пособие , 2002 г.
  • Стефано Поркарелли, Марко Кастальди, Фелисита Ди Джандоменико, Андреа Бондавалли, Паола Инверарди Подход к управлению реконфигурацией в отказоустойчивых распределенных системах

Журналы [ править ]

  • Prognostics Journal - это журнал с открытым доступом, который представляет собой международный форум для электронной публикации оригинальных исследований и статей о промышленном опыте во всех областях надежности систем и прогнозирования.
  • Международный журнал критических компьютерных систем
  • Латиноамериканский симпозиум по зависимым вычислениям

Книги [ править ]

  • JC Laprie, Надежность : основные концепции и терминология Springer-Verlag, 1992. ISBN  0-387-82296-8

Исследовательские проекты [ править ]

  • DESEREC , Надежность и безопасность за счет расширенной реконфигурируемости , интегрированный проект FP6 / IST 2006–2008
  • УЗЛЫ [ постоянная мертвая ссылка ] , Сеть в надежных системах
  • ESFORS, Европейский форум по безопасности для веб-сервисов, программного обеспечения и систем , координационные действия FP6 / IST
  • HIDENETS Высоконадежные сети и службы на базе IP , целевой проект FP6 / IST 2006–2008 гг.
  • RESIST FP6 / IST Network of Excellence 2006–2007 гг.
  • RODIN Целевой проект FP6 / IST со строгой открытой средой разработки для сложных систем 2004–2007 гг.
  • Системная инженерия SERENITY для обеспечения безопасности и надежности , интегрированный проект FP6 / IST 2006–2008 гг.
  • Willow Survivability Architecture и STILT , Система противодействия терроризму и крупномасштабной совместной работы 2002–2004 гг.
  • Надежный и безопасный набор услуг ANIKETOS , интегрированный проект FP7 / IST, 2010–2014 гг.

Ссылки [ править ]

  1. ^ IEC, Electropedia del 192 Dependability , http://www.electropedia.org , выберите 192 Dependability, см. 192-01-22 Dependability.
  2. ^ a b А. Авизенис, Ж.-К. Лапри, Брайан Рэнделл и К. Ландвер, « Основные концепции и таксономия надежных и безопасных вычислений », IEEE Transactions on Dependable and Secure Computing, vol. 1. С. 11-33, 2004.
  3. ^ Брайан Рэнделл , «Надежность программного обеспечения: личное мнение», в материалах 25-го Международного симпозиума по отказоустойчивым вычислениям (FTCS-25), Калифорния, США, стр. 35-41, июнь 1995 г.
  4. ^ JC Laprie. «Надежные вычисления и отказоустойчивость: концепции и терминология», в Proc. 15-й IEEE Int. Symp. по отказоустойчивым вычислениям, 1985 г.
  5. ^ А. Avizienis, Ж.-К. Лапри и Брайан Рэнделл : фундаментальные концепции надежности . Отчет об исследовании № 1145, Lydford g DrAAS-CNRS , апрель 2001 г.
  6. ^ I. Соммервилл, Разработка программного обеспечения: Аддисон-Уэсли, 2004.
  7. ^ А. Avizienis, В. Magnus U, JC Laprie и Брайан Рэнделл , "Основные понятия НАДЕЖНОСТЬ," представлен на МСВ-2000, Кембридж, штат Массачусетс, 2000.
  8. ^ Моради, Мехрдад; Ван Акер, Берт; Ванхерпен, Кен; Денил, Иоахим (2019). Чемберлен, Роджер; Таха, Валид; Торнгрен, Мартин (ред.). «Реализованная на модели гибридная инжекция разломов для Simulink (демонстрация инструментов)». Киберфизические системы. Модельно-ориентированный дизайн . Конспект лекций по информатике. Чам: Издательство Springer International. 11615 : 71–90. DOI : 10.1007 / 978-3-030-23703-5_4 . ISBN 978-3-030-23703-5.
  9. ^ «Оптимизация внедрения разломов в совместном моделировании FMI через разделение чувствительности | Труды конференции по летнему моделированию 2019 года» . dl.acm.org . Проверено 15 июня 2020 .
  10. ^ Moradi, Mehrdad, Bentley Джеймс Оукс, Мустафа Saraoglu, Андрей Морозов, Клаус Janschek и Joachim Denil. «Изучение пространства параметров неисправности с помощью внедрения неисправностей на основе обучения с подкреплением». (2020).
  11. ^ Джон К. Найт, Элизабет А. Странк, Кевин Дж. Салливан: К строгому определению выживаемости информационной системы. Архивировано 29 октября 2006 г. в Wayback Machine.
  12. ^ Джон Ф. Мейер, Уильям Х. Сандерс Спецификация и построение моделей выполнимости