Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
На этой схеме маршрутизатор является единственной точкой отказа сети связи между компьютерами.

Единая точка отказа ( SPOF ) является частью системы , которая, если это не удается , будет остановить всю систему от работы . [1] SPOF нежелательны в любой системе с целью обеспечения высокой доступности или надежности , будь то бизнес-практика, программное приложение или другая промышленная система.

Обзор [ править ]

Системы можно сделать устойчивыми, добавив избыточность во все потенциальные SPOF. Избыточность может быть достигнута на разных уровнях.

Оценка потенциального SPOF включает в себя определение критических компонентов сложной системы, которые могут спровоцировать полный отказ системы в случае неисправности . Высоконадежные системы не должны полагаться на какой-либо такой отдельный компонент.

Например, владелец небольшой компании по уходу за деревьями может владеть только одним измельчителем древесины . Если измельчитель сломается, он может быть не в состоянии завершить свою текущую работу и, возможно, ему придется отменить будущие задания, пока он не получит замену. Владелец компании по уходу за деревьями может иметь запасные части для ремонта измельчителя древесины, если он выйдет из строя. На более высоком уровне у него может быть второй измельчитель древесины, которого он может принести на место работы. Наконец, на самом высоком уровне у него может быть достаточно оборудования, чтобы полностью заменить все на рабочем месте в случае множественных сбоев.

  • Возможные SPOF в простой настройке.

  • Использование избыточности во избежание некоторых SPOF.

  • Система с полным резервированием без SPOF. (Примечание: предполагается, что генератор и сеть имеют номинальное значение N, каждый ИБП имеет номинал N, а «A / C» и «Электрический» сами по себе являются полностью отказоустойчивыми системами.

Вычисления [ править ]

В вычислениях избыточность может быть достигнута на уровне внутренних компонентов, на уровне системы (несколько машин) или на уровне сайта (репликация).

Обычно можно развернуть балансировщик нагрузки, чтобы обеспечить высокую доступность кластера серверов на системном уровне.

В кластере серверов высокой доступности каждый отдельный сервер может обеспечить избыточность внутренних компонентов за счет наличия нескольких источников питания, жестких дисков и других компонентов. Избыточность системного уровня может быть получена за счет наличия запасных серверов, ожидающих выполнения работы другого сервера в случае его отказа.

Поскольку центр обработки данных часто является центром поддержки других операций, таких как бизнес-логика, он сам по себе представляет собой потенциальный SPOF. Таким образом, на уровне сайта весь кластер может быть реплицирован в другом месте, где к нему можно будет получить доступ в случае, если основное местоположение станет недоступным. Обычно эта проблема решается в рамках программы аварийного восстановления (отказоустойчивости) ИТ.

Пол Бэран и Дональд Дэвис разработали коммутацию пакетов , ключевую часть «жизнеспособных сетей связи». Такие сети, включая ARPANET и Интернет,  не имеют единой точки отказа. Множественные пути между любыми двумя точками в сети позволяют этим точкам продолжать связь друг с другом, пакеты «обходят» повреждение даже после любого единичного отказа любого конкретного пути или любого промежуточного узла.

Программная инженерия [ править ]

В программной инженерии , узкое место , когда пропускная способность приложения или компьютерной системы строго ограничена одним компонентом. Узкое место имеет самую низкую пропускную способность из всех частей пути транзакции.

Техника исполнения [ править ]

Выявление узких мест (иногда называемых « горячими точками » - участков кода, которые выполняются наиболее часто, т. Е. Имеют наибольшее количество выполнений), называется анализом производительности . Снижение обычно достигается с помощью специализированных инструментов, известных как анализаторы производительности или профилировщики . Цель состоит в том, чтобы заставить эти конкретные участки кода работать как можно быстрее для повышения общей алгоритмической эффективности .

Компьютерная безопасность [ править ]

Ошибка в одном компоненте может поставить под угрозу всю систему.

Другие поля [ править ]

Концепция единой точки отказа также применялась к областям, выходящим за рамки инженерии, компьютеров и сетей, таких как корпоративное управление цепочкой поставок [2] и управление транспортировкой. [3]

Структуры проектирования, которые создают единые точки отказа, включают узкие места и последовательные цепи (в отличие от параллельных цепей ).

В сфере транспорта некоторые отметили недавние примеры недавнего применения концепции, включая мост через реку Нипигон в Канаде, где в результате частичного обрушения моста в январе 2016 года дорожное движение между Восточной Канадой и Западной Канадой полностью прервалось на несколько дней, поскольку он расположен вдоль части Trans-Canada Highway , где нет альтернативного объезда маршрута для транспортных средств , чтобы взять; [4] и железнодорожный мост через реку Норуолк в Норуолке , штат Коннектикут , стареющий поворотный мост, который иногда застревает при открытии или закрытии, нарушая железнодорожное движение наСеверо-восточная линия коридора . [3]

Концепция единой точки отказа также применяется в области разведки. Эдвард Сноуден говорил об опасностях того, что он описал как «единую точку отказа» - единственное хранилище информации. [5]

Системы жизнеобеспечения [ править ]

Компонент системы жизнеобеспечения, который будет представлять собой единую точку отказа, должен быть чрезвычайно надежным.

См. Также [ править ]

Концепции [ править ]

  • Резервирование  - дублирование критических компонентов для повышения надежности системы.
  • Фактор шины  - измерение риска потери ключевых технических экспертов
  • Закон Люссера  - Закон произведения вероятностей компонентов ряда

Приложения [ править ]

  • Kill switch  - предохранительный механизм для быстрого отключения системы
  • Инженерия надежности  - Подраздел системной инженерии, который подчеркивает надежность в управлении жизненным циклом продукта или системы.
  • Техника безопасности  - инженерная дисциплина, гарантирующая, что спроектированные системы обеспечивают приемлемый уровень безопасности.

В литературе [ править ]

  • Ахиллесова пята  - критическая слабость, которая может привести к падению, несмотря на общую силу
  • Хамартия  - ошибка главного героя в греческой драматической теории

Ссылки [ править ]

  1. ^ 1: Проектирование крупномасштабных локальных сетей - страница 31, К. Дули, О'Рейли, 2002
  2. Гэри С. Линч (7 октября 2009 г.). Единственная точка отказа: 10 основных законов управления рисками цепочки поставок . Вайли. ISBN 978-0-470-42496-4.
  3. ^ a b «Решающий, вековой, а иногда и застрявший: мост Коннектикута - ключ к северо-восточному коридору» . Общественное радио Коннектикута , 8 августа 2017 г.
  4. ^ «Мост через реку Нипигон и другие узкие места в Трансканаде» . Global News , 11 января 2016 г.
  5. ^ "Эдвард Сноуден: правдивая история его утечек АНБ" . Telegraph.co.uk . Проверено 13 декабря 2016 .