Из Википедии, бесплатной энциклопедии
  (Перенаправлен из Fail-over )
Перейти к навигации Перейти к поиску

В вычислительных и связанных технологиях, таких как сети , аварийное переключение - это переключение на резервный или резервный компьютерный сервер , систему , аппаратный компонент или сеть после сбоя или аварийного завершения ранее активного приложения , [1] сервера, системы, аппаратного компонента или сети . Восстановление после сбоя и переключение - это, по сути, одна и та же операция, за исключением того, что переключение происходит автоматически и обычно выполняется без предупреждения, а переключение требует вмешательства человека.

Разработчики систем обычно обеспечивают возможность аварийного переключения в серверах, системах или сетях, требующих почти непрерывной доступности и высокой степени надежности .

На уровне сервера автоматизация аварийного переключения обычно использует систему « пульса », которая соединяет два сервера либо с помощью отдельного кабеля (например, последовательные порты / кабель RS-232 ), либо через сетевое соединение. Пока между главным сервером и вторым сервером продолжается регулярный «пульс» или «пульс», второй сервер не будет переводить свои системы в оперативный режим. Также может быть третий сервер «запасных частей», на котором работают запасные компоненты для «горячего» переключения, чтобы предотвратить простои. Второй сервер берет на себя работу первого, как только он обнаруживает изменение «пульса» первой машины. В некоторых системах есть возможность отправлять уведомления об отказе.

Некоторые системы намеренно не выполняют переключение на отказ полностью автоматически, но требуют вмешательства человека. Эта конфигурация «автоматизирована с утверждением вручную» запускается автоматически после того, как человек утвердил переключение при отказе.

Восстановление после сбоя - это процесс восстановления системы, компонента или службы, ранее находившейся в состоянии сбоя, обратно в исходное рабочее состояние, а также при возвращении резервной системы из работоспособного состояния в режим ожидания.

Использование программного обеспечения для виртуализации позволило снизить зависимость от физического оборудования в практике аварийного переключения в результате процесса, называемого миграцией, при котором работающая виртуальная машина перемещается с одного физического хоста на другой с минимальными перебоями в обслуживании или без них.

История [ править ]

Термин «аварийное переключение», хотя, вероятно, использовался инженерами гораздо раньше, его можно найти в рассекреченном отчете НАСА 1962 года . [2] Термин «переключение» можно найти в 1950-х годах [3] при описании «горячих» и «холодных» резервных систем с текущим значением немедленного переключения на работающую систему (горячего) и отложенного переключения на система, требующая запуска (холодная). В материалах конференции 1957 года описываются компьютерные системы как с аварийным переключением (т.е. аварийное переключение), так и с запланированным аварийным переключением (для обслуживания). [4]

См. Также [ править ]

Ссылки [ править ]

  1. ^ Для отработки отказа на уровне приложения см., Например, Jayaswal, Kailash (2005). «27» . Администрирование центров обработки данных: серверы, хранилища и передача голоса по IP . Wiley-India. п. 364. ISBN 978-81-265-0688-0. Проверено 7 августа 2009 . Хотя невозможно предотвратить некоторую потерю данных во время отработки отказа приложения, определенные [...] шаги могут минимизировать ее..
  2. ^ НАСА Postlaunch Меморандум Отчет о Mercury-Atlas , 15 июня 1962 года.
  3. ^ Инженер-нефтяник для управления - Том 31 - Страница D-40
  4. ^ Труды Западной совместной компьютерной конференции , Macmillan 1957