Отказоустойчивый - Failover

В вычисление и сопутствующие технологии, такие как сеть, аварийное переключение переходит на избыточный или в режиме ожидания компьютер сервер, система, аппаратный компонент или сеть после сбоя или ненормальное прекращение ранее активных заявление,[1] сервер, система, аппаратный компонент или сеть. Отказоустойчивость и переключение по сути, это та же операция, за исключением того, что переключение происходит автоматически и обычно выполняется без предупреждения, в то время как переключение требует вмешательства человека.

Системные проектировщики обычно обеспечивают возможность аварийного переключения на серверах, системах или сетях, требующих почти непрерывная доступность и высокая степень надежность.

На уровне сервера автоматизация аварийного переключения обычно использует "сердцебиение "система, которая соединяет два сервера с помощью отдельного кабеля (например, RS-232 последовательные порты / кабель) или сетевое соединение. Пока между главным сервером и вторым сервером продолжается регулярный «пульс» или «пульс», второй сервер не будет переводить свои системы в оперативный режим. Также может быть третий сервер «запасных частей», на котором работают запасные компоненты для «горячего» переключения, чтобы предотвратить простои. Второй сервер берет на себя работу первого, как только обнаруживает изменение «пульса» первой машины. Некоторые системы имеют возможность отправлять уведомление о переключении при отказе.

Некоторые системы намеренно не выполняют переключение на отказ полностью автоматически, но требуют вмешательства человека. Эта конфигурация «автоматизирована с утверждением вручную» запускается автоматически после того, как человек утвердил переключение при отказе.

Возврат - это процесс восстановления системы, компонента или службы, ранее находившейся в состоянии отказа, обратно в исходное рабочее состояние, а также приведения резервной системы из работоспособного состояния в режим ожидания.

Использование виртуализация программное обеспечение позволило снизить зависимость практики аварийного переключения от физического оборудования благодаря процессу, называемому миграция при котором работающая виртуальная машина перемещается с одного физического хоста на другой с минимальными перебоями в обслуживании или без них.

История

Термин «аварийное переключение», хотя, вероятно, использовался инженерами гораздо раньше, его можно найти в рассекреченном 1962 году. НАСА отчет.[2] Термин «переключение» можно встретить в 1950-х годах.[3] при описании «горячих» и «холодных» резервных систем с текущим значением немедленного переключения на работающую систему (горячая) и отложенного переключения на систему, которая требует запуска (холодная). В протоколе конференции 1957 года описываются компьютерные системы как с аварийным переключением (т.е. аварийным переключением), так и с запланированным аварийным переключением (для обслуживания).[4]

Смотрите также

Рекомендации

  1. ^ Для отработки отказа на уровне приложения см., Например, Джаясвал, Кайлас (2005). "27". Администрирование центров обработки данных: серверы, хранилище и передача голоса по IP. Wiley-India. п. 364. ISBN  978-81-265-0688-0. Получено 2009-08-07. Хотя предотвратить некоторую потерю данных во время переключения приложения при отказе невозможно, определенные [...] шаги могут минимизировать ее..
  2. ^ Отчет НАСА о послестартовом меморандуме о Меркурий-Атлас, 15 июня 1962 г.
  3. ^ Инженер-нефтяник для управления - Том 31 - Страница D-40
  4. ^ Труды Западной совместной компьютерной конференции, Macmillan 1957 г.