Сплит-мозг (вычисления) - Split-brain (computing) - Wikipedia

Сплит-мозг компьютерный термин, основанный на аналогии с медицинским Сплит-мозг синдром. Он указывает на несоответствия данных или доступности, возникающие из-за обслуживания двух отдельных наборов данных с перекрытием по объему, либо из-за серверов в одном сетевой дизайн или состояние отказа, основанное на том, что серверы не обмениваются данными и не синхронизируют свои данные друг с другом. Этот последний случай также обычно называют сетевой раздел.

Хотя термин раздвоение мозга обычно относится к состоянию ошибки, Разделенный DNS (или же Разделенный горизонт DNS) иногда используется для описания преднамеренной ситуации, когда внутренние и внешние Службы DNS для корпоративной сети не обмениваются данными, поэтому необходимо администрировать отдельные пространства имен DNS для внешних компьютеров и для внутренних. Это требует двойного администрирования, и если в именах компьютеров есть совпадения доменов, существует риск того, что полное доменное имя (FQDN), может неоднозначно встречаться в обоих пространствах имен, ссылаясь на разные IP-адреса компьютеров.[1]

Кластеры высокой доступности обычно используют Heartbeat частная сеть соединение, которое используется для мониторинга работоспособности и статуса каждого узла в кластере. Например, синдром расщепленного мозга может возникнуть, когда все частные ссылки отключаются одновременно, но узлы кластера все еще работают, каждый из которых считает, что работает только один. Затем наборы данных каждого кластера могут случайным образом обслуживать клиентов посредством их собственных «идиосинкразических» обновлений набора данных без какой-либо координации с другими наборами данных. Это может привести к повреждение данных или другие несоответствия данных, которые могут потребовать вмешательства оператора и очистки.

Подходы к работе с раздвоенным мозгом

Дэвидсон и др.,[2] изучив несколько подходов к решению проблемы, классифицируйте их как оптимистичные или пессимистические.

Оптимистичные подходы просто позволяют разделенным узлам работать как обычно; это обеспечивает более высокий уровень доступности за счет принесения в жертву правильности. После устранения проблемы может потребоваться автоматическое или ручное согласование, чтобы кластер находился в согласованном состоянии. Одной из текущих реализаций этого подхода является Hazelcast, который выполняет автоматическое согласование своего хранилища ключей и значений.[3]

Пессимистические подходы жертвуют доступностью в обмен на последовательность. После обнаружения разбиения сети доступ к подразделам ограничивается, чтобы гарантировать согласованность. Типичный подход, описанный Coulouris et al.,[4] использовать кворум -согласованный подход. Это позволяет подразделу с большинством голосов оставаться доступным, в то время как оставшиеся подразделы должны перейти в автоматический режим.ограждение режим. Одной из текущих реализаций этого подхода является тот, который используется MongoDB наборы реплик.[5] И еще одна такая реализация - репликация Galera для MariaDB и MySQL.[6]

Современный коммерческий универсальный HA-кластеры обычно используют комбинацию сетевых подключений пульса между узлами кластера и кворум хранилище свидетелей. Проблема с двухузловыми кластерами заключается в том, что добавление устройства-свидетеля увеличивает стоимость и сложность (даже если оно реализовано в облаке), но без него, если тактовый сигнал не работает, члены кластера не могут определить, какое из них должно быть активным. В таких кластерах (без кворума), если член выходит из строя, даже если члены обычно присваивают хостам первичный и вторичный статусы, существует как минимум 50% вероятность того, что двухузловой HA-кластер полностью выйдет из строя, пока не будет обеспечено вмешательство человека. , чтобы предотвратить независимую активацию нескольких элементов, а также прямое противоречие или повреждение данных.

Рекомендации

  1. ^ Windows Server 2008 Active Directory, настройка (2-е издание), Holme, Ruest, Ruest, Kellington, ISBN  978-0-7356-5193-7
  2. ^ Дэвидсон, Сьюзен; Гарсия-Молина, Гектор; Скин, Дейл (1985). «Согласованность в многораздельной сети: обзор». Опросы ACM Computing. 17 (3): 341–370. Дои:10.1145/5505.5508. HDL:1813/6456.
  3. ^ "Документация Hazelcast". Получено 16 февраля 2015.
  4. ^ Кулурис, Джордж; Доллимор, Жан; Киндберг, Тим (2001). Распределенные системы: концепции и дизайн (3-е изд., 1-е, 2-е и 3-е оттиск. Изд.). Харлоу [u.a.]: Эддисон-Уэсли. ISBN  0201-61918-0.
  5. ^ «Основы репликации MongoDB». Получено 12 декабря 2012.
  6. ^ «Взвешенный кворум в кластере Galera». Получено 17 декабря 2015.