Отказоустойчивые Unbreakable-кластеры (high availability)
Автоматическое переключение виртуальных машин на рабочие
узлы при авариях для обеспечения высокого уровня доступности
инфраструктуры и непрерывности бизнес-процессов
Ключевые возможности
Минимум требований к кластеру
Для обеспечения отказоустойчивости кластера (high availability) необходимо от 3 узлов с сетевыми хранилищами Сeph или SAN и виртуализацией KVM
Распознавание различных аварийных ситуаций
Процедура восстановления запускается не только при полном отказе узла, но и при проблемах с доступностью управляющей сети или сетевого хранилища
Оперативное реагирование
Распознавание аварийной ситуации занимает менее минуты, перезапуск виртуальных машин на рабочих узлах — несколько секунд
Приоритизация виртуальных машин
В отказоустойчивом кластере можно выбрать виртуальные машины, подлежащие автоматическому восстановлению, и указать приоритет их запуска на рабочем узле
Как работает High Availability Cluster
VMmanager поддерживает микросервисную архитектуру и построение отказоустойчивых кластеров (Unbreakable clusters). Повышение нагрузки на один сервис не влияет на работу самой платформы и других компонентов.
Отказоустойчивые кластеры обеспечивают непрерывную работу виртуальных машин даже при сбоях оборудования или программного обеспечения. Если на одном из узлов кластера возникает авария, VMmanager автоматически мигрирует виртуальные машины на другие доступные узлы, минимизируя простои и обеспечивая высокий уровень непрерывности бизнеса.
Отказоустойчивость на уровне платформы
Процедура восстановления виртуальных машин обеспечивается High Availability агентами. Аварийное восстановление узла активируется даже в случае сбоя платформы управления виртуализацией VMmanager.
Механизм реализации высокой доступности позволяет обеспечить отказоустойчивость платформы виртуализации без сложного администрирования. Достаточно перенести мастер платформы на одну из отказоустойчивых машин внутри Unbreakable-кластера.
Оперативное восстановление ВМ при аварии
За мониторинг доступности узлов кластера отвечает управляющий узел. Он не только реагирует на полный отказ узла, но и отслеживает:
Доступность управляющей сети
Доступность сетевого хранилища
Для повышения точности и скорости реагирования используется дополнительный фактор — проверочный IP-адрес. Это позволяет распознать аварийную ситуацию, когда узел кластера уже не имеет доступа к управляющей сети, но она остается доступна для виртуальных машин.
Платформа фиксирует аварийную ситуацию в течение минуты после ее возникновения. Миграция виртуальных машин на рабочий узел кластера и их перезапуск занимают несколько секунд. Высокая скорость срабатывания позволяет сократить риски, связанные с недоступностью сервисов, и повысить уровень непрерывности бизнеса.
IT-инфраструктурой
в единой системе
Получите доступ к демонстрации, чтобы оценить решения ISPsystem в действии:
- Попробуйте интерфейс, в котором могут работать пользователи с разным уровнем техподготовки
- Ознакомьтесь с возможностями для автоматизации, мониторинга и учёта
- Посмотрите, как ISPsystem решает задачи по управлению IT и оптимизации расходов