Nutanix Acopolis: как работает High Availability (HA)?

Несмотря на то, что, строго говоря, Nutanix Acropolis, наша встроенная управлялка, «vCenter for KVM», стал доступен пользователям еще в январе, его официальное объявление было задержано, в первую очередь потому, что мы хотели отладить и добавить несколько важных функций, без которых современная подобная система немыслима. Одна из них — функциональность High Availability (HA) для VM на KVM.
Теперь она у нас есть, и вот как это работает.
Сперва — для чего этот HA вообще нужен?


HA это, если по-простому, то, что перезапустит вашу VM на другом хосте кластера, в случае, если ее хост, тот сервер, на котором она выполнялась, по какой-то причине выйдет из строя.
Но тут есть некоторая тонкость, которую, при всей ее очевидности, иногда выпускают из виду. Допустим, у нас в кластере хостов (пусть это будет, для определенности, кластер vSphere), три сервера, объединенные в кластер высокой доступности (VMware HA).
Допустим, вы не следите за пользователями, и вот, обнаруживаете, что на каждом из трех хостов по 70% загрузки по памяти виртуальными машинами. На каждом из хостов осталось всего 30% емкости памяти под VM. Все работает. Но что произойдет, если один из хостов выйдет из строя? Теоретически, VM с отказавшего хоста должны будут мигрировать и перезапуститься на оставшихся двух нодах. Однако места там для всех VM отказавшего хоста просто физически нет.

Вот, например, одна из ситуаций, которую должна разруливать хорошая подсистема HA. И у Nutanix она теперь есть.

В опициях кластера теперь есть новый пункт — Manage VM High Availability.

HAMenu

И возможные варианты это включить-выключить HA вообще, а кроме этого — выбрать между двумя вариантами поведения этого HA: Reserve Space и Best Effort.

HAonBestEffort

Best Effort — это вариант по умолчанию, и он делает ровно то, что вы и ожидаете. VM перезапускаются на других хостах кластера, когда на них есть достаточные ресурсы. Вы можете настроить приоритеты для VM, например для продакшновых VM поставит приоритет высокий, а для всяких тестовых и не смертельнонужных — пониже. Когда ресурсов нет, то сперва будут запускаться VM с высоким приоритетом, а потом с приоритетом ниже, до тех пор, пока ресурсы (например, оперативная память) будут в наличии.

Вариант Reserve Space поступает иначе.

HAonReserveSpace

Когда вы выбрали его, он заранее резервирует в кластере достаточные ресурсы для гарантированного запуска всех VM. Например в случае использования RF=2 будет зарезервирована целиком одна нода в кластере, а в случае RF=3 — две ноды. Такое поведение гарантирует вам возможность возобновить работу всех VM, пусть и таким, довольно принудительно-жестоким способом. Но если ваши VM все такие, и требуют обязательной возможности рестарта, то это хороший выбор.

Со включенным HA на домашней странице Prism UI появляется фрейм, в котором можно увидеть статус HA, а также число запущенных, выключенных, и suspended VM.

HAHomeScreen

Кроме общего включения HA на весь кластер, можно управлять включением HA для конкретной VM.

VMHAupdate

Нажмите для VM на кнопку Update, и в параметрах включите или выключите переключатель High Availability.

VMHA

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *