Что есть что в Nutanix: надежность и устойчивость

Продолжаем краткий обзор основных фич и особенностей внутреннего устройства систем Nutanix, без понимания которого бывает сложно разобраться с тем, как именно все там устроено и почему именно так оно работает.

Высокая доступность сервисов с использованием избыточных путей к данным

Платформа Nutanix является полностью распределенной системой, созданной быть отказоустойчивой и устранять любую единую точку отказа или узкое место архитектуры. Система использует подход shared-nothing, при котором все компоненты и сервисы распределяются по всем узлам кластера. Каждый отдельный компонент разработан с возможностью быстро определить состояние отказа, и тем самым быстрое начать процессы восстановления системы. Если отказывает Controller VM, то Nutanix автоматически перенаправляет пути доступа к данным через хост с работающей Controller VM, например на другом узле кластера. Это перенаправление будет продолжаться до тех пор, пока не восстановится работа локального Controller VM. Поскольку кластер оперирует общим, глобальным namespace и иеет доступ к репликам всех данных этого узла, это делает возможным выполнить такую операцию немедленно. Такая схема позволяет иметь N-way full fault-tolerant failover для всех VM в кластере Nutanix.

Высокая доступность данных с настраиваемой избыточностью

Прежде чем система отрапортует об успешном проведении записи операции ввода-вывода, она синхронно реплицирует эту запись на еще один или несколько узлов кластера. Это обеспечивает сохранение данных в как минимум двух местах в кластере и обеспечивает их высокую доступность. Администратор может динамически конфигурировать различный уровень избыточности данных.

Availability Domains: защита от катастрофических отказов

Availability domains или «домены доступности» обеспечивают надежную защиту даже от катастрофических отказов оборудования, что позволяет кластеру Nutanix выживать без потери данных или сервисов даже в случае, если выйдет из строя целиком физический блок узлов кластера. Соединение избыточности данных и интеллектуального из размещения в кластере позволяет системе автоматически сохранять и целостность данных и непрерывающийся доступ к ним.

Подробнее об анализе отказов в архитектуре хранения данных смотрите в документе Tech Guide: Nutanix Failure Analysis.
Подробнее о том, как Nutanix Virtual Computing Platform обеспечивает надежность данных и сервисов, смотрите Tech Note: Nutanix System Reliability.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *