Установка кластера в Foundation повисает на 74% done

Личный опыт, вдруг кому пригодится.
Устанавливаю кластер Nutanix во вполне стандартной конфигурации. Четыре ноды, включенные в 10G свитч своими 10G портами. Порты 1G из IPMI-карт заведены в гигабитный свитч, который включен в 10G-коммутатор через модуль Gigabit copper SFP+. Конфига стандартнее некуда.

2015-08-04 17-47-40 Blank Network Diagram  Lucidchart ‎- Microsoft Edge

При установке в Foundation инсталляция бодро продвигается к финишу, после чего намертво повисает на статусе «phoenix complete (74%)». В логах ничего вразумительного, никаких ворнингов или ерроров, последняя запись — о штатном завершении соответствующего процесса. На консоли хостов-нод также все ОК. Висит в таком состоянии минут 45-50, после чего также молча отваливается по таймауту.

2015-10-05 14-04-13 Nutanix Foundation - Internet Explorer

Причина была в битом SFP+ линка между 10G и 1G коммутаторами, причем в одном случае это был просто «битый» SFP+ (который распознавался, порт поднимался, но трафик по порту не ходил), в другом — неподдерживаемый свитчом (несмотря на клятвенное уверение клиента, что все ОК), что было видно только на стороне 10G-коммутатора, потому что на гигабитном линк горел в любом случае.

Причина была в том, что после установки Phoenix кухня Nutanix начинает, наконец-то, проверять хождение трафика, и обнаруживает, что сама себя-то она через 10G коммутатор прекрасно видит, но сказать об этом в Foundation, подключенный по гигабиту никак не может. Наверное Foundation стоило бы быть более чутким к таким ошибкам, проверять связность «на входе», и давать больше сетевой диагностики (вместо той неостановимой «болтливости», которой сейчас забиты его логи), но тут надежда уже на Foundation 3.0, в котором много нового, и который вышел вместе с NOS 4.5. Его удастся поглядеть «в бою» в ближайшие дни.

Так или иначе, вот моя личная находка, которая, возможно, сэкономит кому-то часы возни и поисков причин проблем.
Вообще, мой опыт инсталляции говорит однозначно: Проблемы с Nutanix? Ищи проблемы в сетевой обвязке на площадке клиента. Если не нашел — ищи снова. :) 95% проблем инсталляции — сеть, сеть, сеть.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *