Загадка в vSphere

топ 100 блогов ru_root24.06.2016 Как обычно, я наступил на неизвестные науке грабли..

Имеется пара серверов с VMware vSphere и кучей виртуалок. ВНЕЗАПНО один из серверов несколько отвалился. Сам сервер и все его виртуалки отзывались на пинги и даже отвечали на некоторых портах, в том числе на 22, но после установки TCP-соединения наступала полная тишина. ssh -v тоже доходил до "debug1: Connection established", и всё.. Любопытно, что ssh ни к одной машине не отваливался по таймауту, а просто зависал навсегда (я некоторые экземпляры до получаса держал).

Я, было, подумал, что диски отвалились, оно примерно так бы выглядело, но к одной машинке по ssh таки удалось подключиться, и она даже выдавала сообщение про "Last login", после чего всё так же зависало навсегда. При следующей попытке соединения она выдавала "Last login" про мою же предыдущую попытку с соответствующим временем и IPшником, значит диск у неё работал, но всё равно сессия зависала.

Второй сервер и все его виртуалки продолжали успешно работать.

А к вечеру всё как-то само собой починилось.. Все виртуалки живы, не перегружались, значит, и сервер тоже не перегружался. Все диски на месте, в логах только сообщения о недоступности соседних машинок по сети, и больше никаких ошибок. То есть, они всё это время работали.

Самое интересное, что ещё до начала этого глюка у меня была открыта ssh-сессия на сам сервер. Она также залипла, но не отвалилась. Нажатие на Enter выдавало в терминал пустую строку (без prompt'а), значит, сессия была жива, но больше никаких надписей и никаких реакций ни на какие кнопки. Когда оно починилось, в терминал вылетела кучка строк с prompt'ами (на все ранее нажатые Enter'ы), и сессия продолжила нормально работать..

На сервере тоже никаких ошибок не показывают, а на графиках за время глюка вообще полная тишина:

Загадка в vSphere Загадка в vSphere Загадка в vSphere

Что это могло быть?? В целом выглядит как проблема с сетью, но я не могу придумать, как можно сделать, чтоб соединения работали на уровне TCP, но ничуть не выше. И чтоб тот же ssh, который не мог подключиться по SSL, не отваливался по таймауту..

Оставить комментарий

Архив записей в блогах:
83 человека пострадали при аварийной посадке Ту-154 Самолет Ту-154 совершил аварийную посадку в московском аэропорту "Домодедово" из-за отказа трех двигателей, генератора и навигационного оборудования. По данным Минздравсоцразвития, ...
Производство УАМЗ ...
...
- Братья-талибы, прекратите геноцид и убийства" - Ну ладно, уговорили. Братья-талибы Во время онлайн-пресс-конференции Монсеф заявила: «Я хочу использовать эту возможность, чтобы поговорить с нашими братьями, талибами». «Мы призываем вас обеспечить безопасный и гарантированный ...
Я не люблю Россию, не люблю Путина. Просто мне стыдно за нашу страну, за великую Францию, мне очень стыдно за то, что страна с великой культурой, моя Франция, которая дала миру великих математиков, философов, писателей, художников, композиторов; страна которая завоевала всю Европу, тепер ...