База знаний VMmanager

Известные проблемы

Не работает платформа после обновления до версии 2023.09.1

Описание

При обновлении до версии 2023.09.1 командой

vm update

или установке платформы версии 2023.09.1 могут возникать ошибки, связанные с docker. Например, ошибка при пересоздании контейнеров:

ERROR: for vm_box  Renaming a container with the same name as its current name
ERROR: for vm_box  Renaming a container with the same name as its current name
Encountered errors while bringing up the project.
fail

Характерные признаки проблемы:

  • частично или полностью недоступен интерфейс платформы;
  • операции с контейнерами выполняются частично или не выполняются;
  • установка платформы завершается ошибкой:

    Configuring Docker ... done
    Checking docker version ... done
    Pulling images ... fail
    exit status 1

    При анализе лога  установки install.log выявляются проблемы с docker или отсутствие модуля compose.

    Пример ошибки docker
    2023/08/16 13:10:24 Running command 'systemctl restart docker'
    Job for docker.service failed because the control process exited with error code.
    Пример ошибки compose
    Traceback (most recent call last):
     File "/usr/local/bin/docker-compose", line 5, in <module>
     from compose.cli.main import main
    ModuleNotFoundError: No module named 'compose'

Указанная проблема связана с docker и решается установкой docker-compose версии v2.

Решение

Чтобы решить проблему:

  1. Подключитесь к серверу с платформой по SSH.
  2. Загрузите и установите docker-compose командой

    curl -SL https://github.com/docker/compose/releases/download/v2.20.3/docker-compose-linux-x86_64 -o /usr/local/bin/docker-compose

На новом узле не устанавливается служба gomon

Описание

Подключение узла не работает корректно. После подключения нового узла возможно следующее некорректное поведение:

  • ложные сообщения об ошибках. Например, #5344 Недостаточно RAM на узле, в то время, как показатель RAM соответствует требованиям;
  • не обновляется информация о версиях libvirt и qemu;
  • не создаются ВМ на этом узле;
  • недоступна миграция ВМ на этот узел;
  • другие проблемы на новом узле.

Причина этого в том, что при подключении нового узла не установилась служба gomon. Gomon — служба, которая запускается на узле и отвечает за статистику и мониторинг.

Чтобы проверить статус службы gomon, выполните команду на узле:

systemctl status gomon

Если служба не установлена, вывод будет таким:

Unit gomon.service could not be found.

Решение

Чтобы решить проблему:

  1. Подключитесь к серверу с платформой по SSH.
  2. Перезапустите контейнер nodewatch:

    docker stop nodewatch
    docker start nodewatch

    После перезапуска подождите примерно 10 минут. За это время служба gomon установится на узле.

  3. Подключитесь к серверу узла по SSH.
  4. Проверьте статус службы gomon:

    systemctl status gomon
  5. Перезапустите службу gomon:

    systemctl restart gomon
    Если проверить узел, не выполнив рекомендованное ожидание 10 минут после перезапуска nodewatch, результаты могут отобразиться некорректно.

После этого новый узел будет подключён без ошибок.

Ошибка #5349 Нет соединения с узлом 

Описание

Стандартно указанная ошибка возникает при отсутствии связи с узлом. Но в версии 2023.07.1 появляется ложное сообщение об ошибке #5349, когда пользователь выполняет любые действия с ВМ, которые не связаны с узлом. Например, ложное сообщение об ошибке #5349 может появиться при смене конфигурации или включении ВМ.

Решение

Чтобы устранить ошибку:

  1. Подключитесь к серверу с платформой по SSH.
  2. Перезапустите службу мониторинга командой:

    docker exec -it vm_box supervisorctl restart monitor
Дата последнего обновления статьи: 13.05.2025. Статья подготовлена техническими писателями ISPsystem.