Известные проблемы

Не работает платформа после обновления до версии 2023.09.1

Описание

При обновлении до версии 2023.09.1 командой

vm update

или установке платформы версии 2023.09.1 могут возникать ошибки, связанные с docker. Например, ошибка при пересоздании контейнеров:

ERROR: for vm_box  Renaming a container with the same name as its current name
ERROR: for vm_box  Renaming a container with the same name as its current name
Encountered errors while bringing up the project.
fail

Характерные признаки проблемы:

  • частично или полностью недоступен интерфейс платформы;
  • операции с контейнерами выполняются частично или не выполняются;
  • установка платформы завершается ошибкой:

    Configuring Docker ... done
    Checking docker version ... done
    Pulling images ... fail
    exit status 1

    При анализе лога  установки install.log выявляются проблемы с docker или отсутствие модуля compose.

    Пример ошибки docker
    2023/08/16 13:10:24 Running command 'systemctl restart docker'
    Job for docker.service failed because the control process exited with error code.
    Пример ошибки compose
    Traceback (most recent call last):
     File "/usr/local/bin/docker-compose", line 5, in <module>
     from compose.cli.main import main
    ModuleNotFoundError: No module named 'compose'

Указанная проблема связана с docker и решается установкой docker-compose версии v2.

Решение

Чтобы решить проблему:

  1. Подключитесь к серверу с платформой по SSH.
  2. Загрузите и установите docker-compose командой

    curl -SL https://github.com/docker/compose/releases/download/v2.20.3/docker-compose-linux-x86_64 -o /usr/local/bin/docker-compose

На новом узле не устанавливается служба gomon

Описание

Подключение узла не работает корректно. После подключения нового узла возможно следующее некорректное поведение:

  • ложные сообщения об ошибках. Например, #5344 Недостаточно RAM на узле, в то время, как показатель RAM соответствует требованиям;
  • не обновляется информация о версиях libvirt и qemu;
  • не создаются ВМ на этом узле;
  • недоступна миграция ВМ на этот узел;
  • другие проблемы на новом узле.

Причина этого в том, что при подключении нового узла не установилась служба gomon. Gomon — служба, которая запускается на узле и отвечает за статистику и мониторинг.

Чтобы проверить статус службы gomon, выполните команду на узле:

systemctl status gomon

Если служба не установлена, вывод будет таким:

Unit gomon.service could not be found.

Решение

Чтобы решить проблему:

  1. Подключитесь к серверу с платформой по SSH.
  2. Перезапустите контейнер nodewatch:

    docker stop nodewatch
    docker start nodewatch

    После перезапуска подождите примерно 10 минут. За это время служба gomon установится на узле.

  3. Подключитесь к серверу узла по SSH.
  4. Проверьте статус службы gomon:

    systemctl status gomon
  5. Перезапустите службу gomon:

    systemctl restart gomon
    Если проверить узел, не выполнив рекомендованное ожидание 10 минут после перезапуска nodewatch, результаты могут отобразиться некорректно.

После этого новый узел будет подключён без ошибок.

Ошибка #5349 Нет соединения с узлом 

Описание

Стандартно указанная ошибка возникает при отсутствии связи с узлом. Но в версии 2023.07.1 появляется ложное сообщение об ошибке #5349, когда пользователь выполняет любые действия с ВМ, которые не связаны с узлом. Например, ложное сообщение об ошибке #5349 может появиться при смене конфигурации или включении ВМ.

Решение

Чтобы устранить ошибку:

  1. Подключитесь к серверу с платформой по SSH.
  2. Перезапустите службу мониторинга командой:

    docker exec -it vm_box supervisorctl restart monitor
Дата последнего обновления статьи: 13.05.2025. Статья подготовлена техническими писателями ISPsystem