25 октября 2019

Программное обеспечение для управления серверами и дата-центрами

Крупнейший в мире дата-центр SUPERNAP 8. © Switch

Неподалёку от Лас-Вегаса расположен самый крупный в мире дата-центр. На его месте можно разместить почти 250 футбольных полей! А самый высокий ЦОД занимает 32-этажный небоскрёб в Нью-Йорке. Не отстаёт и Россия: тепла, которое выделяет оборудование дата-центра «Яндекса», хватает для отопления финского городка Мянтсяля.

Сравнимые по масштабам хранилища данных появляются во всех регионах планеты. Управлять ими помогает специальное программное обеспечение, оно следит за состоянием оборудования и даже предсказывает проблемы. Но так было не всегда.

От ламповых ЭВМ до бума доткомов

История дата-центров начинается с момента создания в США первого суперкомпьютера ЭНИАК в 1945 году. Модули памяти с магнитными накопителями, резервные блоки электропитания, стойки и кабели под охраной — всё это напоминало современные ЦОДы.

Нашим ответом Штатам в 1948 году стала Малая электронная счётная машина (МЭСМ). Этот суперкомпьютер был ламповым и занимал комнату площадью 60 кв. м. Комната так сильно нагревалась, что для охлаждения пришлось разобрать кровлю. А производил МЭСМ около трёх тысяч операций в минуту — в миллионы раз меньше, чем современный смартфон.

Малая электронная счётная машина. © Balalaika24

Технологии развивались, но долгое время компьютеры использовали только для военных и космических целей. На них рассчитывали баллистику ядерного оружия и расход топлива космической ракеты. Применять технологии для гражданских нужд стали позже, и первыми это сделали в компании IBM.

В 1960 году IBM построила SABRE — систему бронирования для American Airlines. Компьютеры десятков аэропортов объединили в сеть с «серверной» в США, а центр обработки данных системы (возможно, первый коммерческий ЦОД в истории) разместили под землей. В 1964 году в SABRE успешно испытали мейнфрейм IBM System/360 — первый отказоустойчивый сервер для критически важных систем.

IBM System/360 без передней панели. © Ben Franske

Мейнфреймы использовали для обработки и хранения данных вплоть до 80-х годов. Они занимали огромные площади в институтах и коммерческих организациях, и при этом считались «компактным решением».

Привычные нам Unix и PC-серверы появились только в 80-х, а распространились позже, когда стал развиваться интернет. Случившийся в это время бум доткомов повлиял и на рынок хранения данных: если раньше дата-центры создавали только крупные компании, то в 90-х в интернет устремились все.

Индустрия коммерческих ЦОДов развилась настолько, что потребовалась стандартизация: в 1987 году появился Uptime Institute, он установил принятые во всём мире стандарты надёжности дата-центров — Tier.

Собственная инфраструктура была по карману не всем, поэтому стала востребована аренда серверов. К началу 2000-х появились первые хостинг-провайдеры.

От ручного управления к автоматизированному

Кажется само собой разумеющимся, что оборудованием для автоматических вычислений управляет автоматизированный софт. Тем не менее, так было не всегда.

На заре технологий одним суперкомпьютером управляли более 20 человек. Когда серверы стали массовыми, появилась должность системного администратора. Он включал и перезапускал серверы, устанавливал и переустанавливал ОС, вёл учет оборудования в бумажных журналах или Excel-таблицах, следил за энергопотреблением по разрозненным датчикам.

С развитием индустрии начали появляться системы автоматического управления дата-центром — самим зданием и оборудованием в нём. Для управления зданием адаптировали уже распространенные в то время системы мониторинга инженерных систем здания (АСДУ). Для управления серверами программы создавали с нуля.

Теперь софт стал гораздо мощнее и функциональнее, но разделение по набору задач сохранилось. Программное обеспечение для дата-центров делится на две группы: BSM и DCIM.

Building management system (BSM) — системы управления зданием. Они нужны, чтобы оборудование внутри дата-центра работало без перебоев. Следят за электроснабжением, температурой, влажностью и контролируют безопасность. Под контролем у BSM источники электропитания, вентиляция и отопления, пожарная и охранная сигнализация. Отдельные системы помогают экономить на электричестве, оптимизируя нагрузку.

Data center infrastructure management (DCIM) — системы управления оборудованием, установленным в дата-центре: серверами, коммутаторами, маршрутизаторами. Нужны, чтобы готовить серверы к работе, настраивать сетевое оборудование, собирать статистику и вести учёт. Хороший DCIM умеет определять проблемы и уведомлять о них.

DCIM используют как инженеры коммерческих дата-центров, так и владельцы частной инфраструктуры — чтобы управлять своими или арендованными серверами.

DCImanager — универсальное решение для провайдеров и владельцев ИТ-инфраструктуры

Существует много DCIM-решений. Несмотря на общее название, у каждого своя специализация. Одни нацелены на мониторинг и инвентаризацию, вторые на управление оборудованием, третьи закрывают все потребности. Мы предлагаем DCImanager и дальше расскажем, что он умеет.

Мы выпустили первую версию DCImanager ещё в 2007 году, когда такой софт только-только развивался. Новая вышла в 2019-м.

Скриншот DCImanager 6 — новой версии панели управления серверами

DCImanager помогает подготовить сервер к работе, управлять им и следить за состоянием, а если сломается — вовремя починить по гарантии или заменить.

Подготовка
Когда DCImanager находит новый сервер, он запускает диагностику: определяет его характеристики, проверяет быстродействие, настраивает IPMI. Если нужно — очищает от старых данных. После этого устанавливает операционную систему и другой необходимый софт. ОС ставит из шаблонов, а остальной софт — из рецептов.

Провайдеры интегрируют DCImanager с платформами для продажи услуг. Благодаря этому выдача происходит автоматически: клиент заказал оборудование — DCImanager включил сервер, проверил, установил нужный софт. Провайдеру надо только один раз настроить интеграцию, дальше всё будет работать без его участия.

Управление
Через DCImanager удобно управлять сервером: перезапускать, переустанавливать ОС, назначать или удалять IP-адреса. Кроме этого, в DCImanager можно:

  1. работать с сетевым оборудованием: настраивать порты и опрашивать их статус, сохранять конфигурационные файлы, назначать VLAN, их скорость и режим;
  2. диагностировать и восстанавливать сервер через интерфейс удаленного управления (IPMI), даже если он выключен;
  3. включать/выключать устройства распределения электроэнергии (PDU), контролировать нагрузку.

Мониторинг
DCImanager собирает статистику по трафику, питанию, температуре. Если коммутатор или маршрутизатор отключится, расход электроэнергии или температура стойки превысят пороговое значение, просто по какой-то причине отключится сервер — панель сообщит об этом администратору. Новая версия DCImanager будет уметь анализировать внутреннее состояние сервера: память, жесткий диск, CPU.

Инвентаризация
В панели удобно вести учет оборудования: указывать его характеристики, когда куплено и по какой цене, кто поставщик. Если сервер выйдет из строя, из списка станет ясно — пора покупать новый или можно заменить по гарантии.