Мы выпустили первую версию системы мониторинга
11.10.2016

В первую очередь — сделать мониторинг и сбор данных удобными для пользователя. При этом нам нужно было собрать и визуализировать большое количество параметров, отвечающих за работоспособность системы. Это первый шаг в развитии российского ПО для мониторинга больших и сложных ИТ-структур. Идеологической платформой стал Zabbix, но мы попытались сделать интерфейс более понятным.

Мы разработали ВИНГРИД.НЕОН — систему мониторинга и управления серверами, коммутаторами, системами хранилищ данных (СХД), источниками бесперебойного питания (ИБП) и клиентскими устройствами организации.

Приложение для мониторинга поддерживает устройства:

  • Серверы на ОС Linux Ubuntu, Windows Server.
  • Коммутаторы Системы хранения данных
  • Источники бесперебойного питания
  • Клиентские устройства — Ноутбуки, Планшеты, Десктопы на базе OС Windows 7, 8, 10.

Данные мониторинга выводятся на веб-интерфейс администратора.

Администратор может добавлять устройства, менять их конфигурацию и шаблон мониторинга. Это позволяет сильно упростить интерфейс и отслеживать только те показатели, которые необходимы. Вплоть до настройки e-mail уведомлений.

Также мы можем за минуту создать нового пользователя, назначить ему права, просмотреть все последние действия и, если необходимо, сохранить лог. В случае поломки заведённого в систему устройства логи позволят быстро выявить, что привело к неисправности.

Адаптивность и интерфейс

Для каждого типа устройства задается свой шаблон мониторинга. В шаблоне задается список триггеров и событий, которые должны быть сгенерированы при срабатывании триггера. В триггере описываются ситуации, при возникновении которых система должна сгенерировать событие уровня OK (information), warning или critical. Возникновение события уровней warning или critical означает наличие проблем в работе устройства.

Диаграммы дают быстрое и общее представление о состоянии системы. Для каждого типа устройств отображено количество их количество и статус.

Графики позволяют изучить состояние системы в динамике. Графики разбиваются по серверам, для каждого — свой.

Более детальную статистику действий можно посмотреть в таблице-логе. В таблице выводится список всех событий, сгенерированных в системе.

Что ещё умеет система
  • Сканирование и подключение устройств, находящихся в сети организации из списка поддерживаемого оборудования
  • Управление оборудованием:
    • Сервера: ведение списка серверов, мониторинг состояния, анализ BMC и DMM
    • датчиков; управление сервером
    • Коммутаторы: ведение списка, SNMP мониторинг
    • СХД: ведение списка, SNMP мониторинг
    • ИБП: ведение списка, SNMP мониторинг
    • Клиентские устройства: ведение списка, SNMP мониторинг
    • Мониторинг и анализ событий на устройствах сети, настройка Email - уведомлений
    • Управление DHCP сервером
  • Управление прошивками BMC для Серверов и Коммутаторов
  • Управление Агентами мониторинга для Серверов и Клиентских устройств
  • Управление образами операционных систем для Серверов
  • Управление пользователями

Наше ПО призвано облегчить жизнь администраторам, повысить надёжность ИТ-инфраструктуры крупных предприятий. В первую очередь эти задачи решают удобный интерфейс и настраиваемые показатели мониторинга. Плюс, система снимает большое количество показателей по клиентским устройствам — от использования памяти до запылённости блоков питания.

В дальнейшем мы планируем разработать мобильное приложение для администраторов чтобы данные мониторинга были доступны круглосуточно и в любом месте.