Network Node Manager

- мониторинг сетевой инфраструктуры

 

Введение

NNMi – решение, предназначенное для мониторинга и диагностики сетевой инфраструктуры. С помощью этого инструмента сетевой администратор получает возможность наблюдать состояние как всей сети в целом, так и отдельных ключевых сегментов. В результате, NNMi позволяет получить визуальную картину состояния сети, проводить инвентаризацию сетевых устройств, повысить доступность и быстродействие сетевой инфраструктуры, снизить время простоя в результате аварийных ситуаций. NNMi автоматически ищет и распознаёт сетевые устройства, считывает их конфигурацию и создаёт карту сети. Сразу после распознавания обнаруженного устройства NNMi получает с него данные о производительности, состоянии сетевых интерфейсов, информацию с датчиков температуры и т.п., и заносит эту информацию в базу данных.

NNMi отображает состояние сети, используя два основных метода получения данных от устройств:

  • с помощью сообщений, получаемых от управляемых сетевых устройств (SNMP трапы);
  • путём регулярного опроса устройств, наблюдая за изменением их состояния или конфигурации.

С помощью NNMi можно измерять такие параметры, как загрузка интерфейсов, ошибки, загрузка процессора и многие другие, которые предоставляет SNMP агент устройства. NNMi предоставляет подробную информацию о сетевом устройстве. Некоторые атрибуты заполняются автоматически, во время обнаружения и распознавания устройства, остальные могут быть добавлены вручную оператором NNMi. C помощью NNMi можно выводить различные отчеты, такие как список обнаруженных устройств, список IP адресов и сетей, список настроенных VLAN, серийные номера, контактную информацию. Ввиду того, что NNMi работает с устройствами по протоколу SNMP, он может работать с любыми SNMP устройствами, включая рабочие станции и серверы, с установленными SNMP агентами. Но из-за особенностей реализации протокола SNMP, NNMi не может наблюдать за специфичными параметрами оборудования и программного обеспечения серверов. К примеру, на сервере будут обнаружены все IP адреса, но данные о количестве жестких дисков и свободной оперативной памяти будут недоступны.

NNMi поставляется в двух редакциях:

  • «Начальная» («Starter»);
  • «Расширенная» («Advanced»).

Функциональный состав этих редакций представлен в таблице Функциональный состав NNMi).

Таблица  Функциональный состав NNMi

Функция

Редакция NNMi

Начальная

Расширенная

Обнаружение на уровнях 2 и 3 модели OSI

+

+

Настраиваемый сбор данных по протоколу SNMP (без хранения)

+

+

«Dynamic RCA»

+

+

«Management by exception»

+

+

Поддержка iSPI

+

+

Поддержка MPLS

+

+

Поддержка «Multicast»

+

+

Поддержка VoIP

+

+

Корреляция событий на основе данных о производительности

+

+

Интеграция с OVPI

+

+

Интеграция с RAMS

 

+

«Root Cause Analysis (RCA)»

+

+

Агрегирование транков/портов (Поддерживается для PaGP, SMLT, MLT протоколов)

 

+

Расширение «Path View»

 

+

«MPLS WAN Clouds» (RAMS)

 

+

«Global Network Management» (GNM)

 

+

IPv6 на UNIX системах

 

+

Управление виртуализированными серверами

 

+

В данном документе не рассматриваются расширенные возможности NNMi, предоставляемые с помощью дополнительных модулей iSPI.

Технология Спирального обнаружения

Утилита опрашивает коммутаторы, и определяет, к какому порту подключен конечный узел. Конечный узел не обязательно должен быть обнаружен с помощью NNMi, эти данные берутся из ARP таблицы коммутатора. Используя этот метод – утилита позволяет отобразить, следующую информацию:

  • к какому порту коммутатора подключено искомое устройство; поиск может осуществляться по IP адресу, имени узла или MAC адресу;
  • список всех узлов, подключенных к коммутатору.

Формирование инцидентов

«Инциденты» – это происходящие в наблюдаемой сети события, требующие определённой реакции. Они несут информацию об изменениях на наблюдаемых устройствах, либо об изменениях связей между ними. Каждый инцидент имеет уровень, определяющий серьёзность ошибки. Помимо этого, каждый инцидент имеет атрибут, показывающий, насколько быстро ошибка должна быть исправлена.

NNMi создаёт инцидент на основе событий, поступающих из различных источников. События создаются самим NNMi, поступают в виде SNMP трапов, и в виде сообщений, пересылаемых от NNM.

Инциденты могут быть закрыты в следующих случаях:

  • если проблема решена, происходит автоматическое закрытие инцидента. К примеру, узел изменил своё состояние с «выключен» на «включен», инцидент о недоступности узла будет автоматически закрыт;
  • существует список попарно связанных инцидентов, при поступлении которых в определённом порядке происходит автоматическое закрытие инцидента. К примеру – инцидент «SNMPLinkUP» (связь на линии установлена), автоматически закрывает инцидент «SNMPLinkDown» (потеряна связь на линии);
  • инциденты могут быть закрыты вручную, администратором или оператором NNMi.

В NNMi есть ряд правил, позволяющих выявлять корневую причину возникшей проблемы. При анализе используются данные о состоянии узлов, связях, ошибках и данных о производительности.

Регистрирование и анализ SNMP трапов

По умолчанию, NNMi измеряет скорость потока входящих SNMP трапов - скорость входящих трапов для каждого устройства и скорость входящих трапов для трапов с одинаковыми идентификаторами OID. В том случае, если скорость входящих SNMP трапов превышает определённое значение, NNMi блокирует такие трапы, пока скорость не снизится ниже порогового лимита.

Модуль «SNMP trap analytics» позволяет строить следующие отчеты, основанные на информации о трапах:

  •  
    • количество трапов за определённый период;
    • количество трапов для определённого узла;
    • количество трапов с определённым идентификатором – OID.

Встроенные средства первичной диагностики

NNMi содержит встроенные средства самодиагностики, позволяющие наблюдать за состоянием памяти, процессора, и дисковой подсистемы. В том случае, если обнаружены проблемы, связанные, например, с недостатком ресурсов, NNMi формирует соответствующий инцидент.

 Сбор данных в NNMi

 Методы обнаружения узлов

Понятие «обнаружение» включает в себя сканирование заданного диапазона сетевых адресов, распознавания найденного устройства и добавление подробной информации о нём в базу NNMi. Это является ключевой информацией для построения топологии, и дальнейшего мониторинга сетевой инфраструктуры.

NNMi использует ряд протоколов и технологий для сканирования сети и обнаружения устройств. Для обнаруженных устройств NNMi автоматически получает информацию об их конфигурации (включая данные об интерфейсах и информацию, о соединениях). Данные о соединениях на 2 и 3 уровнях модели OSI наносятся на карту, хранящуюся в базе данных NNMi.

Процесс обнаружения непрерывный, и обнаружение никогда не может быть выполнено. Если в сетевой инфраструктуре ничего не произошло, NNMi продолжит обнаруживать изменения по спирали.

По умолчанию, NNMi настроен на поиск в сети только сетевых устройств, таких как маршрутизаторы и коммутаторы. Но без предварительной настройки, NNMi не выполняет поиск, эта функция требует предварительной настройки.

NNMi поддерживает 2 режима обнаружения:

  •  
    • «Обнаружение по списку» - в этом режиме NNMi указываются узлы, которые должны быть точно обнаружены;
    • «Обнаружение, основанное на правилах» - в этом режиме используются правила, которые содержат диапазоны IP адресов, диапазоны OID устройств, исключенные IP адреса, и т.д.

Режим 1 «Обнаружение по списку»

Пример «Обнаружения по списку» представлен на рисунке ниже.

 

Рисунок Обнаружение по списку

Оба этих метода обнаружения могут работать вместе, и их одновременное использование даёт лучшие результаты. Первоначальное обнаружение происходит с помощью метода, основанного на списках. Далее узлы ищутся с помощью спирального обнаружения. Как только NNMi обнаруживает изменения в конфигурации узла, автоматически запускается функция обнаружения для узла и для соседних с ним узлов. Есть только одно исключение – функция обнаружение не запускается, если изменена только внутренняя конфигурация устройства (например, контактное лицо или версия встроенного ПП). Администратор может установить интервал запуска повторного обнаружения от одного часа до нескольких дней. По умолчанию он составляет 24 часа. Обнаружение устройств настраивается с помощью формы «Discovery Configuration Form». Форма «Communication Configuration Form» используется для настройки взаимодействия с устройствами и конфигурирования частоты опроса.

Режим 2 «Обнаружение, основанное на правилах»

Пример «Обнаружения основанного на правилах» представлен на рисунке.

Рисунок Обнаружение основанное на правилах

Взаимодействие с сетевыми узлами

Для мониторинга узлов NNMi использует протокол ICMP («Echo») и протокол SNMP. NNMi работает с протоколом SNMP версий v1, 2c и 3. Протокол SNMP является ключевым при управлении сетями, он позволяет запрашивать у устройств конфигурации, таблицы маршрутизации, статусы сетевых интерфейсов, и т.д. Для взаимодействия между SNMP менеджером и агентом, NNMi необходимо настроить «community name» чтобы иметь доступ к устройствам.

Поэтому, для настройки сетевого взаимодействия с устройствами, на NNMi необходимо произвести следующие настройки:

  • разрешить протокол ICMP (в частности, прохождение «ping» через сетевые фильтры);
  • установить корректные значения «SNMP community name»;
  • установить пороговые значения задержек и количество повторных запросов.

              Есть три способа, которыми можно настроить «SNMP community»:

  •  значение «SNMP community» для конкретного узла;

 

  • значение «SNMP community» для региона, заданного с помощью диапазона адресов;
  • значение «SNMP community» по умолчанию.

Применение фильтров

В больших сетях целесообразно отфильтровывать результаты поиска узлов. Это позволяет сосредоточить внимание на ключевых узлах сети, повысить быстродействие системы, снизить количество необходимых для NNMi лицензий.

NNMi позволяет фильтровать устройства по следующим критериям:

  • «Диапазон IP адресов»;
  • «Диапазон System Object ID» (sysObjID).

Порядок применения правил

В процессе работы NNMi, устройство может попадать под действие различных, взаимоисключающих друг друга правил. Для решения такой проблемы, введено поле «Order» - число, определяющее приоритет правила относительно других. К примеру, есть правило «А», задающее диапазон устройств, которые должны быть обнаружены, и правило «Б», содержащее диапазон устройств, которые не должны быть обнаружены. Устройство попадает одновременно под действие этих двух правил. В конечном итоге, будет применено то правило, где число «Order» - меньше.

Структурирование и визуализация в NNMi

Для упрощения мониторинга сети, NNMi предоставляет возможность разбиения сети на различные группы. NNMi позволяет группировать объекты по различным критериям, например по IP подсетям, регионам, типам устройств и т.п.

Символы NNMi

При отображении на карте узлов и групп узлов NNMi использует специальные пиктограммы. Форма, цвет и логотип внутри символа позволяют получить информацию о типе узла, его состоянии, производителе и модели устройства. Сетевые интерфейсы на узле отмечены маленькими квадратами. Отдельными пиктограммами отображаются соединения подсети.

Группы узлов

Группа узлов объединяет в себя устройства с общими атрибутами, такими как контактная информация, производитель, тип устройства. Устройства могут быть сгруппированы по их расположению, по степени важности, по функциональному назначению и т.п. NNMi позволяет создавать внутри групп подгруппы, тем самым предоставляя возможность организовать иерархическое представление узлов, гибко настраивая необходимый уровень детализации на каждом уровне.

По умолчанию, NNMi включает следующие предопределённые группы:

  • «Microsoft Windows устройства» - в эту группу попадают всё устройства, произведённые компанией «Microsoft»;
  • «Не SNMP устройства» - в эту группу попадают устройства, не отвечающие на SNMP запросы, добавленные вручную или обнаруженные с помощью ICMP протокола;
  • «Приоритетные узлы» - в эту группу администратор помещает наиболее критичные для сетевой инфраструктуры узлы. Эта группа используется NNMi при поиске корневых инцидентов. Когда устройства из этой группы перестают отвечать на запросы, анализатор NNMi создаёт инцидент «Узел недоступен», и устройство получает статус «Критично». Например, если пограничный маршрутизатор перестаёт отвечать, и в тоже время он находится в списке устройств, находящихся в тени другой проблемы, NNMi создаст инцидент «Узел недоступен» и установит статус устройства «Критично», поскольку этот узел находится в группе приоритетных устройств:
  • «Устройства сетевой инфраструктуры» - в эту группу автоматически попадают все SNMP устройства;
  • «Маршрутизаторы» - в эту группу попадают маршрутизаторы, коммутаторы 3 уровня, шлюзы;
  • «Коммутаторы» - в эту группу попадают коммутаторы, активные сетевые устройства 2 уровня сетевой модели OSI.

Карта групп узлов

«Карта групп узлов» – это графическое представление узлов и групп узлов. Используя иерархическую зависимость групп, NNMi позволяет создавать карту внутри карты. В качестве примера можно рассматривать карту мира, внутри которой можно развернуть карты континентов, на карте континента можно развернуть карту страны, на карте страны карту города. Кроме того, NNMi позволяет отображать узлы на географической карте, создавая группы на основе атрибутов, определяющих географическое расположение устройств. Для этого, необходимо иметь географическую карту в виде файла формата «PNG».

Карты групп узлов могут быть просмотрены в разделе «Карты топологии»:

  • «Карта групп узлов» - на карте представлены группы узлов в виде цветных пиктограмм, отображающих состояние каждой группы;
  • «Карта сети» - на карте представлены все устройства сети, известные NNMi;
  • «Карта устройств сетевой инфраструктуры» - на этой карте отображено состояние каждой группы сетевых устройств (группа коммутаторов и группа маршрутизаторов), в виде цветных пиктограмм;
  • «Маршрутизаторы» - отображается статус группы маршрутизаторы;
  •  «Коммутаторы» - отображается статус группы коммутаторы;
  • «Пользовательские карты» - здесь отображаются все созданные карты групп узлов. Оператор может выбрать в этом разделе любую пользовательскую карту групп узлов.

В разделе «Поиск неисправностей» NNMi отображает карты, построенные на собранных данных о сети:

  •  
    • «Карта смежных сетевых устройств 2 уровня» - отображает связи 2 уровня сетевой модели OSI для выбранного устройства с заданным числом транзитных коммутаторов;
    • «Карта смежных сетевых устройств 3 уровня» - отображает связи 3 уровня сетевой модели OSI для выбранного устройства с заданным числом транзитных устройств;
    • «Просмотр маршрута» - отображает сетевой маршрут между двумя выбранными устройствами;
    • «Карта группы узла» - отображает самый нижний уровень группы, к которой принадлежит выбранное устройство.

Группы интерфейсов

NNMi предоставляет возможность организации групп интерфейсов на основании их общих атрибутов, таких как имя интерфейса, тип интерфейса, скорость, расположение и т.п. В отличие от групп узлов, группы интерфейсов не могут быть выстроены в иерархическую модель. Группы интерфейсов создаются с помощью фильтров, применяемых к устройствам, на которых расположены эти интерфейсы.

Группы интерфейсов используются для выборочного просмотра инцидентов, мониторинга сетевых задержек пороговых значений, измерения производительности и определения целей мониторинга.

По умолчанию, NNMi предоставляет следующие сконфигурированные группы:

  •  
    • «ISDN интерфейсы» - содержит множество интерфейсов ISDN, автоматически добавляемых в эту группу при обнаружении соответствующих устройств;
    • «Point-to-Point интерфейсы» - содержит множество интерфейсов типа «точка-точка». Все соответствующие интерфейсы автоматически попадают в эту группу;
    • «Software loopback Interfaces» - включает любые интерфейсы с типом «ifType 24» (База MIB - IANA ifType-MIB), известные как интерфейсы «обратной связи»;
    • «VLAN интерфейсы»;
    • «Voice интерфейсы» - интерфейсы голосовой связи;
    • «Link Aggregation» - содержит все агрегированные интерфейсы, обнаруженные в сети. Данная группа доступна в редакции «Расширенная» (Advanced).

Мониторинг в NNMi

NNMi осуществляет мониторинг сети на 2 и 3 уровнях, включая обнаружение устройств и получение их конфигураций, строит топологию сети на основе полученных данных и производит регулярный опрос устройств. Используя эти данные, NNMi отображает текущее состояние сети, с помощью следующих инструментов визуализации:

  •  
    • «Карты»;
    • «Таблицы»;
    • «Отображение инцидентов».

На рисунке Схема инструментов визуализации показана схема, как комбинация этих инструментов позволяет осуществлять мониторинг сети.

 

Рисунок Схема инструментов визуализации

Каждый из этих подходов позволяет увидеть проблему под разным углом. Преимущества и недостатки каждого метода показаны в нижеприведенной таблице Инструменты визуализации сети.

Таблица  Инструменты визуализации сети

Инструменты

Преимущества

Недостатки

«Карты»

Текущее состояние отражено в виде единой целой картины; легко определить корневой источник проблемы

Цвет узла не несёт информации о том, что конкретно случилось, как часто и какие сообщения были получены

«Таблицы»

Легко отсортировать по выделенному полю, более подробная информация, чем в картах

Цвет узла не несёт информации о том, что конкретно случилось, как часто и какие сообщения были получены

«Инциденты»

Подробная информация о каждом случившемся инциденте. Инциденты могут быть отсортированы по атрибутам

Трудности в расставлении приоритетов для сообщений; даже если все сообщения идут со статусом «Критично», без общей картины трудно расставить приоритеты.

NNMi позволяет реализовать различные подходы к мониторингу сети:

  •  
    • «Мониторинг устройств на наличие проблем»;
    • «Мониторинг инцидентов на наличие проблем».

Мониторинг устройств

Мониторинг устройств осуществляется двумя путями: «просмотр карт» и «таблиц». В том случае, если на карте устройство изменило цвет, пользователь может выполнить ряд действий, по локализации и первичной диагностике проблемы:

  • «Тестирование проблемного узла» - помощью меню, пользователь может выбрать ряд предопределённых действий с узлом, такие как «пинг», «трассировка», и «доступ по протоколу telnet» с NNMi сервера;
  • «Инициирование опроса состояния узла» - с помощью SNMP запроса;
  • «SNMP запрос конфигурации узла».

 

Мониторинг инцидентов

Мониторинг инцидентов в NNMi реализован в соответствии с рекомендациями ITIL. NNMi получает инциденты от объектов мониторинга и направляет их на консоль оператору. Таким образом, реализуется функция мониторинга сетевых сервисов.

Для создания инцидентов используются данные, поступающие из трёх различных источников:

  • ПП NNMi - инциденты создаются NNMi сервером;
  • «SNMP трапы» - инциденты получаются как SNMP трапы от объектов мониторинга;
  • «NNM сообщения» - инциденты создаются на основе сообщений, полученных от NNM сервера.

 

NNMi инциденты содержат как обязательные данные, такие как «текст сообщения», «источник инцидента», «дата», так и дополнительную информацию.

Сообщение об инциденте содержит следующие поля, приведенные в таблице Поля инцидентов.

Таблица Поля инцидентов

Атрибут

Описание

«Критичность»

Поле показывает критичность инцидента; устанавливается NNMi и может быть изменено пользователем

«Приоритет»

Поле содержит приоритет инцидента; устанавливается NNMi и может быть изменено пользователем

«Состояние жизненного цикла»

Поле показывает текущее состояние жизненного цикла инцидента; устанавливается NNMi и может быть изменено пользователем

«Назначено»

Поле содержит имя пользователя, кому назначен данный инцидент; заполняется пользователем NNMi

«Категория»

Показывает семейство инцидента; поле устанавливается NNMi

«Семейство»

Поле отображает семейство инцидента; устанавливается NNMi на основе настроек конфигурации инцидентов

«Источник»

Поле содержит источник инцидента. Устанавливается NNMi

«Характер корреляции»

Поле показывает характер корреляции. Устанавливается NNMi

Разграничение доступа в NNMi

Доступ в консоль NNMi определяется именем пользователя и назначенной ему ролью. Пользователь аутентифицируется в системе с помощью пароля. Необходимые права пользователь получает в соответствии с присвоенной ему ролью. Каждому пользователю может быть присвоена только одна роль. Каждая роль может иметь неограниченное количество пользователей.

В NNMi определены следующие роли:

  • «Администратор»;
  • «Оператор 2 уровня»;
  • «Оператор 1 уровня»;
  • «Гость»;
  • «Клиент».

Роли и их имена не могут быть изменены. Права на доступ к рабочим областям для каждой роли указаны в таблице Права доступа к рабочим областям.

Таблица Права доступа к рабочим областям

Параметр

Гость

Оператор 2 уровня

Оператор 1 уровня

Администратор

Управление инцидентами

+

+

+

+

Карта топологии

+

+

+

+

Мониторинг

+

+

+

+

Поиск и исправление неисправностям

+

+

+

+

Инвентаризация

+

+

+

+

Просмотр инцидентов

+

+

+

+

Режим управления

+

+

+

+

Конфигурация

 

 

 

+

 Аутентификация

В NNMi реализовано две модели аутентификации: встроенная аутентификация и внешняя аутентификация в службе каталогов. Внешняя аутентификация предназначена для уменьшения количества хранимых учётных данных операторов. Для реализации этой возможности необходимо наличие работающей службы каталогов.

Три возможные модели аутентификации показаны в таблице Модели аутентификации.

Таблица Модели аутентификации

Тип входа в систему

Где хранится имя пользователя

Где хранится пароль

Где хранится соответствие пользователя и роли

1

NNMi

NNMi

NNMi

2

NNMi, служба каталогов

Служба каталогов

NNMi

3

Служба каталогов

Служба каталогов

Служба каталогов

Аудит пользователей

NNMi отслеживает действия пользователей и позволяет сохранять эти данные в журнале. Аудит в NNMi можно разделить на 2 части:

  • Аудит регистрации пользователей в системе;
  • Аудит действий пользователей.

 

При регистрации в системе, NNMi фиксирует следующие параметры: «дату», «время», когда пользователь «вошел/вышел» из системы, «имя пользователя», назначенную ему «роль», «имя компьютера», откуда пользователь «зарегистрировался» и «номер порта».

Аудит действий позволяет определить, какой пользователь внёс те или иные изменения в конфигурации NNMi и дату, когда это произошло.

Интеграция NNMi с другими приложениями

NNMi содержит инструменты, позволяющие осуществлять его интеграцию с другими приложениями. В настоящее время поддерживается интеграция со следующими продуктами:

  • «HP Business Availability Center»;
  • «CiscoWorks LAN Management Solution» (LMS);
  • «HP Network Automation»;
  • «NorthBound Interface»;
  • «HP Operations Manager»;
  • «HP Systems Insight Manager»;
  • «HP Universal Configuration Management Database» (UCMDB).

 

 Расширение возможностей NNMi

Для обеспечения большей гибкости в настройке, NNMi предоставляет возможности расширения функционала. Для реализации пользовательских надстроек, предлагается использовать следующие инструменты:

  • добавление к объектам пользовательских атрибутов;
  • настройка пользовательского меню;
  • расширение возможностей с помощью использования URL.

 

Пользовательские атрибуты расширяют перечень данных об объектах, хранимых в NNMi. Пользовательские атрибуты могут помочь при интеграции NNMi со сторонними приложениями, могут быть использованы при реализации дополнительной функциональности и просто использоваться для хранения дополнительных данных об объектах.

NNMi предоставляет возможность администратору создавать дополнительные пункты меню «Action». Это позволяет повысить эффективность работы операторов и адаптировать систему под необходимые требования.

NNMi обеспечивает возможность внешнего просмотра карт, групп, форм и пунктов меню через URL. Это делает возможным гибко интегрировать NNMi с другими продуктами, или создавать дополнительные модули без вмешательства в исходный код.

«HP Business Availability Center»