Услуга Мониторинга SLA
Почему сегодня это необходимо?
Организация непрерывной работы бизнес-процессов сегодня наиболее актуальная задача для средних и крупных, географически распределенных организаций, развитие которых напрямую зависит от ИТ-технологий.
Сервисы, которые сегодня используются системными администраторами, дают только техническую оценку, чаще всего, не дающую полную картину функционирования предприятия.
Insitu внедряет решения по обеспечению непрерывности бизнес-процессов в соответствии с лучшими мировыми практиками.
Мониторинг SLA от нашей компании включает в себя операционную оценку, визуализацию, выявление, отслеживание рисков и их оперативное решение.
Что такое Service Level Agreement?
Соглашение об уровне предоставляемого сервиса определяет качество предоставляемого сервиса.
В таком соглашении четко прописаны временные рамки для выявления и устранения проблем, определены параметры качества, приоритетность выполнения и т.д.
Инситу предлагает:
- Круглосуточно (24/7) работающий Центр Управления Сетями (ЦУС);
- Смежные смены персонала;
- Поддержка на Русском / Английском языках;
- Время реакции специалиста первого уровня – до 15 минут;
- Отзвон / email / смс-информирование о статусе проблемы;
- Время диагностирования и решения проблемы – от 1 до 4 часов;
- Постоянная оптимизация Ваших бизнес-процессов.
Источники или Что же можно включить в мониторинг?
Отслеживать можно все то, что генерирует какие-либо данные (информацию).
- Мониторинг действующих инженерных систем (систем электроснабжения и кондиционирования вычислительных центров);
- Мониторинг магистральных и территориальных линий связи;
- Мониторинг активного сетевого оборудования;
- Мониторинг блейд-шасси;
- Мониторинг блейд-серверов;
- Мониторинг стоечных серверов;
- Мониторинг дисковых систем, виртуальных ленточных библиотек для хранения данных;
- Мониторинг Ленточных библиотек;
- Мониторинг системы аппаратно–программного комплекса резервного копирования;
- Мониторинг приложений автоматизированных систем;
- Мониторинг баз данных;
- Мониторинг периферийных устройств (принтеры, сканеры, многофункциональные устройства);
- Сбор информации о критичных событиях с дополнительными возможностями:
- сбор событийной информации без агентов системы мониторинга по протоколом SNMP, SMI-S и др.;
- сбор событийной информации с агентов системы мониторинга;
- с информационных систем;
- передачу событийной информации в централизованную подсистему событийной обработки.
- Обработку поступающей событийной информации, включая следующие возможности:
- настройка алгоритмов и механизмов корреляции и автоматической реакции на поступающие события с использованием встроенных средств платформы;
- корреляция и эскалация поступающей событийной информации;
- фильтрация повторяющейся событийной информации;
- автоматическая реакция на поступающие события в виде запуска заданного сценария.
- Визуализацию событийной информации, включающую следующие возможности:
- настройка фильтров отображения событийной информации;
- настройка представлений событийной информации (таблицы, графики, диаграммы);
- настройка схем соединений;
- настройка группировки объектов мониторинга;
- гео привязка объектов мониторинга, и визуализация на карте с отображением статуса объектов мониторинга;
- Различные варианты уведомления;
- и многое другое.
Этапы разработки системы мониторинга
Система может находиться как и на нашей стороне, так и на оборудовании Заказчика
- Проведение обследования (мониторинга) и анализа существующей ИТ-функции организации и состояния ИТ-инфраструктуры.
- Отслеживание событий, требующих быстрого решения проблемы (выявление, классификация, регистрация неполадки).
- Выявление взаимосвязей между ИТ-активами и определение их влияния на критические бизнес-процессы.
- Выявление аномального поведения.
- Разработка комплекса мероприятий по минимизации влияния рисков, связанных с выходом из строя ИТ-активов, на ключевые бизнес-процессы, в том числе:
1) Подготовка рекомендаций по оптимизации ИТ-инфраструктуры (в рамках используемых решений).
2) Разработка и тестирование плана обеспечения непрерывности бизнеса.
3) Формирование плана восстановления после аварии.
4) Разработка процедур доработки и тестирования плана в случае изменений в ИТ-инфраструктуре и/или бизнес-процессах.
В результате система мониторинга обеспечивает:
- Интуитивно понятный графический интерфейс руководителя, на который агрегировано поступает информация верхнего уровня обработанных и откоррелированных событий от всех объектов мониторинга;
- Технические инженерные интерфейсы для каждой логической группы (серверы, приложения, активное сетевое оборудование и т.д.), позволяющие иерархически опускаться до самого нижнего уровня на объекте мониторинга.
Возможности системы мониторинга
- Возможность управления составными частями системы: создание, изменение параметров функционирования, удаление;
- Ролевое разграничение доступа к различным элементам системы. Система мониторинга должна иметь функцию внутреннего разграничения прав доступа в систему для разных категорий пользователей (администратор, оператор, инженер и т.д.) Для каждой группы пользователей должны быть реализованы и настроенные соответствующие профили доступа;
- Ведение представлений, структур данных и данных, возможность создания пользовательских элементов и структур данных и представлений;
- Поддержание основных технологических процессов, направленных на обеспечение бесперебойного функционирования Системы (возможность сохранения и восстановления данных, сохранение и восстановление без остановки работы системы, инкрементальные архивы и т.д.).
- Сбор, хранение и обработку информации, поступающую от объектов мониторинга.
- Формирование детализированных отчетов по наиболее часто выходящим за рамки нормального функционирования объектам ИС.
- и многое другое.
Основа системы
ОС – CentOS, Zabbix.
Хранилища – MySQL, PostgreSQL и т.д.
Интеграция с любыми используемыми системами Заказчика.
Преимущества использования
Разработка собственной системы мониторинга или использование ЦУС в качестве основного или дополнительного центра управления сетями позволит вам с большей эффективностью распределять свои ресурсы и сокращать расходы без ущерба для стабильности сетей и сервисов, от которых зависит Ваша прибыль.