Лабораторная работа «Prometheus + Grafana для системных аналитиков»

Лабораторная работа «Prometheus + Grafana для системных аналитиков»
31 мая 2026
ВОСКРЕСЕНЬЕ
10:00

За 4 часа вы научитесь:

  • Работать с PromQL — от простых счётчиков до анализа процентилей
  • Создавать дашборды в Grafana — панель мониторинга «Взгляд аналитика»
  • Настраивать уведомления в Telegram — система сама сообщит о проблемах
  • Формулировать SLO/SLA на основе метрик — от общих слов к конкретным числам
  • Расследовать инциденты по графикам — 3 сценария реальных поломок
  • Понимать разницу между бизнес-метриками и техническими метриками
  • Говорить с командой на одном языке — словарь мониторинга: метрики, дашборды, алерты

✅ Что такое Prometheus + Grafana (вкратце)?

Prometheus — система сбора и хранения метрик с мощным языком запросов PromQL. Grafana — платформа визуализации, которая превращает сырые данные в понятные дашборды. Вместе они образуют стандарт де-факто для мониторинга в современной IT-инфраструктуре.

Для системного аналитика важно не администрирование, а умение читать метрики, формулировать требования к наблюдаемости и расследовать инциденты по графикам. Результат легко воспроизвести на любом стенде, а затем эволюционировать к полноценной системе мониторинга.

✅ Для кого

Системные и бизнес-аналитики, архитекторы, PM, QA — все, кто:

  • Работает с нефункциональными требованиями к производительности
  • Участвует в разборе инцидентов и хочет видеть картину целиком
  • Формулирует SLO/SLA для команд разработки

Не нужно: быть DevOps или администратором.

Нужно: понимать веб-приложения, иметь опыт работы с требованиями, базовые знания HTTP/JSON.

✅ Практика за 4 часа (на кейсе интернет-магазина)

Блок 1: Запуск стенда и бизнес-метрики (25 мин)

Запустите готовый Docker-стенд интернет-магазина. Увидите, как выглядят бизнес-метрики: количество заказов, конверсия, ошибки checkout.

Блок 2: Основы метрик и PromQL (40 мин)

Напишете 20+ запросов PromQL — от простых счётчиков до histogram_quantile. Поймёте разницу между gauge, counter, histogram и summary.

Блок 3: Панель мониторинга «Взгляд аналитика» (35 мин)

Соберёте дашборд из 6 графиков для реальных задач: нагрузка, ошибки, latency, бизнес-метрики.

Блок 4: SLA/SLO — целевые показатели (30 мин) ⚔️

Ключевой блок! Научитесь формулировать SLO на основе метрик:

  • Как перевести «система должна быть быстрой» в latency SLO
  • Рассчёт бюджета ошибок (error budget)
  • Многоуровневые SLO: пользовательский, API, инфраструктурный

Блок 5: Продвинутые возможности Grafana (30 мин)

Кастомные переменные, ad-hoc фильтры, аннотации событий, экспорт дашбордов.

Блок 6: Настройка уведомлений и Telegram (25 мин)

Настроите алерты в Grafana, подключите Telegram-бота, научитесь писать осмысленные сообщения об инцидентах.

Блок 7: Работа с инцидентами (35 мин)

Отработка 3 сценариев: падение сервиса, деградация производительности, утечка памяти. Алгоритм: дашборд → график → PromQL → описание инцидента.

Блок 8: Внедрение в реальных проектах (20 мин)

Чеклист внедрения мониторинга. Как формулировать требования к observability в техническом задании.

✅ Вы уйдёте с результатами

Компетенции, которые вы прокачаете:

✓ Работа с PromQL — 20+ запросов для реальных задач

✓ Создание дашбордов — панель «Взгляд аналитика» с 6 графиками

✓ Формулирование SLO — конкретные показатели вместо общих слов

✓ Расследование инцидентов — от графика к причине и описанию

✓ Коммуникация с командой — правильные вопросы про метрики и алерты

Что получите «на руки»:

✓ Готовый стенд — Docker-окружение запускается одной командой

✓ 20+ запросов PromQL — шпаргалка для повседневных задач

✓ Готовый дашборд Grafana — импортируйте и используйте

✓ Правила уведомлений — шаблоны для Telegram

✓ Чеклист SLO — что измерять и какие цели ставить

✅ Чем эта лабораторная отличается

✓ Фокус на роли SA — не администрирование, а метрики и требования

✓ SLO как главный навык — целый блок про целевые показатели

✓ Готовый стенд — никакой возни с установкой, всё в Docker

✓ Реальные сценарии — 3 инцидента, которые вы расследуете по графикам

✅ Предпосылки и формат

Требования к участникам:

  • Базовые знания командной строки (CLI)
  • Опыт работы с VS Code или другим редактором кода
  • Понимание основ HTTP/JSON
  • Желание разобраться в метриках и мониторинге

Формат проведения:

  • Онлайн, длительность 4 часа
  • ~80% практики, 20% теории
  • Работа на готовом Docker-стенде
  • Все шаги воспроизводимы командами из раздатки

✅ Дальнейший маршрут развития

После этой лабораторной рекомендуем:

  • Лабораторная «Docker для системных аналитиков» — основы контейнеризации
  • Лабораторная «Kubernetes для системного аналитика» — оркестрация контейнеров
  • Лабораторная «PostgreSQL Advanced» — анализ производительности БД
  • Лабораторная «Apache Kafka для event-driven архитектур» — асинхронная коммуникация

Даты проведения:

  • Ближайшая дата: 31 мая 10:00 - 14:00

Что получают участники:

  • [x] Запись лабораторной работы
  • [x] Презентация и методические материалы
  • [x] Готовые скрипты и конфигурации
  • [x] Шпаргалка PromQL с 20 запросами
  • [x] Доступ к стенду на 7 дней для самостоятельной практики

Поддержка после мероприятия:

  • [x] Закрытый чат для участников лабораторной работы
  • [x] Ответы на вопросы в течение 14 дней после проведения
  • [x] Дополнительные материалы по теме: статьи, видео, примеры из практики

Ведущий: Андрей Чуян

  • Экспертиза: Инженер по управлению IT-инфраструктурой с 10+ лет опыта, специалист по мониторингу и observability
  • Основатель сообщества ПолныйСтек, автор лабораторных работ по Kubernetes, Prometheus + Grafana

изменить информацию сообщить о проблеме

С этим мероприятием что-то не так?

  • Неправильная дата или время
  • Неправильный адрес
  • Неправильно указан тип мероприятия
  • Плохое описание
  • Мероприятие отменено или отложено
  • Неприемлемый/неприличный контент
  • Нарушение авторских прав
  • Это спам
  • Не получается купить билет
Куда пойти в онлайне в эти выходные

Онлайн

похожие мероприятия

Все мероприятия в онлайне