OTUS

Observability: мониторинг, логирование, трейсинг

  • Язык: Русский
  • Осталось мест: не ограничено
Записаться

Observability: мониторинг, логирование, трейсинг

Для кого этот курс?

  • DevOps инженерам курс поможет быстро выявлять и устранять проблемы в инфраструктуре с помощью мониторинга, логов и трассировки. Также Вы сможете начать создавать метрики и алерты для автоматизации мониторинга, что оптимизирует использование ресурсов и улучшает; пользовательский опыт;
  • Системным администраторам курс позволит улучшить контроль за инфраструктурой, создавая полноценную систему наблюдаемости для быстрого обнаружения и устранения неполадок;
  • Разработчикам Backend и FullStack, так как курс позволяет глубже понять поведение приложений в продакшене, что помогает в быстром выявлении и устранении проблем;
  • Администраторам Linux курс поможет разобраться в разработке комплексного подхода к управлению инфраструктурой.

Вам подойдет курс если необходимо настроить мониторинг, логирование и трейсинг с помощью Prometheus, Grafana, ELK, Tempo.

Построй траекторию прямо сейчас и получи скидку на первый месяц

Программа обучения
  • Observability - и что он включает. GAP-stack (Grafana, Prometheus, Alertmanager)

    Введение в мониторинг, логирование, трейсинг и алертинг. Рассмотрим основу Gap-стека. Поговорим об устройстве и принципах работы Prometheus, о том как он собирает метрики и хранит их. Разберем основы работы с PromQl. Рассмотрим Alertmanager, обсудим его устройство и то как он работает с алертами. Научимся визуализировать метрики с помощью дашбордов в Grafana

    Тема 1: Задачи мониторинга, логирования, трейсинга

    Тема 2: Prometheus - как новый виток развития систем мониторинга

    Тема 3: Prometheus - Exporters, Service Discovery // ДЗ

    Тема 4: Grafana - основной инструмент визуализации данных

    Тема 5: Отказоустойчивость Prometheus, хранилища метрик для Prometheus (Thanos, VictoriaMetrics, Mimir) // ДЗ

    Тема 6: Prometheus, Alertmanager - работа с метриками (PromQL), написание алертов и их ротация // ДЗ

    Тема 7: Grafana - продвинутое использование // ДЗ

    Тема 8: Kube-prometheus-stack - мониторинг Kubernetes при помощи Prometheus operator

    Тема 9: Q&A сессия по разбору домашних заданий

  • Zabbix

    В данном модуле рассмотрим работу с Zabbix. Его устройство, как собираются и хранятся метрики. Рассмотрим как создаются алерты и графики по метрикам

    Тема 1: Установка и конфигурация

    Тема 2: Мониторинг порталов и баз данных

    Тема 3: Настройка алертинга // ДЗ

    Тема 4: Discovery Trapper

    Тема 5: Графики и комплексные экраны. Q&A по модулю zabbix

  • TICK стек

    В данном модуле мы рассмотрим набор open source инструментов которые являются составными частями системы сбора, хранения и визуализации временных рядов.

    Тема 1: Telegraf

    Тема 2: Хранение временных рядов с InfluxDB

    Тема 3: Chronograf как инструмент визуализации метрик

    Тема 4: Алертинг с Kapacitor // ДЗ

  • Логирование

    В данном модуле: - разберем какие способы логирования существуют - сравним популярные стеки для логирования (Elastic stack, Opensearch, Loki, Graylog), разберемся чем они отличаются.

    Тема 1: Классическое логирование в Linux

    Тема 2: Централизованные системы логирования

  • Elastic stack

    В данном модуле: - рассмотрим устройство стека и его задачи - подробно рассмотрим компоненты стека по отдельности.

    Тема 1: Построение системы централизованного логирования на основе Elasticsearch, Logstash, Kibana, Beats. Введение в Elasticsearch

    Тема 2: Elasticsearch

    Тема 3: Beats - инструменты доставки данных // ДЗ

    Тема 4: Системы агрегации сообщений Logstash/Vector // ДЗ

    Тема 5: Kibana как инструмент визуализации логов

    Тема 6: Q&A сессия по разбору домашних заданий

  • Системы централизованного логирования

    - Рассмотрим систему логирования от компании Grafana, вдохновленную Prometheus подходом к данным; - Бесплатный форк Elastic stack от Amazon; - Opensource систему централизованного логирования Graylog; - Рассмотрим роль Apache Kafka как очереди сообщений в схемах систем логирования.

    Тема 1: Grafana Loki - управление логами и доставка // ДЗ

    Тема 2: Opensearch // ДЗ

    Тема 3: Graylog // ДЗ

    Тема 4: Apache Kafka в логировании

  • Системы распределенного трейсинга

    - Разберем систему хранения трейсов Tempo - Подробно рассмотрим систему распределенного трейсинга Zipkin

    Тема 1: Построение распределенного трейсинга на примере Zipkin

    Тема 2: Jaeger и Grafana Tempo

  • Проектная работа

    Заключительный месяц курса посвящен проектной работе. Свой проект — это то, что интересно писать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей

    Тема 1: Консультация по проектам и домашним заданиям

    Тема 2: Защита проектной работы // Проект

Преподаватели

  • Эрик Арайс

    Специалист группы эксплуатации вычислительной систем

  • Сергей Андрюнин

    DevOps инженер

  • Иван Федоров

    Технический директор

  • Артем Полозов

    Senior Java Developer

  • Антон Касимов

  • Сергей Бывшев

  • Олег Нова