Нетология

DataOps-инженер

  • Начальный уровень
  • Наставник: Нет
  • Сертификат: Нет
  • Формат: Online
  • Рассрочка: Нет
  • Язык: Русский
  • Осталось мест: не ограничено
Записаться

DataOps-инженер

Что это за курс : Это курс о методах и инструментах, которые обеспечивают быструю, надежную и возобновляемую доставку данных, готовых к аналитике и эксплуатации моделей data science. DataOps-инженер — тот специалист, который может развернуть и конфигурировать все эти инструменты там, где остро встает вопрос масштабирования и гибкости. Курс предназначен для тех, кто уже знает, как строятся базы данных и работает ETL-процесс, кто уже прошел путь первичных построений и нуждается в расширенных методах обработки потоковых данных и хранения огромных массивов.

Поможем найти ту самую работу:

  • Оформите резюме и сопроводительное письмо Научитесь выгодно презентовать свои сильные стороны, чтобы получать больше откликов компаний
  • Узнаете, как найти работу Познакомитесь с площадками для поиска работы, получите доступ к бирже проектов Нетологии, стажировкам и вакансиям партнёров
  • Подготовитесь к собеседованию Научитесь рассказывать о себе последовательно и без стресса, правильно реагировать на вопросы работодателя и завершать беседу
  • Соберёте портфолио Научитесь оформлять портфолио так, чтобы работодателю было удобно изучать ваши работы и у него осталось хорошее впечатление
  • Научитесь работать на себя Узнаете, где искать первых заказчиков, как выстраивать с ними коммуникацию и защитить свои права
  • Подберем наиболее подходящие курсы

    Для кого этот курс?
    • ETL-разработчикам
      Сделаете следующий шаг в карьере и сможете помочь бизнесу в процессах масштабирования.
    • Разработчикам Scala, Python, Java
      Сможете сменить разработку на работу с данными, при этом глубокие знания языков позволят это сделать безболезненно и продуктивно.
    Программа обучения
    Python
    • Основы Python
    • Введение в анализ данных на Python
    • Библиотека NumPy: вычислительные задачи
    • Предобработка данных
    • Библиотека Pandas: обзор возможностей и базовые операции
    Data Lake & Hadoop
    • Основы Hadoop
    • HDFS
    • MapReduce
    • MapReduce 2
    • Yarn
    • Pig & Hive
    • HBase & Cassandra
    • Кластер. Управление и администрирование
    Продвинутые методы работы с данными
    • Apache Spark
    • Работа со Spark
    • Spark SQL
    • Продвинутый Spark
    • Airflow
    • Работа с Airflow
    • Продвинутый Airflow
    • Dbt как инструмент ETL
    Работа с потоковыми данными
    • Устройство Clickhouse и загрузка данных в корпоративное хранилище
    • Устройство Kafka и работа с кластером
    • Конфигурация Kafka Streams
    • Kafka Streams Interactive Queries, Kafka Streams Processor API, Kafka Connect
    • Spark Streaming: характеристики и особенности использования
    • Создание простого приложения на Spark Structure Streaming + Kafka
    Работа с данными в облаке
    • Google Cloud Platform — хранение данных
    • Spark в GCP
    • Managed ETL в GCP
    • Обработка real-time данных в GCP
    • Поиск инсайтов в данных при помощи ML
    • Другие облачные провайдеры
    Введение в DS & ML
    • Введение в машинное обучение
    • Задача классификации
    • Задача кластеризации
    • Ансамблевые методы решения задачи классификации
    • Feature engineering
    MLOps
    • Зачем нужен DevOps
    • Docker и микросервисная архитектура
    • K8S
    • Оркестраторы
    • CI/CD
    • Мониторинг
    • Инструменты DevOps для обучения ML-моделей
    • Deploy ML-моделей
    • Название занятия
    Карьерное планирование
    • Создание резюме: как поменять сферу, используя опыт предыдущих компаний
    • Отработка навыков написания резюме
    • Карьерное консультирование
    Дипломный проект
    Знания и навыки, которые приобретете
    • Опыт выстраивать конвейер обработки данных в облачной среде
    • Умение создавать модели машинного обучения и обучать нейросети
    • Умение масштабировать, тестировать и запускать ML-модели по принципам гибкого подхода MLOps
    • Понимание принципов и процессов разработки по
    • Опыт работы с техниками тест-дизайна
    • Опыт написания тестовой документации

    Преподаватели

    • Александр Крылов

    • Алексей Кузьмин

      Директор разработки и руководитель Data Science и работы с данными, «ДомКлик»

    • Константин Башевой

      Аналитик-разработчик, Яндекс

    • Дмитрий Турченков

      IT Cluster Lead, Сбер Преподаёт «Продвинутые методы работы с данными», «Работа с потоковыми данными»

    • Андрей Серебрянский

      Big Data Engineer, Vivid Money Преподаёт «Работу с потоковыми данными»

    • Сергей Виноградов

      Архитектор, SberCloud MLSpace Преподаёт «Работу с данными в облаке»

    • Максим Золотарёв

      Senior Data Engineer, Tabby Преподаёт «Продвинутые методы работы с данными»

    • Дарья Буланова

      Senior Data Engineer, Dodo Brands Преподаёт «Продвинутые методы работы с данными»

    Твой персональный наставник в карьере