DataOps-инженер

Начальный уровень
Наставник: Нет
Сертификат: Нет
Формат: Online
Рассрочка: Нет
Язык: Русский
Осталось мест: не ограничено

~~108000 ₽~~ 64 800 ₽/курс

Записаться

Вы будете перенаправлены на сайт партнера.

DataOps-инженер

Что это за курс : Это курс о методах и инструментах, которые обеспечивают быструю, надежную и возобновляемую доставку данных, готовых к аналитике и эксплуатации моделей data science. DataOps-инженер — тот специалист, который может развернуть и конфигурировать все эти инструменты там, где остро встает вопрос масштабирования и гибкости. Курс предназначен для тех, кто уже знает, как строятся базы данных и работает ETL-процесс, кто уже прошел путь первичных построений и нуждается в расширенных методах обработки потоковых данных и хранения огромных массивов.

Поможем найти ту самую работу:

Оформите резюме и сопроводительное письмо Научитесь выгодно презентовать свои сильные стороны, чтобы получать больше откликов компаний

Узнаете, как найти работу Познакомитесь с площадками для поиска работы, получите доступ к бирже проектов Нетологии, стажировкам и вакансиям партнёров

Подготовитесь к собеседованию Научитесь рассказывать о себе последовательно и без стресса, правильно реагировать на вопросы работодателя и завершать беседу

Соберёте портфолио Научитесь оформлять портфолио так, чтобы работодателю было удобно изучать ваши работы и у него осталось хорошее впечатление

Научитесь работать на себя Узнаете, где искать первых заказчиков, как выстраивать с ними коммуникацию и защитить свои права

Инновационная система карьерного планирования

Попробовать

Для кого этот курс?

ETL-разработчикам

Сделаете следующий шаг в карьере и сможете помочь бизнесу в процессах масштабирования.
Разработчикам Scala, Python, Java

Сможете сменить разработку на работу с данными, при этом глубокие знания языков позволят это сделать безболезненно и продуктивно.

Программа обучения

Python

Основы Python
Введение в анализ данных на Python
Библиотека NumPy: вычислительные задачи
Предобработка данных
Библиотека Pandas: обзор возможностей и базовые операции

Data Lake & Hadoop

Основы Hadoop
HDFS
MapReduce
MapReduce 2
Yarn
Pig & Hive
HBase & Cassandra
Кластер. Управление и администрирование

Продвинутые методы работы с данными

Apache Spark
Работа со Spark
Spark SQL
Продвинутый Spark
Airflow
Работа с Airflow
Продвинутый Airflow
Dbt как инструмент ETL

Работа с потоковыми данными

Устройство Clickhouse и загрузка данных в корпоративное хранилище
Устройство Kafka и работа с кластером
Конфигурация Kafka Streams
Kafka Streams Interactive Queries, Kafka Streams Processor API, Kafka Connect
Spark Streaming: характеристики и особенности использования
Создание простого приложения на Spark Structure Streaming + Kafka

Работа с данными в облаке

Google Cloud Platform — хранение данных
Spark в GCP
Managed ETL в GCP
Обработка real-time данных в GCP
Поиск инсайтов в данных при помощи ML
Другие облачные провайдеры

Введение в DS & ML

Введение в машинное обучение
Задача классификации
Задача кластеризации
Ансамблевые методы решения задачи классификации
Feature engineering

MLOps

Зачем нужен DevOps
Docker и микросервисная архитектура
K8S
Оркестраторы
CI/CD
Мониторинг
Инструменты DevOps для обучения ML-моделей
Deploy ML-моделей
Название занятия

Карьерное планирование

Создание резюме: как поменять сферу, используя опыт предыдущих компаний
Отработка навыков написания резюме
Карьерное консультирование

Дипломный проект

Знания и навыки, которые приобретете

Опыт выстраивать конвейер обработки данных в облачной среде
Умение создавать модели машинного обучения и обучать нейросети
Умение масштабировать, тестировать и запускать ML-модели по принципам гибкого подхода MLOps
Понимание принципов и процессов разработки по
Опыт работы с техниками тест-дизайна
Опыт написания тестовой документации

Тэги

Преподаватели

Александр Крылов
Алексей Кузьмин

Директор разработки и руководитель Data Science и работы с данными, «ДомКлик»
Константин Башевой

Аналитик-разработчик, Яндекс
Дмитрий Турченков

IT Cluster Lead, Сбер Преподаёт «Продвинутые методы работы с данными», «Работа с потоковыми данными»
Андрей Серебрянский

Big Data Engineer, Vivid Money Преподаёт «Работу с потоковыми данными»
Сергей Виноградов

Архитектор, SberCloud MLSpace Преподаёт «Работу с данными в облаке»
Максим Золотарёв

Senior Data Engineer, Tabby Преподаёт «Продвинутые методы работы с данными»
Дарья Буланова

Senior Data Engineer, Dodo Brands Преподаёт «Продвинутые методы работы с данными»