Постер курса

OTUS

Machine Learning. Professional

  • Продвинутый уровень
  • Наставник: Есть
  • Сертификат: Есть
  • Формат: Online
  • Рассрочка: Нет
  • Язык: Русский
  • Осталось мест: Неограничено
Записаться

Machine Learning. Professional

Что даст вам этот курс


Вы последовательно освоите современные инструменты анализа данных и сможете на профессиональном уровне создавать модели машинного обучения. Для закрепления навыков с каждым алгоритмом вы будете проводить полный pipeline работ от подготовки датасета до анализа результатов и подготовки к продакшену.
Практики и знаний, которые вы получите, будет достаточно, чтобы самостоятельно решать задачи классического ML и претендовать на Junior+ и Middle позиции Data Scientist.

Карта курсов направления Data Science в OTUS

Проекты для портфолио


В течение курса вы выполните несколько проектов для портфолио и научитесь грамотно презентовать результаты своих работ, чтобы проходить собеседования. Для выпускного проекта вы можете взять один из предложенных преподавателем вариантов или реализовать свою идею.

Для кого этот курс?


Для начинающих аналитиков и Data Scientist’s. Курс поможет вам систематизировать и углубить свои знания. Вы сможете поэкспериментировать с подходами, разобрать рабочие кейсы и получить качественную обратную связь от экспертов.
Для разработчиков и специалистов других направлений, желающих сменить профессию и развиваться в области Data Science. Курс даст вам возможность собрать сильное портфолио и погрузиться в атмосферу реальных задач дата сайентиста.

Для обучения вам понадобится опыт Python на уровне написания собственных функций, а также знание мат.анализа, линейной алгебры, теории вероятностей и мат. статистики.

Сравнение с курсом Machine Learning. Advanced

Особенности курса


Best Practices и тренды. Каждый запуск программа обновляется с учетом быстро меняющихся тенденций в Data Science. После обучения вы сразу сможете приступить к работе в реальных проектах.
Важные второстепенные навыки. В курс входят темы, которые обычно упускаются из внимания, но необходимы специалисту в повседневных задачах и очень ценятся работодателями:
— построение систем для автоматического поиска аномалий;
— прогнозирования временных рядов при помощи машинного обучения;
— end-to-end pipelin’ы по работе с данными, готовые к внедрению в production.
Творческая атмосфера и условия, близкие к реальным рабочим процессам. Весь курс построен как симулятор рабочих будней дата сайентиста, где вам придется справляться с «грязными» данными, просчитывать свои действия наперед, экспериментировать с решениями и готовить модели в продакшн. В этом деле вам понадобятся любопытство, упорство и жажда нового опыта.

Выпускной проект


Мы стремимся, чтобы студенты самостоятельно выбирали темы для выпускных проектов, а не работали по шаблонным заготовкам. В результате все работы получаются уникальными исследовательскими проектами по машинному обучению, о которых с большим интересом можно рассказывать во время собеседований или даже публиковать статьи. Примеры таких выпускных проектов можно найти по ссылкам:- Как сделать тематическое моделирование форума быстро или что беспокоит людей с целиакией - Анализируем шедевры живописи с помощью классического ML

Процесс обучения


Образовательный процесс происходит ONLINE в формате вебинаров (язык преподавания — русский). В рамках курса слушателям предлагаются к выполнению домашние задания, которые позволяют применить на практике знания, полученные на занятиях. По каждому домашнему заданию преподаватель дает развернутый фидбек. В течение всего учебного процесса преподаватель находится в едином коммуникационном пространстве с группой, т. е. при обучении слушатель может задавать преподавателю уточняющие вопросы по учебным материалам.
Программа обучения
Продвинутые методы машинного обучения
  • Тема 1. Вводный урок. Программа курса. Повторение основных концепций машинного обучения
  • Тема 2. Повторение основных понятий задачи классификации на практике: EDA, cross-validation, метрики качества
  • Тема 3. Деревья решений
  • Тема 4. Ансамбли моделей
  • Тема 5. Градиентный бустинг
  • Тема 6. Метод опорных векторов
  • Тема 7. Методы уменьшения размерности
  • Тема 8. Обучение без учителя. K-means
  • Тема 9. Обучение без учителя. Иерархическая кластеризация. DB-Scan
  • Тема 10. Поиск аномалий в данных
  • Тема 11. Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
  • Тема 12. Алгоритмы на графах
Сбор данных. Анализ текстовых данных
  • Тема 13. Сбор данных
  • Тема 14. Анализ текстовых данных. Часть 1: Предобработка и токенизация
  • Тема 15. Анализ текстовых данных. Часть 2: Векторные представления слов, работа с предобученными эмбеддингами
  • Тема 16. Анализ текстовых данных. Часть 3: Named Entity Recognition
  • Тема 17. Анализ текстовых данных. Часть 4: Тематическое моделирование
  • Тема 18. Q&A
Анализ временных рядов
  • Тема 19. Анализ временных рядов. Часть 1: Постановка задачи, простейшие методы. ARIMA-модель
  • Тема 20. Анализ временных рядов. Часть 2: Извлечение признаков и применение моделей машинного обучения. Автоматическое прогнозирование
  • Тема 21. Анализ временных рядов Часть 3: Кластеризация временных рядов (ищем связанные котировки акций)
Рекомендательные системы
  • Тема 22. Рекомендательные системы. Часть 1: Постановка задачи, метрики качества. Коллаборативная фильтрация. Холодный старт
  • Тема 23. Рекомендательные системы. Часть 2: Контентная фильтрация, гибридные подходы. Ассоциативные правила
  • Тема 24. Рекомендательные системы. Часть 3: Implicit feedback (извлекаем предпочтения из поведения пользователя)
  • Тема 25. Практическое занятие по рекомендательным системам. Surpsise
  • Тема 26. Q&A
Дополнительные темы
  • Тема 27. Введение в Deep Learning №1
  • Тема 28. Введение в Deep Learning №2
  • Тема 29. ML в Apache Spark
  • Тема 30. Поиск Data Science работы
Проектная работа
  • Тема 31. Выбор темы и организация проектной работы
  • Тема 32. Предзащита проектных работ №1
  • Тема 33. Предзащита проектных работ №2
  • Тема 34. Защита проектных работ
Что нужно знать?
  • Навыки программирования на Python (опыт написания собственных функций), — знания математического анализа (вычисление производных сложных функций), — знания линейной алгебры (матричные операции и собственные вектора), — знания теории вероятностей и мат. статистики (понимание дисперсии, мат. ожидания, нормального закона распределения)
Знания и навыки, которые приобретете
  • Заберете с собой материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач)
  • Получите приглашение пройти собеседование в компаниях-партнерах Otus (в случае успешного обучения на курсе)
  • Получите сертификат на русском о прохождении курса
  • Научитесь использовать методы машинного обучения для решения реальных бизнес-задач
  • Создадите своё портфолио проектов, которое поможет в прохождении собеседований
Партнеры

Преподаватели

  • Мария Тихонова

    Senior Data Scientist Сбер, преподаватель ВШЭ

    Работает специалистом по анализу данных в команде AGI NLP в Сбере. Занимается нейросетевыми языковыми моделями и их применением в реальных задачах. Считает, что работа в области Data Science дает уникальную возможность заниматься безумно крутыми вещами on the edge of science, которые меняют мир здесь и сейчас.Преподает в Высшей Школе Экономики дисциплины по анализу данных, машинному обучению и data science.Мария закончила механико-математический факультет МГУ и школу анализа данных Яндекса. В настоящий момент Мария обучается в аспирантуре ВШЭ на факультете компьютерных наук. Среди ее научных интересов такие области data science, как natural language processing и тематическое моделирование. Руководитель программы

  • Андрей Канашов

    Data Scientist в OMD OM GROUP

    Работает на позиции Data Scientist в рекламном агентстве OMD OM GROUP. В текущей деятельности решает задачи:- Аудиторного профилирования- Персонализации рекламы - Анализа социальных сетейСамостоятельно занимался изучением Machine Learning. Знает, что нужно для освоения новой профессии и какие при этом возникают вопросы. Преподаватель

  • Антон Лоскутов

    Data Scientist в Mail.Ru Group

    Работает на позиции Data Scientist в Mail.Ru Group. Окончил образовательный проект «Техносфера» от Mail.Ru. Закончил обучение в МГУ имени М. В. Ломоносова на механико-математическом факультете.Читал лекции по машинному обучению в проекте Open Data Science, сейчас проводит авторский курс по машинному обучению внутри Mail.Ru. Считает, что машинное обучение — это не только fit-predict, но и математическое понимание происходящего.

  • Александр Миленькин

    Старший менеджер по работе с большими данными в X5 Retail Group. Ранее старший аналитик в Асна, data scientist в Gero и биоинформатик в Insilico Medicine.Около 6 лет в IT. Выпускник МФТИ. Преподаватель

  • Дмитрий Сергеев

    Head of R&D в WeatherWell

    Практикует машинное обучение и анализ данных с 2012 года. В настоящий момент работает Head of R&D в компании WeatherWell. Имеет опыт практического применения машинного обучения в геймдеве, банковской сфере и Health Tech. Преподавал машинное обучение и анализ данных в Центре Математических Финансов МГУ, был приглашенным лектором на Факультете Компьютерных Наук НИУ ВШЭ и различных летних школах. Образование: Эконом-мат РЭУ им. Плеханова, ЦМФ МГУ, ДПО ФКН ВШЭ «Практический анализ данных и машинное обучение», MSc Computer Science Aalto UniversityСтек/интересы: Python, Machine Learning, Time Series, Anomaly Detection, Open Data, ML for social good

  • Богдан Кириллов

    младший научный сотрудник Института Биологии Гена Российской Академии Наук

    В отрасли машинного обучения с 2013 года, сначала занимался статистической обработкой психологических исследований, затем компьютерным зрением, искусственным интеллектом в анализе медицинских данных и биоинформатикой.В 2016 году закончил бакалавриат Университета ИТМО, направление "Техническая физика". В 2016-17 учился в магистратуре "Анализ данных в биологии и медицине" НИУ ВШЭ. В 2019 году закончил магистерскую программу "Науки о жизни" Сколковского института науки и технологии. В 2019 году занимался поиском новых иммунных систем бактерий при помощи машинного обучения в Национальном Центре Биотехнологической Информации (NCBI, NLM, NIH, г. Бетезда, Мэрилэнд, США). С 2019 года - аспирант Сколковского института науки и технологий, тема диссертации - "Оценка неопределенности и интерпретация предсказаний нейронных сетей для изучения механизмов работы системы CRISPR". В 2020 году преподавал в НИУ ВШЭ, читал курс "Культура работы с данными" для студентов первого курса ФБиБ. В 2019-2020 году работал в компании СберМедИИ (тогда называвшейся CoBrain Analytics), основной проект - система автоматической деперсонализации отсканированных рукописных историй болезни. С 2021 - младший научный сотрудник Института Биологии Гена Российской Академии Наук. Преподаватель

  • Максим Пантелеев

    Специалист по машинному обучению и разработке (BigData). Работал в таких компаниях как Mail.Ru Group, Wamba, NVidia, Sber, Megafon, Техносерв Консалтинг, где реализовывал практические кейсы применения машинного обучения полного цикла - прогнозирование временных рядов, детектирование аномалий, системы анализа соц. медиа поля (NLP), рекомендательные системы в ритейле и тд, так и HighLoad практическая реализация этих кейсов в продуктивном окружении - Hadoop, Spark, Flink, Kafka и тдДолгое время занимался преподаванием курсов по машинному обучению и технологиям BigData в таких организациях как тренинговый Центр Люксофт, ВШЭ Преподаватель

  • Андрей Дзись

    В настоящее время работает аналитиком данных в Инжиниринговом Центре МФТИ по полезным ископаемым. Занимается анализом и обработкой данных с оборудования для нефтедобычи с целью реализации интеллектуальных продуктов для эффективного мониторинга и эксплуатации на основе алгоритмов машинного обучения. Выпускник совместной программы магистратуры ФРКТ МФТИ и Сколковского Института Науки и Технологии по направлению "Интеллектуальный анализ данных".

  • Борис Цейтлин

    Выпускник магистратуры "Науки о данных" ФКН ВШЭ.Работал machine learning инженером в Mindsdb, где разрабатывал auto-ml решения. Имеет опыт работы в аналитике продукта и back-end разработке. Сфера научных интересов включает в себя computer vision, semi-supervised learning, few-shot learning. Преподаватель

  • Андрей Сухобок

    Data Scientist, Unity Technologies, Finland

    Специалист по машинному обучению в компании Unity Technologies. Получил степень магистра по Machine Learning в университете Aalto в Финляндии.Занимался рядом проектов на стыке двух дисциплин (машинного обучения и экономики). Работал в отделе Deloitte Analytics Institute в компании Deloitte (отдел разрабатывал продукты на основе машинного обучения для внутренних нужд компании и внешних заказчиков), а так же участвовал в проекте по анализу текстов в Институте Гайдара. Также занимался анализом GPS-данных различного транспорта для ЦОДД Москвы.Имеет разносторонний бэкграунд и широкий спектр интересов: Python, Machine Learning, Natural Language Processing, Neural Networks, Statistical Modelling. Образование:— НИУ ВШЭ, «Математические методы анализа экономики»;— Центр математических финансов МГУ им. М.В. Ломоносова, программа «Анализ Данных»;— ДПО ФКН НИУ ВШЭ, программа «Deep Learning: расширенный курс»;— Aalto University (Finland), MSc, Machine Learning. Преподаватель