Постер курса

OTUS

Machine Learning. Advanced

  • Продвинутый уровень
  • Наставник: Есть
  • Сертификат: Есть
  • Формат: Online
  • Рассрочка: Нет
  • Язык: Русский
  • Осталось мест: Неограничено
Записаться

Machine Learning. Advanced

Что даст вам этот курс


Вы освоите продвинутые приемы машинного обучения, которые позволят вам уверенно себя чувствовать на ведущих Middle/ Senior позициях и справляться даже с нестандартными задачами.

Вы расширите свой набор доступных для работы инструментов. При этом даже для таких тем, как Байесовские методы и обучение с подкреплением, которые обычно преподаются исключительно в виде теории, мы подобрали реальные рабочие кейсы из наших практик.

Отдельный модуль посвящен работе в production: настройке окружения, оптимизации кода, построению end-to-end пайплайнов и внедрению решений.

Карта курсов направления Data Science в OTUS

Особенный подход к практическим занятиям



Почти каждый такой вебинар проходит в формате Live coding, где преподаватель начинает с «чистого листа» — пустого Jupyter ноутбука, имея на руках лишь задачу и набор данных. Мы программируем, ошибаемся, обсуждаем, исправляем ошибки и получаем решение с нуля, чтобы вы видели реальный процесс работы с данными, а не стерильные готовые ноутбуки.

Разносторонние проектные задания
В течение курса вы выполните несколько практических заданий для закрепления навыков по пройденным темам. Каждое такое задание представляет собой практический проект по анализу данных, который решает конкретную прикладную задачу машинного обучения.

Для кого этот курс?



Для аналитиков, программистов и дата сайентистов, практикующих машинное обучение. Курс поможет расширить свои возможности и продвинуться дальше по карьерному пути.

Сравнение с курсом Machine Learning. Professional

После прохождения курса вы сможете:


Настраивать окружение и писать production код, готовый к внедрению
Работать с AutoML подходами и понимать ограничения в их применении
Понимать и уметь применять Байесовские методы и обучение с подкреплением для соответствующих задач
Решать нестандартные проблемы, возникающие в рекомендательных системах, временных рядах и графах

Выпускной проект


Мы стремимся, чтобы студенты самостоятельно выбирали темы для выпускных проектов, а не работали по шаблонным заготовкам. В результате все работы получаются уникальными исследовательскими проектами по машинному обучению, о которых с большим интересом можно рассказывать во время собеседований или даже публиковать статьи. Примеры проектов, которые студенты делали на курсе Machine Learning. Professional :- Как сделать тематическое моделирование форума быстро или что беспокоит людей с целиакией - Анализируем шедевры живописи с помощью классического ML

Процесс обучения


Образовательный процесс происходит ONLINE в формате вебинаров (язык преподавания — русский). В рамках курса слушателям предлагаются к выполнению домашние задания, которые позволяют применить на практике знания, полученные на занятиях. По каждому домашнему заданию преподаватель дает развернутый фидбек. В течение всего учебного процесса преподаватель находится в едином коммуникационном пространстве с группой, т. е. при обучении слушатель может задавать преподавателю уточняющие вопросы по учебным материалам.
Программа обучения
Advanced Machine Learning. AutoML
  • Тема 1. Production Code проекта на примере задачи классификации/регрессии, Virtual environments, dependency management, pypi/gemfury
  • Тема 2. Практическое занятие - Оптимизация кода, parallelization, multiprocessing, ускорение pandas, Modin для Pandas
  • Тема 3. Advanced Data Preprocessing. Categorical Encodings
  • Тема 4. Встреча с руководителем курса (Дополнительное занятие)
  • Тема 5. Featuretools - а вы что, за меня и признаки придумывать будете?
  • Тема 6. H2O и TPOT - а вы что, за меня и модели строить будете?
  • Тема 7. Поиск нечетких дублей (Дополнительное занятие)
Production
  • Тема 8. Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
  • Тема 9. REST-архитектура: Flask API
  • Тема 10. Docker: Структура, применение, деплой
  • Тема 11. Kubernetes, контейнерная оркестрация
Временные ряды
  • Тема 12. Извлечение признаков. Fourier и Wavelet transformation, Automatic Feature generation - tsfresh
  • Тема 13. Unsupervised подходы: Кластеризация временных рядов
  • Тема 14. Unsupervised подходы: Сегментация временных рядов
  • Тема 15. Практическое занятие по работе в проде: деплой докера в AWS
Рекомендательные системы. Задача ранжирования
  • Тема 16. Рекомендательные системы 1. Explicit feedback
  • Тема 17. Рекомендательные системы 2. Implicit feedback
  • Тема 18. Задача ранжирования - Learning to rank
  • Тема 19. Практическое занятие по рекомендательным системам. Surpsise!
  • Тема 20. Q&A
Графы
  • Тема 21. Введение в графы: основные понятия. NetworkX, Stellar
  • Тема 22. Анализ графов и интерпретация. Community Detection
  • Тема 23. Link Prediction и Node Classification
  • Тема 24. Практическое занятие: Хейтеры в Twitter
Bayesian Learning, PyMC
  • Тема 25. Введение в вероятностное моделирование, апостериорные оценки, сэмплирование
  • Тема 26. Markov Chain Monte-Carlo (MCMC), Metropolis–Hastings
  • Тема 27. Байесовское АB тестирование
  • Тема 28. Generalized linear model (GLM) - байесовские регрессии, вывод апостериорных оценок коэффициентов
  • Тема 29. Практическое занятие по GLM
  • Тема 30. Байесовская сеть доверия: практическая занятия
  • Тема 31. Практическое занятие по логит-регрессии
Reinforcement Learning
  • Тема 32. Введение в обучение с подкреплением
  • Тема 33. Multi-armed bandits для оптимизации AB тестирования, от теории - сразу в бой
  • Тема 34. Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация
  • Тема 35. Markov Decision Process, Value function, Bellman equation
  • Тема 36. Value iteration, Policy iteration
  • Тема 37. Monte Carlo Methods
  • Тема 38. Temporal Difference (TD) и Q-learning
  • Тема 39. SARSA и Практическое занятие: финансовый кейс TD и Q-learning
  • Тема 40. Q&A
Проектная работа
  • Тема 41. Выбор темы проекта
  • Тема 42. Бонус: Поиск Data Science работы
  • Тема 43. Предзащита проектных работ №1
  • Тема 44. Предзащита проектный работ №2
  • Тема 45. Защита проектных работ
Дополнительные материалы
  • Тема 46. Сбор данных
  • Тема 47. Анализ текстовых данных. Часть 1: Предобработка и токенизация
  • Тема 48. Анализ текстовых данных. Часть 2: Векторные представления слов, работа с предобученными эмбеддингами
  • Тема 49. Анализ текстовых данных. Часть 3: Named Entity Recognition
  • Тема 50. Анализ текстовых данных. Часть 4: Тематическое моделирование
Что нужно знать?
  • Python на уровне «писал свои небольшие проекты» Знакомство с экосистемой для машинного обучения (pandas, numpy, sklearn) Знание и понимание базовых принципов и алгоритмов машинного обучения Знания математического анализа (вычисление производных сложных функций) Знания линейной алгебры (матричные операции и собственные вектора) Знания теории вероятностей и мат. статистики (понимание дисперсии, мат. ожидания, законы распределений)
Знания и навыки, которые приобретете
  • Заберете с собой материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач)
  • Получите сертификат на русском о прохождении курса
  • Научитесь использовать методы машинного обучения для решения реальных бизнес-задач
  • Создадите своё портфолио проектов, которое поможет при прохождении собеседований
  • Получите приглашение пройти собеседование в компаниях-партнерах OTUS в Москве (в случае успешного обучения на курсе)
Партнеры

Преподаватели

  • Мария Тихонова

    Senior Data Scientist Сбер, преподаватель ВШЭ

    Работает специалистом по анализу данных в команде AGI NLP в Сбере. Занимается нейросетевыми языковыми моделями и их применением в реальных задачах. Считает, что работа в области Data Science дает уникальную возможность заниматься безумно крутыми вещами on the edge of science, которые меняют мир здесь и сейчас.Преподает в Высшей Школе Экономики дисциплины по анализу данных, машинному обучению и data science.Мария закончила механико-математический факультет МГУ и школу анализа данных Яндекса. В настоящий момент Мария обучается в аспирантуре ВШЭ на факультете компьютерных наук. Среди ее научных интересов такие области data science, как natural language processing и тематическое моделирование. Руководитель программы

  • Андрей Канашов

    Data Scientist в OMD OM GROUP

    Работает на позиции Data Scientist в рекламном агентстве OMD OM GROUP. В текущей деятельности решает задачи:- Аудиторного профилирования- Персонализации рекламы - Анализа социальных сетейСамостоятельно занимался изучением Machine Learning. Знает, что нужно для освоения новой профессии и какие при этом возникают вопросы. Преподаватель

  • Антон Лоскутов

    Data Scientist в Mail.Ru Group

    Работает на позиции Data Scientist в Mail.Ru Group. Окончил образовательный проект «Техносфера» от Mail.Ru. Закончил обучение в МГУ имени М. В. Ломоносова на механико-математическом факультете.Читал лекции по машинному обучению в проекте Open Data Science, сейчас проводит авторский курс по машинному обучению внутри Mail.Ru. Считает, что машинное обучение — это не только fit-predict, но и математическое понимание происходящего.

  • Александр Миленькин

    Старший менеджер по работе с большими данными в X5 Retail Group. Ранее старший аналитик в Асна, data scientist в Gero и биоинформатик в Insilico Medicine.Около 6 лет в IT. Выпускник МФТИ. Преподаватель

  • Дмитрий Сергеев

    Head of R&D в WeatherWell

    Практикует машинное обучение и анализ данных с 2012 года. В настоящий момент работает Head of R&D в компании WeatherWell. Имеет опыт практического применения машинного обучения в геймдеве, банковской сфере и Health Tech. Преподавал машинное обучение и анализ данных в Центре Математических Финансов МГУ, был приглашенным лектором на Факультете Компьютерных Наук НИУ ВШЭ и различных летних школах. Образование: Эконом-мат РЭУ им. Плеханова, ЦМФ МГУ, ДПО ФКН ВШЭ «Практический анализ данных и машинное обучение», MSc Computer Science Aalto UniversityСтек/интересы: Python, Machine Learning, Time Series, Anomaly Detection, Open Data, ML for social good

  • Богдан Кириллов

    младший научный сотрудник Института Биологии Гена Российской Академии Наук

    В отрасли машинного обучения с 2013 года, сначала занимался статистической обработкой психологических исследований, затем компьютерным зрением, искусственным интеллектом в анализе медицинских данных и биоинформатикой.В 2016 году закончил бакалавриат Университета ИТМО, направление "Техническая физика". В 2016-17 учился в магистратуре "Анализ данных в биологии и медицине" НИУ ВШЭ. В 2019 году закончил магистерскую программу "Науки о жизни" Сколковского института науки и технологии. В 2019 году занимался поиском новых иммунных систем бактерий при помощи машинного обучения в Национальном Центре Биотехнологической Информации (NCBI, NLM, NIH, г. Бетезда, Мэрилэнд, США). С 2019 года - аспирант Сколковского института науки и технологий, тема диссертации - "Оценка неопределенности и интерпретация предсказаний нейронных сетей для изучения механизмов работы системы CRISPR". В 2020 году преподавал в НИУ ВШЭ, читал курс "Культура работы с данными" для студентов первого курса ФБиБ. В 2019-2020 году работал в компании СберМедИИ (тогда называвшейся CoBrain Analytics), основной проект - система автоматической деперсонализации отсканированных рукописных историй болезни. С 2021 - младший научный сотрудник Института Биологии Гена Российской Академии Наук. Преподаватель

  • Максим Пантелеев

    Специалист по машинному обучению и разработке (BigData). Работал в таких компаниях как Mail.Ru Group, Wamba, NVidia, Sber, Megafon, Техносерв Консалтинг, где реализовывал практические кейсы применения машинного обучения полного цикла - прогнозирование временных рядов, детектирование аномалий, системы анализа соц. медиа поля (NLP), рекомендательные системы в ритейле и тд, так и HighLoad практическая реализация этих кейсов в продуктивном окружении - Hadoop, Spark, Flink, Kafka и тдДолгое время занимался преподаванием курсов по машинному обучению и технологиям BigData в таких организациях как тренинговый Центр Люксофт, ВШЭ Преподаватель

  • Андрей Дзись

    В настоящее время работает аналитиком данных в Инжиниринговом Центре МФТИ по полезным ископаемым. Занимается анализом и обработкой данных с оборудования для нефтедобычи с целью реализации интеллектуальных продуктов для эффективного мониторинга и эксплуатации на основе алгоритмов машинного обучения. Выпускник совместной программы магистратуры ФРКТ МФТИ и Сколковского Института Науки и Технологии по направлению "Интеллектуальный анализ данных".

  • Борис Цейтлин

    Выпускник магистратуры "Науки о данных" ФКН ВШЭ.Работал machine learning инженером в Mindsdb, где разрабатывал auto-ml решения. Имеет опыт работы в аналитике продукта и back-end разработке. Сфера научных интересов включает в себя computer vision, semi-supervised learning, few-shot learning. Преподаватель

  • Андрей Сухобок

    Data Scientist, Unity Technologies, Finland

    Специалист по машинному обучению в компании Unity Technologies. Получил степень магистра по Machine Learning в университете Aalto в Финляндии.Занимался рядом проектов на стыке двух дисциплин (машинного обучения и экономики). Работал в отделе Deloitte Analytics Institute в компании Deloitte (отдел разрабатывал продукты на основе машинного обучения для внутренних нужд компании и внешних заказчиков), а так же участвовал в проекте по анализу текстов в Институте Гайдара. Также занимался анализом GPS-данных различного транспорта для ЦОДД Москвы.Имеет разносторонний бэкграунд и широкий спектр интересов: Python, Machine Learning, Natural Language Processing, Neural Networks, Statistical Modelling. Образование:— НИУ ВШЭ, «Математические методы анализа экономики»;— Центр математических финансов МГУ им. М.В. Ломоносова, программа «Анализ Данных»;— ДПО ФКН НИУ ВШЭ, программа «Deep Learning: расширенный курс»;— Aalto University (Finland), MSc, Machine Learning. Преподаватель

  • Максим Мигутин

    Более 5-ти лет опыта в индустрии Данных & Аналитики в роли внешнего косультанта (IBM) и in-house лидера Data Engineering и Data Science-проектов (Альфа-Банк, Yum! Brands).Сферы интересов: построение end-to-end аналитических систем, внедрение инструментов Машинного обучения в промышленную эксплуатацию, Рекомендательные системы, MPP-базы данных.Образование: МГУ им. Ломоносова, математическая кафедра Экономического факультета Преподаватель

  • Фаррух Кушназаров

    Ping'an- iTutorGroup, Sr. Data Scientist

    - к.т.н. по направлению Мат.моделирование и комплекс программ; - 10+ лет опыта работы в сфере ИТ; - 5+ лет опыта в проектах машинного обучения, глубокого обучения и искусственного интеллекта в различных областях; - более 2-х лет педагогического опыта; - 10+ научных публикаций. Преподаватель

  • Максим Бекетов

    Аспирант ФКН ВШЭВыпускник ФОПФ МФТИ и Сколтеха, в машинное обучение пришел из теоретической физики. Опыт работы в анализе данных (компания App In The Air) и Python-разработки (Archeads Inc.)Многолетний опыт преподавания: линейной алгебры, статистики и теории вероятностей, разработки и анализа данных на Python.