OTUS

NLP / Natural Language Processing

  • Язык: Русский
  • Осталось мест: не ограничено
Записаться

NLP / Natural Language Processing

Для кого этот курс?

Для дата-сайентистов, аналитиков данных и специалистов по машинному обучению

 

Необходимые знания:

  • базовое знакомство с Python
  • базовые знания линейной алгебры, математического анализа, математической статистики
  • базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия)

Что такое Natural Language Processing? 

Natural Language Processing (NLP, обработка естественного языка)– это направление, которое объединяет в себе лингвистику, компьютерные науки и искусственный интеллект. NLP применяет алгоритмы машинного обучения для анализа естественных языков, ResNet и EfficientNet, до самых современных Vision Transformers, таких как MViT

 

Хотите изучить или повторить Python, математический анализ и основны ML?

Посмотрите программу ДПО Machine Learning Специализация

Подходит ли эта программа именно вам?

Пройдите короткий тест, который проверяет ваше знание пререквизитов, а именно математики и Python, которые понадобятся вам на курсе

Поможем найти работу твоей мечты!

Программа обучения
  • Python для работы с текстами

    Вводный модуль, посвященный повторению основных методов работы с данными в Python и работе с текстами. В модуле также рассмотрены методы парсинга данных и методы работы с регулярными выражениями — необходимые навыки в NLP.

    Тема 1: Введение в NLP

    Тема 2: Recap python/ data analysis/ визуализации

    Тема 3: Работа со строками + регулярные выражения

    Тема 4: Парсинг данных

  • Введение в DL

    Вводный модуль по Deep Learning. Данный модуль дает общее представление о нейронных сетях, фокусируясь на методах и архитектурах, востребованных в NLP.

    Тема 1: Введение в нейросети

    Тема 2: Градиентный спуск и backpropagation

    Тема 3: PyTorch. Часть 1

    Тема 4: PyTorch. Часть 2

    Тема 5: Рекуррентные сети. Часть 1

    Тема 6: Рекуррентные сети. Часть 2

  • Классичесикие методы NLP и трансформерные модели

    Модуль посвящен традиционным подходам в обработке естественного языка. В нем рассматриваются ключевые этапы предобработки текстовых данных, различные способы представления слов в векторном пространстве, а также классические рекуррентные нейросетевые архитектуры, включая RNN и seq2seq, используемые для задач машинного перевода и генерации текста.

    Тема 1: Предобработка данных и векторные представления слов

    Тема 2: Понятие языковой модели, RNN для работы с текстом

    Тема 3: Машинный перевод и seq2seq

  • Трансформерные модели

    Модуль посвящен современным трансформерным моделям и их применению в NLP. В нем изучаются архитектура Transformer, механизмы transfer learning, модель BERT и работа с предобученными языковыми моделями. Рассматриваются задачи именованного распознавания сущностей (NER), генеративные языковые модели, а также подходы к промптингу и использование LLM в диалоговых системах.

    Тема 1: Архитектура Transformer

    Тема 2: Transfer learning; BERT model

    Тема 3: Работа с предобученными языковыми моделями. Задача NER

    Тема 4: Генеративные языковые модели и энкодер-декодер архитектуры

    Тема 5: Towards ChatGPT

    Тема 6: Теория промптинга LLM

    Тема 7: Q&A

  • Дополнительные главы NLP

    В модуле рассмотрены дополнительные вопросы из области NLP, выходящие за рамки основной программы: распределенные вычисления, вопросы оценки языковых моделей, тематическое моделирование. На практике будет рассмотрено, как создавать телеграмм-ботов и встраивать в них обученные модели.

    Тема 1: Оценка LLM

    Тема 2: Создание телеграм-бота

  • Проектный модуль

    Проектный модуль, во время которого студенты выполняют финальную работу на основе методов, изученных на курсе.

    Тема 1: Выбор темы и организация проектной работы

    Тема 2: Предзащита №1

    Тема 3: Предзащита №2

    Тема 4: Защита проектных работ

Преподаватели

  • Андрей Коняев

    Data Scientist (NLP)

  • Александр Брут-Бруляко

    DS инженер (к.э.н.)

  • Дмитрий Гайнуллин

    Machine Learning Engineer

  • Мария Тихонова

    PhD Computer Science, Senior Data Scientist

  • Алексей Кисляков

    (д.э.н., к.т.н.) преподаватель/ученый-исследователь

  • Алексей Клочков

    Data Science Team Lead

  • Александр Гавриленко

    Биоинформатик

Закрыть меню