Иннополис

Аналитика данных и машинное обучение

  • Сертификат: Есть
  • Формат: Online
  • Язык: Русский
  • Осталось мест: не ограничено
Записаться

Аналитика данных и машинное обучение

На курсе научитесь создавать модели машинного обучения. Также изучите различные темы по проверке статистических гипотез, программированию Python и связанных с ним приложений для работы с большими данными.

Для кого:
Граждане РФ от 18 лет и до достижения пенсионного возраста: — имеющие среднее специальное или высшее образование или — получающие среднее специальное или высшее образование (студенты колледжей, техникумов и вузов
— начинающие аналитики и ИТ-специалисты;
— студенты ИТ-направлений;
— специалисты, желающие сменить сферу деятельности.

Компетенции:
  1. Основам веб-разработки на python и применению веб-проектов для аналитики данных
  2. Теоретическим основам, инструментам и методам анализа больших данных
  3. Применять статистические методы для проверки гипотез
  4. Решать задачи классификации, кластеризации, регрессии, прогнозирования
  5. Работать с данными с применением библиотек NumPy, Pandas, Matplotlib
  6. Как работают нейронные сети и глубокое обучение на числовых данных, тексте и изображениях

Поможем найти работу твоей мечты!

Программа обучения
  • «Машинное обучение»
    Модуль включает в себя следующие темы:
    • Структура курса. Введение в аналитику
    • Этика использования данных
    • Язык python для аналитики данных
    • Pandas
    • Matplotlib, seaborn, plotly
    • Реляционные базы данных
    • Введение в машинное обучение. KNN. Метрики качества. Матрица ошибок
    • Линейная регрессия
    • Логистическая регрессия. Полиномиальная регрессия
    • Регуляризация. Гребневая регрессия. Лассо
    • SVM
    • Решающее дерево
    • Снижение размерности. PCA
    • Снижение размерности. tSNE
    • Основы статистики. p-value, t-value. Проверка гипотез
    • Непараметрическая статистика. KS-test. Bootstrap
    • Промежуточная аттестация
  • «Нейронные сети и алгоритмы глубокого обучения. Применение искусственного интеллекта в обработке текста и цифровых изображений».
    Модуль включает в себя следующие темы: 
    • Нейронные сети. Обратное распространение ошибки
    • Слои нейронной сети
    • Pytorch
    • NN Architectures (ResNet, VGG)
    • Автокодировщики
    • Рекуррентные нейронные сети
    • LSTM, GRU
    • Seq2Seq, Encoder-Decoder. Attention
    • Exploratory analysis (common sense, methodology). Model deployment, Функциональное тестирование
    • Model deployment, Функциональное тестирование
    • Временные ряды. ARIMA, SARIMA
    • Обработка данных
    • Плавающее окно
    • RF Regressor, Feature engineering
    • Предобработка текста. nltk, pymorphy, natasha
    • Упрощенное представление текста. TF-IDF, word2vec
    • Эмбединги. ELMO
    • Трансформер, BERT
    • Цветовые пространства
    • Сверточные фильтры
    • Морфологические фильтры
    • Распознавание лиц
    • YOLO, Object Deteсtion, Image segmentation
    • Промежуточная аттестация
  • «Проектная работа»
    Модуль включает в себя следующие темы: 
    • Разработка веб-проекта для анализа данных. Библиотека Streamlit.
    • Разработка чат-бота для работы с проектом по анализу данных
    • Docker для веб-проекта на python
    • Виртуальные машины.Ubuntu
    • Разработка и тестирование приложения с применением искусственного интеллекта.
    • Промежуточная аттестация
  • Итоговая аттестация