Нетология

Data Scientist: старт в профессии

  • Начальный уровень
  • Наставник: Нет
  • Сертификат: Нет
  • Формат: Online
  • Рассрочка: Нет
  • Язык: Русский
  • Осталось мест: Неограничено
Записаться

Data Scientist: старт в профессии

Курс с акцентом на практику позволит быстро войти в профессию и претендовать на позицию начинающего специалиста. Вы научитесь анализировать данные, познакомитесь с основами нейросетей, создадите и обучите предиктивные модели с помощью алгоритмов машинного обучения.

С чем будем иметь дело:

  • Python Проанализируете уровень удовлетворенности сотрудников. Построите модель LDA, которая предскажет, уволится ли сотрудник
  • SQL Развернёте базу данных авиаперевозок локально или в виртуальной среде. Решите несколько бизнес-задач и сформируете отчёты
  • Математика Решите несколько математических задач с использованием Python
  • Для кого этот курс?
    • Новичкам
      С нуля овладеете знаниями и навыками, необходимыми для работы в перспективной сфере
    • Аналитикам
      Углубитесь в Data Science, систематизируете знания и повысите свою ценность на рынке труда
    Программа обучения
    SQL и получение данных
    • Базы данных
    • Основы SQL
    • Итоговый проект
    • Работа с PostgreSQL
    • Лабораторная работа
    Python для анализа данных
    • Основы Python: Jupiter Notebook, комментарии в коде, арифметические операции, переменные, условные конструкции
    • Регулярные выражения и основы синтаксического разбора
    • Бонусные видеолекции по Git
    • Работа с файловой системой и модули
    • Библиотека NumPy: вычислительные задачи
    • Основы парсинга
    • Продвинутый Pandas: оптимизация, сводные таблицы, методы работы со строками, объединения датафреймов, конкатенация таблиц, оптимизация хранения данных
    • Функции
    • Понятие класса
    • Управляющие конструкции и коллекции
    • Исключения и обработка ошибок
    • Функции и работа с данными
    • Библиотека Pandas: обзор возможностей и базовые операции
    • Лабораторная работа
    Основы практической статистики
    • Основы статистики
    • Основные статистические показатели. Корреляция
    • Статистические критерии. Проверка гипотез и формулирование выводов
    • Основные статистические показатели. Виды распределений данных
    • Взаимосвязи данных и формулирование гипотез по SMART
    • Итоговое задание
    Математика для анализа данных
    • Линейная алгебра
    • Теория оптимизации
    • Итоговый проект
    • Математический анализ
    • Теория вероятностей и основы статистики
    Машинное обучение
    • Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
    • Функции потерь и оптимизация
    • Проблема качества данных
    • Работа с переменными
    • Ансамблирование
    • Feature selection
    • Алгоритмы кластеризации
    • Классификация. Логистическая регрессия и SVM
    • Оценка точности модели, переобучение, регуляризация
    • Работа с пропусками
    • Деревья решений
    • Поиск выбросов и генерация новых признаков
    • Метрики близости. Работа с текстовыми данными. Наивный Байес
    • Улучшение качества модели
    • Итоговый проект
    Введение в нейронные сети
    • Введение в нейронные сети и библиотеку Keras
    • Свёрточные нейронные сети
    • Рекуррентные нейронные сети
    • Дополнительные темы
    Дипломный проект
    Знания и навыки, которые приобретете
    • Правила ведения сопроводительной документации.
    • Базовые знания о БДД.
    • Технические характеристики разных автомобилей и правила их эксплуатации.
    • Умение диагностировать ту или иною поломку ТС по неспецифическим признакам.
    • Нормы охраны труда и пожаробезопасности.
    • Правила приемки автотранспортных средств, которые вернулись на базу после ремонта или работы.

    Преподаватели

    • Python

      Язык программирования для анализа данных и машинного обучения

    • SQL

      Язык программирования для управления базами данных

    • Google colab

      Бесплатная интерактивная облачная среда для работы с кодом от Google

    • Scikit-learn

      Библиотека машинного обучения на Python с открытым исходным кодом

    • Dbeaver

      Универсальный инструмент управления базами данных

    • Seaborn

      Библиотека Python для взаимодействия с искусственными нейронными сетями

    • Git

      Система управления версиями кода

    • PostgreSQL

      Реляционная база с открытым исходным кодом

    • Pandas

      Библиотека машинного обучения на Python с открытым исходным кодом

    • Matplotlib

      Библиотека Python для визуализации данных