Открытое образование

Аналитика данных

  • Сертификат: Нет
  • Формат: Online
  • Язык: Русский
  • Осталось мест: не ограничено
Записаться

Аналитика данных

Программа от Университет ИТМО

Что это за специальность?

Аналитик данных — ключевой игрок цифровой экономики. Количество вакансий, связанных с аналитикой данных, за 3 года выросло на 433%. Спрос значительно превышает предложение. Ритейл, киберспорт, путешествия, образование, медицина — грамотный Data Scientist востребован в каждой индустрии.

Каждую секунду мы создаем новые данные: общаемся в мессенджерах, выкладываем фотографии, делаем покупки онлайн, бронируем авиабилеты, пользуемся навигаторами. Вся генерируемая в процессе информация накапливается и сохраняется. Но она оказывается полезной лишь в том случае, когда ее удается расшифровать, обработать и интерпретировать. Этими процессами занимается аналитик данных. Он ищет закономерности, визуализирует, интерпретирует, выявляет проблемные места, выдвигает гипотезы и на основе полученной информации предлагает оптимальные решения для улучшения бизнес-процессов.


Для кого эта программа?

Для новичков. Вы получите востребованные и высокооплачиваемые навыки в IT-сфере.
Для практикующих IT-специалистов. Вы получите новую траекторию развития вашей карьеры и станете востребованным специалистом в перспективной сфере.

Что вас ждет во время обучения?

Персонализированное обучение: чат в Telegram для общения с наставниками и обучающимися.
Мастер-классы и консультации от команды преподавателей.
Вебинары с наставниками и практикующими специалистами.
Карьерные консультации. HR-специалисты расскажут о состоянии рынка труда и перспективах трудоустройства в изучаемой области.
Индивидуальные задания. Работа над задачами из реальной практики, решение которых может быть использовано в портфолио.
Оценка и предоставление обратной связи. Рекомендации экспертов по выполнению индивидуальных заданий на протяжении всего обучения.

Чему вы научитесь?

  • Собирать, агрегировать и структурировать данные. 
  • Писать регулярные выражения, создавать сводные таблицы, работать с временными рядами. 
  • Визуализировать данные. 
  • Работать с базами данных. 
  • Освоите работу с реляционными СУБД на примере PostgreSQL и Oracle, научитесь использовать NoSQL хранилища на базе MongoDB, Redis и Neo4J. 
  • Сможете вычислять статистические параметры  наборов данных и узнаете законы распределения. 
  • Научитесь строить доверительный интервал и выдвигать гипотезы.



Первичная обработка данных: 
( 1 неделя → 5 неделя )

  1. Введение в науку о данных
    • Основные понятия анализа данных
    • Измерения и шкалы. Виды данных
    • Источники данных. Подготовка данных
  2. Инструменты обработки данных
    • Инструменты первичной обработки данных
    • Электронные таблицы
    • Сортировка и фильтрация данных. Сводная таблица
  3. Визуализация данных
    • Задачи визуализации
    • Методы визуализации
    • Визуализация данных в Google-таблицах
  4. Анализ и преобразование данных
    • Описательная статистика
    • Преобразование данных
    • Нормировка данных
    • Целевая функция
  5. Работа с временными рядами
    • Анализ временных рядов
    • Сглаживание временных рядов
    • Определение трендов временных рядов
    • Построение моделей для временных рядов с сезонными составляющими

Хранение больших данных:
( 6 неделя → 9 неделя )

  1. Системы управления базами данных
    • Информационные системы
    • Базы данных: основные функции систем управления данными
    • Архитектура СУБД. Реляционные базы данных
  2. Проектирование структурированных данных
    • Проектирование данных и связей
    • Преобразование ER-модели в БД
    • Создание таблиц. Ограничения целостности
  3. Запросы на языке SQL
    • Оператор SELECT. Условия выборки
    • Агрегатные функции. Вложенные запросы
    • Теоретико-множественные операции. Соединение таблиц
  4. Объекты баз данных
    • Выражения на SQL
    • Встроенные функции на SQL
    • Объекты. Индексы

Статистический анализ данных:
( 10 неделя → 14 неделя )

  1. Обзор задач, решаемых статистикой
    • Введение в статистику
    • Точечное и интервальное оценивание
    • Проверка гипотез
  2. Выборочные характеристики
    • Основные понятия и задачи математической статистики
    • Выборочное распределение
    • Эмпирическая функция распределения
    • Гистограмма
    • Выборочные моменты и квантили
  3. Точечное оценивание
    • Точечные оценки и их свойства
    • Метод моментов
    • Состоятельность оценки метода моментов
    • Метод максимального правдоподобия
  4. Точные и асимптотические доверительные интервалы
    • Интервальное оценивание
    • Точные доверительные интервалы для семейства нормальных распределений
    • Асимптотические доверительные интервалы и примеры их построения
    • Асимптотическая нормальность оценки и построение доверительных интервалов
  5. Проверка гипотез
    • Понятие гипотезы и критерия. Ошибки 1 и 2 рода
    • Уровень значимости и мощность
    • Критерии согласия

Элементы теории вероятностей (факультативный курс):
( 1 неделя → 19 неделя )

  1. Вероятностное пространство
    • Пространство элементарных исходов. События и операции над ними
    • Простейшее вероятностное пространство
    • Классическое определение вероятности
    • Комбинаторика
    • Условная вероятность. Независимость
  2. Простейшие случайные величины
    • Случайные величины и их характеристики
    • Закон больших чисел. Предельные теоремы в схеме Бернулли
    • Неравенства Маркова и Чебышёва
  3. Общее понятие вероятностного пространства
    • Геометрическая вероятность
    • Общее определение вероятностного пространства
    • Случайные величины и их распределения
  4. Типы распределений случайных величин
    • Распределения случайных величин
    • Многомерные распределения
  5. Числовые характеристики, сходимость
    • Начальные сведения о функциях от случайных величин
    • Некоторые числовые характеристики случайных величин
    • Сходимость последовательностей случайных величин

Каких навыков вам не хватает?