Skillbox

Язык R для анализа данных

  • Начальный уровень
  • Наставник: Нет
  • Сертификат: Есть
  • Формат: Online
  • Рассрочка: Нет
  • Язык: Русский
  • Осталось мест: Неограничено
Записаться

Язык R для анализа данных

Вы научитесь обрабатывать большие массивы данных, использовать библиотеки и строить графики. Сможете автоматизировать задачи и прокачаться до нового уровня в аналитике с помощью языка R.

Для кого этот курс?
  • Научитесь программировать на R с нуля и автоматизируете свою работу. Сможете решать более сложные задачи и повысите свою ценность на рынке.
  • Систематизируете знания и изучите продвинутые функции R. Сможете тратить меньше времени на ежедневные рутинные задачи.
  • Освоите популярный инструмент для работы с данными и научитесь обрабатывать информацию с помощью языка R. Сделаете шаг к карьере в аналитике и обойдёте конкурентов уже на старте.
Программа обучения
Язык программирования R
  • Знакомство с языком R и базовые операции

    Установите R и RStudio — среду для разработки на R — и познакомитесь с её интерфейсом. Узнаете, как создавать файлы R и Rmarkdown, начнёте изучать синтаксис языка и познакомитесь с понятием вектора в R.

  • Типы и структуры данных

    Изучите типы данных в R и научитесь преобразовывать данные из одного типа в другой. Разберёте структуры данных в R: векторы, матрицы, датафреймы и списки. Узнаете, как с ними работать.

  • Управляющие конструкции

    Научитесь использовать условную конструкцию if-else, проверять условия, работать с циклами и функциями.

Обработка данных. Библиотека tidyverse
  • Чтение и запись файлов в R

    Узнаете, как работать с файлами в рабочей папке, читать и записывать файлы форматов csv, txt и Excel.

  • Обработка данных базовыми средствами R

    Научитесь использовать датафреймы и работать с данными с помощью базовых средств R. Узнаете, как выводить описание датафрейма, работать со строками и столбцами.

  • Обработка данных с библиотекой tidyverse: часть 1

    Познакомитесь с библиотекой tidyverse и её возможностями. Разберёте особенности синтаксиса tidyverse и изучите работу с разными функциями. Узнаете, как группировать и агрегировать данные, выгружать сводную информацию с помощью библиотеки stargazer.

  • Обработка данных с библиотекой tidyverse: часть 2

    Научитесь трансформировать структуру данных и объединять таблицы.

  • Работа с пропущенными значениями в R

    Научитесь выполнять поиск и подсчёт пропущенных значений и искать в них закономерности. Поймёте, как визуализировать пропущенные значения с помощью библиотек mice и VIM и заполнять пропуски средствами tidyverse.

  • Работа с порядковыми и категориальными данными в R

    Изучите шкалы данных: числовую, порядковую и категориальную. Разберёте особенности факторных данных в R и операции с ними. Научитесь работать с категориальными данными с forcats.

Визуализация данных
  • Визуализация данных в R

    Научитесь строить простейшие графики базовыми средствами R — гистограмму, диаграмму рассеяния и линейный график. Узнаете, как их настраивать и выгружать в файл.

  • Визуализация данных с библиотекой ggplot2

    Узнаете, как строить графики с библиотекой ggplot2. Научитесь работать с одномерными, двумерными и нечисловыми данными и группировать данные на графиках.

Статистический анализ данных в R
  • Разведывательный анализ данных в R

    Познакомитесь с описательными статистиками в R. Научитесь пользоваться библиотекой psych и искать нетипичные значения. Изучите коэффициенты корреляции Пирсона и Спирмена и поймёте, как их применять. Узнаете о понятии корреляционных матриц, сможете их визуализировать и выгружать в отчёт.

  • Введение в теорию вероятностей

    Узнаете, что такое случайный эксперимент и условная вероятность. Познакомитесь с разными типами случайных величин. Научитесь решать задачи на определение вероятности события.

  • Статистическое оценивание

    Познакомитесь с законами статистики. Научитесь формулировать и проверять статистические гипотезы с помощью графиков распределения, доверительных интервалов и p-value.

  • A/B-тестирование

    Узнаете, что такое A/B тестирование и в каких задачах его применяют. Научитесь проверять гипотезы с помощью метода ANOVA и тестов Уилкоксона и Краскела-Уоллиса.

  • Поиск взаимосвязей в данных в R

    Научитесь выделять взаимосвязи в количественных и категориальных данных. Изучите простую линейную регрессию. Узнаете, как работать с регрессионной моделью, проверять её качество, выгружать результаты и включать их в отчёт Rmarkdown.

  • Регрессионный анализ в R

    Узнаете, что такое регрессионные модели и в чём их ценность для статистических исследований. Научитесь строить регрессии в R, чтобы решать аналитические задачи.

Продвинутая визуализация и представление результатов анализа
  • Интерактивные графики с библиотекой Plotly

    Познакомитесь с проектом Plotly, разберёте его возможности, особенности синтаксиса и функции. Научитесь строить интерактивные графики Plotly в 2D и 3D и публиковать результаты на RPubs.

  • Аналитические панели в R: фреймворк Shiny

    Изучите проект Shiny, его возможности и устройство кода. Установите библиотеку Shiny, научитесь редактировать шаблонное приложение, добавлять на дашборд меню, строки датафрейма и элементы интерфейса.

Итоговый проект
  • Обработка и анализ социально-экономических данных

    Вы выгрузите данные из разных файлов, соберёте их в единый датафрейм и обработаете его. Проведёте разведывательный анализ, построите регрессионные модели и графики, а затем представите результаты и интерпретацию в отчёте.

Преподаватели

  • Алла Тамбовцева

    Ведёт курсы по статистике, анализу данных и программированию на языках R и Python. Опыт преподавания — больше 7 лет.