Профессиональная переподготовка

Работа с данными

Специалист по Data Science

Сертифицированная программа нацпроекта «Цифровая экономика». Изучение всех разделов современного анализа данных: от программирования и базовых разделов математики до машинного обучения, прикладной статистики, работы с большими данными и глубинного обучения.

Занятия по вторникам (19:00 - 22:00) и субботам (13:00 - 16:00)

Подать заявку
  • Старт курса

    12.09.2023

  • Продолжительность

    15 месяцев

  • Формат обучения

    Очный

  • Документ

    Диплом о профессиональной переподготовке НИУ ВШЭ

Это программа по анализу данных и машинному обучению, которая охватывает все разделы современного анализа данных, в том числе глубинное обучение и его применения.

  • Программа начинается с самых основ — изучения программирования и базовых разделов математики — и переходит к разделам по машинному обучению, прикладной статистике и обработке данных, работе с большими данными, глубинному обучению, его применениям к изображениям, текстам и сигналам. При разработке программы мы сделали акцент на практическую работу.
  •  В декабре 2019 г. программа «Специалист по Data Science» стала сертифицированной программой нацпроекта «Цифровая экономика» и победила в номинации «Подготовка профессионалов цифровой индустрии».

О профессии

Специалист по Data Science — тот, кто разрабатывает алгоритмы для работы с данными. Например, придумывает рекомендательную систему для музыкального сервиса, строит модель ценообразования для сети магазинов или создает бота-помощника.

Для кого

Очная программа «Специалист по Data Science» подходит:

  • Начинающим

    В программу включены основы программирования и математики

  • Специалистам не из IT

    Вы освоите новые методы и инструменты для работы с данными в своей области

  • Программистам

    Вы освежите в памяти алгоритмы и структуры данных и научитесь обучать нейронные сети

В результате освоения программы вы:

  • Изучите

    Программирование на Python, математику для анализа данных, прикладную статистику, классические модели машинного обучения и нейронные сети, а также основы обработки текстов, звука и изображений.

  • Освоите инструменты

    SQL, Python, Jupyter Notebook, Spark, Tensorflow/Pytorch и другие

  • Выполните три проекта

    Вы напишете чат-бот, выполните проект по машинному обучению и финальный проект. Это хорошая возможность пополнить портфолио, особенно для начинающих.

  • По итогам программы вы получите самые актуальные знания в одной из самых востребованных областей XXI века

    Подать заявку

Программа обучения

  • Python для автоматизации и анализа данных 18 занятий

    • Введение в язык Python. Знакомство со средой программирования. Базовые операции. Интерпретация ошибок.
    • Строки и списки в Python.
    • Понятие управляющих конструкций. Условные операторы.
    • Циклы for и while.
    • Устройство функций в Python. Поиск ошибок в коде и отладка.
    • Итераторы, генераторы, генераторы списков. Рекурсия.
    • Работа с файлами. Продвинутая работа со словарями.
    • Библиотеки для хранения и работы с данными в табличном формате: pandas.
    • Сбор данных: web-scraping с BeautifulSoup.
    • Сбор данных: Selenium, работа с сервисами через API.
    • Объектно-ориентированное программирование. Классы.
    • Введение в numpy.
    • Введение в pandas.
    • Работы с пропущенными данными.
    • Визуализация для презентации данных: matplotlib. Основные виды графиков. Основные ошибки при создании визуализаций.
    • Создание интерактивных визуализаций: plotly.
    • Разведывательный анализ данных. Особенности исследования текста.
  • SQL 5 занятий

    • Введение в  SQL. Основные блоки запросов. Типы данных.
    • Агрегационные функции и подзапросы.
    • Join'ы и их применение.
    • Оконные функции.
    • SQL в связке с Python.
  • Математика для анализа данных 19 занятий

    Дискретная математика:

    • Множества и логика.
    • Комбинаторика и вероятность.
    • Неориентированные графы.
    • Ориентированные графы и алгоритмы на графах.

    Математический анализ:

    • Функции одной переменной, пределы, производные.
    • Касательные, критические точки, поиск минимумов и максимумов.
    • Интегралы, введение в вычисление интегралов.
    • Функции нескольких переменных, градиент, производная по направлению, линии уровня, касательная плоскости, критические точки, поиск минимумов и максимумов.
    • Оптимизационные задачи, лагранжиан и его геометрический смысл, нахождение минимума или максимума с заданными ограничениями.

    Линейная алгебра:

    • Системы линейных уравнений, матрицы, обратимость и невырожденность.
    • Определитель, обратная матрица.
    • Векторные пространства и подпространства, размерности, ранги матриц.
    • Линейные отображения и их матричное описание. Собственные значения и векторы, связь со спектром.
    • Билинейные и квадратичные формы. Скалярные произведения, углы и расстояния. Ортогонализация и QR-разложение. Линейные многообразия и линейные классификаторы, отступы.
    • Операторы в евклидовых пространствах. Сингулярное разложение (SVD).

    Теория вероятностей:

    • Пространство элементарных исходов. События. Вероятность и её свойства. Условная вероятность. Формула полной вероятности. Формула Байеса.
    • Дискретные случайные величины и их распределения. Независимость случайных величин. Распределение функции от дискретной случайной величины. Математическое ожидание и дисперсия.
    • Случайные величины, имеющие плотности. Математическое ожидание случайной величины, имеющей плотность. Равномерное, экспоненциальное, нормальное распределения.
    • Функция распределения. Распределение функции от случайной величины, имеющей плотность. Многомерные случайные величины. Ковариация и корреляция.
    • Неравенства концентрации (неравенства Маркова и Чебышёва). Распределение суммы случайных величин. Закон больших чисел. Центральная предельная теорема.
  • Алгоритмы и структуры данных 10 занятий

    • Асимптотический анализ.
    • Базовые структуры данных.
    • Сортировки.
    • Бинарные деревья поиска.
    • Хеш-таблицы.
    • Алгоритмы на графах.
    • Алгоритмы на строках.
    • Динамическое программирование.
  • Прикладная статистика для машинного обучения9 занятий

    Теория оценивания. Оценивание параметров распределения. Метод моментов и метод максимального правдоподобия. Сравнение оценок.

    • Теория оценивания. Оценивание характеристик распределения. Метод Монте-Карло.
    • Доверительное оценивание. Построение доверительных интервалов. Доверительные интервалы в нормальной модели. Бутстрэп.
    • Проверка гипотез. Введение в проверку гипотез. Критерии согласия.
    • Проверка гипотез. Критерии однородности и A/B тестирование I.
    • Проверка гипотез. Критерии однородности и A/B тестирование II.
    • Линейные модели со статистической точки зрения I. Исследование зависимости признаков. Ковариация и корреляция.
    • Линейные модели со статистической точки зрения II. Метод наименьших квадратов (МНК). Статистические свойства оценок МНК.
    • Временные ряды. Модель SARIMA и ее подгонка.
  • Машинное обучение14 занятий

    • Введение и основные задачи.
    • Линейная регрессия.
    • Градиентные методы обучения.
    • Линейная классификация и метрики качества классификации.
    • Логистическая регрессия и SVM.
    • Многоклассовая классификация, работа с категориальными признаками и текстами.
    • Решающие деревья.
    • Бэггинг и случайные леса.
    • Градиентный бустинг.
    • Градиентный бустинг: имплементации.
    • Отбор признаков и понижение размерности.
    • Кластеризация.
    • Поиск аномалий.
    • Рекомендательные системы.
    • Ранжирование.
  • Промышленное машинное обучение на Spark 8 занятий

    • Введение: как работают и где находятся большие данные.
    • Среда Spark. Spark RDD / Spark SQL.
    • Advanced SQL.
    • Spark ML / Spark TimeSeries.
    • Advanced ML и проверка результатов качества моделей.
    • Spark GraphX /Spark Streaming.
    • Экосистема Spark (MLFlow, AirFlow,H2O AutoML).
    • Spark в архитектуре проекта / Spark CI/CD.
  • Глубинное обучение10 занятий

    • Введение в глубокое обучение. От линейной регрессии к нейронной сети. Смотрим на базовые возможности tensorflow/pytorch, собираем первую нейросеть.
    • Обучение нейронных сетей. Алгоритм обратного распространения ошибки.
    • Свёрточные нейронные сети. Классификация изображений.
    • Оптимизация. Эвристики для обучения нейронных сетей. Нормализация по батчам, инициализация и др.
    • Архитектуры свёрточных сетей. Что видят свёрточные сети. Transfer learning.
    • Обзор задач компьютерного зрения. Детекция, сегментация, перенос стиля, распознавание лиц.
    • Автокодировщики и генеративные модели (Generative Adversarial Networks).
    • Глубокое обучение для NLP. Векторные представления текстов: word2vec, fasttext.
    • Рекуррентные нейронные сети, работа с последовательностями. ELMO-эммбеддинги.
    • Sequence2sequence, архитектуры с механизмом внимания. Трансформеры. BERT.
  • Прикладные задачи анализа данных 10 занятий

    • Введение в цифровую обработку сигналов и классификация звуков.
    • Автоматическое распознавание речи.
    • Преобразование текста в речь.
    • Введение в обработку текстов и классификация текстов.
    • Языковое моделирование.
    • Машинный перевод.
    • Распознавание лиц и метрическое обучение.
    • Семантическая сегментация изображений.
    • Детекция объектов на изображениях.
    • Глубинное обучение в производстве: обслуживание и ускорение.
  • Финальный проект

Документ об окончании

Диплом о профессиональной переподготовке при успешном завершении обучения.

У нас есть лицензия на образовательную деятельность.

Документ об окончании
Подать заявку

Преимущества программы

  • Наши преподаватели работают в крупных IT-компаниях, банках и инновационных стартапах. На каждом занятии они учат применять теорию к реальным задачам, которые они решают в индустрии.

  • Мы выкладываем видеозапись и материалы занятий. Доступ сохраняется за вами в течение 2 месяцев после завершения.

  • Вы можете общаться с другими студентами и преподавателями очно или в закрытом чате Телеграм.
    Доступ к чатам открыт навсегда – если у вас возникают вопросы, вы можете задать их даже после окончания обучения.

Преподаватели

  • Касьяненко Дарья Алексеевна

    Старший преподаватель факультета компьютерных наук

  • Пиле Ян Эрнестович

    Руководитель группы аналитики в VK

  • Кантонистова Елена Олеговна

    Доцент факультета компьютерных наук

  • Карпов Максим Евгеньевич

    Старший преподаватель факультета компьютерных наук

  • Максаев Артём

    Старший преподаватель факультета компьютерных наук

  • Горденко Мария Константиновна

    Старший преподаватель факультета компьютерных наук

  • Промыслов Валентин Валерьевич

    Старший преподаватель факультета компьютерных наук

  • Балдицын Владимир

    ML-разработчик в Яндексе

  • Хуракай Долма

    Аналитик в Самокате

  • Матвеева Анна

    Аналитик данных в Деметра-Холдинг

  • Соловей Владислав

    Руководитель направления в Сбере

  • Гайфуллин Сергей Александрович

    Доцент факультета компьютерных наук

  • Коломейцева Катерина

    Data Scientist в Сколтехе

  • Максимовская Анастасия

    Data Scientist в Сбербанке

  • Рахимов Руслан

    Инженер-исследователь в Сколтехе

  • Овчинников Кирилл

    Руководитель направления в Сбере

  • Находнов Максим

    Инженер-исследователь в AIRI

  • Костоев Руслан

    Ведущий исследователь в Аiri

  • Бекезин Никита

    Lead Data Scientist в X5 Retail Group

  • Петров Тимур

    Аналитик в Яндекс.Лавке

Эксперты

  • Соколов Евгений Андреевич

    Научный руководитель Центра непрерывного образования

  • Теванян Элен Арамовна

    Руководитель команды развития алгоритмов диспатча в Яндексе

  • Иосипой Леонид Сергеевич

    Старший научный сотрудник

  • Пиле Ян Эрнестович

    Руководитель группы аналитики в VK

Стоимость и условия

  • 58 125 ₽

    раз в два месяца при рассрочке без переплат: 8 платежей

  • или 465 000 ₽ за весь курс

    Подать заявку
  • Скидка

    5-10 %

    Для студентов, выпускников и слушателей основных и дополнительных программ НИУ ВШЭ.

Как поступить на программу

  • 01

    Оставить заявку на программу. В заявке важно указать актуальные номер и e-mail.

  • 02

    Подтвердить обучение на курсе. Менеджер свяжется с вами по указанным в заявке контактам, чтобы вы могли подтвердить участие в обучении.

  • 03

    Отправить сканкопии документов для зачисления (паспорт, снилс, диплом, справка из вуза, свидетельство о смене фамилии).

  • 04

    Заключить договор.Менеджер отправит вам договор на ознакомление и ссылку на оплату, по которой нужно будет оплатить обучение.

  • 05

    Начать обучение. За несколько дней до начала обучения менеджер отправит организационное письмо со всей важной информацией о программе и ссылкой на чат в Telegram.

Контакты

Где проходят занятия?

  • Вы будете учиться в главном корпусе Вышки – на Покровском бульваре, в компьютерных классах.

  • На время обучения получите пластиковый пропуск с доступом во все корпуса ВШЭ. В любое время вы можете зайти в библиотеку, чтобы поучиться или поработать.

  • Можете приезжать на занятия в корпус, а можете подключаться по Zoom. 

Отзывы выпускников

  • После защиты диплома я перешел с позиции эксперта в нефтегазовой компании на позицию инженера-разработчика по интерпретации данных.

  • Понравился удобный формат обучения: очные занятия с трансляцией онлайн. Можно подключиться из любой точки мира, экономить время на дороге, при необходимости можно посмотреть, пересмотреть занятия в записи. При этом всегда есть возможность задать вопросы преподавателям. Что важно: сбалансированы теория и практика. Пройденный материал осознаешь и закрепляешь через домашние задания, а домашние задания разбираются на факультативах.

  • Когда я выбирал программу по Data Science, я изучил несколько вариантов в разных учебных заведениях Москвы. «Специалист по Data Science» во ВШЭ показалась мне наиболее полной: она включает в себя курс алгоритмов, дискретки, линала, теории вероятностей и матстата — все, что необходимо было освежить перед погружением в машинное обучение. Престиж университета тоже сыграл свою роль при выборе.

FAQ

  • Почему я должен выбрать вашу программу?

    В наших программах в коротком формате упакован опыт бакалаврских и магистерских программ факультета компьютерных наук Вышки. Опираясь на наши знания об отрасли, мы дадим Вам необходимую базу, чтобы войти в профессию или перейти на новый уровень на вашей текущей работе.
    К тому же, большинство наши программы – очные. Это означает, что вы сможете еженедельно общаться с преподавателями, получать поддержку ассистентов и одногруппников, это поможет сохранять мотивацию.
    Обучаясь на наших курсах, вы получаете возможность интегрироваться в сообщество Вышки, общаться с нашими преподавателями и участвовать в мероприятиях факультета и университета: например, мы проводили «Ночь анализа данных», у нас регулярно проходят IT-лекторий и научный коллоквиум ФКН.
    У нас есть лицензия на образовательную деятельность, поэтому по результатам обучения мы выдаем удостоверения о повышении квалификации и дипломы о профессиональной переподготовке установленного в НИУ ВШЭ образца.

  • Чем специалист по Data Science отличается от аналитика данных?

    Приведем пример.

    Менеджер интересуется, какие товары пользователи интернет-магазина покупают вместе, с этим вопросом он пойдет к продуктовому аналитику. Аналитик поможет выявить такие категории товаров и предложит идеи для прототипа системы рекомендаций. Для многих интернет-магазинов таких рекомендаций может оказаться достаточно, чтобы повысить средний чек. Но далее может возникнуть потребность автоматизировать рекомендации и построить модель. Этим уже займется специалист по Data Science.

    Еще больше об этом рассказал Сергей Юдин в интервью «Аналитик данных и data scientist: в чем отличие?»

  • Если я студент, могу ли я поступить на программу «Специалист по Data Science»?

    Да, но диплом о профессиональной переподготовке можно получить только после окончания вуза при предоставлении диплома.

  • Могу ли я заниматься на своем ноутбуке?

    Да, вы можете приходить со своим ноутбуком. Также можно использовать компьютеры университета — все занятия проходят в компьютерных классах.