Руководство пользователя личного кабинета
Скачать
  • Бизнес-образование
  • Больше профилей
Работа с данными
Профессиональная переподготовка·Москва·Факультет компьютерных наук

Специалист по Data Science

Сертифицированная программа национального проекта «Цифровая экономика». Изучение всех направлений современного анализа данных: от основ программирования и дискретной математики до машинного обучения, прикладной статистики, Big Data и не только.

Расписание занятий: по понедельникам и четвергам (19:00 - 22:00)

В корзинуПодать заявкуЗадать вопрос
  • Старт курса

    16.05.2024

  • Стоимость обучения

    465 000 ₽

  • Продолжительность

    18 месяцев

  • Формат обучения

    Очный

  • Документ

    Диплом о профессиональной переподготовке

О профессии

Специалист по Data Science — тот, кто разрабатывает алгоритмы для работы с данными. Например, придумывает рекомендательную систему для музыкального сервиса, строит модель ценообразования для сети магазинов или создает бота-помощника.

Наш курс по анализу данных и машинному обучению охватывает все разделы современной науки о данных, в том числе Deep Learning и его применение в технологиях искусственного интеллекта.

Вы начнете с самых основ — изучения программирования и базовых разделов математики — и перейдете к теме Machine Learning, прикладной статистике и практическому использованию фреймворков для проведения распределительных операций неструктурированных данных. Получите опыт решения прикладных задач в области дата-анализа и обработки Big Data, сможете применять навыки дата-сайентиста в работе с изображениями, текстами, сигналами и нейросетями.

По итогам обучения вы получите актуальные знания по Data Science, проекты в портфолио и диплом о профессиональной переподготовке установленного НИУ ВШЭ образца.

Для кого

Очная программа «Специалист по Data Science» предназначена слушателям, желающим разобраться в анализе данных

  • Начинающим

    Изучите основы программирования, математики, машинного обучения и работы с Big Data

  • Специалистам не из IT

    Освоите новые методы и инструменты для работы с данными в своей области

  • Программистам

    Освежите в памяти алгоритмы и структуры данных и научитесь обучать нейронные сети

Программа обучения

За 18 месяцев профессиональной переподготовки в НИУ ВШЭ вы изучите Python и SQL, прикладную математику и статистику, алгоритмы и структуры данных, Machine Learning и другие темы

  • Python для автоматизации и анализа данных 18 занятий

    Научитесь работать с основными конструкциями и структурами данных в Python.

    • Введение в Python, Jupyter. Ввод-вывод, основные типы данных (int, float, str). Первые функции;
    • Логические переменные, операции и операторы сравнения. Условия if-elif-else. Условный цикл while. Списки, кортежи, последовательности;
    • Множества. Словари. Вложенные структуры данных. Методы строк, списков. Срезы;
    • Цикл for. Вложенный цикл for;
    • Функции. Рекурсия. О-нотация; Текстовые файлы и таблицы;
    • Регулярные выражения; Классы и основы ООП. Декораторы;
    • Телеграм-бот на Python. Работа с SQL и базами данных с помощью Python;
    • Введение в numpy. Работа с векторами и матрицами. Введение в pandas;
    • Pandas продолжение. Разведочный анализ данных (EDA);
    • Сбор данных: скрейпинг, requests, BeautifulSoup;
    • Сбор данных: requests, BeautifulSoup — продолжение;
    • Сбор данных: работа с сервисами через API;
    • Сбор данных: Selenium, работа с сервисами через API;
    • Визуализация для презентации данных: matplotlib, seaborn;
    • EDA особенности;
    • Предобработка текстов: лемматизация, удаление стоп-слов.
  • SQL 5 занятий

    Познакомитесь с базами данных.

    • Введение в базы данных. Обращение к базе данных. Типы данных. Фильтрация данных;
    • Агрегирующие функции. Функции работы с датами. Функции работы со строками;
    • Взаимоотношения между таблицами. Операторы JOIN и UNION;
    • Подзапросы и временные таблицы;
    • Оконные функции.
  • Алгоритмы и структуры данных 10 занятий

    Получите представление о том, как работают стандартные контейнеры, научитесь анализировать алгоритмы и оценивать эффективность их работы.

    • Асимптотика. Нотация О-большое. Измерение времени работы программы;
    • Базовые структуры данных (список, стек, дек, очередь);
    • Базовые структуры данных (сет, мэп, хэш-таблицы);
    • Сортировки: итеративные, линейные, рекурсивные. Поиск;
    • Динамическое программирование;
    • Алгоритмы на строках. Сравнение строк. Расстояние редактирования;
    • Теория графов. Введение. Алгоритмы обхода графов;
    • Поиск кратчайших путей в графе;
    • Минимальное остовное дерево;
    • Эвристические и приближенные алгоритмы.
  • Математика для анализа данных 19 занятий

    Изучите основные разделы и методы математического анализа, линейной алгебры, основ статистики и теории вероятностей для понимания работы алгоритмов машинного обучения.

    Дискретная математика:

    • Множества и логика;
    • Комбинаторика и вероятность;
    • Неориентированные графы;
    • Ориентированные графы и алгоритмы на графах.

    Математический анализ:

    • Функции одной переменной, пределы, производные;
    • Касательные, критические точки, поиск минимумов и максимумов;
    • Интегралы, введение в вычисление интегралов;
    • Функции нескольких переменных, градиент, производная по направлению, линии уровня, касательная плоскости, критические точки, поиск минимумов и максимумов;
    • Оптимизационные задачи, лагранжиан и его геометрический смысл, нахождение минимума или максимума с заданными ограничениями.

    Линейная алгебра:

    • Системы линейных уравнений, матрицы, обратимость и невырожденность;
    • Определитель, обратная матрица;
    • Векторные пространства и подпространства, размерности, ранги матриц;
    • Линейные отображения и их матричное описание. Собственные значения и векторы, связь со спектром;
    • Билинейные и квадратичные формы. Скалярные произведения, углы и расстояния. Ортогонализация и QR-разложение. Линейные многообразия и линейные классификаторы, отступы;
    • Операторы в евклидовых пространствах. Сингулярное разложение (SVD).

    Теория вероятностей:

    • Пространство элементарных исходов. События. Вероятность и её свойства. Условная вероятность. Формула полной вероятности. Формула Байеса;
    • Дискретные случайные величины и их распределения. Независимость случайных величин. Распределение функции от дискретной случайной величины. Математическое ожидание и дисперсия;
    • Случайные величины, имеющие плотности. Математическое ожидание случайной величины, имеющей плотность. Равномерное, экспоненциальное, нормальное распределения;
    • Функция распределения. Распределение функции от случайной величины, имеющей плотность. Многомерные случайные величины. Ковариация и корреляция;
    • Условное распределение. Неравенства концентрации (неравенства Маркова и Чебышёва). Распределение суммы случайных величин. Закон больших чисел. Центральная предельная теорема. Неравенство Чернова.
  • Прикладная статистика для машинного обучения10 занятий

    Познакомитесь с характеристиками распределений, оценкой характеристик распределения методами Монте-Карло, бутстрэп и не только. Освоите проверку гипотез и работу с временными рядами.

    • Основы теории вероятностей. Описательные статистики;
    • Взаимосвязи между случайными величинами. Взаимосвязи в данных;
    • Методы оценивания параметров распределения. Свойства статистических оценок;
    • Предельные теоремы. Асимптотические и точные доверительные интервалы;
    • Процедура проверки гипотез. Параметрические критерии;
    • Непараметрические критерии. Критерии согласия. Бутстрап, множественное тестирование;
    • Введение в А/Б тестирование: постановка задачи, особенности сбора данных, взаимосвязь размера выборки, уровня значимости, мощности теста и MDE. Особенности метрик;
    • Основные методы А/Б тестирования: стратификация, бакетное преобразование, линеаризация, CUPED;
    • Статистический взгляд на линейную регрессию;
    • Основы анализа временных рядов. Модель SARIMA и её подгонка.
  • Машинное обучение14 занятий

    Узнаете, как работают классические алгоритмы машинного обучения и научитесь применять их на практике. Изучите основные виды моделей, сможете обрабатывать данные и проводить их первичный анализ.

    • Введение в машинное обучение. Основные понятия. Типы задач;
    • Разбиение на train и test. Обучение и оценка качества модели;
    • Линейные методы регрессии. Функционал ошибки. Метрики качества. Переобучение;
    • Градиентный спуск; Регуляризация в линейной регрессии. Кросс-валидация. Кодирование категориальных признаков;
    • Линейные методы классификации (бинарная). Логистическая регрессия. Метрики качества;
    • SVM. Многоклассовая классификация;
    • Нелинейные методы классификации. Байесовский классификатор. KNN. Kernel SVM;
    • Деревья решений. Критерии информативности;
    • Ансамблевые методы. Случайный лес, бэггинг. Разложение ошибки на bias, variance;
    • Градиентный бустинг. XGBoost, CatBoost, LIghtGBM;
    • Обучение без учителя. Кластеризация и визуализация данных. Метрики качества;
    • Понижение размерности. PCA. Детектирование аномалий;
    • Рекомендательные системы;
    • Статистический взгляд на модели МО. Анализ временных рядов.
  • Промышленное машинное обучение на Spark 8 занятий

    Сможете управлять файлами и массивами информации в распределительном хранилище компании с помощью фреймворка Apache Spark и запросов SQL.

    • Введение в Big Data: как работают и где находятся большие данные;
    • Среда Spark. Spark RDD / Spark SQL;
    • Advanced SQL;
    • Spark ML /Spark TimeSeries;
    • Advanced ML и проверка результатов качества моделей;
    • Spark GraphX /Spark Streaming;
    • Экосистема Spark (MLFlow, AirFlow,H2O AutoML);
    • Spark в архитектуре проекта / Spark CI/CD.
  • Глубинное обучение10 занятий

    Познакомитесь с возможностями Deep Learning, научитесь обучать нейронные сети. В том числе вы изучите архитектуру Transformer, которая позволила появиться ChatGPT: огромному шагу к «общему искусственному интеллекту».

    • Введение в глубокое обучение. От линейной регрессии к нейронной сети. Смотрим на базовые возможности tensorflow/pytorch, собираем первую нейросеть;
    • Обучение нейронных сетей. Алгоритм обратного распространения ошибки;
    • Сверточные нейронные сети. Классификация изображений;
    • Оптимизация. Эвристики для обучения нейронных сетей. Нормализация по батчам, инициализация и другое;
    • Архитектуры сверточных сетей. Что видят сверточные сети. Transfer learning;
    • Обзор задач компьютерного зрения. Детекция, сегментация, перенос стиля, распознавание лиц;
    • Автокодировщики и генеративные модели (Generative Adversarial Networks);
    • Глубокое обучение для NLP. Векторные представления текстов: word2vec, fasttext;
    • Рекуррентные нейронные сети, работа с последовательностями. ELMO-эмбеддинг; Sequence-to-sequence, архитектуры с механизмом внимания. Трансформеры. BERT.
  • Прикладные задачи анализа данных | онлайн с преподавателем10 занятий

    Решите практические задачи на построение ML-моделей для обработки изображений, речи, текстов, сигналов.

    • Введение в цифровую обработку сигналов и классификация звуков. Автоматическое распознавание речи;
    • Преобразование текста в речь;
    • Введение в обработку текстов и классификация текстов; Языковое моделирование;
    • Машинный перевод;
    • Распознавание лиц и метрическое обучение;
    • Семантическая сегментация изображений;
    • Детекция объектов на изображениях;
    • Глубинное обучение в производстве: обслуживание и ускорение.
  • Финальный проект

Формат обучения

Продолжительность общая в часах: 714 часов

Условия приема: высшее или среднее профессиональное образование; лица, получающие высшее образование

Формат обучения: очный

Состав группы: группа до 30 человек

Результаты обучения

  • РАЗБЕРЕТЕСЬ В НАПРАВЛЕНИЯХ DATA SCIENCE

    Изучите программирование на Python, математику для анализа данных, прикладную статистику, классические модели машинного обучения и нейронные сети, а также основы обработки текстов, звука и изображений

  • РАЗОВЬЕТЕ HARD SKILLS

    Освоите SQL, Python, Jupyter Notebook, Spark, Tensorflow, Pytorch и другие инструменты

  • ВЫПОЛНИТЕ ТРИ ПРОЕКТА

    Напишете чат-бота, программу для машинного обучения и защитите финальный проект. Это хорошая возможность пополнить портфолио, особенно для начинающих

  • Получите самые актуальные знания по специальности и сможете работать специалистом по Data Science в крупных IT-компаниях

    Подать заявкуЗадать вопрос

Преимущества программы

  • 01

    В декабре 2019 г. обучающий курс «Специалист по Data Science» стал сертифицированной программой нацпроекта «Цифровая экономика» и победил в номинации «Подготовка профессионалов цифровой индустрии»

  • 02

    Наши преподаватели работают в ведущих IT-корпорациях, банках и инновационных стартапах. На каждом занятии они учат применять теорию к реальным задачам, которые решают в индустрии

  • 03

    Мы выкладываем видеозаписи и материалы занятий, доступ сохраняется за вами в течение 2 месяцев после завершения

  • 04

    Вы можете общаться с другими студентами и преподавателями очно или в закрытом Telegram-канале. Доступ к чатам открыт навсегда — если у вас возникают вопросы, вы можете задать их даже после окончания обучения

Документ об окончании

Диплом о профессиональной переподготовке при успешном завершении обучения.

У нас есть лицензия на образовательную деятельность

Документ об окончании
Подать заявкуЗадать вопрос

Преподаватели

  • Касьяненко Дарья Алексеевна

    Старший преподаватель факультета компьютерных наук

  • Пиле Ян Эрнестович

    Тимлид аналитики товарных рекомендаций в Wildberries

  • Кантонистова Елена Олеговна

    Доцент факультета компьютерных наук

  • Карпов Максим Евгеньевич

    Старший преподаватель факультета компьютерных наук

  • Артём Максаев

    Доцент факультета компьютерных наук

  • Промыслов Валентин Валерьевич

    Старший преподаватель факультета компьютерных наук

  • Горденко Мария Константиновна

    Старший преподаватель факультета компьютерных наук

  • Максим Никонов

    AI-аналитик в департаменте AI, контентных и рекомендательных сервисов, VK

  • Дарима Мылзенова

    Старший ML-инженер в Rask.ai

  • Юлия Ушакова

    Дата-аналитик в VK

  • Владимир Балдицын

    ML-разработчик в Яндексе

  • Долма Хуракай

    Аналитик в Самокате

  • Анна Матвеева

    Аналитик данных в Деметра-Холдинг

  • Евгений Колмагоров

    Старший разработчик в Самокате

  • Владислав Соловей

    Руководитель направления в Сбере

  • Евгений Паточенко

    Приглашенный преподаватель факультета компьютерных наук, ML-engineer в Crypto Tech

  • Платон Промыслов

    Преподаватель центра непрерывного образования ФКН

  • Екатерина Кириллова

    Руководитель группы анализа продуктов в Афише

  • Руслан Рахимов

    Инженер-исследователь в Сколтехе

  • Кирилл Овчинников

    Руководитель направления в Сбере

  • Максим Находнов

    Инженер-исследователь в AIRI

  • Руслан Костоев

    Ведущий исследователь в Аiri

Эксперты

  • Соколов Евгений Андреевич

    Научный руководитель Центра непрерывного образования

  • Теванян Элен Арамовна

    Руководитель программы; руководитель по машинному обучению в операциях, Сбермаркет

  • Иосипой Леонид Сергеевич

    Старший научный сотрудник

  • Пиле Ян Эрнестович

    Тимлид аналитики товарных рекомендаций в Wildberries

Стоимость и условия

  • 58 125 ₽

    раз в два месяца при рассрочке без переплат: 8 платежей

  • или 418 500 ₽ за весь курс

  • Скидки

    5-10 %

    для студентов, выпускников и слушателей основных и дополнительных программ НИУ ВШЭ

Как поступить на программу

  • 01

    Положить программу в корзину и зарегистрироваться в личном кабинете в правом верхнем углу на странице программы

  • 02

    Заполнить профиль в личном кабинете и приложить скан-копии личных документов

  • 03

    Перейти в корзину и оформить заказ. Кнопка "Оформить заказ" станет активна, если вы заполнили все необходимые поля в профиле

  • 04

    Дождаться подтверждения заявки. После подтверждения заявки, в личном кабинете появится договор на ознакомление и ссылка на оплату

  • 05

    Начать обучение. За несколько дней до начала обучения менеджер отправит на почту организационное письмо со всей важной информацией о программе и ссылкой на учебный чат в Telegram

Отзывы выпускников

  • Именно во время обучения  в НИУ ВШЭ я сделал дипломный проект, который сейчас превратился в большое направление в Сбере. Тема диплома — «Применение машинного обучения для анализа бизнес-процессов банка». Сейчас, как исполнительный директор по исследованию данных, лидирую это направление.

  • Уже в процессе работы я узнала об обработке естественных языков как о направлении Data Science. Решила пройти обучение, так как появилось желание понимать больше о том, как все устроено. Сейчас использую полученные навыки на прошлом месте работы — недавно стала руководителем отдела.

  • После защиты диплома я перешел с позиции эксперта в нефтегазовой компании на позицию инженера-разработчика по интерпретации данных.

  • Понравился удобный формат обучения: очные занятия с трансляцией онлайн. Можно подключиться из любой точки мира, экономить время на дороге, при необходимости можно посмотреть, пересмотреть занятия в записи. При этом всегда есть возможность задать вопросы преподавателям. Что важно: сбалансированы теория и практика. Пройденный материал осознаешь и закрепляешь через домашние задания, а домашние задания разбираются на факультативах.

  • Когда я выбирал программу по Data Science, я изучил несколько вариантов в разных учебных заведениях Москвы. «Специалист по Data Science» во ВШЭ показалась мне наиболее полной: она включает в себя курс алгоритмов, дискретки, линала, теории вероятностей и матстата — все, что необходимо было освежить перед погружением в машинное обучение. Престиж университета тоже сыграл свою роль при выборе.

Где проходят занятия?

  • Вы будете учиться в главном корпусе Вышки – на Покровском бульваре, в компьютерных классах.

  • На время обучения получите пластиковый пропуск с доступом во все корпуса ВШЭ. В любое время вы можете зайти в библиотеку, чтобы поучиться или поработать.

  • Можете приезжать на занятия в корпус, а можете подключаться по Zoom. 

FAQ

  • Как я буду учиться?

    Вы будете учиться два раза в неделю в зависимости от расписания вашей группы. Также предусмотрены каникулы. Каждое занятие состоит из лекции и практики. Для закрепления материала выдаются домашние задания. Все занятия проходят в корпусе на Покровском бульваре, 11. И в качестве бонуса мы записываем их и отправляем видео в учебные чаты. 


  • Сколько часов в неделю мне нужно уделять учебе?

    Приготовьтесь уделять учебе больше 10 часов в неделю. Вместе с преподавателями вы будете учиться 6 часов, 2 занятия в неделю. До 10 часов в среднем может уходить на выполнение домашних заданий. 
    Хорошая новость — у вас будут перерывы на каникулы.

  • Программа для начинающих?

    Да, программа для начинающих. Однако потребуется много сил, времени и самоорганизованности, чтобы освоить материал. Наша команда преподавателей, ассистентов и менеджеров будут рядом.

  • Почему я должен выбрать вашу программу?

    В наших программах в коротком формате упакован опыт бакалаврских и магистерских программ факультета компьютерных наук Вышки. Опираясь на наши знания об отрасли, мы дадим Вам необходимую базу, чтобы войти в профессию или перейти на новый уровень на вашей текущей работе. К тому же, большинство наши программы — очные. Это означает, что вы сможете еженедельно общаться с преподавателями, получать поддержку ассистентов и одногруппников, это поможет сохранять мотивацию. Обучаясь на наших курсах, вы получаете возможность интегрироваться в сообщество Вышки, общаться с нашими преподавателями и участвовать в мероприятиях факультета и университета: например, мы проводили «Ночь анализа данных», у нас регулярно проходят, школы по аналитике и Data ScienceIT-лекторий и научный коллоквиум ФКН. У нас есть лицензия на образовательную деятельность, поэтому по результатам обучения мы выдаем удостоверения о повышении квалификации и дипломы о профессиональной переподготовке установленного в НИУ ВШЭ образца.

  • Чем специалист по Data Science отличается от аналитика данных?

    Приведем пример. Менеджер интересуется, какие товары пользователи интернет-магазина покупают вместе, с этим вопросом он пойдет к продуктовому аналитику. Аналитик поможет выявить такие категории товаров и предложит идеи для прототипа системы рекомендаций. Для многих интернет-магазинов таких рекомендаций может оказаться достаточно, чтобы повысить средний чек. Но далее может возникнуть потребность автоматизировать рекомендации и построить модель. Этим уже займется специалист по Data Science.

    Еще больше об этом рассказал Сергей Юдин в интервью «Аналитик данных и data scientist: в чем отличие?»

  • Если я студент, могу ли я поступить на программу «Специалист по Data Science»?

    Да, но диплом о профессиональной переподготовке можно получить только после окончания вуза при предоставлении диплома.

  • Могу ли я заниматься на своем ноутбуке?

    Да, вы можете приходить со своим ноутбуком. Также можно использовать компьютеры университета — все занятия проходят в компьютерных классах.

  • Что делать, если мне тяжело учиться?

    Мы понимаем, что программа сложная и не все можно спланировать. Если вы чувствуете, что не справляетесь с материалом, обратитесь за помощью к преподавателям и ассисстентам программы. Возможно, кто-то из учащихся столкнулся с той же проблемой и поможет ее решить вам. А если нужен перерыв, напишите менеджерам.

Контакты

На звонки и письма отвечаем в рабочее время: понедельник — суббота, 11:00 – 19:00

465 000 ₽

В корзину
Подать заявкуЗадать вопрос