• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Что такое Data Culture?

Data Culture — это общий термин для обозначения навыков и культуры работы с данными. Cовременный специалист в любой области постоянно сталкивается с задачами по обработке данных: юрист изучает сотни дел, историк — тысячи документов на различных языках, экономист — разрабатывает прогнозную модель на основе большого объема данных.

Проект Data Culture направлен на то, чтобы у студентов всех программ бакалавриата Высшей школы экономики появилось понимание возможностей современных технологий в области Data Science. Таким образом студенты программ по направлению "Менеджмент" смогут давать точные задачи аналитикам, аналитики — оперативно строить модели, прикладные специалисты — использовать самые современные инструменты в этой сфере.

В 2017 году проект охватил большую часть программ бакалавриата университета, а в 2018 году в него войдут все без исключения образовательные программы первого уровня высшего профессионального образования.

Уровни в рамках проекта

В зависимости от направления образовательной программы объём курсов в рамках проекта варьируется. Существует пять уровней: начальный, базовый, продвинутый, профессиональный и экспертный. Ниже подробнее о каждом из них:

Что уже есть в Вышке?

На Факультете компьютерных наук, МИЭМ, а также на Факультете бизнеса и менеджмента в рамках программы «Бизнес-информатика» готовят специалистов по работе с информацией и данными с акцентами на разные ее аспекты. За последние годы в портфеле магистерских программ университета доля программ, нацеленных на подготовку специалистов, работающих с данными, постоянно растёт. Так, в 2014 году была открыта программа «Науки о данных», в 2016 году — «Анализ данных в биологии и медицине», в 2017 году стартовали совместная со Сбербанком программа «Финансовые технологии и анализ данных» и англоязычная программа «Статистическая теория обучения». И это далеко не полный спектр подобных программ НИУ ВШЭ. Для студентов факультета гуманитарных наук действует минор «Современные методы в гуманитарных науках», который знакомит студентов с новыми исследовательскими подходами и задачами в истории, литературоведении, лингвистике, культурологии, основывающиеся на применении методов компьютерной обработки текста.

С 2015 года в университете для всех образовательных программ бакалавриата запущен ставший одним из самых популярных у студентов майнор «Интеллектуальный анализ данных», который даёт возможность по формированию универсальных компетенций в области Data Science. Несмотря на свою сложность, его изучают студенты практически всех программ: от филологов до математиков.

Как проект выглядит для студентов?

На большинстве программ на первом курсе в учебные планы включаются обязательные дисциплины, знакомящие первокурсников с возможностями и инструментами в области Data Science. При этом учитывается специфика программы: никто не обязывает будущего искусствоведа изучать анализ данных с фондовых рынков, а специалистов в области финансов — инструменты работы с большими массивами исторической информации.

Как и раньше, для всех студентов сохраняются все элективные возможности образовательных программ. Учащиеся могут изучать майноры (включая профильный майнор «Интеллектуальный анализ данных»), миноры (для студентов факультета гуманитарных наук) и циклы дисциплин по выбору из профессиональной части программ. Таким образом, если, к примеру, студент-менеджер захочет узнать больше о технологиях машинного обучения в маркетинге, то у него будет возможность выбрать такой курс в рамках вариативной части учебного плана.

А кто преподаёт?

Основную нагрузку по реализации этого проекта берёт на себя Факультет компьютерных наук. Дополнительно привлекаются специалисты из числа выпускников Школы анализа данных (ШАД) Яндекса, а также эксперты Data Science-сообщества.

Помимо этого, в проекте задействованы другие подразделения университета: Школа бизнес-информатики, Московский институт электроники и математики им. А.Н. Тихонова, Школа лингвистики и другие.

Для действующих сотрудников Вышки будут проводиться циклы мастер-классов и воркшопов при участии сотрудников Яндекса.

Первое мероприятие состоялось 14–15 июня. Записи доступны на этой странице.

Примеры курсов

Специально для проекта Data Culture разрабатываются совершенно новые курсы, учитывающие особенности уже существующих образовательных программ. Вот примеры некоторых курсов, которые уже в 2017 году включены в учебные планы программ:

Цифровая грамотность 

Где читается?

Философия, филология, история, история искусств, культурология, иностранные языки и межкультурная коммуникация

О чём курс?

Этот курс создан для формирования начальных и базовых компетенций в области работы с данными. В курсе, в основном, рассматриваются общие темы (работа поисковых систем, большие данные, машинное обучение) и специализированные темы, связанные с применением компьютерных технологий для исследования гуманитарных объектов и сохранения культурного наследия. Для разных образовательных траекторий разработан отдельный пул тем, изучаемых студентами. К примеру, на программе «Философия» будут изучаться принципы построения формальных онтологий, а для студентов-историков будет лекция по корпусным приложениям N-gram Viewer, Antconc, word2vec и принципам их работы.

Страница курса

Машинное обучение (экономика)

Где читается?

Экономика, совместный бакалавриат НИУ ВШЭ и РЭШ

О чём курс?

В данном курсе рассматриваются основные алгоритмы машинного обучения, которые могут быть полезны для обработки данных, в том числе экономических. Рассматриваются более сложные методы классификации, регрессии и анализа взаимосвязей в данных. В настоящее время машинное обучение является очень популярным направлением, так как во многих областях собираются большие объемы данных, которые нужно анализировать. Курс будет сопровождаться примерами практических задач, в решении которых может помочь машинное обучение: кредитный скоринг, маркетинговые исследования рынка или прогноз цен на недвижимость и др.

Страница курса

Анализ больших данных в социальных науках

Где читается?

Политология

О чём курс?

Основную часть курса занимает изучение методов машинного обучения. Обсуждаются как задачи обучения с учителем (регрессия, классификация), так и без учителя (кластеризация, визуализация, обучение представлений). Разбираются основные виды данных и особенности работы с ними, изучаются наиболее популярные виды моделей (линейные модели, решающие деревья и их композиции, затрагиваются нейронные сети). Также в курсе пойдёт речь об особенностях обучения моделей на больших данных и о применениях методов машинного обучения в социальных науках. Изучение всех подходов и методов сопровождается практикой на языке Python.

Страница курса

Информационные технологии в деятельности юриста

Где читается?

Юриспруденция

О чём курс?

В курсе будут рассмотрены такие разделы, как: юридическое обслуживание новых технических изменений, технические инструменты (в том числе, работа с данными, в юриспруденции с разбором кейсов из криминологии, криминалистики), основы legal tech, способы постановки задач программистам, аналитикам, специалистам по работе с данными; ограничения современных методов анализа данных и искусственного интеллекта.

Основы искусственного интеллекта 

Где читается?

Дизайн, Мода

О чём курс?

Последние десятилетия во многих областях науки и индустрии, включая творческие, стали накапливаться большие объёмы данных, а также стали развиваться методы машинного обучения, позволяющие извлекать из этих данных знания и экономическую пользу. Сегодня методы анализа данных позволяют решать настолько сложные задачи, что в применении к ним всё чаще используют термин «искусственный интеллект».

Данный курс является вводным и ставит перед собой цель обрисовать текущее состояние методов искусственного интеллекта. В нем пойдет речь про большие данные и то, как их использование может поменять бизнес; будут разбираться современные постановки задач в машинном обучении, особое внимание будет уделено задачам понимания естественного языка (natural language understanding) и компьютерного зрения (которое в последнее время называют визуальным интеллектом); также будут обсуждаться методы визуализации сложных данных. В ходе курса будут анализироваться применения искусственного интеллекта в дизайне: автоматический подбор одежды и рекомендации по стилю, синтез изображений и сцен, оптимизация визуального оформления и выбор лучшего контента в веб-дизайне, виртуальная реальность, перенос стилей и генерация видео и т.д.

Основы анализа данных в международных отношениях 

Где читается?

Международные отношения

О чём курс?

Активное развитие машинного обучения, накопление больших объёмов данных и появление простых инструментов анализа данных привели к тому, что методы искусственного интеллекта стали применяться во многих предметных областях: экономике, социологии, финансах, маркетинге, политологии. Методы анализа больших данных могут применяться для оптимизации политических кампаний, для выявления закономерностей в новостных источниках и т.д.

Данный курс направлен на знакомство с современными кейсами применения анализа данных в международных отношениях. Рассматриваются основные постановки задач и модели в машинном обучении, методологии проведения экспериментов и оценивания качества. Разбираются некоторые кейсы анализа текстов и анализа социальных сетей в применении к международным отношениям. Обсуждаются вопросы анонимизации данных и работы с персональными данными. Также затрагиваются вопросы криптовалют и технологии блокчейн.

Страница курса

Онлайн-курсы НИУ ВШЭ

Благодаря этому курсу вы изучите основные типы задач, решаемых с помощью машинного обучения. Узнаете об основных методах машинного обучения и их особенностях, научитесь оценивать качество моделей и познакомитесь с современными библиотеками, применяемые при решении реальных задач в области машинного обучения.
Этот курс подойдет всем, кто успешно освоил школьный курс математики и желает научиться программировать на языке Python "с нуля" или переучиться с другого языка программирования, а также систематизировать свои знания.
Данный курс пригодится вам для того, чтобы изучить азы линейной алгебры и ознакомиться с базовыми определениями, понятиями и алгоритмами, научиться решать задачи, в которых необходим данный инструментарий.
Курс «Алгоритмизация вычислений» будет вам интересен и просто необходим, если вы хотели бы изучить программирование с нуля и выйти на хороший базовый уровень, научиться составлять, понимать и анализировать алгоритмы.
Эта специализация создана в партнёрстве с University of California, San Diego и охватывает широкий спектр тем от базовых понятий алгоритмов и структур данных до сложных алгоритмов, применяемых при решении задач в области Big Data.
Эта специализация была разработана совместно с University of California, San Diego и охватывает такие темы, как: комбинаторика, теория графов, теория вероятностей и теория чисел.

Дополнительные возможности

Для всех студентов также доступны дополнительные возможности по изучению методов и инструментов в области Data Science. Ежегодно университет открывает набор на десятки общеуниверситетских факультативов, программ дополнительного профессиональног образования, которые позволяют студентам расширить спектр знаний в этой области или углубиться в изучение определённого продукта/области.  

Курсы Дополнительного профессионального образования

Общеуниверситетские факультативы

Любой студент НИУ ВШЭ может самостоятельно выбрать для изучения любой общеуниверситетский факультатив. Общеуниверситетский факультатив изучается вне рамок основной образовательной программы. Факультативы также открыты для всех внешних заинтересованных слушателей независимо от возраста и уровня обучения.

С полным перечнем общеуниверситетских факультативов Вы можете ознакомиться здесь.

На факультете компьютерных наук также есть факультетские факультативы от крупных IT-компаний (SAS, Parallels, JetBrains и пр.)