• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Магистерская программа «Науки о данных»

В Высшей школе экономики установлен суперкомпьютер

Суперкомпьютер, МИЭМ НИУ ВШЭ

Суперкомпьютер, МИЭМ НИУ ВШЭ
© Высшая школа экономики/ Сергей Строков

Мощности суперкомпьютера, находящегося в МИЭМ, позволят университету выйти на новый уровень исследований в области глубинного обучения и математического моделирования.  Вычислительный кластер занял 6-е место в апрельском рейтинге «Топ-50 суперкомпьютеров России»

Использовать суперкомпьютер в научной деятельности планируют такие подразделения университета как Московский институт электроники и математики им. А.Н. Тихонова, факультет компьютерных наук, Институт статистических исследований и экономики знаний, а также Центр нейроэкономики и когнитивных исследований факультета социальных наук.

 
Игорь Агамирзян
вице-президент НИУ ВШЭ 

«Когда мы проводили опрос всех научных подразделений НИУ ВШЭ о необходимом научном оборудовании, большинство участников отметили в качестве основной потребности именно вычислительные ресурсы. На этапе планирования архитектуры и стоимости закупки предполагалось, что вычислительный кластер попадет в десятку рейтинга, но 6-е место стало приятным сюрпризом».

Архитектура суперкомпьютера спроектирована в Институте системного программирования им. В.П. Иванникова и обладает самой современной элементной базой. При достаточно скромной комплектации кластер Вышки имеет очень  высокую производительность. Также система является лидирующей в стране по графическим ускорителям  и объему оперативной памяти на узел кластера.


Лев Щур,
научный руководитель образовательной программы
«Суперкомпьютерное моделирование в науке и инженерии» 
 

«Технические особенности нашего кластера лучше всего видны в сравнении. У лидера рейтинга суперкомпьютера «Ломоносов-2» скорость 2.5 петафлопса и больше полутора тысяч узлов. У нас 26 узлов. Скорость 0,56 петафлопс. Казалось бы — узлов в 50 раз меньше, а скорость всего лишь в  5 раз меньше. Это означает, что сами по себе узлы на порядок мощнее. Кроме того, можно смотреть на мощность по специфике задач. Если для задач моделирования наш кластер находится на 6-м месте, то по возможности глубокого машинного обучения это самое мощное устройство в России на данный момент.

 

Новая технологическая линейка фирмы Intel обеспечивает очень большую мощность и скорость на малом количестве узлов. Это упрощает решение задач по моделированию любых процессов: гидродинамических или биологических.  Например, можно рассчитать обтекание крыла самолета, а можно построить модель движения кластеров клеток в кровеносных сосудах, проливающую свет на процесс распространения метастазов раковых опухолей. Второй пример — одно из приложений моего проекта, поддержанного грантом РНФ, по моделированию течения многокомпонентной жидкости в сложной геометрии. Еще одно возможное практическое применение этого исследования — изучение возможности адресной доставки лекарственных аппаратов, упакованных в кластеры».

Математическое моделирование широко используется и в инженерии: при производстве радиоэлектронной техники для космических исследований или оборудования для нефтегазового сектора и промышленности. Цифровой Двойник (Digital Twin) позволяет рассчитать особенности и поведение конструкции перед тем, как ее воплощать. В машиностроении, например, виртуальное тестирование турбины позволяет сэкономить огромные деньги на испытаниях — поведение модели полностью соответствует поведению объекта. Появление суперкомпьютера с высокоскоростной оперативной памятью в 1.5 терабайта на узел кластера позволит МИЭМ выйти на проектирование таких объектов, которые без такого вычислительного оборудования были бы невозможны.

Суперкомпьютер значительно расширит возможности и факультета компьютерных наук, в частности научно-учебной лаборатории методов анализа больших данных и центра байесовских методов. Для исследований этих подразделений необходимо большое количество графических карт. Теперь количество вычислительных мощностей, доступных исследователям, увеличится примерно в 10 раз.


Андрей Устюжанин,
заведующий научно-учебной лабораторий методов анализа больших данных ФКН

«Вычислительный кластер оснащен ресурсами, позволяющими решать как вычислительные оптимизационные задачи, так и задачи глубинного обучения. Мы надеемся, что с его помощью мы дадим студентам возможность гораздо ближе познакомиться с ресурсоемкими инструментами глубинного обучения, а исследовательским лабораториям ускорить получение научных результатов. Ближайшим примером таких проектов могут стать работы по гранту РНФ по исследованию возможностей генеративных моделей для развития технологий цифровых двойников, которым наша лаборатория занимается совместно с центром глубинного обучения и байесовских методов».



Антон Осокин,
заместитель заведующего Центром глубинного обучения и байесовских методов 

«Наш центр разрабатывает фундаментальную основу для тех, кто занимается обучением с подкреплением, а также приложениями, связанными с обработкой изображений и естественного языка. Речь идет о создании новых методов обучения и использования глубоких нейросетей — это основное направление исследований в области искусственного интеллекта прямо сейчас.

Целый ряд недавних прорывов в области ИИ — победы компьютера над человеком в различных играх — основаны именно на совместном использовании нейросетей и обучения с подкреплением. Сначала это были шахматы, потом Го, теперь — киберспорт (Starcraft и DotA). Традиционно считается: люди превосходят компьютер в задачах, связанных с творческим мышлением, интуицией — где недостаточно просто просчитывать варианты или вариантов слишком много. Но недавно выяснилось, что это не совсем так.

Мы не можем создать систему, которая обыграет человека в Starcraft или Го, — для этого нужно быть огромной технологической корпорацией с колоссальным объемом вычислительных и людских ресурсов. Но мы можем улучшить методы, которые лежат в основе таких систем. Работая над задачами, которые находятся на переднем краю науки и которые компании не умеют решать в совершенстве, мы как бы делаем следующие шаги в развитии технологий».

Так как одна часть задач требует большой оперативной памяти,  а другая — графических ускорителей, встает вопрос о балансировке нагрузки. На данный момент идет поиск технических решений, которые позволят минимизировать побочные эффекты от запуска разных типов задач на одной машине.

Вопрос освоения мощностей суперкомпьютера для выполнения научных проектов стал темой первого семинара по высокопроизводительным вычислениям, на котором обсуждались результаты тестов по производительности и экспериментов по моделированию. В мероприятии приняли участие представители МГУ, Института системного программирования им. В.П. Иванникова РАН, НИЦ «Курчатовский институт», ОИЯИ и других. Семинар планируется проводить на регулярной основе каждый первый вторник месяца. С предложениями по работе семинара заинтересованные сотрудники НИУ ВШЭ могут обращаться к профессору Льву Щуру.