• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Как программисты помогают разгадывать тайны физики

Как программисты помогают разгадывать тайны физики

Прошла Летняя школа по машинному обучению в физике высоких энергий, соорганизаторами которой стали факультет компьютерных наук ВШЭ и компания «Яндекс». О сотрудничестве физиков и программистов, об участии исследователей вуза и Яндекса в экспериментах CERN и о том, как обычные пользователи смартфонов помогут разгадать тайны Вселенной, рассказывает заведующий Научно-учебной лабораторией методов анализа больших данных ВШЭ Андрей Устюжанин.

Как машинное обучение помогает физикам

О Европейском центре ядерных исследований (CERN) и Большом адронном коллайдере (LHC) знает, наверное, каждый, кто хоть сколько-нибудь интересуется наукой или является поклонником ситкома «Теория Большого взрыва». Но немногие знают, что ученые Яндекса, а теперь и Вышки — точнее, исследовательская группа во главе с Андреем Устюжаниным, — сотрудничают с CERN еще с 2011 года. А все потому, что физикам в их экспериментах по поиску элементарных частиц не обойтись без помощи специалистов по большим данным. «Машинное обучение используется практически во всех областях, развиваемых специалистами CERN», — говорит Устюжанин.

Более того, область применения машинного обучения постоянно растет. «Мы начали применять наши технологии для оптимизации сетевых хранилищ данных (речь идет о GRID — сети датацентров участников экспериментов CERN), — продолжает Устюжанин. — Грубо говоря, для хранения данных есть дорогие и быстрые диски и дешевые, но медленные ленты. Используя статистику обращения к файлам, мы предсказываем, что можно оставить на дисках, а что сохранить на лентах. В результате работы такой модели можно сэкономить до 40 процентов дорогих дисков — без уменьшения скорости работы всей системы».

Эта модель сейчас реализуется на части «грида» CERN, которая принадлежит эксперименту LHCb (основной задачей этого эксперимента является исследование асимметрии материи и антиматерии во взаимодействиях b-кварков; в июле 2015 года LHCb объявил об обнаружении нового класса частиц — пентакварков). Школа анализа данных (ШАД) Яндекса в 2014 году вошла в число участников LHCb.

Что рассказывали на летней школе

По словам Андрея Устюжанина, Летняя школа по машинному обучению в физике высоких энергий (MHLEP-2015) стала «естественным продолжением отношений лаборатории с CERN». «От физики мы пригласили четырех ученых из разных экспериментов CERN, которые рассказали, как они используют машинное обучение для анализа данных, проверки физических гипотез, поиска новых теорий и онлайн-отбора событий, — говорит Устюжанин. — На самом этапе обработки данных 99,9% событий «выбрасывается в корзину», и очень важно, чтобы среди этого кажущегося мусора не оказалось физически значимых данных».

На школу было прислано вдвое больше заявок, чем предполагали организаторы. «Нам было важно, чтобы у участников был реальный интерес, — поясняет Андрей Устюжанин. — Замечательным результатом школы были бы реальные исследования, которые участники смогли усилить, вооружившись тем знанием, инструментами и методами, которые мы им дали в ходе школы».

Как найти нобелевскую премию

Еще один проект на стыке физики и компьютерных наук, в котором участвуют Вышка и ШАД вместе с экспериментом LHCb, — это организация конкурса на площадке онлайн-сервиса Kaggle. В 2014 году проходил конкурс, участники которого искали Бозон Хиггса (кстати, студент факультета компьютерных наук Станислав Семенов занял тогда седьмое место).

Нынешний конкурс посвящен новой физике — участникам предстоит разобраться с нарушениями законов симметрии аромата лептонов. Работать нужно как с реальными данными, полученными в эксперименте LHCb, так и с данными, полученными из симулятора. В конечном счете цель конкурса — коллективными усилиями найти новые методы обработки данных, которые помогут найти распад тау-лептона на три мюона. Этого распада никто никогда не видел, но если его получится найти — это находка уровня нобелевской премии.

«Приходишь на площадку Kaggle, регистрируешься, выбираешь соревнование «Flavours of Physics», знакомишься с правилами и получаешь доступ к данным, — объясняет Андрей Устюжанин. — Есть starter kit, который помогает новичкам разобраться и в данных, и в метрике, и в формате отправки решения. Важно, чтобы человек умел программировать, чтобы ему нравилось разбираться в данных и чтобы ему была интересна физика, именно исследовательская часть — мы постарались сделать так, чтобы участникам не приходилось разбираться в тонкостях собственно эксперимента». Результаты самых интересных работ могут быть использованы в анализе новых данных LHCb 2015 года.

Почему физика становится популярной

У каждого человека есть интерес к познанию окружающего мира, уверен Андрей Устюжанин. Для многих наука становится чем-то вроде хобби, и такая «оппортунистическая» научная деятельность может оказаться весьма продуктивной. «Новый взгляд всегда что-то добавляет, и чем больше нового, тем выше шансы, что оно даст что-то полезное, — говорит Устюжанин. — Мы это видим на примере нашего конкурса «Flavours of Physics», когда люди пытались выйти за рамки, которыми мы их ограничили, и способы обхода этих рамок, даже если они сами по себе были бесполезны для физики, вызывают цепную реакцию. Другие участники поняли: ага, так делать нельзя, но может быть, если немного изменить подход, то получится что-то полезное».

С любителями всегда охотно сотрудничали астрофизики. А вот физика высоких энергий долгое время оставалась закрытой для непрофессионалов из-за определенной культуры и специфики работы с данными, в которой человек «со стороны» не смог бы разобраться. Но ситуация меняется. «Есть движение со стороны науки, по крайней мере некоторых экспериментов, которые готовы делиться частью накопленных данных, чтобы привлечь экспертизу извне. В выигрыше от этого оказываются обе стороны, — отмечает Андрей Устюжанин. — Например, CERN выложил данные нескольких экспериментов за 2010 год и планирует опубликовать данные последующих лет».

Смартфон как новое оружие физика-любителя

Эксперименты CERN — не единственный проект, над которым работают сотрудники Научно-учебной лаборатории методов анализа больших данных ВШЭ (LAMBDA), возглавляемой Андреем Устюжаниным. Другой проект, Crayfis, как раз «открывает» науку для любителей.

Crayfis — это международный консорциум (Вышка является его партнером наряду с крупнейшими американскими университетами) по поиску космических частиц высокой энергии, которые попадают в атмосферу Земли. Когда они соударяются с верхними слоями атмосферы, то вызывают своего рода цепную реакцию, разгоняя другие частицы, — и получается «ливень» из частиц, который накрывает площадь около одного квадратного километра. Источник таких частиц — одна из неразрешенных загадок нашего времени.

Такие частицы очень редки (по некоторым оценкам на Землю их прилетает порядка 1 частицы на 100 квадратных километров в год), никто не знает, откуда они берутся, их ищут специальные обсерватории, построенные в Южной Америке,  и понятно, что обслуживание таких обсерваторий и всего их оборудования стоит огромных средств.

Crayfis — проект поиска тех же самых частиц, но с помощью мобильных телефонов. Чувствительного элемента смартфона достаточно, чтобы его камера смогла зафиксировать продукты распада такой частицы.

«Мы занимаемся разработкой технической части: каким образом нужно фильтровать показания камеры, чтобы уменьшить шум, и как построить систему накопления данных, которая сохраняла бы информацию от всех участников проекта», — рассказывает Андрей Устюжанин. Но нужна огромная сеть из специально настроенных смартфонов, чтобы «поймать» в нее частицу. Проект будет успешным, если соберет около миллиона участников по всему миру. Доступ к данным, собранным этим экспериментом, будет открыт всем участникам, предоставившим свои смартфоны.

Наука или бизнес?

«Большинству людей интереснее приложить свои умения к тому, на чем они могут зарабатывать деньги, — говорит Устюжанин, — и в этом смысле для математиков, программистов, наверное, привлекательнее хедж-фонды или биржи, где ты запустил алгоритм — и сразу увидел, как это отражается на финансах компании. Но есть люди, которых интересуют вопросы более фундаментальные. Как хакеры исследуют устройство чужих программ и систем, так и эти люди пытаются найти ключ к тому, как работает Вселенная».

«Мы рассматриваем студентов лаборатории как потенциальных исследователей, которые в дальнейшем могут влиться в полноценную работу над физическими экспериментами», — отмечает руководитель LAMBDA. Но сфера применения полученных в лаборатории знаний гораздо шире. Умение работать с данными позволяет переключаться между разными областями науки — от финансов до медицины.

Главное — интерес и готовность самостоятельно использовать предложенные инструменты, а не ждать, что кто-то другой все посчитает за вас. «Экосистема, которую нам удалось создать вокруг, помогает нам привлекать именно таких коллег, и если среди читателей есть подобные люди, мы рады будем с ними пообщаться и посмотреть, чем мы можем быть полезны друг другу», — говорит Андрей Устюжанин.

А школьникам, интересующимся компьютерными науками или применением компьютерных наук в физике можно посоветовать обязательно прийти в Вышку 13 сентября на День программиста. Сотрудники лаборатории LAMBDA и ИТ-компаний объяснят, почему то, чем они занимаются, не только интересно, но и полезно для человечества.

Вам также может быть интересно:

«Вычислительные социальные науки»: когда не нужно выбирать между физиками и лириками

На ряде образовательных программ НИУ ВШЭ предметная подготовка сочетается с углубленным изучением компьютерных наук и освоением сложных цифровых инструментов и сервисов. Одна из таких программ бакалавриата — «Вычислительные социальные науки» («ВСН»): на первом курсе на нее могут перейти студенты, поступившие на «Психологию», «Государственное и муниципальное управление», «Политологию» или «Социологию». Чему там учат и как туда поступить, рассказывают замдекана факультета социальных наук Дарья Присяжнюк и академический руководитель программы Евгений Седашов.

«Мы можем изменять спины электронов, прикладывая внешнее магнитное поле»

Ученые ВШЭ, МФТИ и Института физики твердого тела РАН совместно с коллегами из Англии, Швейцарии и Китая изучили свойства тонкослойной гетероструктуры «платина — ниобий». Проведенные ими эксперименты и теоретические расчеты подтвердили, что при контакте со сверхпроводником в платине возникает спин, который можно использовать как носитель информации. Платина не обладает собственным магнитным моментом, что в перспективе дает возможность создавать на базе новой структуры еще более миниатюрные чипы, чем в «традиционной» спинтронике. Работа опубликована в журнале Nature Communications.

Микролазеры с квантовыми точками оказались способны работать даже при высоких температурах

Ученые из Международной лаборатории квантовой оптоэлектроники НИУ ВШЭ в Санкт-Петербурге исследовали, как размер резонатора влияет на температуру работы микродискового лазера с квантовыми точками в режиме двухуровневой генерации. Выяснилось, что микролазеры способны генерировать излучение на нескольких частотах даже при высокой температуре. Это позволит в будущем использовать микролазеры в фотонных интегральных схемах и передавать в два раза больше информации. Результаты исследования опубликованы в журнале Nanomaterials.

На ФКН ВШЭ прошла летняя школа по программной инженерии

В начале июля на факультете компьютерных наук Вышки проходила летняя школа по программной инженерии. Она стала правопреемницей школы по разработке мобильных приложений, которая проводилась на ФКН с 2015 по 2022 год. Партнерами мероприятия выступили «1С», Сбер, сообщество авторов игр «Индикатор» и IT-школа Samsung Innovation Campus.

Атомные часы, квантовые деньги и разноцветные алмазы: как прошел День света на факультете физики ВШЭ

В конце мая факультет физики Вышки впервые организовал День света для студентов и абитуриентов. Его целью стало погружение школьников и учащихся младших курсов в увлекательный мир науки. Ученые ВШЭ рассказывали о распространении света в галактике, демонстрировали волновую теорию света на потолке лекционного зала и опыты с получением флуоресцеина. А студенты старших курсов представили свои исследовательские работы.

ФКН проведет фестиваль «Дни компьютерных наук»

Этой весной факультет компьютерных наук Вышки отмечает девятый день рождения. К важной дате ФКН организует фестиваль «Дни компьютерных наук», который пройдет в НИУ ВШЭ с 8 по 16 апреля. В программе мастер-классы для школьников, научно-популярные лекции, конференция, неформальное общение с преподавателями и сотрудниками ФКН, а завершится все днем абитуриента 16 апреля.

Научную премию имени Сегаловича получили трое ученых Вышки

По итогам ежегодной научной премии имени Ильи Сегаловича в 2022 году лауреатами стали ученые факультета компьютерных наук НИУ ВШЭ: профессор-исследователь Дмитрий Ветров, доцент Алексей Наумов и аспирант Сергей Самсонов. Премия, учрежденная компанией «Яндекс» в 2019 году, направлена на поддержку молодых исследователей и научного сообщества в области IT в России, Беларуси и Казахстане.

«Цифровой индустрии необходим грамотный менеджмент»

Аягоз Мусабаева, выпускница магистратуры факультета компьютерных наук Вышки, с успехом нашла применение исследовательским навыкам в бизнесе. После работы в лаборатории базовой кафедры Института проблем передачи информации (ИППИ) на факультете математики НИУ ВШЭ она пришла в индустрию и сейчас ведет исследования в сфере машинного обучения в международной компании Akvelon. В интервью «Конструктору успеха» она рассказала, как data scientist может найти себя в киберспорте и что делать с дефицитом софт-скилов в IT.

Завершилась летняя школа по компьютерным наукам ФКН ВШЭ

В июле факультет компьютерных наук Вышки провел восьмую летнюю школу по компьютерным наукам. Ее основная цель — подготовка участников к Всероссийской олимпиаде школьников по информатике и другим перечневым олимпиадам. Мероприятие было организовано на базе Центра поддержки одаренных детей «Стратегия» (г. Липецк) при поддержке Липецкого института развития образования. Чтобы принять участие, 95 учеников 8-10 классов из 30 городов России прошли два этапа отбора, решая задачи на платформе Codeforces. Среди других требований — владение языком программирования C++ и умение реализовывать базовые алгоритмы.

Туннельный контакт помог изучить электронную структуру углеродных нанотрубок

Российские физики показали, что можно использовать туннельный контакт для спектроскопии электронных состояний углеродных нанотрубок. Предложенная технология изготовления туннельного контакта и метод спектроскопии помогут точно определять ширину запрещенной зоны нанотрубок, которая является ключевой характеристикой для разработки любых электронных устройств на их основе. Результаты работы были представлены в журнале Applied Physics Letters.