• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Ученые усомнились в том, что искусственный интеллект DeepMind понимает физику молекул с нецелым зарядом

Ученые усомнились в том, что искусственный интеллект DeepMind понимает физику молекул с нецелым зарядом

Фото: deepmind.com

В журнале Science, одном из самых авторитетных научных изданий, команда исследователей из Высшей школы экономики, Сколтеха, Института органической химии им. Н.Д. Зелинского и Kyungpook National University (Южная Корея) опубликовала комментарий к статье DeepMind, говорится на сайте Сколтеха. В нем ученые показали, что приведенные аргументы в пользу достижения поставленной DeepMind цели не настолько надежны, как кажется, и требуют дополнительного исследования.

Команда DeepMind в статье, опубликованной в журнале Science в декабре 2021 года, попыталась решить одну из ключевых проблем современной физики: создать метод теории функционала плотности (DFТ), корректно работающий для самых разных молекулярных систем, включая имеющие нецелое количество электронов.

Михаил Медведев

«Современные химия и наука о материалах постепенно переходят от экспериментального метода проб и ошибок к изучению цифровых двойников. Вместо того чтобы ставить десятки или даже сотни экспериментов в надежде найти новый эффективный катализатор или материал, для этого класса катализаторов/материалов создается цифровой двойник (математическая модель), который досконально изучается в компьютере, и на основании найденных теоретически закономерностей ставятся несколько прицельных экспериментов. Этот подход позволяет экономить килограммы дорогостоящих химических реагентов и тонны токсичных органических растворителей», — говорит руководитель Группы теоретической химии Института органической химии им. Н.Д. Зелинского РАН, доцент факультета химии НИУ ВШЭ Михаил Медведев.

Евгений Епифанов

Вместе с Михаилом Медведевым в группе исследователей над проблемой работал третьекурсник ОП «Химия» НИУ ВШЭ Евгений Епифанов. «Когда в начале 1-го курса мне пришлось определяться с лабораторией для научной работы, я хотел заниматься квантовой химией и решил выбрать группу теоретической химии ИОХ РАН, — рассказал он. — В этой группе есть разные направления работы, в целом можно описать их как предсказание возможности протекания реакций без проведения эксперимента. Я разрабатываю методы, чтобы такие расчеты были точнее. Здесь нужны не только знания химии, нужно еще уметь программировать. Но даже если не умеете, более опытные коллеги научат. Мне нравится этим заниматься, и я планирую писать диплом по этой теме».

Теория функционала плотности является самым широко используемым подходом для построения цифровых двойников в химии и науке о материалах. Она позволяет относительно корректно описать взаимодействие большого количества электронов между собой, что необходимо для построения цифровых двойников сложных химических систем: молекул, наночастиц, кристаллов. Основой теории функционала плотности является обменно-корреляционный функционал, для которого точный вид все еще не установлен, поэтому в настоящий момент для него используются различные приближенные выражения, которых уже более 400.

Петр Жиляев

«С каждым годом количество приближенных выражений для обменно-корреляционного функционала растет, предлагаются все более и более точные выражения. DeepMind, известные своей разработкой нейросетевой программы AlphaGo, победившей одного из сильнейших игроков мира в игру го, решили применить свои наработки в нейронных сетях для создания нейросетевого функционала теории функционала плотности. Их работа была далеко не первой, однако она однозначно является одной из самых амбициозных», — говорит старший научный сотрудник Центра технологий материалов Сколтеха Петр Жиляев.

DeepMind создали новый функционал теории функционала плотности — DM21. Предполагалось, что он будет способен корректно работать с системами, содержащими нецелое количество электронов: несмотря на отсутствие таких систем в природе, корректная работа функционала на них должна помочь ему в описании обычных химических систем. Для того чтобы научить свой функционал корректно работать на таких системах, команда DeepMind добавила их в базу данных, на которой обучался DM21. Чтобы убедиться, что DM21 научился работать на таких системах, авторы протестировали его на тестовом наборе BBB, состоящем из пар атомов на разных расстояниях друг от друга, например два атома водорода с одним электроном на двоих. DM21 показал превосходную точность на наборе BBB, обойдя стандартные функционалы, а также функционал DM21m, обученный DeepMind на том же датасете, за исключением систем с нецелым количеством электронов.

Авторы постарались обойти одно из ключевых ограничений традиционных функционалов — их неспособность корректно описывать системы с нецелым количеством электронов. DeepMind добавили в функционал новый нелокальный ингредиент (информацию о волновой функции системы, которую функционал может использовать для вычисления энергии), который ранее никогда не использовался, — пространственно разделенную локальную обменную энергию. В дальнейшем она может помочь строить функционалы с лучшим разделением между обменной и корреляционной энергиями.

Команда DeepMind ввела дополнительную регуляризацию, связанную с процедурой самосогласованного поля. Их дополнительное слагаемое в функции ошибки модели приближенно равно выражению для изменения энергии после шага вариационной процедуры минимизации, начинающегося с орбиталей традиционного функционала. Эта регуляризация позволяет сделать обучаемый функционал более стабильным.

«В машинном обучении очень важно не использовать для тестирования нейронной сети данные, на которых она была обучена. Однако в своей работе команда DeepMind допустила подобную ошибку: наиболее сложные димеры из набора BBB очень близки к системам с нецелым количеством электронов из обучающей выборки», — рассуждает инженер-исследователь Центра технологий материалов Сколтеха Александр Рябов.

«Если нейронные сети не могут понять, как прийти к правильным ответам, они пытаются их зазубрить. Поэтому не столь сложно обучить нейронную сеть — сложно показать, что она действительно осознала физические законы, лежащие в основе вопроса, на который она отвечает. Так что тестировать нейронную сеть на данных, на которых она обучалась, — это все равно что дать студенту на экзамене ту же задачу, которая разбиралась пять минут назад на доске: мы узнаем, хорошая ли у него память, но вряд ли узнаем, понимает ли он предмет», — отмечает Михаил Медведев.

Этот недостаток не был очевидным. Системы в наборе BBB состоят из двух атомов, тогда как DM21 обучался на одноатомных системах с нецелым количеством электронов. Поэтому предвидеть то, что произошло, было очень непросто. Ученые поняли, что при расстояниях между атомами в тест-сете BBB, где обычные функционалы начинают испытывать проблемы, атомы уже практически не взаимодействуют между собой и каждый атом в отдельности по сути становится тем самым «атомом с нецелым числом электронов», на которых проводилось обучение.

Читать материал в источнике

Вам также может быть интересно:

«Нам нужно учиться общаться с сервисами искусственного интеллекта»

На платформе «Открытое образование» стартовал онлайн-курс «Что такое генеративный ИИ?», который поможет слушателям узнать больше о том, как правильно общаться с нейросетями, чтобы они лучше выполняли задачи. Как работает генеративный ИИ и как с его помощью создавать любой контент, рассказала эксперт Центра непрерывного образования, старший преподаватель департамента больших данных и информационного поиска ФКН Дарья Касьяненко.

«Специалист по Data Science» ВШЭ — первая программа переподготовки с аккредитацией Альянса в сфере ИИ

Согласно итогам экспертизы, программа Высшей школы экономики охватывает современные области анализа данных и машинного обучения и помогает нетехническим специалистам приобрести базовые знания в области больших данных и искусственного интеллекта. Это уже шестая образовательная программа факультета компьютерных наук НИУ ВШЭ, получившая престижную профессионально-общественную аккредитацию.

В Вышке стартует конкурс компетенций в области ИИ и машинного обучения

Дирекция программы развития НИУ ВШЭ объявляет о проведении конкурса компетенций в интересах развития исследований в области искусственного интеллекта и машинного обучения. Заявки принимаются до 2 мая 2024 года.

Что мы знаем о мозге и его возможностях: рассказывают исследователи ВШЭ

Правда ли, что мозг — самый неизученный орган? Как нейротехнологии помогают в лечении сложных заболеваний? Может ли искусственный интеллект соревноваться с естественным? И куда пойти учиться, чтобы стать нейроученым? Эти и другие темы в новом выпуске рубрики «Разговор с экспертом» обсудили ученые из Высшей школы экономики — Ольга Драгой, Андрей Мячиков и Алексей Осадчий.

НИУ ВШЭ планирует до конца года обучить преподавателей работе с ИИ

Высшая школа экономики представила новый комплексный проект по повышению квалификации профессорско-преподавательского состава НИУ ВШЭ в области использования искусственного интеллекта. Входящий в него пакет программ направлен на обеспечение высокого уровня компетенций в области использования ИИ в образовании и исследованиях. Курсы бесплатны и предназначены для штатных преподавателей, а в дальнейшем — научных сотрудников и аспирантов московского кампуса НИУ ВШЭ.

«Нейросети показывают, какие качества действительно делают людей уникальными»

Онлайн-кампус НИУ ВШЭ запустил курс «Прикладные нейросети» на портале «Открытое образование». Теперь разобраться в том, как применять возможности искусственного интеллекта на практике, может любой желающий.

В Вышке наградят студентов, которые напишут диплом с помощью ИИ

Высшая школа экономики запустила конкурс решений, применяющих технологии искусственного интеллекта, при подготовке дипломов. Задача конкурса — оценить использование студентами инструментов на основе генеративных моделей в выпускных квалификационных работах (ВКР), защищаемых в 2024 году.

Определены победители финала НТО по профилю «Искусственный интеллект»

Названы победители и призеры Национальной технологической олимпиады (НТО) по профилю «Искусственный интеллект», который уже второй год оказывается самым популярным по количеству регистраций из 41 направления НТО. В этом сезоне участниками соревнований стали более 6300 человек из 84 регионов России, а также Казахстана, Молдовы и Узбекистана. В финал вышли 104 школьника из 28 регионов России. Среди субъектов РФ по числу финалистов лидируют Москва (26 человек), Санкт-Петербург (16 человек) и Новосибирская область (13 человек).

Производство будущего: Центр ИИ ВШЭ представил разработки в области контроля ручных операций

Исследователи Центра ИИ НИУ ВШЭ выстроили систему автоматизированного контроля ручных операций, которая находит применение в промышленном производстве. Система облегчает процессы наблюдения за объектами и действиями, а также позволяет контролировать качество их исполнения.

ФКН ВШЭ и Яндекс расширят сотрудничество в сфере подготовки специалистов по ИИ

В следующие 10 лет партнерство Яндекса и факультета компьютерных наук НИУ ВШЭ расширится по трем направлениям: создание новых образовательных программ, развитие исследований в области ИИ и применение генеративных нейросетей в учебном процессе. ФКН был основан Вышкой и Яндексом 10 лет назад и стал одним из лидеров в подготовке разработчиков и специалистов по ИИ и машинному обучению. За это время выпускниками факультета стали 3385 человек.