Ученые усомнились в том, что искусственный интеллект DeepMind понимает физику молекул с нецелым зарядом
В журнале Science, одном из самых авторитетных научных изданий, команда исследователей из Высшей школы экономики, Сколтеха, Института органической химии им. Н.Д. Зелинского и Kyungpook National University (Южная Корея) опубликовала комментарий к статье DeepMind, говорится на сайте Сколтеха. В нем ученые показали, что приведенные аргументы в пользу достижения поставленной DeepMind цели не настолько надежны, как кажется, и требуют дополнительного исследования.
Команда DeepMind в статье, опубликованной в журнале Science в декабре 2021 года, попыталась решить одну из ключевых проблем современной физики: создать метод теории функционала плотности (DFТ), корректно работающий для самых разных молекулярных систем, включая имеющие нецелое количество электронов.
Михаил Медведев
«Современные химия и наука о материалах постепенно переходят от экспериментального метода проб и ошибок к изучению цифровых двойников. Вместо того чтобы ставить десятки или даже сотни экспериментов в надежде найти новый эффективный катализатор или материал, для этого класса катализаторов/материалов создается цифровой двойник (математическая модель), который досконально изучается в компьютере, и на основании найденных теоретически закономерностей ставятся несколько прицельных экспериментов. Этот подход позволяет экономить килограммы дорогостоящих химических реагентов и тонны токсичных органических растворителей», — говорит руководитель Группы теоретической химии Института органической химии им. Н.Д. Зелинского РАН, доцент факультета химии НИУ ВШЭ Михаил Медведев.
Евгений Епифанов
Вместе с Михаилом Медведевым в группе исследователей над проблемой работал третьекурсник ОП «Химия» НИУ ВШЭ Евгений Епифанов. «Когда в начале 1-го курса мне пришлось определяться с лабораторией для научной работы, я хотел заниматься квантовой химией и решил выбрать группу теоретической химии ИОХ РАН, — рассказал он. — В этой группе есть разные направления работы, в целом можно описать их как предсказание возможности протекания реакций без проведения эксперимента. Я разрабатываю методы, чтобы такие расчеты были точнее. Здесь нужны не только знания химии, нужно еще уметь программировать. Но даже если не умеете, более опытные коллеги научат. Мне нравится этим заниматься, и я планирую писать диплом по этой теме».
Теория функционала плотности является самым широко используемым подходом для построения цифровых двойников в химии и науке о материалах. Она позволяет относительно корректно описать взаимодействие большого количества электронов между собой, что необходимо для построения цифровых двойников сложных химических систем: молекул, наночастиц, кристаллов. Основой теории функционала плотности является обменно-корреляционный функционал, для которого точный вид все еще не установлен, поэтому в настоящий момент для него используются различные приближенные выражения, которых уже более 400.
Петр Жиляев
«С каждым годом количество приближенных выражений для обменно-корреляционного функционала растет, предлагаются все более и более точные выражения. DeepMind, известные своей разработкой нейросетевой программы AlphaGo, победившей одного из сильнейших игроков мира в игру го, решили применить свои наработки в нейронных сетях для создания нейросетевого функционала теории функционала плотности. Их работа была далеко не первой, однако она однозначно является одной из самых амбициозных», — говорит старший научный сотрудник Центра технологий материалов Сколтеха Петр Жиляев.
DeepMind создали новый функционал теории функционала плотности — DM21. Предполагалось, что он будет способен корректно работать с системами, содержащими нецелое количество электронов: несмотря на отсутствие таких систем в природе, корректная работа функционала на них должна помочь ему в описании обычных химических систем. Для того чтобы научить свой функционал корректно работать на таких системах, команда DeepMind добавила их в базу данных, на которой обучался DM21. Чтобы убедиться, что DM21 научился работать на таких системах, авторы протестировали его на тестовом наборе BBB, состоящем из пар атомов на разных расстояниях друг от друга, например два атома водорода с одним электроном на двоих. DM21 показал превосходную точность на наборе BBB, обойдя стандартные функционалы, а также функционал DM21m, обученный DeepMind на том же датасете, за исключением систем с нецелым количеством электронов.
Авторы постарались обойти одно из ключевых ограничений традиционных функционалов — их неспособность корректно описывать системы с нецелым количеством электронов. DeepMind добавили в функционал новый нелокальный ингредиент (информацию о волновой функции системы, которую функционал может использовать для вычисления энергии), который ранее никогда не использовался, — пространственно разделенную локальную обменную энергию. В дальнейшем она может помочь строить функционалы с лучшим разделением между обменной и корреляционной энергиями.
Команда DeepMind ввела дополнительную регуляризацию, связанную с процедурой самосогласованного поля. Их дополнительное слагаемое в функции ошибки модели приближенно равно выражению для изменения энергии после шага вариационной процедуры минимизации, начинающегося с орбиталей традиционного функционала. Эта регуляризация позволяет сделать обучаемый функционал более стабильным.
«В машинном обучении очень важно не использовать для тестирования нейронной сети данные, на которых она была обучена. Однако в своей работе команда DeepMind допустила подобную ошибку: наиболее сложные димеры из набора BBB очень близки к системам с нецелым количеством электронов из обучающей выборки», — рассуждает инженер-исследователь Центра технологий материалов Сколтеха Александр Рябов.
«Если нейронные сети не могут понять, как прийти к правильным ответам, они пытаются их зазубрить. Поэтому не столь сложно обучить нейронную сеть — сложно показать, что она действительно осознала физические законы, лежащие в основе вопроса, на который она отвечает. Так что тестировать нейронную сеть на данных, на которых она обучалась, — это все равно что дать студенту на экзамене ту же задачу, которая разбиралась пять минут назад на доске: мы узнаем, хорошая ли у него память, но вряд ли узнаем, понимает ли он предмет», — отмечает Михаил Медведев.
Этот недостаток не был очевидным. Системы в наборе BBB состоят из двух атомов, тогда как DM21 обучался на одноатомных системах с нецелым количеством электронов. Поэтому предвидеть то, что произошло, было очень непросто. Ученые поняли, что при расстояниях между атомами в тест-сете BBB, где обычные функционалы начинают испытывать проблемы, атомы уже практически не взаимодействуют между собой и каждый атом в отдельности по сути становится тем самым «атомом с нецелым числом электронов», на которых проводилось обучение.
Вам также может быть интересно:
Три команды ВШЭ стали победителями на всероссийском хакатоне «Цифровой прорыв»
В конце сентября в Москве состоялся всероссийский хакатон «Цифровой прорыв. Сезон: Искусственный интеллект». На соревнование собрались 314 команд и 1616 человек со всей страны. Они состязались в решении задач от партнеров хакатона — государственных организаций и компаний: «РЖД», «Росатома», Центра робототехники Сбера, «Сколтеха» и многих других. Три команды студентов факультета компьютерных наук НИУ ВШЭ приняли участие в хакатоне и выиграли в двух кейсах.
С помощью ученых НИУ ВШЭ и Сбера преподаватели смогут повысить качество онлайн-обучения
Ученые Центра искусственного интеллекта НИУ ВШЭ и исследователи Лаборатории искусственного интеллекта Сбербанка научились определять вовлеченность участников онлайн-мероприятий. Метод, основанный на анализе видео лица, помогает выявить, насколько слушатель заинтересован в материале. Научная статья о проведенном исследовании опубликована в рамках Международной конференции по искусственному интеллекту в образовании — AIED 2024.
Вышка расширит сотрудничество с Агентством стратегических инициатив для разработки передовых решений
В Высшей школе экономики прошел День знакомства университета и Агентства стратегических инициатив (АСИ). Стороны представили свои исследовательские и аналитические проекты и наметили направления совместной работы. Задача ученых и экспертов — повысить эффективность и ускорить внедрение в практику прорывных научных разработок по широкому спектру направлений — от экономических прогнозов до нейропротезирования.
Исследователи НИУ ВШЭ и Сбера добавят эмоций искусственному интеллекту
Ученые Центра искусственного интеллекта НИУ ВШЭ и исследователи Лаборатории искусственного интеллекта Сбербанка разработали специальную систему, которая с помощью больших языковых моделей сделает искусственный интеллект (AI) более эмоциональным при общении с человеком. Синтезом AI-эмоций займутся набирающие популярность мультиагентные модели. Научная работа о проведенном исследовании опубликована в рамках Международной совместной конференции по искусственному интеллекту — IJCAI 2024.
Вышка и «Яндекс» научат преподавателей российских вузов ИИ-грамотности
«Яндекс Образование» и факультет компьютерных наук НИУ ВШЭ (ФКН ВШЭ) создали совместный онлайн-гайд, посвященный промптингу — формулированию запросов к нейросетям. Он доступен всем на платформе «Яндекса» и в первую очередь будет полезен преподавателям, которые никогда не пользовались GPT в работе или только начинают применять ИИ-инструменты. Как правильно создать запрос к нейросети? Как грамотно использовать GPT-модели в образовательных целях? Какие задачи преподаватели могут решать с помощью искусственного интеллекта? Гайд отвечает на эти и другие вопросы по работе с нейросетями.
«Оставаться конкурентным специалистом без применения нейросетей может стать нелегкой задачей»
Цифровые технологии прочно вошли в нашу жизнь и продолжают стремительно развиваться. Неудивительно, что все чаще возникает вопрос, сможет ли однажды искусственный интеллект полностью заменить специалистов. О перспективах лингвистики в эпоху нейросетей рассуждает Даниил Осипов, кандидат филологических наук, доцент Школы иностранных языков НИУ ВШЭ.
В НИУ ВШЭ разработали нейросеть для оценки уровня владения английским языком
Нейросеть «ИИ Лингво» была разработана совместно Центром искусственного интеллекта, Школой иностранных языков и онлайн-кампусом НИУ ВШЭ. Модель обучена на основе тысяч экспертных оценок устных и письменных текстов. Система позволяет оценить способность к устному и письменному общению на английском языке.
Ученые НИУ ВШЭ рассказали о будущем искусственного интеллекта в судопроизводстве
Современные технологии меняют не только нашу повседневную жизнь, но и такие консервативные сферы, как судебная система. Сотрудники кафедры конституционного и административного права НИУ ВШЭ в Нижнем Новгороде Ирина Михеева и Олег Шерстобоев проанализировали возможности и вызовы, связанные с внедрением ИИ в судебный процесс. Исследование опубликовано в журнале «Вестник Российского университета дружбы народов».
«В третий раз соберем на площадке ВШЭ лучших ученых и исследователей ИИ в России»
Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ и Центр ИИ 25–26 октября в Москве организуют конференцию Fall into ML 2024. Главной темой ежегодного мероприятия станут перспективы развития фундаментального искусственного интеллекта. Титульным партнером конференции выступит Сбер.
В Вышке упростили разработку интеллектуальных сервисов
Ученые НИУ ВШЭ разработали MLOps-платформу, применение которой поможет внедрять эффективные и безопасные ИИ-решения во всех кампусах и подразделениях университета. В дальнейшем рассматривается возможность масштабирования инструмента на внешний рынок.