• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Сегодня сделать большую языковую модель — это гигантский труд»

«Сегодня сделать большую языковую модель — это гигантский труд»

Фото: wtcmoscow.ru

С 22 по 24 ноября проходит международная онлайн-конференция в сфере технологий искусственного интеллекта AI Journey 2023. В ее работе приняли участие эксперты НИУ ВШЭ. В фокусе обсуждения — языковые модели и методы, которые применяются сегодня для обучения искусственного интеллекта.

Научный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ Елизавета Гончарова выступила с докладом «Языковые модели. Что можно выучить, генерируя текст?». Она рассказала об истории развития процесса обработки естественного языка и больших языковых моделей как виртуальных ассистентов. По ее словам, начало этому направлению было положено еще в середине прошлого столетия, но применяемые тогда подходы главным образом были основаны на правилах, связанных с формальной грамматикой и регулярными выражениями. «Однако впоследствии нейросетевые подходы по обработке естественного языка и трансформерные модели взяли верх, и все большие и наиболее успешные примеры работ моделей по обработке естественного языка теперь связаны именно с архитектурой трансформеров», — отметила исследовательница.

Елизавета Гончарова

Елизавета Гончарова считает, что большие языковые модели очень мощные, поэтому, будучи предобученными на простой задаче языкового моделирования, они способны решать гораздо более сложные прикладные задачи даже без дальнейшего обучения. «Если заглянуть внутрь модели, то мы увидим, что каждая часть модели отвечает за кодирование и своей информации, и той информации, на которую мы посягаем как люди: лингвистической структуры текста, фактологии, понятий времени и пространства и даже визуальных концептов, в целом закодированных внутри модели, которую мы рассматриваем, — объяснила она. — Добавление на дообучение модели данных других модальностей позволяет лучше улавливать понятия, связанные с этими модальностями, как в случае цветов, так и в случае форм. Это намекает нам на то, что текстов недостаточно, чтобы модель получила все знания о мире. Возможно, расширение модальности позволит нам открыть новые формы моделей и перейти к более сложным и более умным моделям, которые мы будем использовать в будущем».

Об алгоритмах, которые применяются для создания языковых моделей, используемых искусственным интеллектом, рассказал Евгений Соколов, руководитель департамента больших данных и информационного поиска, доцент факультета компьютерных наук, научный руководитель Центра непрерывного образования НИУ ВШЭ. Тема его доклада — «Tехнологии и алгоритмы внутри больших языковых моделей, или Что сегодня понимают под ИИ?». Евгений Соколов отметил, что сегодня уже много информации об успехах ИИ, генеративных моделей, больших языковых моделей. Он предложил разобраться, как они работают, что находится внутри, какие алгоритмы делают возможными все эти результаты и за счет чего происходит рост качества в методах ИИ.

Евгений Соколов

«Сегодня сделать большую языковую модель — это гигантский труд. Да, математика, которая лежит в основе, очень простая: производные, градиенты, градиентный спуск. А дальше начинается много интересного, нужно придумать методы для извлечения информации из данных, — говорит Евгений Соколов. — Сейчас есть трансформеры, но, кто знает, может, завтра придумают что-то новое? Очень важны сегодня обучающие данные. Классическая парадигма — это когда мы берем обучающие данные и подкручиваем параметры какой-то модели, какого-то алгоритма, чтобы получилось получше. Но сейчас этого мало, недостаточно. Нам нужно как-то внедрить требования качества в эту модель. Для этого мы берем асессоров, собираем большую выборку, строим отдельную оценивающую модель, что требует тоже очень много времени, и на основе этого докручиваем параметры нашей большой языковой модели. Получается сложная схема, какой мы видим ее сегодня. И это то, как сейчас обучаются большие языковые модели».

Эксперт отметил, что в этой работе главную роль играет не решение задачи, чтобы модель как-то «догадалась», что разработчики в нее заложили какие-то глубокие понимания — например, понимание того, как устроен язык. В этой работе важны два момента — собрать качественные данные и взять модель побольше. По его мнению, последние годы исследований показали, что основной рост качества языковых моделей достигается за счет определения большего количества параметров, по которым в дальнейшем будет вестись разработка большой языковой модели.

Свои доклады на конференции также представили и другие исследователи из Вышки. Так, младший научный сотрудник Института искусственного интеллекта и цифровых наук Айбек Аланов выступил с докладом «Редактирование изображений с помощью диффузионных моделей». Сотрудник Института искусственного интеллекта и цифровых наук и Научно-учебной лаборатории методов анализа больших данных НИУ ВШЭ Виталий Поздняков представил доклад на тему «Генерация стрессовых данных для проверки устойчивости моделей». Доцент факультета компьютерных наук, сотрудник Международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ Дмитрий Ильвовский сделал сообщение на тему «Интерпретируемые подходы к дискурсивным, логическим и аргументативным структурам в тексте». А профессор НИУ ВШЭ в Нижнем Новгороде Андрей Савченко представил исследование «Эффективные методы распознавания выражений лиц на видео».

В форсайт-сессии «ИИ для человека будущего» выступил Александр Чулок, директор Центра научно-технологического прогнозирования ИСИЭЗ НИУ ВШЭ.

Вам также может быть интересно:

Быть, а не казаться: как вырастить из ИИ профессионала

Пока ученые спорят о пользе и вреде искусственного интеллекта, молодежь активно осваивает и интегрирует нейросети в свою жизнь, приспосабливая нашу реальность к новым условиям. О том, как дообучить LLM, чтобы они смогли служить полноценными ассистентами в профессиональной среде, обсудили в Вышке на воркшопе «Большие языковые модели в науке и в жизни».

«Нам нужно учиться общаться с сервисами искусственного интеллекта»

На платформе «Открытое образование» стартовал онлайн-курс «Что такое генеративный ИИ?», который поможет слушателям узнать больше о том, как правильно общаться с нейросетями, чтобы они лучше выполняли задачи. Как работает генеративный ИИ и как с его помощью создавать любой контент, рассказала эксперт Центра непрерывного образования, старший преподаватель департамента больших данных и информационного поиска ФКН Дарья Касьяненко.

«Специалист по Data Science» ВШЭ — первая программа переподготовки с аккредитацией Альянса в сфере ИИ

Согласно итогам экспертизы, программа Высшей школы экономики охватывает современные области анализа данных и машинного обучения и помогает нетехническим специалистам приобрести базовые знания в области больших данных и искусственного интеллекта. Это уже шестая образовательная программа факультета компьютерных наук НИУ ВШЭ, получившая престижную профессионально-общественную аккредитацию.

В Вышке стартует конкурс компетенций в области ИИ и машинного обучения

Дирекция программы развития НИУ ВШЭ объявляет о проведении конкурса компетенций в интересах развития исследований в области искусственного интеллекта и машинного обучения. Заявки принимаются до 2 мая 2024 года.

Что мы знаем о мозге и его возможностях: рассказывают исследователи ВШЭ

Правда ли, что мозг — самый неизученный орган? Как нейротехнологии помогают в лечении сложных заболеваний? Может ли искусственный интеллект соревноваться с естественным? И куда пойти учиться, чтобы стать нейроученым? Эти и другие темы в новом выпуске рубрики «Разговор с экспертом» обсудили ученые из Высшей школы экономики — Ольга Драгой, Андрей Мячиков и Алексей Осадчий.

НИУ ВШЭ планирует до конца года обучить преподавателей работе с ИИ

Высшая школа экономики представила новый комплексный проект по повышению квалификации профессорско-преподавательского состава НИУ ВШЭ в области использования искусственного интеллекта. Входящий в него пакет программ направлен на обеспечение высокого уровня компетенций в области использования ИИ в образовании и исследованиях. Курсы бесплатны и предназначены для штатных преподавателей, а в дальнейшем — научных сотрудников и аспирантов московского кампуса НИУ ВШЭ.

«Нейросети показывают, какие качества действительно делают людей уникальными»

Онлайн-кампус НИУ ВШЭ запустил курс «Прикладные нейросети» на портале «Открытое образование». Теперь разобраться в том, как применять возможности искусственного интеллекта на практике, может любой желающий.

В Вышке наградят студентов, которые напишут диплом с помощью ИИ

Высшая школа экономики запустила конкурс решений, применяющих технологии искусственного интеллекта, при подготовке дипломов. Задача конкурса — оценить использование студентами инструментов на основе генеративных моделей в выпускных квалификационных работах (ВКР), защищаемых в 2024 году.

Определены победители финала НТО по профилю «Искусственный интеллект»

Названы победители и призеры Национальной технологической олимпиады (НТО) по профилю «Искусственный интеллект», который уже второй год оказывается самым популярным по количеству регистраций из 41 направления НТО. В этом сезоне участниками соревнований стали более 6300 человек из 84 регионов России, а также Казахстана, Молдовы и Узбекистана. В финал вышли 104 школьника из 28 регионов России. Среди субъектов РФ по числу финалистов лидируют Москва (26 человек), Санкт-Петербург (16 человек) и Новосибирская область (13 человек).

Производство будущего: Центр ИИ ВШЭ представил разработки в области контроля ручных операций

Исследователи Центра ИИ НИУ ВШЭ выстроили систему автоматизированного контроля ручных операций, которая находит применение в промышленном производстве. Система облегчает процессы наблюдения за объектами и действиями, а также позволяет контролировать качество их исполнения.