Гришина Екатерина Романовна
- Стажер-исследователь: Факультет компьютерных наук / Институт искусственного интеллекта и цифровых наук / Научно-учебная лаборатория матричных и тензорных методов в машинном обучении
- Начала работать в НИУ ВШЭ в 2026 году.
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.
Researchers from the AI and Digital Science Institute at the HSE Faculty of Computer Science have developed a new compression method for large language models such as GPT and LLaMA that reduces their size by 25–36% without additional training or significant loss of accuracy. This is the first approach to use mathematical transformations—specifically, rotations of model weights—to make models more amenable to compression with structured matrices. The study results have been published in ACL Findings 2025. The code is available on GitHub.
Исследователи из Института искусственного интеллекта и цифровых наук (Институт ИИиЦН) ФКН НИУ ВШЭ разработали новый метод сжатия больших языковых моделей, таких как GPT и LLaMA, который позволяет уменьшить их объем на 25–36% без дополнительного обучения и значительной потери в точности. Это первый подход, который использует математические преобразования — вращения весов модели, — чтобы сделать модели более удобными для сжатия с помощью структурированных матриц. Результаты исследования опубликованы в ACL Findings 2025. Код метода доступен на GitHub.
17 февраля в офисе Яндекса прошла традиционная зимняя встреча лауреатов стипендии Яндекса 2024 года.
Шрифты HSE Sans и HSE Slab разработаны в Школе дизайна НИУ ВШЭ