Ученые НИУ ВШЭ научились сжимать большие языковые модели без потерь в качестве

Исследователи из Института искусственного интеллекта и цифровых наук (Институт ИИиЦН) ФКН НИУ ВШЭ разработали новый метод сжатия больших языковых моделей, таких как GPT и LLaMA, который позволяет уменьшить их объем на 25–36% без дополнительного обучения и значительной потери в точности. Это первый подход, который использует математические преобразования — вращения весов модели, — чтобы сделать модели более удобными для сжатия с помощью структурированных матриц. Результаты исследования опубликованы в ACL Findings 2025. Код метода доступен на GitHub.
Большие языковые модели, такие как ChatGPT и LLaMA, показывают впечатляющие результаты в генерации текста, переводе и других задачах, но их огромный размер делает их дорогими в использовании и хранении. Традиционные методы сжатия — уменьшение точности чисел, удаление лишних связей или упрощение структуры — часто требуют долгого дообучения модели и могут ухудшить ее работу. Ученые искали способ сократить объем модели быстро и без потери ее интеллекта.
Исследователи НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН факультета компьютерных наук НИУ ВШЭ предложили метод ProcrustesGPT, основанный на идее, что выходные данные модели не меняются, если применить к ее внутренним весам специальные ортогональные преобразования — своего рода математические повороты. Как объясняют ученые, это такое преобразование пространства, которое может как угодно повернуть или перевернуть картинку, но не может растянуть или сжать ни один объект. Например, если взять лист бумаги с нарисованным на нем треугольником, то можно перевернуть или повернуть его под любым углом — длины сторон и углы между ними останутся точно такими же. В математике такое преобразование и называется ортогональным. Эти преобразования подбираются так, чтобы веса модели лучше поддавались сжатию с помощью структурированных матриц — математических конструкций, которые занимают гораздо меньше памяти.
Екатерина Гришина
Екатерина Гришина, стажер-исследователь НУЛ матричных и тензорных методов в машинном обучении, объясняет: «В основе нашей работы лежит изящная математическая концепция — задача Прокруста. Как и мифический герой, подгонявший путников под свое ложе, этот метод помогает найти идеальное ортогональное преобразование, которое подгоняет веса модели под простую структуру без искажения ее сути. Именно эта идея дала имя нашему методу — ProcrustesGPT — и стала ключом к сжатию без значительной потери качества».
В рамках работы были опробованы два типа таких структур: суммы кронекеровских произведений и GS-матрицы. Метод не требует дообучения модели, работает быстро и может применяться к уже существующим моделям. Эксперименты проводились на открытых моделях OPT и LLaMA2.
Новый метод ProcrustesGPT демонстрирует эффективность: он позволяет уменьшить объем больших языковых моделей на треть, а точнее, на 25–36% от исходного размера, сохранив при этом их интеллектуальные способности. Сжатые модели показывают результаты, близкие к оригиналам: на генерации связного текста и решении логических задач они сохраняют от 90 до 95% своей первоначальной эффективности.
В сравнении с другими современными методами сжатия, например SliceGPT, который также не требует длительного дообучения, ProcrustesGPT в большинстве тестов оказался точнее. Особенно ярко это преимущество проявляется при работе с моделями семейства LLaMA2, на которых разработанный подход опережает аналог на 9–10%.
Максим Рахуба
Максим Рахуба, заведующий НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН НИУ ВШЭ, рассказывает: «Методы сжатия помогают ускорять внедрение больших языковых моделей в устройства с ограниченными ресурсами, такие как мобильные устройства и IoT-гаджеты, что делает ИИ более доступным и распространенным в повседневной жизни».
Вам также может быть интересно:
Институт робототехнических систем ВШЭ запустил научно-технический семинар
Институт робототехнических систем (ИРС) ВШЭ запустил новый ежемесячный формат — Научно-технический семинар. Он объединяет сотрудников института, приглашенных экспертов, студентов, исследователей и представителей других подразделений НИУ ВШЭ для обсуждения актуальных задач мехатроники, робототехники и киберфизических систем.
В НИУ ВШЭ разработали сервис обезличивания табличных данных для безопасного использования в ИИ-системах
Институт искусственного интеллекта и цифровых наук ФКН ВШЭ разработал сервис обезличивания табличных данных, предназначенный для подготовки корпоративных данных к использованию в аналитических и ИИ-сервисах. Решение позволяет выявлять персональные данные в структурированных наборах, применять к ним воспроизводимые правила обезличивания и формировать артефакты, необходимые для контроля качества, аудита и последующего использования данных в защищенных контурах.
«Дни компьютерных наук год от года становятся масштабнее, и это отражает развитие ФКН»
Прошедший недавно в корпусе НИУ ВШЭ на Покровке фестиваль «Дни компьютерных наук» (ДКН) стал главной точкой притяжения для всех, кто интересуется технологиями. Событие, организованное факультетом компьютерных наук (ФКН) Вышки совместно с партнерами, собрало около трех тысяч участников: студентов, абитуриентов, выпускников, преподавателей и экспертов индустрии.
МИЭМ ВШЭ и АО «Нанотроника» запускают совместную мастерскую электронного машиностроения
Под руководством экспертов компании студенты будут решать задачи, связанные с улучшением характеристик устройств для электронного машиностроения. Среди них — моделирование физических и технологических процессов, расчет, конструирование и автоматизация систем, подсистем и элементов технологического и контрольно-измерительного оборудования, сбор данных, метрологические задачи.
Технодень МИЭМ ВШЭ: праздник технологий и старт новых партнерств
В атриуме на Покровке прошел масштабный фестиваль технологических решений инженерных проектных команд Московского института электроники и математики ВШЭ, где были представлены лучшие студенческие разработки и совместные мастерские МИЭМ и партнеров. Кроме того, в рамках события прошел круглый стол, посвященный вопросам инженерного образования, и были подписаны новые соглашения о сотрудничестве с компаниями – технологическими лидерами в своих отраслях деятельности.
Высшая школа экономики и «Ростелеком» поддержат ИИ-стартапы для госсектора
НИУ ВШЭ и «Ростелеком» подписали на ПМЭФ-2026 соглашение о сотрудничестве в рамках реализации акселератора ИИ-решений для государственного сектора. Совместная работа позволит объединить технологическую экспертизу крупнейшего цифрового партнера государства и академический потенциал ведущего исследовательского университета страны.
Проблемы этики: как и где использовать ИИ
За последние годы этика в сфере искусственного интеллекта превратилась из философско-теоретической в прикладную дисциплину. Эксперты в НИУ ВШЭ обсудили, какие этические проблемы возникают в связи со стремительным развитием цифровизации и какие их инженерные решения могут быть предложены.
НИУ ВШЭ второй год подряд на первом месте рейтинга вузов Альянса в сфере ИИ
Альянс в сфере искусственного интеллекта опубликовал рейтинг российских высших учебных заведений по качеству подготовки кадров для работы с ИИ. Высшая школа экономики второй год занимает первую строчку рейтинга, оставаясь единственным университетом в категории A++.
Институт искусственного интеллекта и цифровых наук ВШЭ представил платформу предиктивной аналитики для бизнеса
Институт искусственного интеллекта и цифровых наук ФКН ВШЭ разработал Predict Core — унифицированное алгоритмическое ядро предиктивной аналитики. Платформа переводит работу с данными из режима отчетности постфактум в управленческую привычку с прогнозами, интерпретацией и понятным следом, показывающим, как была получена эта цифра.
НИУ ВШЭ и МТС договорились об обмене ИИ-компетенциями при подготовке инженерных кадров для телекома
НИУ ВШЭ и ПАО «МТС» заключили соглашение о стратегическом партнерстве, которое предполагает подготовку кадров с ИИ-компетенциями для телекоммуникационной отрасли по программам высшего и дополнительного профессионального образования. Соглашение направлено на повышение качества образования, обмен экспертизой и компетенциями при подготовке инженеров, владеющих технологиями ИИ и машинного обучения.


