Исследователи НИУ ВШЭ выяснили, как нейросети понимают каламбуры

Международная команда с участием исследователей ФКН НИУ ВШЭ представила KoWit-24 — корпус из 2700 русскоязычных заголовков «Коммерсанта» с игрой слов. Корпус позволил оценить, как искусственный интеллект распознает и объясняет языковую игру. Эксперименты с пятью большими языковыми моделями подтвердили: даже передовые системы пока ошибаются, причем интерпретация игры слов является для них более сложной задачей, чем ее выявление. Результаты работы были представлены на конференции RANLP, cтатья доступна в репозитории Arxiv.org, датасет и код для воспроизведения экспериментов — в GitHub.
Игра слов — это прием, когда автор специально ломает норму языка ради эффекта: чтобы привлечь внимание, усилить иронию или вызвать улыбку. В российских новостных заголовках такие приемы встречаются часто и могут выглядеть по-разному. Например, «Особо бумажные персоны» обыгрывает фразу «особо важные персоны»: «важные» рифмуются с «бумажные», и смысл сдвигается к производству бумаги. Или «Код накликал» звучит почти так же, как идиома «кот наплакал» (очень мало), что создает шутливую двусмысленность.
Для читателя такая игра слов очевидна и заголовки не нуждаются в пояснении. Однако современные большие языковые модели, например ChatGPT или GigaChat Max, часто теряются: им трудно заметить каламбур и тем более объяснить, на чем построена шутка. Одна из причин — это ограниченность наборов данных, на которых обучаются языковые модели. Чаще всего юмор в них представлен короткими шутками из интернета, которые помечены ярлыком «шутка». Этого мало, чтобы алгоритм понял, почему это смешно. Кроме того, у таких наборов почти нет разметки — понятных машине и человеку слоев описания, которые могут показывать, есть ли там игра слов или нет, какой это тип приема, к чему отсылает заголовок и т.д.
Исследователи факультета компьютерных наук НИУ ВШЭ вместе с коллегами из Австрийского университета междисциплинарных трансформаций, а также независимыми исследователями создали набор данных KoWit-24. Он содержит 2700 заголовков «Коммерсанта» за январь 2021 года — декабрь 2023-го с контекстом: к каждому заголовку приложены подводка к статье, название рубрики и краткое описание сюжета. Для примеров с игрой слов авторы вручную отметили тип приема, выделили «якоря» — ключевые слова, где происходит смысловой сдвиг, указали исходные выражения и добавили ссылки на статьи в «Википедии» там, где это возможно.
Авторы работы использовали определение лингвиста Алана Скотта Партингтона: игра слов возникает, когда одна и та же фраза читается минимум двумя способами, и этот эффект не случаен. При этом игра слов может возникать в нескольких случаях. Первый, когда двусмысленность заложена в самом слове или в его звучании. Например, заголовок «“Волгу” не могут заставить течь быстрее»: «Волга» здесь и река, и название федеральной трассы. Второй — легкая переделка известной фразы или названия: автор меняет форму, а читатель узнает исходник и достраивает шутку. Например, «Миссия сократима» отсылает к фильму «Миссия невыполнима» и одновременно намекает, что дипломатическую миссию можно сократить.
Исследователи отдельно выделили окказионализмы (разовые неологизмы под задачу) и оксюмороны (сочетание противоположных смыслов). Все это позволило не только собрать и описать примеры, но и сравнить разные языковые модели между собой.
После разметки авторы проверили корпус на пяти больших языковых моделях: GPT-4o, YandexGPT4, GigaChat Lite, GigaChat Max и Mistral NeMo. Моделям давали заголовок и подводку к новости и просили решить две задачи: сначала определить, есть ли в заголовке игра слов, а затем объяснить ее, то есть назвать исходную фразу или отсылку. При этом исследователи сравнивали два режима подсказок: короткий вопрос «Есть ли игра слов?» и расширенную инструкцию, в которой объясняется, что считать игрой слов, и приводятся примеры разных типов. Трем моделям из пяти более подробные инструкции помогали в распознавании игры слов, а лучшую точность показала GPT-4o. При этом интерпретировать источник шутки всем моделям заметно сложнее, чем просто фиксировать, что игра слов есть.
Павел Браславский
«KoWit-24 закрывает две ключевые проблемы прежних наборов — дает контекст к каждому заголовку и многоуровневую разметку. Это превращает подборку примеров в полноценный “тестовый стенд” для ИИ. Теперь можно объективно сравнивать модели между собой: видит ли модель сам факт игры слов, находит ли “якорь”, правильно ли восстанавливает исходную фразу или отсылку. Такие проверяемые метрики помогают не только точнее оценивать текущие системы, но и целенаправленно их улучшать — подбирать формулировки подсказок, обучающие примеры и стратегии проверки фактов. В будущем мы хотим исследовать, можно ли с помощью этого набора улучшить генерацию шуток», — отмечает один из авторов работы, доцент факультета компьютерных наук НИУ ВШЭ Павел Браславский.
Кроме того, корпус задает общий понятный стандарт оценки: исследователи работают с одними и теми же данными и сценариями экспериментов. Это уменьшает «шум» в результатах и помогает создавать модели, которые лучше понимают живой язык, а не просто следят за логикой текста.
Вам также может быть интересно:
В НИУ ВШЭ пройдет II конгресс «Генетика и сердце»
Высшая школа экономики, Национальная исследовательская лига кардиологической генетики (НИЛКГ) и Центральная государственная медицинская академия (ЦГМА) Управления делами Президента РФ организуют II Конгресс с международным участием «Генетика и сердце». Мероприятие состоится 7–8 февраля 2026 года в Центре культур НИУ ВШЭ.
Ученые ВШЭ выяснили, как сила авторитета формирует доверие
Исследователи Института когнитивных нейронаук НИУ ВШЭ выяснили, как мозг реагирует на аудиодипфейки — реалистичные поддельные записи речи, созданные с помощью ИИ. Выяснилось, что люди склонны доверять мнению авторитетного спикера даже в тех случаях, когда новые утверждения противоречат его прежней позиции. Это работает и в ситуациях, когда утверждение не согласуется с собственным мнением слушающего. Исследование опубликовано в журнале NeuroImage.
МИЭМ ВШЭ и Инновационный центр «Альфачип» заключили соглашение о сотрудничестве
Среди основных задач — совместные проекты в области микроэлектроники, участие специалистов компании в сопровождении научно-исследовательской деятельности студентов и аспирантов. Также планируется подготовка совместных научных публикаций, организация производственной практики и стажировок студентов, повышение квалификации специалистов компании.
«Я — профессионал»: ВШЭ — в лидерах по числу студентов в заключительном этапе
С сентября самые талантливые студенты со всей страны боролись за право стать частью вселенной карьерных возможностей «Я — профессионал» и получить доступ к бонусам при поступлении в магистратуру Высшей школы экономики, стажировкам в известных компаниях-партнерах («Яндекс», Сбербанк, ВТБ, РЖД и др.) и денежному вознаграждению до 300 000 рублей. Вышка вошла в число лидеров по количеству студентов, прошедших в заключительный этап олимпиады «Я — профессионал», который состоится с февраля по апрель 2026 года.
Математик из НИУ ВШЭ в Нижнем Новгороде нашел способ решить уравнение, нерешаемое с XIX века
Ученый из НИУ ВШЭ в Нижнем Новгороде и ИППИ РАН Иван Ремизов совершил концептуальный прорыв в теории дифференциальных уравнений. Ему удалось вывести универсальную формулу для решения задач, которые более 190 лет считались нерешаемыми аналитическим путем. Полученный результат радикально меняет картину мира в одной из старейших областей математики, важной для фундаментальной физики и экономики. Результаты работы опубликованы во Владикавказском математическом журнале.
НИУ ВШЭ и ГК InfoWatch подписали соглашение о сотрудничестве
Соглашение ознаменует новый этап сотрудничества между НИУ ВШЭ и ГК InfoWatch, который направлен на развитие образовательных программ и укрепление практико-ориентированного подхода в подготовке кадров для цифровой экономики. Стороны договорились совместно разрабатывать и проводить экспертизу учебных программ. Кроме того, эксперты ГК InfoWatch будут вести преподавательскую работу в рамках обучения студентов IT- и ИБ-направлений Высшей школы экономики.
В Вышке повысят квалификацию руководители, отвечающие за информационную безопасность
В НИУ ВШЭ стартовал набор на программу повышения квалификации «Кибербезопасность как стратегия», выпускники которой будут внедрять на своих предприятиях лучшие практики стратегического и операционного управления информационной безопасностью. Начало занятий запланировано на 16 марта. В чем актуальность программы, на кого она рассчитана и чему будут обучать слушателей, рассказал ее руководитель, директор Центра программных разработок и цифровых сервисов МИЭМ НИУ ВШЭ Антон Сергеев.
НИУ ВШЭ, MR и ГК «А101» будут готовить специалистов по территориальному развитию
В 2026 году на факультете городского и регионального развития (ФГРР) Вышки открывается новая образовательная программа бакалавриата «Девелопмент и городское планирование». Ключевые партнеры образовательной программы — компания MR и Группа компаний «А101».
МИЭМ ВШЭ проведет XXX, юбилейную межвузовскую конференцию имени Е.В. Арменского
20–27 апреля в Московском институте электроники и математики имени А.Н. Тихонова ВШЭ пройдет главное для МИЭМ научное студенческое событие года — юбилейная, XXX ежегодная межвузовская научно-техническая конференция студентов, аспирантов и молодых специалистов имени основателя и первого ректора МИЭМ Евгения Викториновича Арменского. В конференции могут принять участие студенты, аспиранты вузов и молодые специалисты, работающие в сфере электроники, в ИТ-области, телекоммуникациях, материаловедении. Отдельная секция конференции открыта для школьников.
Участники СВО и их дети впервые смогут поступить в НИУ ВШЭ на бюджетные места на онлайн-программы
В рамках приемной кампании 2026 года Высшая школа экономики впервые открыла бюджетный набор на онлайн-программы бакалавриата с целью выделить места для поступления абитуриентов по отдельной квоте. Ранее прием на образовательные программы, реализуемые в онлайн-формате, осуществлялся только на платной основе.


