Google объявил, что «продвинутая версия Gemini Deep Think» достигла выступления на уровне золота на Международной математической олимпиаде (IMO) 2025, престижную конкуренцию для молодых математиков, проводимых ежегодно с 1959 года. IMO включает в себя дошкольные математики, решающие шесть исключительных проблем в Алгебре, сочетаниях, геометрии и номеры. Медали присуждаются верхней половине участников, причем приблизительно 8% получают золотую медаль.

В течение прошлой недели IMO 2025, продвинутая модель Gemini Deep Think идеально решила пять из шести задач, набрав 35 общих очков. Это производительность считается уровнем золотой медали. Google сделал решения публично доступными.

Для достижения этого усовершенствованные Близнецы были обучены с использованием новых методов обучения подкреплению, предназначенных для улучшения многоэтапных рассуждений, решения проблем и возможностей обеспечения теоремы. Кроме того, ему было предоставлено кураторский корпус высококачественных решений для математических проблем и общих советов по подходу к проблемам IMO.

Это достижение знаменует собой значительный прогресс по сравнению с производительностью Google DeepMind в IMO 2024 года, где альфаггерометрия и алфапуф обеспечили серебряную медаль, решив четыре из шести проблем и набрав 28 очков. Ключевое отличие в этом году состоит в том, что Близнецы «управляли сквозными на естественном языке, создавая строгие математические доказательства непосредственно из официальных описаний проблем-все в 4,5-часовом ограничении срока соревнования». Напротив, моделям 2024 года требовалось, чтобы проблемы были переведены с естественного языка на специфичные для домена языки.

  Wordscapes Daily Puzzle: 8 января 2023 г.

Глубокая мысль описывается как «режим расширенного рассуждения», который включает в себя «последние методы исследования», такие как параллельное мышление. Это позволяет модели исследовать и объединять несколько потенциальных решений одновременно, а не следовать линейному мыслительному процессу.

Хотя режим глубокого мышления Близнецов был анонсирован в I/O 2025, он еще не широко доступен. Google планирует сделать версию этой глубокой модели Think, доступной для избранной группы «доверенных тестеров», включая математиков. После этого этапа он будет интегрирован в Google AI Ultra, хотя конкретная дата запуска для подписчиков уровня 250 долларов в месяц остается неподтвержденной.

Source: ИИ Google только что зарегистрировал математическую олимпиаду