Все новости
Это интересно
Сейчас читают
Наука
Аватар Evernews Evernews

ИИ OpenAI смог удивить математиков, придумывавших для него задачи

1
0
Поделиться
Телеграфировать

Ученые сравнивают модель с очень хорошим аспирантом.

ИИ OpenAI смог удивить математиков, придумывавших для него задачи

Большая языковая модель o4-mini, созданная OpenAI, сумела удивить ученых-математиков своими знаниями и способностями, связанными с точными науками. Об этом сами математики рассказали Scientific American.

В мае 2025 года три десятка известных математиков из разных стран мира собрались в Беркли, чтобы создать набор задач для тестирования ИИ. Чтобы понимать, на какой уровень ориентироваться, математики получили доступ к чат-боту на базе o4-mini.

Модель продемонстрировала способность решать задачи, уровень которых варьировался от бакалавриата до аспирантуры; o4-mini справлялась с задачами, которые ранее не публиковались и не входили в обучающие наборы данных. Многие участники признали: результаты превзошли их ожидания.

По условиям эксперимента, за каждую задачу, с которой бот не справлялся, ее автор получал вознаграждение в размере $7500. За два дня математикам удалось придумать всего десять таких задач.

В качестве примера математик Кен Оно приводит то, как модель справилась с предложенной им задачей, связанной с теорией чисел. Математик описывает ее как «задачу уровня хорошей докторской диссертации», но o4-mini смогла решить ее примерно за 10 минут, детально описав ход своих размышлений.

Кен Оно
математик

Раньше я никогда не видел, чтобы модели так рассуждали. Именно так действуют ученые. Это пугает.

По словам Оно, нейросети дорасли до уровня, когда могут считаться «сильными партнерами» реальных математиков. Коллега Оно, британский математик Ян Хуэй Хэ, сравнил o4-mini с «очень хорошим аспирантом».

Развитие подобных технологий, считают математики, требует переосмысления роли человека в науке и пересмотра подходов к образованию с акцентом на творческое и концептуальное мышление.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
659 голосов, 6.4%
До 7000 рублей
212 голосов, 2.1%
До 6000 рублей
267 голосов, 2.6%
До 5000 рублей
970 голосов, 9.5%
До 4000 рублей
318 голосов, 3.1%
До 3000 рублей
475 голосов, 4.6%
До 2000 рублей
1163 голоса, 11.4%
За любые деньги
551 голос, 5.4%
Ни за сколько, я пират
5631 голос, 55.0%
Теги: Наука, Технологии
Аватар Evernews
Evernews
8074 подписчика