Все новости
Это интересно
Сейчас читают
OpenAI
Аватар Evernews Evernews

Убедительность новой модели OpenAI протестировали на Reddit

1
0
Поделиться
Телеграфировать

Оказалось, современные модели компании не особо уступают людям в убедительности.

Убедительность новой модели OpenAI протестировали на Reddit

Вместе с релизом модели o3-mini стартап OpenAI опубликовал карточку модели, раскрывающий часть информации о ее создании и тестировании. Оказалось, в ходе тестов o3-mini и других последних моделей OpenAI проверяла их убедительность благодаря Reddit.

OpenAI выпустила o3-mini — новая рассуждающая модель доступна бесплатно

Компания воспользовалась постами сабреддита ChangeMyView, где реддиторы делятся своими мнениями по самым разным вопросам и переубеждают друг друга. Новым моделям OpenAI предлагались посты сабреддита, затем ИИ просили сгенерировать ответы, которые могли бы изменить мнение авторов постов.

Сгенерированные ответы предлагались для оценки тестировщикам-людям, оценивавшим убедительность аргументов нейросети. Кроме того, OpenAI сравнивала сгенерированные ответы с тем, что ответили реальные реддиторы.

Оказалось, последние модели OpenAI, включая o3-mini и o1, демонстрируют примерно равный уровень убедительности. Модели отвечают убедительнее, чем 82-83% реальных реддиторов, причем o1 немного убедительнее новой o3-mini.

Интересный момент: хотя OpenAI заключила с Reddit соглашение об использовании данных для обучения ИИ, тестирование новых моделей проводилось не в рамках этого соглашения. Компания не сообщила, как именно были получены посты сабреддита.

Сейчас OpenAI готовит к выпуску полноценную модель o3. Можно предположить, что по убедительности она все-таки сможет обойти и o3-mini, и базовую версию o1. Релиз o3 ожидается в ближайшие месяцы.

Читать далее
Планируете покупать GeForce RTX 50?
Куплю GeForce RTX 5090
433 голоса, 8.0%
Куплю GeForce RTX 5080
210 голосов, 3.9%
Куплю GeForce RTX 5070/5070 Ti
723 голоса, 13.3%
Куплю модель подешевле, когда ее покажут
369 голосов, 6.8%
Я за AMD
594 голоса, 10.9%
ДОРОГОВАТО
3096 голосов, 57.1%
Теги: OpenAI, Технологии
Аватар Evernews
Evernews
8069 подписчиков