Все новости
Это интересно
Сейчас читают
OpenAI
Аватар Evernews Evernews

Убедительность новой модели OpenAI протестировали на Reddit

1
0
Поделиться
Телеграфировать

Оказалось, современные модели компании не особо уступают людям в убедительности.

Убедительность новой модели OpenAI протестировали на Reddit

Вместе с релизом модели o3-mini стартап OpenAI опубликовал карточку модели, раскрывающий часть информации о ее создании и тестировании. Оказалось, в ходе тестов o3-mini и других последних моделей OpenAI проверяла их убедительность благодаря Reddit.

OpenAI выпустила o3-mini — новая рассуждающая модель доступна бесплатно

Компания воспользовалась постами сабреддита ChangeMyView, где реддиторы делятся своими мнениями по самым разным вопросам и переубеждают друг друга. Новым моделям OpenAI предлагались посты сабреддита, затем ИИ просили сгенерировать ответы, которые могли бы изменить мнение авторов постов.

Сгенерированные ответы предлагались для оценки тестировщикам-людям, оценивавшим убедительность аргументов нейросети. Кроме того, OpenAI сравнивала сгенерированные ответы с тем, что ответили реальные реддиторы.

Оказалось, последние модели OpenAI, включая o3-mini и o1, демонстрируют примерно равный уровень убедительности. Модели отвечают убедительнее, чем 82-83% реальных реддиторов, причем o1 немного убедительнее новой o3-mini.

Интересный момент: хотя OpenAI заключила с Reddit соглашение об использовании данных для обучения ИИ, тестирование новых моделей проводилось не в рамках этого соглашения. Компания не сообщила, как именно были получены посты сабреддита.

Сейчас OpenAI готовит к выпуску полноценную модель o3. Можно предположить, что по убедительности она все-таки сможет обойти и o3-mini, и базовую версию o1. Релиз o3 ожидается в ближайшие месяцы.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
1603 голоса, 7.1%
До 7000 рублей
552 голоса, 2.5%
До 6000 рублей
711 голосов, 3.2%
До 5000 рублей
2027 голосов, 9.0%
До 4000 рублей
760 голосов, 3.4%
До 3000 рублей
1058 голосов, 4.7%
До 2000 рублей
2556 голосов, 11.3%
За любые деньги
1231 голос, 5.5%
Ни за сколько, я пират
12028 голосов, 53.4%
Теги: OpenAI, Технологии
Аватар Evernews
Evernews
8086 подписчиков