Все новости
Это интересно
Сейчас читают
OpenAI
Аватар Evernews Evernews

Убедительность новой модели OpenAI протестировали на Reddit

1
0
Поделиться
Телеграфировать

Оказалось, современные модели компании не особо уступают людям в убедительности.

Убедительность новой модели OpenAI протестировали на Reddit

Вместе с релизом модели o3-mini стартап OpenAI опубликовал карточку модели, раскрывающий часть информации о ее создании и тестировании. Оказалось, в ходе тестов o3-mini и других последних моделей OpenAI проверяла их убедительность благодаря Reddit.

OpenAI выпустила o3-mini — новая рассуждающая модель доступна бесплатно

Компания воспользовалась постами сабреддита ChangeMyView, где реддиторы делятся своими мнениями по самым разным вопросам и переубеждают друг друга. Новым моделям OpenAI предлагались посты сабреддита, затем ИИ просили сгенерировать ответы, которые могли бы изменить мнение авторов постов.

Сгенерированные ответы предлагались для оценки тестировщикам-людям, оценивавшим убедительность аргументов нейросети. Кроме того, OpenAI сравнивала сгенерированные ответы с тем, что ответили реальные реддиторы.

Оказалось, последние модели OpenAI, включая o3-mini и o1, демонстрируют примерно равный уровень убедительности. Модели отвечают убедительнее, чем 82-83% реальных реддиторов, причем o1 немного убедительнее новой o3-mini.

Интересный момент: хотя OpenAI заключила с Reddit соглашение об использовании данных для обучения ИИ, тестирование новых моделей проводилось не в рамках этого соглашения. Компания не сообщила, как именно были получены посты сабреддита.

Сейчас OpenAI готовит к выпуску полноценную модель o3. Можно предположить, что по убедительности она все-таки сможет обойти и o3-mini, и базовую версию o1. Релиз o3 ожидается в ближайшие месяцы.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
92 голоса, 4.6%
До 7000 рублей
29 голосов, 1.4%
До 6000 рублей
50 голосов, 2.5%
До 5000 рублей
218 голосов, 10.8%
До 4000 рублей
64 голоса, 3.2%
До 3000 рублей
110 голосов, 5.5%
До 2000 рублей
265 голосов, 13.2%
За любые деньги
97 голосов, 4.8%
Ни за сколько, я пират
1085 голосов, 54.0%
Теги: OpenAI, Технологии
Аватар Evernews
Evernews
8072 подписчика