Все новости
Это интересно
Сейчас читают
OpenAI
Аватар Evernews Evernews

Убедительность новой модели OpenAI протестировали на Reddit

1
0
Поделиться
Телеграфировать

Оказалось, современные модели компании не особо уступают людям в убедительности.

Убедительность новой модели OpenAI протестировали на Reddit

Вместе с релизом модели o3-mini стартап OpenAI опубликовал карточку модели, раскрывающий часть информации о ее создании и тестировании. Оказалось, в ходе тестов o3-mini и других последних моделей OpenAI проверяла их убедительность благодаря Reddit.

OpenAI выпустила o3-mini — новая рассуждающая модель доступна бесплатно

Компания воспользовалась постами сабреддита ChangeMyView, где реддиторы делятся своими мнениями по самым разным вопросам и переубеждают друг друга. Новым моделям OpenAI предлагались посты сабреддита, затем ИИ просили сгенерировать ответы, которые могли бы изменить мнение авторов постов.

Сгенерированные ответы предлагались для оценки тестировщикам-людям, оценивавшим убедительность аргументов нейросети. Кроме того, OpenAI сравнивала сгенерированные ответы с тем, что ответили реальные реддиторы.

Оказалось, последние модели OpenAI, включая o3-mini и o1, демонстрируют примерно равный уровень убедительности. Модели отвечают убедительнее, чем 82-83% реальных реддиторов, причем o1 немного убедительнее новой o3-mini.

Интересный момент: хотя OpenAI заключила с Reddit соглашение об использовании данных для обучения ИИ, тестирование новых моделей проводилось не в рамках этого соглашения. Компания не сообщила, как именно были получены посты сабреддита.

Сейчас OpenAI готовит к выпуску полноценную модель o3. Можно предположить, что по убедительности она все-таки сможет обойти и o3-mini, и базовую версию o1. Релиз o3 ожидается в ближайшие месяцы.

Читать далее
Как думаете, GTA VI выйдет в 2025 году?
Выйдет без переносов
163 голоса, 15.3%
Выйдет, но после переноса
90 голосов, 8.5%
Нет, перенесут на 2026 год
579 голосов, 54.4%
Нет, перенесут на 2026 год — а потом на 2027 год
232 голоса, 21.8%
Теги: OpenAI, Технологии
Аватар Evernews
Evernews
8068 подписчиков