Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

GPT-4.5 проходит тест Тьюринга в 73% случаев — исследование

0
0
Поделиться
Телеграфировать

Модель действует особенно успешно, если ее просят выдавать себя за реального человека.

GPT-4.5 проходит тест Тьюринга в 73% случаев — исследование

Некоторые современные нейросети могут проходить стандартный тест Тьюринга в более чем 50% случаев, следует из исследования ученых Калифорнийского университета в Сан-Диего. Лучше всего себя показывает GPT-4.5 от OpenAI.

В двойном рандомизированном исследовании приняли участие модели ELIZA, GPT-4o, LLaMa-3.1-405B и GPT-4.5. За исключением чат-бота ELIZA модели запускались в двух вариантах: с детальным промптом, предлагавшим им выдавать себя за реального человека, и без него.

Промпт Persona выглядит так

Модели, запускавшиеся без длинного промпта Persona, получали простые инструкции: им сообщали, что они проходят тест Тьюринга, и предлагали убедить собеседника, что он говорит с человеком.

Оказалось, что модели с промптом проходят тест Тьюринга заметно лучше, чем без него. Собеседники-люди посчитали GPT-4.5 человеком в 73% случаев, модель LLaMa-3.1 с тем же промптом признали человеком в 56% случаев. У ELIZA показатель «побед» равен всего 23%, у GPT-4o он на уровне 21%.

Исследователи называют свой эксперимент первым эмпирическим доказательством того, что нейросети могут проходить стандартный тест Тьюринга. Сам Тьюринг полагал, что прохождение теста может говорить о способности компьютера мыслить; в случае с современными нейросетями о мышлении речь не идет.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
1189 голосов, 6.9%
До 7000 рублей
402 голоса, 2.3%
До 6000 рублей
522 голоса, 3.0%
До 5000 рублей
1586 голосов, 9.2%
До 4000 рублей
558 голосов, 3.2%
До 3000 рублей
809 голосов, 4.7%
До 2000 рублей
1954 голоса, 11.4%
За любые деньги
933 голоса, 5.4%
Ни за сколько, я пират
9242 голоса, 53.7%
Теги: Технологии
Аватар Evernews
Evernews
8082 подписчика