Джордж Лукас сыграл в «Миньонах и монстрах»

9
Популярные игры

Gothic 1 Remake

Romestead

Paralives

Subnautica 2

Windrose

Resident Evil Requiem

The Outer Worlds 2

Hollow Knight: Silksong

Silent Hill f

Zenless Zone Zero

еще 5 популярных страниц
Amazon MGM отказалась выпускать почти готовый фильм о Сэме Альтмане и кризисе в OpenAI

18
Драйвер Nvidia для Linux получил поддержку DLSS

24
В Crimson Desert починили исчезновение мебели: вышел патч 1.12.01

21
Космическая гантеля с древней водой: NASA изучило астероид Дональдджохансон вблизи

20
Ремиэлла и Сигрид: первый взгляд на героев Zenless Zone Zero 3.1

22
Куда в GTA 6 пропало отражение колеса обозрения — объясняет Digital Foundry

42

1
CD Projekt сомневается в восстановлении доверия игроков после провала Cyberpunk 2077

45
СМИ: «Гринч – похититель Рождества» может получить сиквел с Джимом Керри

37
В Minecraft создали «микробазу» — минималистичный домик для выживальщика

34
Создатель Resident Evil объяснил, почему разработчикам не стоит бояться стримов

33

4
Убивать NPC в ремейке Gothic стало сложнее: основные изменения патча 1.0.2

32
Шансы на ремейк Gothic 2 выросли после успеха первого ремейка

48

1
«Вангеры» получили патч на 60 fps в честь 28-летия

29

2
Ассасин на Кубе: новый геймплей Assassin’s Creed Black Flag Resynced

31
Epic Games показала новый магазин и лаунчер 2.0 — они больше напоминают Steam

33
Новая экранизация «Человека-бензопилы» выйдет в 2027 году — второй трейлер

40
Геймпад-хранитель: Sony патентует авторизацию консоли с помощью контроллера

28

1
«Корзина» в Windows 11 начала путать имена файлов, но с удалением в порядке

35
Голос Дарта Мола назвал «Скрытую угрозу» разочарованием — из-за денег и внешности персонажа

28

Полезные ссылки

OpenAI 20.12.2024 в 22:12

OpenAI показала модель o3 — она обходит людей в бенчмарке ARC-AGI

У модели пока не будет публичной версии.

OpenAI провела последнюю из 12 запланированных презентаций. Компания показала новую большую языковую модель, o3; по качеству ответов она значительно превосходит o1 и модели конкурентов (модели o2 у OpenAI не будет).

Модель o3 умеет размышлять примерно так же, как это делает o1. У новой модели есть две версии, более дешевая o3-mini и полноценная o3. В бенчмарке ARC-AGI обе версии o3 показали результаты, превосходящие результаты не только других моделей, но и людей.

Модель o3-mini в ARC-AGI показала результат в 76%, o3 продемонстрировала результат в 88%. Обычные люди показывать результат чуть хуже, чем o3-mini. Прежде тест ARC-AGI использовался как доказательство того, что модели не умеют «думать»; теперь, видимо, придется делать новый бенчмарк.

В то же время такие размышления стоят недешево. Прогон ARC-AGI через o3 обошелся дороже $1000 (меньше $10 для o1), версия o3-mini стоила заметно дешевле — но все равно больше, чем у предыдущих моделей.

Согласно тестам, проведенным OpenAI, модель o3 превосходит предшественников во всех задачах, иногда очень значительно. Например, модель o3 набрала 2727 рейтинг на Codeforces — это результат, недостижимый для большинства людей.

Сейчас доступ к o3 есть только у ученых, помогающих OpenAI тестировать модель. Запуск o3-mini намечен на январь 2025 года, o3 запустят позже. Информации о стоимости доступа к моделям пока нет.

Crimson Desert - будущая игра года?

Да, великая игра

646 голосов, 41.9%

Неплохая, но не игра года

543 голоса, 35.2%

Ужасная игра, ей никогда не победить

354 голоса, 22.9%

Теги: OpenAI, Технологии

Evernews

8091 подписчик

Подписаться на автора

Подписывайтесь на WTFTime в Google.Новости