Разработчики Minecraft все-таки не отказались от крупных обновлений

15
Популярные игры

Resident Evil Requiem

The Outer Worlds 2

Hollow Knight: Silksong

Silent Hill f

Zenless Zone Zero

Mafia The Old Country

Clair Obscur: Expedition 33

Doom: The Dark Ages

Baldur's Gate 3

Kingdom Come: Deliverance 2

еще 5 популярных страниц
Фото: космическая картошка на борту МКС

21

1
«Тащи весь реквизит»: Том Фелтон связался с Драко Малфоем из сериала «Гарри Поттер»

25
Раскопки в Помпеях подтвердили существование римского ритуала, известного только по описаниям

28
СМИ: для борьбы с VPN российские операторы связи введут лимит на иностранный трафик

29

6
На PlayStation Vita впервые честно получили редчайший трофей — ушло почти 10 часов

28
Copilot стал добавлять рекламу в запросы на GitHub

23
Прогноз магнитных бурь на 31 марта: будет долгая магнитная буря

29
Файтинг Avatar Legends The Fighting Game выйдет 2 июля — новый трейлер

26
Xbox анонсирует летнюю презентацию: Xbox Games Showcase пройдет 7 июня

33
Apple оштрафовали за платежи российской компании в 2022 году, найденные самой Apple

27
СМИ: в России могут запретить пополнение баланса Apple ID со счета телефона

37

3
СМИ: Apple готовит iMac с OLED-экраном

23
Konami пятый год подряд повышает зарплаты всех сотрудников, но совсем чуть-чуть

26
Бюджет GTA 6 может исчисляться миллиардами — если судить по зарплатам

35

1
Софи Тернер получила травму на съемках Tomb Raider — ходят слухи, что ее заменят

41

1
Crimson Desert получила обновление 1.01.02 специально для ПК

31
«Проект «Конец света» — самый кассовый фильм 2026 года, «Прыгуны» немного отстали

26

1
Похоже, Кратос получил пепельную кожу более-менее случайно

34
Второй сезон «Гарри Поттера» пока не начали снимать — ежегодных премьер не будет

31

1

Полезные ссылки

OpenAI 21.04.2025 в 11:47

Модель OpenAI o3 оказалась не так хороша в бенчмарках, как говорила компания

Результаты совпали по нижней границе — возможно, в OpenAI говорили о верхней границе.

Новые модели, выпущенные OpenAI в апреле, были протестированы командой Epoch AI, создавшей бенчмарк FrontierMath. Этот бенчмарк использовался для тестов моделей и самой OpenAI, но результаты оказались разными.

Результаты прогонов моделей o3 и o4-mini от Epoch AI совпали с цифрами, показанными OpenAI, только по нижней границе. Повторить все результаты, показанные OpenAI, не удалось.

Публично доступная версия модели o3 смогла набрать в бенчмарке около 10%. Во время презентации представители OpenAI говорили о результатах на уровне 25%.

Перед релизом новых моделей сотрудники OpenAI говорили о выпуске оптимизированной версии o3, отличающейся от той, что тестировалась ранее. Представители компании не рассказывали, как эта оптимизация может повлиять на прохождение бенчмарков.

В обозримом будущем OpenAI намерена выпустить еще одну версию модели o3, o3-pro. Возможно, эта модель сумеет показать результаты, соответствующие предыдущим заявлениям компании.

Как вам S.T.A.L.K.E.R. 2?

Отличная игра

10675 голосов, 29.9%

Хорошо, но могло быть лучше

4333 голоса, 12.1%

Самая обычная игра

2396 голосов, 6.7%

Ужасно, пожалел о покупке/скачивании

3133 голоса, 8.8%

Не играл и не собираюсь

15148 голосов, 42.4%

Теги: OpenAI, Технологии

Evernews

8089 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Google.Новости