Балрог вернется, назгулы тоже тут: тизер 3 сезона «Властелин колец: Кольца власти»

0

1
Популярные игры

Assassin's Creed Black Flag Resynced

Gothic 1 Remake

Romestead

Subnautica 2

Windrose

Resident Evil Requiem

The Outer Worlds 2

Hollow Knight: Silksong

Silent Hill f

Zenless Zone Zero

еще 5 популярных страниц
Первый тизер «Бегущий по лезвию 2099» — премьера 25 ноября

15

1
Ремейк Resident Evil 4 заработал $560 миллионов — аналитика

8
Apple разрешили заплатить владельцам iPhone до $95 за задержку ИИ-версии Siri

12
Anthropic выпустила модель Claude Opus 5

17
GTA 6 надо скачать максимум за 170 дней после выхода в Японии — потом ключи перестанут действовать

25
Плазма превратила влажную кофейную гущу в аналог угля за полторы минуты

24
Космическая «пропажа»: недостающую материю нашли в гигантских пустотах между галактиками

25
Tomb Raider Catalyst отложена до 2028 года

30
Падающие мешки с кровью: на съемках «Обители зла» чуть не погиб исполнитель главной роли

38

1
6 полезных модов для Assassin’s Creed Black Flag Resynced: Черная Борода, улучшенная камера и читы

29
Фото: ранние назгулы в 3 сезоне «Властелин колец: Кольца власти»

29

1
Дешевая видеокарта удвоила производительность GeForce RTX 3090 в разрешении 4K

21
Старая GeForce RTX 3060 оказалась удачнее некоторых более современных видеокарт

18
PlayStation Network частично упала и пока не встает

36

2
Долгая жизнь с подвохом: паразит превращает муравьев в ленивых «аристократов»

43

2
Neuralink показала инвалидную коляску с управлением силой мысли

29
Через новую обратную совместимость Windows запустили игры для Xbox 360

30
Бесплатные когти Росомахи с Comic-Con начали продавать за десятки или сотни долларов

36
EA Sports FC 27 получило издание за $150

27

2

Полезные ссылки

Технологии 06.02.2025 в 14:31

Рассуждающую модель уровня OpenAI o1 сделали за $50

До обучения с нуля дело все-таки не дошло.

Стартап OpenAI сейчас развивает семейство рассуждающих моделей o: две версии o1 уже выпущены, доступна o3-mini (o2 решили пропустить), на подходе полноценная версия o3. Исследователи из Стэнфорда и Вашингтонского университета решили выяснить, можно ли сделать подобную модель на базе открытых аналогов.

Оказалось — можно. В качестве подтверждения ученые выложили модель, получившую название s1: это рассуждающая модель с открытыми исходниками, по качеству ответов на математические вопросы сопоставимая с OpenAI o1-preview и DeepSeek R1.

Примечательно, что создание s1 обошлось энтузиастам примерно в $50. Об обучении модели с нуля речь не шла: исследователи взяли модель Gemini 2.0 Flash Thinking Experimental от Google, доступ к которой предоставляется бесплатно.

Модель s1 обучалась за счет дистилляции, то есть нейросеть учили на базе ответов Gemini 2.0 Flash Thinking Experimental. Предполагается, что похожим образом могла быть обучена модель R1 от DeepSeek, только в роли исходника были модели OpenAI.

Для обучения s1 использовали всего 1000 «тщательно отобранных» вопросов с ответами на них, сгенерированными моделью Google. Вместе с самими ответами модели исследователей скармливали и всю цепочку рассуждений.

Интересный момент: хотя OpenAI и ее конкуренты используют для создания рассуждающих моделей обучение с подкреплением, авторы s1 обошлись без него. Вместо этого ученые просто попросили модель имитировать определенное поведение и «подождать» — это почему-то повысило качество ответов.

Crimson Desert - будущая игра года?

Да, великая игра

777 голосов, 42.6%

Неплохая, но не игра года

621 голос, 34.1%

Ужасная игра, ей никогда не победить

425 голосов, 23.3%

Теги: Технологии

Evernews

8090 подписчиков

Подписаться на автора

Подписывайтесь на WTFTime в Google.Новости