Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Нейросети иногда можно «сделать умнее» без долгого дообучения — исследование

0
0
Поделиться
Телеграфировать

Похоже, такой подход будет работать только в некоторых сценариях.

Нейросети иногда можно «сделать умнее» без долгого дообучения — исследование

Исследователи из Google и Калифорнийского университета в Беркли предложили способ повышения качества ответов больших языковых моделей, не требующий долгого и дорогого увеличения. В ходе тестов модель Gemini 1.5 Pro, вышедшая год назад, по качеству ответов обошла современную o1-preview.

Авторы научной работы предлагают достаточно простое решение проблемы масштабирования: модели предлагается сгенерировать некоторое количество ответов вместо одного, а потом самостоятельно выбрать из них самый лучший. Во время теста Gemini 1.5 Pro генерировала 200 ответов.

Кроме того, авторы исследования обнаружили, что самопроверка ответов самой моделью «автоматически» работает лучше по мере наращивания размера самой модели. Предполагалось, что будет наблюдаться обратный эффект.

Решение, предложенное исследователями, на первый взгляд поможет решить недавно всплывшую проблему: оказалось, по мере дообучения большие языковые модели умнеют не так быстро, как ожидалось. Однако, отмечают эксперты, тут тоже есть проблема.

Лучше всего предложенный подход будет работать в случаях, когда есть хорошая функция оценки — то есть можно достаточно легко определить качество ответа. Но этот подход вряд ли хорошо покажет себя, например, при генерации ответов, связанных с взаимодействием на естественном языке.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
2066 голосов, 7.2%
До 7000 рублей
790 голосов, 2.8%
До 6000 рублей
948 голосов, 3.3%
До 5000 рублей
2524 голоса, 8.8%
До 4000 рублей
1007 голосов, 3.5%
До 3000 рублей
1354 голоса, 4.7%
До 2000 рублей
3205 голосов, 11.2%
За любые деньги
1595 голосов, 5.6%
Ни за сколько, я пират
15069 голосов, 52.8%
Теги: Технологии
Аватар Evernews
Evernews
8089 подписчиков