Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

ИИ может понимать действия человека по звуку и данным датчиков движения — исследование

0
0
Поделиться
Телеграфировать

Модели показали неплохие результаты даже без дообучения.

ИИ может понимать действия человека по звуку и данным датчиков движения — исследование

Большие языковые модели могут распознавать действия людей, анализируя данные с микрофонов и датчиков движения, сообщают исследователи Apple. Сотрудники компании протестировали модели Gemini 2.5 Pro и Qwen-32B и пришли к интересным результатам.

В своем исследовании Apple использовала датасет Ego4D, включающий тысячи часов видео, снятых от первого лица. Исследователи выбрали 12 типичных категорий повседневных действий: уборка, готовка, футбол и так далее.

Для анализа нейросетям нарезали 20-секундные фрагменты данных инерциальных сенсоров и соответствующие аудиозаписи. Примечательно, что модели анализировали не «сырые» данные, а текстовые описания, созданные на их базе вспомогательными алгоритмами.

Оказалось, даже без специального дообучения большие языковые модели смогли определять деятельность людей с ненулевой точностью. При добавлении одного примера каждой активности результаты моделей стали еще лучше.

Эксперименты проводились в двух форматах: с заранее известным набором действий и без него. В обоих случаях нейросети оказались способны правильно интерпретировать данные.

В Apple считают, что подобные технологии могут улучшить работу фитнес-функций и систем мониторинга здоровья, особенно в ситуациях, когда обычных данных по какой-либо причине недостаточно.

Читать далее
Сколько вы тратите на игры за год?
Больше 100000 рублей
2069 голосов, 7.2%
От 50000 до 100000 рублей
1344 голоса, 4.7%
От 25000 до 50000 рублей
1570 голосов, 5.5%
От 10000 до 25000 рублей
2571 голос, 9.0%
До 10000 рублей
5211 голосов, 18.2%
Нисколько, я пират. Йо-хо-хо!
15805 голосов, 55.3%
Теги: Технологии
Аватар Evernews
Evernews
8089 подписчиков