СМИ: Apple, Nvidia и другие компании обучали ИИ на роликах с YouTube без разрешения
За сбор датасетов якобы отвечала сторонняя компания.
Кстати, на сайте читать удобнее
Крупные корпорации, включая Apple и Nvidia, могли использовать ролики с YouTube для обучения своих нейросетей, пишет редакция Proof News в своем расследовании. По данным издания, ролики использовались без разрешения их создателей.
Согласно подсчетам журналистов, в датасете, использованном корпорациями, есть субтитры к 173536 роликам с YouTube, взятым с более чем 48 тысяч каналов. Представители Apple, Nvidia и некоторых других компаний не ответили на вопросы издания.
В то же время достоверность датасета подтвердили в Anthropic и Salesforce. Обе компании действительно использовали его для обучения своих моделей.
Предполагается, что датасет собран некоммерческой организацией EleutherAI, декларируемая задача которой — помогать разработчикам с обучением нейросетей. Представители компании тоже не стали общаться с журналистами.
Интересный момент: источники The New York Times считают, что ролики с YouTube использовались и для обучения GPT-4. Примечательно, что пользовательское соглашение YouTube запрещает несанкционированное сканирование или скачивание видеороликов.
- Власти Германии могут продать конфискованные биткоины на $3 миллиарда
- Создан реактивный двигатель без подвижных частей для дронов
- Новый ускоритель Starship проходит огневые испытания: фото
- Kingdom Come Deliverance 2 подарят некоторым владельцам первой игры
- Построена плавучая ветряная турбина, выдерживающая ураган 5 категории
- СМИ: OpenAI «сжато» тестировала новую модель и отпраздновала релиз еще до начала тестов