Лучшее  🚀
16.07.2024 в 19:59 Evernews

СМИ: Apple, Nvidia и другие компании обучали ИИ на роликах с YouTube без разрешения

За сбор датасетов якобы отвечала сторонняя компания.

Кстати, на сайте читать удобнее

Крупные корпорации, включая Apple и Nvidia, могли использовать ролики с YouTube для обучения своих нейросетей, пишет редакция Proof News в своем расследовании. По данным издания, ролики использовались без разрешения их создателей.

Согласно подсчетам журналистов, в датасете, использованном корпорациями, есть субтитры к 173536 роликам с YouTube, взятым с более чем 48 тысяч каналов. Представители Apple, Nvidia и некоторых других компаний не ответили на вопросы издания.

В то же время достоверность датасета подтвердили в Anthropic и Salesforce. Обе компании действительно использовали его для обучения своих моделей.

Предполагается, что датасет собран некоммерческой организацией EleutherAI, декларируемая задача которой — помогать разработчикам с обучением нейросетей. Представители компании тоже не стали общаться с журналистами.

Интересный момент: источники The New York Times считают, что ролики с YouTube использовались и для обучения GPT-4. Примечательно, что пользовательское соглашение YouTube запрещает несанкционированное сканирование или скачивание видеороликов.

Читать далее