Суд обязал OpenAI раскрыть переписку об удалении пиратских книг
Предполагается, что датасеты использовались для обучения моделей компании.
OpenAI придется раскрыть переписку сотрудников компании, касающуюся удаления датасетов Books1 и Books2. Эти датасеты были созданы в 2021 году на основе пиратской библиотеки Library Genesis.
Переписка будет раскрыта в рамках коллективного иска писателей, поданного против OpenAI. Истцы утверждают, что их произведения были незаконно использованы при обучении моделей компании.
Документы подтверждают, что OpenAI действительно удалила датасеты Books1 и Books2 до публичного запуска ChatGPT в 2022 году, однако причины этого шага остаются неясными.
По версии OpenAI, датасеты были удалены, потому что не использовались компанией. Истцы предлагают другую версию: так OpenAI хотела скрыть следы нарушения авторских прав.
Примечательно, что после начала разбирательства OpenAI заявила, что причины удаления датасетов защищены адвокатской тайной. Это вызвало дополнительные подозрения в попытке сокрытия информации.
Теперь OpenAI обязана передать суду все переписки, касающиеся решения об удалении датасетов, а также все сообщения, в которых упоминается библиотека Library Genesis. Данные надо подготовить до 8 декабря.
Если выяснится, что OpenAI действительно нарушала авторские права при обучении моделей, то за каждое нарушение компании может грозить штраф до $150 тысяч.
- Disney вложит в OpenAI $1 миллиард и разрешит появление своих персонажей в Sora
- СМИ: OpenAI экстренно улучшает ChatGPT из-за конкуренции со стороны Google и Anthropic
- Духан в Хогвартсе: братья Фелпс вспомнили съемки в «Гарри Поттере» и запах вонючих носков
- OpenAI получила кусочек подразделения своего инвестора
- В коде приложения ChatGPT нашли намеки на показ рекламы

