OpenAI выпустила частично открытые модели для поиска вредного контента
Модели могут использовать все желающие, но исходников нет.
Компания OpenAI выложила в открытый доступ модели gpt-oss-safeguard-120b и gpt-oss-safeguard-20b. Это доработанные версии последних публично доступных моделей OpenAI, ориентированные на поиск вредного контента.
Обе нейросети — это рассуждающие модели, по названиям ясно, что у моделей порядка 120 миллиардов и 20 миллиардов параметров. Анализируя контент, модели могут определять широкий спектр нарушений: от дезинформации до агрессивного поведения.
Модели можно адаптировать под конкретные задачи и внутренние политики организаций. В тестировании модели принимали участие Discord и SafetyKit, сам проект реализован совместно с организацией Robust Open Online Safety Tools.
Обе модели могут работать только с текстовым контентом. OpenAI не уточняет, планируется ли периодически выкладывать обновленные версии моделей, дообученные на актуальных данных, — без такого дообучения с фактчеком могут быть проблемы.
- Агент в браузере ChatGPT Atlas избегает сайты компаний, судящихся с OpenAI
- Джорджу Мартину и другим писателям разрешили подать в суд на OpenAI
- Нож не трожь: приметы на 30 октября
- Nvidia стала первой компанией с капитализацией в $5 триллионов
- OpenAI завершила реструктуризацию и заключила новое соглашение с Microsoft
- ChatGPT Go на год сделают бесплатным в Индии

