Stable Diffusion 3 вышла, но только в виде доступа к API
Скачать и потюнить модельку пока не получится.
Кстати, на сайте читать удобнее
Стартап Stability AI открыл пользователям доступ к нейросети Stable Diffusion 3, генерирующей изображения по запросам. Пока использовать Stable Diffusion 3 можно только через API Stability AI.
Хотя пользователи могут запрашивать генерацию изображений по своим описаниям, они пока не могут запускать модель локально или дообучить ее на собственных наборах данных. В Stability AI не уточнили, когда состоится полный релиз.
В компании утверждают, что по точности следованию запросам Stable Diffusion 3 либо превосходит DALL-E 3 и Midjourney V6, либо показывает аналогичный уровень. О качестве генерации речь не идет, но оно явно повысилось.
Stable Diffusion 3 использует архитектуру Multimodal Diffusion Transformer и получила отдельные наборы весов для изображений и языковых представлений. Благодаря этому удалось улучшить качество как понимания текста, так и его генерации.
Полноценный публичный релиз Stable Diffusion 3 с возможностью дообучить модель должен состояться в ближайшее время. Более конкретные сроки не называются.
- Опубликованы веса Stable Diffusion 3 Medium — модель доступна всем желающим
- Stable Diffusion 3 полноценно выйдет 12 июня
- Manor Lords выходит в раннем доступе: что надо знать об игре и ее будущем
- Посмотрите, как делали гуля для Fallout
- Исследование: Midjourney имитирует кадры десятков фильмов и игр
- Midjourney V6 обвинили в том, что она слишком хороша — ИИ воссоздает кадры из фильмов и скриншоты