Вышел генератор музыки Stable Audio 2.0 — послушайте, что он умеет
Разработчики открыли исходники, но не веса модели.
Кстати, на сайте читать удобнее
Стартап Stability AI, создавший нейросеть-генератор изображений Stable Diffusion, выпустил новую версию Stable Audio. Это генератор музыки, пытающийся конкурировать с популярным приложением Suno.
Stable Audio 2.0 умеет генерировать треки продолжительностью до трех минут. Поэкспериментировать с возможностями нейросети можно на сайте проекта, также команда Stability AI запустила стрим на YouTube, музыку для которого генерирует Stable Audio 2.0.
Есть нюанс: нынешняя версия Stable Audio 2.0 генерирует только музыку. Нейросеть не сумеет, как это делает Suno, сгенерировать полноценную песню или озвучить слова; впрочем, иногда в сгенерированных треках появляется что-то похожее на вокал.
Другой интересный момент: разработчики Stable Audio 2.0 открыли исходники проекта, но пока не стали выкладывать веса модели, то есть дообучить нейросеть не получится. Кроме того, доступна небольшая статья, описывающая техническую часть нейросети.