Компанията Stability AI, която разработи технологията за изкуствен интелект Stable

Изкуствен интелект композира музика. Трябва само да му кажете какво искате

Компанията Stability AI, която създаде технологията за изкуствен интелект Stable Diffusion за превръщане на текст в изображения, разгласи общественото стартиране на Stable Audio - невронна мрежа за генериране на къси аудиоклипове въз основа на текстови описания. Stable Audio се основава на същите съществени техники на изкуствения разсъдък, употребявани от Stable Diffusion за генериране на изображения.

„ Stability AI е най-известен с работата си с изображения, само че в този момент пускаме първия си артикул за основаване на музика и аудио, наименуван Stable Audio ", сподели Ед Нютън-Рекс, вицепрезидент по аудио в Stability AI. - Идеята е доста елементарна: описвате музиката или аудиото, което желаете да чуете, в текст, а нашата система го генерира вместо вас ".
-->
Ед не е нов в света на компютърната музика: през 2011 година той основава стартъпа Jukedeck, който през 2019 година е закупен от TikTok. Технологията зад Stable Audio обаче се корени не в Jukedeck, а във вътрешното изследователско студио за основаване на музика на Stability AI, наречено Harmonai, основано от Зак Евънс. Евънс изясни, че текстовият модел употребява техника, известна като аудиоконтрастно авансово образование на езика (CLAP). Аудиомоделът на Stable има към 1,2 милиарда параметъра, което е почти същото като истинската версия на Stable Diffusion за генериране на изображения.

Възможността за генериране на съществени аудио записи благодарение на технологията не е нещо ново. В предишното е бил употребен способ, наименуван символно генериране, който нормално се употребява при работа с формата MIDI (Musical Instrument Digital Interface). Възможностите за генериране на изкуствен интелект на Stable Audio разрешават на потребителите да основават нова музика оттатък повтарящите се последователности от ноти, присъщи за MIDI и символното генериране.

Stable Audio работи непосредствено с необработени аудио семпли, с цел да обезпечи по-високо качество на продукцията. Моделът е подготвен върху повече от 800 000 лицензирани музикални творби от аудиобиблиотеката AudioSparks. " Една от най-трудните задания при основаването на текстово основани модели е приемането на аудио данни, които са освен висококачествени, само че и имат подобаващи метаданни ", изясни Еванс.

Една от постоянно срещаните задания, които потребителите слагат пред моделите за генериране на изображения, е да ги стилизират по този начин, че да наподобяват на избран реализатор. В случая на Stable Audio обаче потребителите няма да могат да изискат от изкуствения разсъдък да направи това - съгласно основателите на Stable Audio множеството музиканти по-скоро желаят да бъдат по-креативни.

Stable Audio ще бъде разполагаем гратис или в проект Pro за 12 $ на месец. Безплатната версия ви разрешава да създавате по 20 песни на месец с дълготрайност до 20 секунди, до момента в който Pro версията усилва броя на песните до 500, а времето им за възпроизвеждане - до 90 секунди. Последната разрешава и комерсиално потребление на творбите. Като част от стартирането на пазара, Stability Audio AI ще пусне и управление за текстови реплики.

Изкуствен интелект композира музика. Трябва само да му кажете какво искате

изкуствен интелект

интелект композира

композира музика

музика трябва

трябва само

само кажете

кажете какво

какво искате

изкуствен

интелект

композира

музика

трябва

само

кажете

какво

искате