La nuova rete neurale audio stabile genera musica in base alla descrizione testuale

Miscellanea / by admin / September 14, 2023

click fraud protection

Dai creatori di Stable Diffusion.

Stability AI, nota principalmente per le reti neurali per la generazione di immagini (Diffusione stabile, Scarabocchio stabile e non solo), rilasciato nuova rete neurale Audio stabile. Come suggerisce il nome, genera clip audio.

Schermata: Lifehacker

Tutto funziona più o meno allo stesso modo dei generatori di immagini basati su descrizioni testuali. L'utente specifica le parole chiave (ad esempio, "hip-hop lo-fi melodico, melodico, 85 BPM" o “death metal con potenti riff di chitarra e batteria veloce”), la durata desiderata e attende il risultato.

Abbiamo utilizzato come base lo stesso modello di Stable Diffusion, ma lo abbiamo addestrato su composizioni musicali invece che su immagini. In totale, le sono stati forniti circa 800mila brani dal sito di musica stock AudioSparx, ovvero circa 19.500 ore di suoni diversi.

I creatori notano che la caratteristica principale di Stable Audio è la capacità di generare composizioni di una determinata durata. In precedenza, le reti neurali funzionavano solo con una durata fissa: se venivano addestrate su clip audio di 30 secondi, potevano generare solo composizioni di 30 secondi. Per poter regolare la durata di una traccia, gli sviluppatori hanno dovuto modificare il modello e aggiungere metadati per l'inizio e la fine della composizione.

instagram viewer

Stable Audio è offerto in tre modelli. La versione gratuita ti consente di generare non più di 20 brani della durata massima di 45 secondi al mese. C'è anche un abbonamento Professional che ti consente di creare fino a 500 tracce della durata massima di 90 secondi per $ 12 al pezzo. mese (≈1.200 rubli) e l'opzione Enterprise per le aziende con la possibilità di selezionare individualmente il volume di generazione e il prezzo OK. Non è possibile utilizzare la musica generata per scopi commerciali senza un abbonamento a pagamento.

Come con altre reti neurali simili, Stable Audio si rivolge più ai creatori di contenuti che ai musicisti professionisti. Tali strumenti sono adatti per creare rapidamente musica di sottofondo per podcast e video quando non hai il tempo o il budget per collaborare con un compositore. Può anche sostituire i suoni standard se desideri risate uniche o rumori della folla.

Puoi provare Stable Audio sul sito ufficiale. Dovrai registrarti o accedere con un account Google. All'inizio potrebbero verificarsi interruzioni nell'accesso a causa del carico elevato del server.

Audio stabile →

Altre nuove reti neurali🦾✨

L'assistente virtuale AIDA di Sber diagnosticherà i pazienti nelle cliniche di Mosca
La nuova app Artisse genera fantastiche foto con il volto dell'utente
Stability AI ha introdotto il chatbot Stable Chat, un analogo gratuito di ChatGPT

Tag nuvola

Miscellanea

Valutazione

Visualizzazioni

Commenti