NVIDIA ha introdotto una rete neurale per la generazione di video in base alla descrizione
Miscellanea / / April 20, 2023
Se volevi guardare uno stormtrooper imperiale aspirare la spiaggia.
Azienda NVIDIA annunciato un nuovo modello AI di VideoLDM che crea brevi video basati sul testo. È stato sviluppato in collaborazione con i ricercatori della Cornell University.
VideoLDM prende in considerazione fino a 4,1 miliardi di parametri, 2,7 miliardi dei quali vengono formati su video. Le clip generate possono essere fino a 2048×1280 pixel a 24 fotogrammi e avere una durata massima di 4,7 secondi.
La rete neurale è in grado di creare sia scene semplici con un paio di parole nella richiesta, sia qualcosa di più complesso. Alcuni esempi:
- Fuochi d'artificio.
- Uno stormtrooper sta passando l'aspirapolvere sulla spiaggia.
- Un viaggiatore cammina da solo in una foresta nebbiosa al tramonto.
Altri esempi sono disponibili sito web del progetto.
Questa rete neurale NVIDIA non è ancora di pubblico dominio. È stato presentato come documento di ricerca nell'ambito della conferenza sulla visione artificiale e il riconoscimento dei modelli.
Gli sviluppatori hanno notato progressi impressionanti e rapidi nell'apprendimento, ma non hanno parlato del possibile futuro della rete neurale. Tuttavia, possiamo presumere che presto avremo un analogo video a tutti gli effetti metà viaggio.
Leggi anche🧐
- 10 servizi di rete neurale per la creazione di video
- 7 strumenti di rete neurale per migliorare la qualità video
- Runway lancia un nuovo modello di rete neurale per la creazione di video da una descrizione testuale