NVIDIA ha introdotto una rete neurale per la generazione di video in base alla descrizione

Miscellanea / by admin / April 20, 2023

click fraud protection

Se volevi guardare uno stormtrooper imperiale aspirare la spiaggia.

Azienda NVIDIA annunciato un nuovo modello AI di VideoLDM che crea brevi video basati sul testo. È stato sviluppato in collaborazione con i ricercatori della Cornell University.

VideoLDM prende in considerazione fino a 4,1 miliardi di parametri, 2,7 miliardi dei quali vengono formati su video. Le clip generate possono essere fino a 2048×1280 pixel a 24 fotogrammi e avere una durata massima di 4,7 secondi.

La rete neurale è in grado di creare sia scene semplici con un paio di parole nella richiesta, sia qualcosa di più complesso. Alcuni esempi:

Fuochi d'artificio.

Uno stormtrooper sta passando l'aspirapolvere sulla spiaggia.

Un viaggiatore cammina da solo in una foresta nebbiosa al tramonto.

Altri esempi sono disponibili sito web del progetto.

Questa rete neurale NVIDIA non è ancora di pubblico dominio. È stato presentato come documento di ricerca nell'ambito della conferenza sulla visione artificiale e il riconoscimento dei modelli.

instagram viewer

Gli sviluppatori hanno notato progressi impressionanti e rapidi nell'apprendimento, ma non hanno parlato del possibile futuro della rete neurale. Tuttavia, possiamo presumere che presto avremo un analogo video a tutti gli effetti metà viaggio.