Google ha collaborato con il Weizmann Institute of Science, l’Università di Tel Aviv e Technion – Israel Institute of Technology per realizzare Lumiere, un nuovo sistema di generazione di video a partire da input testuali. Questo innovativo modello di diffusione spazio-temporale, definizione coniata dai ricercatori stessi, consente di creare video partendo da brevi testi.
Nel documento ufficiale della ricerca che accompagna l’annuncio di Lumiere viene spiegato il funzionamento del modello, progettato per essere estremamente user friendly. Basta inserire nel campo di testo il soggetto, l’azione da compiere e lo stile del video desiderato e l’intelligenza artificiale si occuperà di generare movimenti realistici in base alle indicazioni fornite.
La resa dei video creati da Lumiere è straordinaria, con risultati sempre sorprendentemente realistici e fluidi. Inoltre, le potenzialità offerte dall’IA rendono Lumiere estremamente versatile, consentendo di caricare foto e animare solo determinate sezioni per creare immagini di grande impatto visivo.
Dal punto di vista tecnico, Lumiere può generare 80 fotogrammi al secondo a una risoluzione di 1024×1024 pixel ed è stato addestrato con un database di 30 milioni di video. Tuttavia, il continuo sviluppo della tecnologia promette di portare le potenzialità di Lumiere a nuovi livelli di eccellenza.