Google presenta Veo e Imagen 3, i suoi ultimi modelli di creazione multimediale AI

Google presenta Veo e Imagen 3, i suoi ultimi modelli di creazione multimediale AI

Tutto sempre AI su Google I/O! Google ha annunciato oggi i suoi nuovi motori di creazione multimediale AI: Veo, in grado di produrre video 1080p di “alta qualità”; e Imagen 3, l'ultimo framework da testo a immagine. Nessuno dei due sembra particolarmente rivoluzionario, ma sono un modo per Google di continuare la lotta contro il modello video Sora di OpenAI e Dall-E 3, uno strumento che è diventato praticamente sinonimo di immagini generate dall'intelligenza artificiale.

Google afferma che Veo ha una “comprensione avanzata del linguaggio naturale e della semantica visiva” per creare qualsiasi video tu abbia in mente. I video generati dall'intelligenza artificiale possono durare “più di un minuto”. Veo è anche in grado di comprendere tecniche cinematografiche e visive, come il concetto di time lapse. Ma in realtà, questa dovrebbe essere la posta in gioco per un modello di creazione video basato sull’intelligenza artificiale, giusto?

Per dimostrare che Veo non intende rubare il lavoro agli artisti, Google ha anche collaborato con Donald Glover e Gilga, il suo studio creativo, per dimostrare le capacità del modello. In un brevissimo video promozionale, vediamo Glover e la troupe usare la sceneggiatura per creare un video di una decappottabile che arriva in una casa europea e di una barca a vela che scivola attraverso l'oceano. Secondo Google, Veo può simulare la fisica del mondo reale meglio dei suoi modelli precedenti e ha anche migliorato il modo in cui visualizza filmati ad alta definizione.

“Tutti diventeranno registi e tutti dovrebbero essere registi”, dice Glover nel video, guadagnandosi lo stipendio da Google. “Al centro di tutto questo c'è solo la narrazione. Più ci avviciniamo alla possibilità di raccontarci le nostre storie, più ci capiamo.”

Resta da vedere se qualcuno vorrà davvero guardare video generati dall’intelligenza artificiale, al di là della morbosa curiosità di vedere una macchina tentare di ricreare algoritmicamente il lavoro di artisti umani. Ma ciò non impedisce a Google o OpenAI di promuovere questi strumenti e sperare che siano utili (o almeno guadagnino un sacco di soldi). Veo sarà disponibile oggi all'interno dello strumento VideoFX di Google per alcuni creatori e la società afferma che arriverà anche su YouTube Shorts e altri prodotti. Se Veo diventasse parte integrante di YouTube Shorts, questa sarebbe almeno una funzionalità che Google potrebbe superare TikTok.

GoogleIo2024

Google

Per quanto riguarda Imagen 3, Google sta facendo le solite promesse: si dice che sia il modello testo-immagine della “più alta qualità” dell'azienda, con un “straordinario livello di dettaglio” per “immagini realistiche e realistiche” e meno artefatti. Il vero test, ovviamente, sarà vedere come gestisce i prompt rispetto al Dall-E 3. Google afferma che Imagen 3 gestisce il testo meglio di prima ed è anche più agile nel gestire i dettagli dei prompt lunghi.

Google sta anche collaborando con artisti del calibro di Wyclef Jean e Bjorn per testare Music AI Sandbox, un insieme di strumenti che possono aiutare a creare canzoni e ritmi. Ne abbiamo visto solo un rapido assaggio, ma ha portato ad alcune demo interessanti:

Il sole sorge e tramonta. Stiamo tutti morendo lentamente. E l’intelligenza artificiale diventa ogni giorno più intelligente. Questo sembra essere il risultato più importante degli ultimi strumenti di creazione multimediale di Google. Ovviamente stanno migliorando! Google sta spendendo miliardi per trasformare il sogno dell’intelligenza artificiale in realtà, nel tentativo di conquistare il prossimo grande passo avanti nel campo dell’informatica. Tutto ciò migliorerà davvero la nostra vita? Saranno in grado di produrre arte con vero spirito? Controlla il Google I/O ogni anno finché l'intelligenza generale artificiale (AGI) non emergerà effettivamente o la nostra civiltà non crollerà.

Segui tutte le novità del Google I/O 2024 in diretta Qui!

READ  Apple WWDC 2022: cosa aspettarsi

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *