Onte comezou o Google I/O, e como vimos contando, realizáronse importantes anuncios no campo da intelixencia artificial (IA), como as novas funcionalidades que recibirá Android ou Google Fotos. Mais a cousa non quedou aí. Google presentou novos modelos de IA xerativa para a creación de vídeo, imaxes e música, destinados a creadoras de contido. Falamos de Veo, Imagen 3 e Lyria.
Veo, modelo para a xeración de vídeo
Veo é o novo modelo de xeración de vídeo de Google, capaz de xerar vídos de alta calidade con resolución de até 1080p. Poden chegar a ser de máis dun minuto, con gran diversidade de estilos visuais e cinematográficos.
Este modelo é capaz de realizar unha análise avanzada da linguaxe natural e da semántica visual, para converter as peticións en vídeos que representen a visión creativa das usuarias, renderizando con exactitude de detalles en peticións longas e captando ben a ton.
Responde con precisión a peticións de termos cinematográficomos, como timelapse ou tomas áreas, proporcionando un maior nivel de detalle. Pode así mesmo crear imaxes consistentes e coherentes, que inclúan persoas, animais e obxectos, que se moverán de forma realista a través das tomas.
No vídeo anterior poden verse algunhas mostras de vídeos creados con Veo por unha selección de creadores que participaron con Google deste proceso.
Veo está dispoñíbel desde hoxe nunha versión preliminar privada, a través de VideoFX. Con todo, Google avanza que no futuro ten previsto levar algunha das súas capacidades a YouTube Shorts.
Imagen 3, modelo para a xeración de imaxes
Pola súa banda, Imagen 3 é o modelo de Google para xerar imaxes a partir de texto. É quen de xerar un nivel de detalle próximo á fotorrealidade, con moitos menos artefactos visuais que nos modelos anteriores de Google.
Mellora no entendemento da linguaxe natural e a intención que teñen as usuarias coa petición, dominando diversos estilos. Ao tempo, Imagen 3 tamén é o mellor modelo de Google para renderizar texto, o que abre as posibilidades a xerar mensaxes personalizadas para accións cotiás, como felicitar un aniversario ou titular diapositivas.
A continuación poden observarse algunhas imaxes creadas con Imagen 3
De forma semellante a Veo, Imagen 3 está dispoñíbel para creadoras seleccionadas como unha vista previa previada dentro de ImageFX. As persoas interesadas poden rexistrarse para unirse á lista de espera.
Lyria, modelo para a xeración musical
Por último, Google tamén anunciou unha serie de colaboración con músicos, compositores e produtores para o desenvolvemento das súas tecnoloxías de música xerativa, incluída Lyria, o modelo máis avanzado para xerar música con IA.
Como parte deste traballo desenvolveron Music IA Sandbox, unha serie de ferramentas pensadas para que as persoas poidan crear novas pezas instrumentadas desde cero ou transformar o son de novos xeitos, entre outras.
Creación responsábel
É evidente que a creación de contidos (vídeos, fotos ou música) mediante intelixencia artificial pode xerar moitas dúbidas, e dar pé a usos malitencionados. Por iso Google destaca ter tomado medidas para abordar os retos que supón a súa implementación por parte de usuarias e organizacións.
Entre estas accións destaca o uso da ferramenta SynthID, que permite integrar marcas de auga dixitais imperceptíbeis en imaxes, sons, textos e vídeos xerados por IA. De feito, todos os vídeos xerados por Veo contarán con esta marca de auga.
Imaxes | Google