Google anuncia Veo 3, Imagen 4 e Flow com avanços em geração de mídias por IA

Google Flow

O Google anunciou hoje diversos updates em funcionalidades do Gemini, incluindo melhorias e novos recursos de geração de imagens e vídeos por IA. Dentre eles, estão o Veo 3, o Imagen 4 e o Flow, que permitem a criação de vídeos com diálogos e efeitos sonoros, filmes cinematográficos e imagens com renderização de texto aprimorada.

Os três modelos marcam avanços significativos para o Gemini e expandem os limites da geração de mídia. Segundo o Google, eles oferecem ferramentas incríveis para que todos se expressem, capacitando artistas a dar vida à sua visão criativa. A empresa fez parcerias com cineastas, músicos, artistas e criadores para oferecer os serviços de forma responsável e dar aos criadores novas ferramentas.

Veo 3

O Veo 3, modelo de geração de vídeo sucessor do Veo 2, possui como maior novidade o suporte nativo a efeitos sonoros, ruídos de fundo e diálogos entre personagens — e é o primeiro do mundo a oferecer esse recurso.

Ele aprimora a qualidade técnica dos vídeos em relação ao seu antecessor e é capaz de imitar a física do mundo real e criar diálogos com sincronização labial. Basta contar uma história curta na sua introdução para que o modelo produza um vídeo dando vida às suas palavras.

Diga adeus à era silenciosa da geração de vídeos: Apresentamos o Veo 3 — com geração de áudio nativa. 🗣
A qualidade é superior à do Veo 2 e agora você pode adicionar diálogos entre personagens, efeitos sonoros e ruído de fundo.
O Veo 3 já está disponível no @GeminiApp para assinantes do Google AI Ultra nos EUA.
#GoogleIO

Com os avanços obtidos no Veo 3, novos recursos foram adicionados ao Veo 2 baseados no trabalho com criadores e cineastas. São eles a ampliação de quadros por meio da pintura externa, a possibilidade de fornecer referências sobre personagens, cenas, objetos e estilos, controles de câmera para seus takes e a adição e remoção de objetos dos vídeos por meio de comandos.

O Veo 3 está disponível hoje para os assinantes do Google AI Ultra (oferecido inicialmente somente nos Estados Unidos) nos apps Gemini e Flow, bem como para usuários corporativos do Vertex AI.

Imagen 4

O segundo grande recurso de criação anunciado para o Gemini diz respeito à criação de imagens: o Imagen 4. A versão mais recente é capaz de criar imagens em melhor agilidade, qualidade e renderização, além de prometer mitigar os erros comuns de ortografia e tipografia observados em outras IAs e nas versões anteriores do modelo.

Ele combina a velocidade e precisão para oferecer nitidez notável em mínimos detalhes, como tecidos, gotas d’água e pelos de animais, se destacando tanto em estilos fotorrealistas quanto abstratos.

As imagens criadas pelo Imagen 4 podem ter diferentes proporções e até 2K de resolução — ideal para impressões ou apresentações. Com os recursos aprimorados de texto, ele também pode ser utilizado para criar pôsteres, cartões criativos e quadrinhos. Por mais que a IA ainda esteja suscetível a erros de digitação, a renderização de texto da nova versão se mostra significativamente melhor, de acordo com o Google.

O Imagen 4 já está disponível nos apps Gemini, Whisk, Vertex AI e nas ferramentas do Workspace (Google Slides, Vids, Docs e mais). Uma variante do modelo até dez vezes mais rápida que o Imagen 3 também deverá ser lançada em breve.

Flow

Por fim, o Google anunciou o Flow, uma nova ferramenta de criação cinematográfica projetado para criar clipes, cenas e histórias de integrando os recursos avançados de IA do DeepMind, como o Veo, o Imagen e o Gemini.

Ele foi desenvolvido especialmente para o Veo e planejado para possibilitar a transformação de grandes ideias em cenas de filmes sem gastar muito dinheiro.

Por meio do uso de linguagem natural para descrever e controlar cenas, personagens, objetos e estilos, o Flow pode gerenciar aspectos técnicos de vídeo e câmera com tecnologia de referência, manter os personagens consistentes de uma cena para outra e lidar com efeitos sonoros e diálogos por conta própria — permitindo que o usuário abuse de sua criatividade para transformar sua narrativa em produções e cenas com qualidade de cinema.

O Flow está disponível hoje para assinantes dos planos Google AI Pro e Ultra nos EUA, com suporte a mais países em breve.

Adicionar aos favoritos o Link permanente.