O Google Gemini recebeu, no início de maio, uma atualização que expandiu as funcionalidades de edição de imagem diretamente dentro do aplicativo. Com a nova ferramenta, os usuários podem enviar imagens e modificá-las por meio de comandos de texto enviados à inteligência artificial
Dessa forma, passou a permitir mudanças no fundo, inserção ou remoção de objetos, além de alterações visuais como cor do cabelo e aparência. A funcionalidade faz parte da iniciativa da empresa de tornar o Gemini um assistente de criação multimodal completo, seguindo os passos do Google AI Studio.
Leia também: Android Auto 14.0 começa a ser liberado e vem com Gemini no lugar do Google Assistente

O recurso, chamado Google Gemini AI Photo Editing, funciona de forma interativa, segundo a empresa. Após o envio da imagem, o usuário pode solicitar modificações usando linguagem natural, e o sistema responde com uma combinação de texto explicativo e imagem atualizada.
De acordo com o Google, a ferramenta utiliza a mesma tecnologia base do AI Studio, que anteriormente funcionava como uma plataforma separada para criação visual com inteligência artificial. Entretanto, ele aparece com novos recursos para entregar o resultado esperado para o usuário.
Google Gemini amplia recursos de edição por IA
Entre os comandos disponíveis, os usuários conseguem alterar o plano de fundo de uma imagem. Dessa forma, podem substituir uma sala de estar por uma praia, por exemplo. Além disso, pode remover elementos específicos. Também é possível adicionar objetos fictícios, como animais, elementos de fantasia ou itens personalizados, além de experimentar variações de aparência, como diferentes cortes e cores de cabelo.
Leia também: IA Google Gemini é capaz de remover marcas d’água em imagens
O Google informa que a ferramenta cria ou edita imagens e aplica uma marca d’água invisível chamada SynthID. Ela indica a origem artificial do conteúdo sem comprometer a qualidade visual. Além disso, a empresa afirmou que testa a aplicação de uma marca d’água visível. Isso seria uma forma adicional de combate à desinformação e ao uso indevido de imagens manipuladas.

O Google iniciou a distribuição da atualização no dia 1º de maio, de forma gradual, com suporte inicial para mais de 45 idiomas e regiões. Por isso, usuários elegíveis devem receber acesso ao longo das próximas semanas. A proposta do Google segue tendências de mercado e coloca o Gemini como concorrente direto de plataformas que já oferecem edição e geração de imagens, como ChatGPT e Microsoft Designer.
Fonte: Diyphotography

🧠 IA no idioma
Google aposta em IA do Gemini para rivalizar com Duolingo