OpenAI lança novo gerador de imagens integrado ao ChatGPT

Ícone do app ChatGPT no iPhone

A OpenAI turbinou o ChatGPT com um recurso que muita gente estava esperando: agora o chatbot também gera imagens de alta qualidade. A novidade usa o modelo GPT-4o e chega para todos os usuários, desde o plano gratuito até as versões Plus, Pro e Team.

Quem já tentou criar imagens com a IA se deparava com um problema: o modelo “embaralhava” os elementos, colocando atributos nos objetos errados. Mas a OpenAI garante que o GPT-4o consegue lidar com até 20 objetos numa mesma cena sem se perder — um avanço e tanto se comparado aos 5-8 objetos dos modelos anteriores.

A geração de imagens 4o chegou.
Ela está começando a ser lançada hoje no ChatGPT e Sora para todos os usuários Plus, Pro, Team e gratuitos.

Outro drama que parece ter fim é o do texto nas imagens. Antes, quando o usuário pedia um cartaz ou um meme, as letras saíam tortas ou ilegíveis. Agora, depois de meses de ajustes, os textos ficaram mais nítidos.

A grande sacada veio da mudança na tecnologia: enquanto o DALL-E usava difusão, o GPT-4o monta as imagens como se estivesse “lendo” da esquerda pra direita. Segundo a empresa, foi justamente isso que melhorou a organização dos elementos.

As possibilidades são infinitas: dá pra criar desde diagramas científicos até posts para o Instagram, passando por anúncios publicitários e até quadrinhos com personagens. E o melhor: se a imagem não ficou perfeita, dá para editar direto no chat, pedindo para ajustar cores, remover elementos ou até mudar o estilo.

A integração com o Sora, o gerador de vídeos da OpenAI, também promete — em breve vai dar para usar essas imagens diretamente nos seus vídeos criados por IA.

De acordo com a OpenAI, foram tomados alguns cuidados: há filtros contra deepfakes impróprios, materiais ilegais e remoção de marcas d’água. Todas as imagens saem com um metadado escondido identificando que foram criadas por IA, mas sem marcas d’água que estragam a imagem.

Mas nem tudo são flores: a decisão de afrouxar um pouco as restrições de conteúdo gerou debate. O CEO 1 da empresa, Sam Altman, admitiu que o sistema pode sim gerar coisas polêmicas “dentro do razoável”, mas diz que a OpenAI quer equilibrar liberdade e responsabilidade.

Quem usa o ChatGPT já pode testar a novidade, que substituirá aos poucos o velho DALL-E. A expectativa é que o recurso seja liberado para o público de forma gradual.

Notas de rodapé

1    Chief executive officer, ou diretor executivo.
Adicionar aos favoritos o Link permanente.