
A Meta Platforms (Nasdaq: META) anunciou uma nova leva de modelos avançados de inteligência artificial que reforçam sua aposta em ampliar os limites da visão computacional, do processamento de linguagem natural e da robótica. Entre os lançamentos estão tecnologias como Perception Encoder, Perception Language Model (PLM), Meta Locate 3D, Dynamic Byte Latent Transformer e Collaborative Reasoner, cada uma voltada a desafios específicos da IA moderna.
O Perception Encoder se destaca por sua capacidade de interpretar informações visuais em imagens e vídeos. Segundo a Meta, ele supera modelos anteriores em tarefas de classificação e busca zero-shot, sendo capaz de identificar animais em seus habitats naturais com precisão. A empresa afirma que, ao ser combinado com modelos de linguagem de grande escala, o Perception Encoder também apresentou melhorias notáveis em tarefas linguísticas.
Já o Perception Language Model (PLM) é um modelo de código aberto treinado com uma combinação de dados humanos e sintéticos, capaz de lidar com tarefas complexas de reconhecimento visual. Com versões que chegam a até 8 bilhões de parâmetros, o PLM foi lançado junto com o PLM-VideoBench, um novo benchmark voltado à compreensão de atividades e raciocínio fundamentado em tempo e espaço.
Meta Platforms
No campo da robótica, o Meta Locate 3D oferece avanços na localização de objetos em ambientes tridimensionais com base em comandos em linguagem natural, o que pode facilitar o desenvolvimento de robôs mais autônomos. A tecnologia chega acompanhada de um conjunto de dados com 130 mil anotações em linguagem, destinado a acelerar pesquisas nesse segmento.
Outro destaque é o Dynamic Byte Latent Transformer, que adota uma arquitetura baseada em bytes em vez de tokens para aumentar a eficiência no processamento de linguagem. Segundo a Meta, o modelo atinge desempenho comparável ao de modelos tradicionais e agora está disponível publicamente.
A empresa também apresentou o framework Collaborative Reasoner, que tem como objetivo criar agentes de IA capazes de colaborar com humanos e com outros agentes inteligentes. O sistema inclui tarefas complexas que envolvem múltiplas etapas de raciocínio e interações em vários turnos. Para estimular a pesquisa, a Meta liberou o pipeline completo de dados e modelagem como código aberto.
A iniciativa reforça a estratégia da Meta de liderar o desenvolvimento de modelos de IA abertos e avançados, aplicáveis em diversas áreas como educação, assistência virtual, automação e pesquisa científica.
O post Meta apresenta novos modelos de IA apareceu primeiro em Capitalist.