Modelos base da Apple Intelligence foram treinados em chips do Google

Chips TPU v5p, do Google

A Apple revelou em um novo artigo [PDF] que utilizou chips na nuvem do Google para pré-treinar os modelos de linguagem fundamentais que alimentam a Apple Intelligence, conjunto de recursos de inteligência artificial lançado hoje em fase de testes pela empresa na versão beta do iOS 18.1 para desenvolvedores.

Esses modelos base, denominados Apple Foundation Models (AFM), foram projetados para promover experiências como escrita, refinamento de texto, priorização e resumo de notificação, criação de imagens para conversação e rastreamento de atividades para simplificar a interação em apps, segundo o artigo.

Posts relacionados

  • O divórcio entre a OpenAI e a Microsoft já começou
  • Apple acredita que IA impulsionará as vendas dos “iPhones 16” no fim do ano
  • Apple apresenta conjunto mais eficiente de modelos para treinamento de IAs

No trabalho, a Apple detalhou dois desses modelos: o AFM-on-device (modelo menor, projetado para ser executado diretamente no dispositivo dos usuários) e o AFM-server (modelo maior, executado em servidores para suportar tarefas mais complexas e intensas).

De acordo com a Apple, esses modelos foram pré-treinados em chips TPUs na nuvem, uma abordagem que permitiu um treinamento de seus modelos AFM de forma eficiente e escalável — “incluindo o AFM-on-device, o AFM-server e modelos grandes” desenvolvidos pela companhia.

O AFM-on-device foi treinado em uma parcela de 2.048 chips de TPU v5p, enquanto o AFM-server em 8.192 chips de TPU v4 — ambos desenvolvidos pelo Google e comercializados pela empresa para outras companhias ou organizações visando principalmente treinamento de modelos de IA.

Como pontuado pela CNBC, o uso das TPUs do Google pode indicar um aumento na procura por alternativas à NVIDIA, que domina o lucrativo mercado de GPUs 1 projetadas para treinamento de IA e conta com clientes já consolidados nesse mercado como OpenAI, Anthropic e Microsoft.

Notas de rodapé

1    Graphics processing units, ou unidades de processamento gráfico.
Adicionar aos favoritos o Link permanente.