O Google Cloud anunciou na quarta-feira sua oitava geração de chips de IA personalizados, conhecidos como unidades de processamento tensorial (TPUs), que será dividida em duas versões. Um chip, chamado TPU 8t, será voltado para o treinamento de modelos, enquanto o outro, o TPU 8i, será destinado à inferência.
A inferência corresponde ao uso contínuo dos modelos, ou seja, o que acontece depois que os usuários enviam seus prompts.
Desempenho e Eficiência Aprimorados
A empresa destaca especificações de desempenho impressionantes para esses novos TPUs em comparação com as gerações anteriores. Eles prometem um treinamento de modelos de IA até 3 vezes mais rápido, uma melhoria de 80% no desempenho por dólar e a capacidade de fazer mais de 1 milhão de TPUs trabalharem juntos em um único cluster. O resultado esperado é um poder de computação muito maior com um consumo de energia e custo significativamente menores para os clientes.
Não é um Adeus à Nvidia
No entanto, os chips do Google não representam um ataque frontal ao futuro da Nvidia, pelo menos por enquanto. Assim como outros gigantes da nuvem, incluindo a Microsoft e a Amazon, o Google está usando esses chips para suplementar os sistemas baseados em Nvidia que oferece em sua infraestrutura, e não para substituí-los completamente. Na verdade, o Google promete que sua nuvem disponibilizará o mais recente chip da Nvidia, o Vera Rubin, ainda este ano.
A Tendência dos Chips Próprios
Um dia, os provedores de nuvem que estão construindo seus próprios chips de IA (o que inclui Amazon, Microsoft e Google) podem diminuir sua dependência da Nvidia, à medida que as empresas movem suas necessidades de IA para a nuvem e adaptam seus aplicativos para esses novos chips. Contudo, na situação atual, apostar contra a Nvidia não parece ser uma estratégia lucrativa.
Como o renomado analista de mercado de chips, Patrick Moorhead, publicou em tom de brincadeira no X, ele havia previsto em 2016 que os TPUs do Google poderiam ser uma má notícia para a Nvidia. Hoje, com a Nvidia sendo uma empresa com valor de mercado de quase 5 trilhões de dólares, essa previsão não se concretizou.
Colaboração Estratégica
Se tudo correr conforme o plano da Nvidia, o crescimento do Google como provedor de nuvem para IA resultará em mais negócios para a fabricante de chips, e não menos, mesmo que muitas cargas de trabalho rodem nos chips do próprio Google. De fato, o Google também anunciou que colaborará com a Nvidia para aprimorar a tecnologia de rede definida por software chamada Falcon, que o Google criou e tornou de código aberto em 2023, visando otimizar ainda mais o desempenho de sistemas baseados em Nvidia em sua nuvem.



