Novos TPUs: Mais Rápidos e Eficientes
O Google Cloud anunciou na quarta-feira sua oitava geração de chips de IA personalizados, conhecidos como Tensor Processing Units (TPUs). A nova geração será dividida em duas versões especializadas: o TPU 8t, otimizado para o treinamento de modelos de inteligência artificial, e o TPU 8i, focado em inferência, que é o processo de usar os modelos já treinados.
A empresa destaca avanços significativos de desempenho em comparação com as gerações anteriores:
- Treinamento de modelos de IA até 3x mais rápido.
- Melhora de 80% no desempenho por dólar investido.
- Capacidade de conectar mais de 1 milhão de TPUs para trabalharem juntos em um único cluster.
O objetivo é oferecer um poder computacional muito maior com um consumo de energia e custo consideravelmente menores para os clientes.
A Relação Complexa com a Nvidia
Apesar do investimento em seus próprios chips, o movimento do Google não representa um ataque direto ao domínio da Nvidia. Assim como outros gigantes da nuvem, como Microsoft e Amazon, o Google está usando esses chips customizados para complementar, e não substituir, os sistemas baseados em Nvidia que oferece em sua infraestrutura.
Na verdade, o Google reforçou sua parceria, prometendo que sua nuvem disponibilizará o mais novo chip da Nvidia, o Vera Rubin, ainda este ano. A estratégia parece ser a de que, um dia, conforme as empresas migrem suas cargas de trabalho de IA para a nuvem, a dependência da Nvidia possa diminuir.
Contudo, a realidade atual mostra que apostar contra a Nvidia não tem sido um bom negócio. Um analista de mercado de chips relembrou que, em 2016, previu que os TPUs do Google poderiam ser uma má notícia para a Nvidia. Hoje, a Nvidia é uma empresa com um valor de mercado de quase 5 trilhões de dólares, mostrando que aquela previsão não se concretizou.
Para fortalecer ainda mais a colaboração, o Google informou que trabalhará com a Nvidia para otimizar a tecnologia de rede Falcon. O objetivo é fazer com que os sistemas baseados em Nvidia tenham um desempenho ainda mais eficiente dentro do Google Cloud, consolidando uma relação de cooperação e competição.



