Meituan desafia NVIDIA com modelo de IA de 1.6T parâmetros treinado em chips chineses

Tempo de leitura: 5 minutesMeituan lança modelo de IA com 1,6 trilhão de parâmetros treinado em chips chineses, superando GPT-5.5 em programação e desafiando domínio da NVIDIA no mercado global.

30 de junho de 2026

hardware-iaChips de IAdesenvolvimento autônomoInteligência ArtificialLongCatMeituanModelos de Linguagemopen source

Meituan desafia NVIDIA com modelo de IA de 1.6T parâmetros treinado em chips chineses

Autor

Justine Vaz
Ver perfil e artigos do autor

Tempo de leitura: 5 minutes

Introdução

A gigante chinesa de delivery Meituan acaba de lançar o LongCat-2.0, um modelo de inteligência artificial com 1,6 trilhão de parâmetros que promete revolucionar o desenvolvimento de software autônomo. O que torna este lançamento verdadeiramente disruptivo não é apenas seu desempenho — que supera o GPT-5.5 da OpenAI em tarefas de programação — mas o fato de ter sido treinado inteiramente em chips chineses, sem depender das GPUs da NVIDIA que dominam o mercado global de IA.

O modelo, disponibilizado como código aberto sob licença MIT, representa um marco na independência tecnológica chinesa e oferece às empresas uma alternativa viável aos modelos proprietários americanos, especialmente em um momento em que o governo dos EUA tem restringido o acesso a seus modelos de IA mais avançados por questões de segurança nacional.

Arquitetura técnica: como funciona o LongCat-2.0

O LongCat-2.0 utiliza uma arquitetura Mixture-of-Experts (MoE) que permite escalar para 1,6 trilhão de parâmetros totais, mas ativa apenas entre 33 e 56 bilhões de parâmetros por token processado, com média de 48 bilhões. Essa abordagem é similar à utilizada pelo GPT-4 e outros modelos de fronteira, mas com otimizações específicas para tarefas de programação e desenvolvimento de software.

Uma das inovações mais significativas é a janela de contexto de 1 milhão de tokens — para comparação, o GPT-4 Turbo suporta até 128 mil tokens. Isso significa que o modelo pode processar repositórios de código inteiros, documentação extensa e históricos completos de projetos em uma única interação, algo fundamental para agentes de IA que precisam entender sistemas complexos.

A tecnologia LongCat Sparse Attention (LSA) resolve os gargalos computacionais típicos de contextos longos através de três vetores principais: indexação com consciência de streaming, indexação entre camadas e indexação hierárquica. Essas otimizações permitem que o modelo mantenha performance mesmo ao processar volumes massivos de informação.

Desempenho em benchmarks: superando gigantes americanos

Nos testes padronizados da indústria, o LongCat-2.0 demonstrou resultados impressionantes, especialmente em tarefas de engenharia de software. No benchmark SWE-bench Pro, que avalia a capacidade de resolver problemas reais de programação, o modelo chinês alcançou 59,5 pontos, superando os 58,6 do GPT-5.5 da OpenAI.

Em outras avaliações importantes, o modelo registrou 70,8 no Terminal-Bench 2.1 (simulação de operações em terminal), 77,3 no SWE-bench Multilingual (programação em múltiplas linguagens) e 73,2 no FORTE (simulador de fluxos de trabalho corporativos). Embora ainda fique atrás de modelos premium como o Claude Opus 4.8 em tarefas gerais, sua especialização em desenvolvimento autônomo o torna extremamente competitivo para aplicações específicas.

O sistema de pós-treinamento MOPD (Multi-Teacher Optimization via Mixture of Specialized Experts) divide a otimização em três clusters especializados: Agent Experts (execução estrutural e invocação de ferramentas), Reasoning Experts (lógica multi-hop e resolução de problemas STEM) e Interaction Experts (alinhamento humano e segurança). Essa segregação evita a degradação funcional comum em modelos generalistas.

Modelo de negócios: preços agressivos e cache gratuito

A estratégia comercial da Meituan é claramente voltada para conquistar market share rapidamente. Durante o período promocional, o modelo cobra apenas US$ 0,30 por milhão de tokens de entrada e US$ 1,20 por milhão de tokens de saída — valores significativamente menores que os US$ 2,50/US$ 15,00 cobrados pelo GPT-5.4 ou os US$ 5,00/US$ 25,00 do Claude Opus 4.8.

Mais revolucionário ainda é o sistema de cache gratuito: quando o modelo precisa processar repetidamente o mesmo contexto (comum em desenvolvimento de software), os hits de cache não são cobrados. Para empresas que trabalham com grandes bases de código, isso pode representar economias de 70-90% em comparação com modelos tradicionais.

A Meituan também oferece ‘Token Packs’ — pacotes pré-pagos com validade de 30 dias, vendidos em flash sales quatro vezes ao dia. Essa estratégia, comum no e-commerce chinês mas nova no mercado de IA, permite que a empresa gerencie a carga em seus clusters de ASICs enquanto oferece preços ainda mais competitivos.

Implicações geopolíticas: o fim do monopólio americano em IA

O aspecto mais disruptivo do LongCat-2.0 é ter sido treinado em um cluster de mais de 50.000 ASICs (Application-Specific Integrated Circuits) chineses, sem usar nenhuma GPU da NVIDIA. Isso prova que é possível desenvolver modelos de IA de fronteira sem depender da infraestrutura americana, algo que até agora era considerado improvável ou impossível.

Essa conquista acontece em um momento crítico. O governo dos EUA recentemente solicitou que a OpenAI limitasse o acesso aos seus novos modelos GPT-5.6 (Sol, Terra e Luna), enquanto a Anthropic foi forçada a retirar completamente do ar seus modelos Claude Fable 5 e Mythos 5. Essas restrições, motivadas por preocupações de segurança nacional, acabaram criando uma oportunidade de mercado que empresas chinesas como a Meituan estão rapidamente preenchendo.

Para a NVIDIA, isso representa uma ameaça existencial ao seu modelo de negócios. Se empresas chinesas conseguirem consistentemente treinar modelos de trilhões de parâmetros usando chips domésticos, o domínio da empresa americana no mercado de hardware para IA pode estar com os dias contados.

O que isso significa para empresas brasileiras

Para o mercado brasileiro, o LongCat-2.0 oferece oportunidades concretas. Empresas de tecnologia que dependem de APIs de IA para desenvolvimento de software agora têm uma alternativa de alto desempenho e baixo custo aos modelos americanos. A licença MIT permite uso comercial irrestrito, incluindo modificações e incorporação em produtos proprietários.

Startups e scale-ups que desenvolvem ferramentas de programação assistida por IA, plataformas de automação ou sistemas de análise de código podem se beneficiar especialmente. O modelo é otimizado para tarefas como migração de bases de código legado, detecção de bugs, geração de testes automatizados e refatoração de sistemas complexos — todas demandas crescentes no mercado brasileiro.

A janela de contexto de 1 milhão de tokens é particularmente relevante para empresas que trabalham com sistemas legados extensos, comuns em bancos e grandes corporações brasileiras. A capacidade de processar repositórios inteiros permite análises e transformações que seriam impossíveis ou proibitivamente caras com modelos tradicionais.

Meituan: de super app a potência em IA

A trajetória da Meituan ilustra a velocidade da transformação tecnológica chinesa. Fundada em 2010 como um clone do Groupon, a empresa evoluiu para se tornar o ‘super app’ dominante na China, integrando delivery de comida, avaliações locais, reservas de hotel e dezenas de outros serviços para mais de 770 milhões de usuários anuais.

Enfrentando margens comprimidas e competição intensa no mercado doméstico, a Meituan anunciou investimentos bilionários em IA e chips próprios como estratégia de diversificação. O lançamento do LongCat-Flash (560 bilhões de parâmetros) no final de 2025, seguido pelo LongCat-Flash-Thinking e agora o LongCat-2.0, demonstra que a empresa está executando essa visão com velocidade impressionante.

Ao disponibilizar esses modelos como código aberto, a Meituan não busca apenas receita direta, mas posicionar-se como player fundamental na infraestrutura global de IA — uma estratégia similar à que a Huawei usou em telecomunicações e que empresas como Alibaba e Tencent aplicam em cloud computing.

Conclusão

O lançamento do LongCat-2.0 marca um ponto de inflexão no desenvolvimento global de IA. Pela primeira vez, um modelo treinado inteiramente fora do ecossistema americano de hardware consegue não apenas competir, mas superar modelos de fronteira em tarefas específicas. Isso sinaliza o fim do monopólio tecnológico ocidental e o início de uma era multipolar no desenvolvimento de inteligência artificial.

Para empresas e desenvolvedores, as implicações são imediatas e práticas: acesso a modelos de alta performance a custos drasticamente menores, maior diversidade de opções tecnológicas e redução da dependência de fornecedores únicos. O modelo de cache gratuito e a especialização em tarefas de programação tornam o LongCat-2.0 especialmente atrativo para aplicações empresariais de desenvolvimento de software.

Mais amplamente, este lançamento confirma que as tentativas de conter o avanço tecnológico chinês através de restrições de exportação e limitações de acesso podem estar tendo o efeito oposto ao pretendido, acelerando o desenvolvimento de alternativas independentes. Para o mercado global de IA, isso significa mais competição, inovação mais rápida e, ultimamente, melhores opções para todos os usuários.

Fonte original: Este artigo foi adaptado e traduzido a partir da matéria publicada em VentureBeat, disponível em https://venturebeat.com/technology/meituan-open-sources-longcat-2-0-the-1-6t-near-frontier-agentic-coding-model-thats-been-leading-openrouter-trained-entirely-on-chinese-chips.