Sakana AI lança Fugu: sistema multi-agente que supera modelos monolíticos

Tempo de leitura: 5 minutesSakana AI lança Fugu, sistema de orquestração multi-agente que supera modelos como Claude Fable 5 em benchmarks, oferecendo alternativa resiliente contra vendor lock-in e restrições geopolíticas.

22 de junho de 2026

modelos-llmClaudeFuguInteligência ArtificialModelos de LinguagemOrquestração de IASakana AISistemas Multi-Agente

Sakana AI lança Fugu: sistema multi-agente que supera modelos monolíticos

Autor

Justine Vaz
Ver perfil e artigos do autor

Tempo de leitura: 5 minutes

Introdução

Em um movimento estratégico que pode redefinir como empresas implementam inteligência artificial em escala, a startup japonesa Sakana AI lançou o Fugu, um sistema de orquestração multi-agente que promete entregar performance de ponta sem depender de um único fornecedor de modelo. O lançamento ganha relevância especial após a Anthropic ter bloqueado acesso público aos seus modelos mais poderosos, Claude Fable 5 e Claude Mythos 5, em resposta a controles de exportação do governo americano. Para empresas brasileiras que buscam implementar IA de forma resiliente e sem riscos de vendor lock-in, o Fugu representa uma alternativa arquitetural fundamentalmente diferente dos modelos monolíticos tradicionais.

A arquitetura revolucionária do Fugu

Diferentemente de modelos como GPT-5.5 ou Claude Opus que processam requisições internamente, o Fugu funciona como um maestro orquestrando uma sinfonia de modelos especializados. Quando recebe uma tarefa complexa, o sistema não tenta resolvê-la sozinho. Em vez disso, ele decompõe o problema em subtarefas, delega cada parte para modelos específicos de seu pool, verifica os resultados e sintetiza a resposta final.

David Ha, CEO e cofundador da Sakana AI e ex-pesquisador do Google Brain, explicou que o Fugu é ele próprio um LLM treinado para chamar vários LLMs em um pool de agentes, incluindo instâncias de si mesmo recursivamente. Essa abordagem se baseia em dois papers de pesquisa da Sakana de 2026: TRINITY e Conductor, que estabeleceram as bases para estratégias de coordenação aprendidas em vez de workflows desenhados manualmente.

A empresa oferece duas variantes do sistema. O Fugu padrão é otimizado para tarefas cotidianas com baixa latência, ideal para chatbots interativos e ambientes de programação. Já o Fugu Ultra foi projetado para tarefas complexas e de alto risco, como pesquisa em IA, análise de cibersegurança e investigações de patentes em múltiplas etapas.

Performance que desafia gigantes do mercado

Os benchmarks divulgados pela Sakana mostram resultados impressionantes. No LiveCodeBench, teste que avalia performance em programação com problemas atualizados regularmente, o Fugu Ultra alcançou 93.2 pontos, superando o Claude Fable 5 que obteve 89.8. No GPQA-Diamond, conjunto de 198 questões de nível de pós-graduação em biologia, física e química, o Fugu atingiu 95.5 pontos, ultrapassando o Claude Mythos Preview que marcou 94.6.

No entanto, é importante contextualizar esses resultados. Em tarefas que exigem raciocínio bruto em domínios altamente específicos, modelos monolíticos de ponta ainda mantêm vantagem. Por exemplo, no teste Humanity’s Last Exam, o Fugu Ultra (50.0) ficou atrás do Fable 5 (53.3). No benchmark de cibersegurança CTI-REALM, o Claude Opus 4.8 permaneceu como líder com 69.6 pontos contra 69.4 do Fugu Ultra.

Testes práticos realizados pela comunidade de desenvolvedores revelaram trade-offs interessantes. Mark Santos, proprietário de uma agência criativa, comparou Fugu Ultra e Claude Opus 4.8 na tarefa de construir um clone do jogo Crossy Road usando Three.js. O Fugu completou a tarefa em 22 minutos usando aproximadamente 89 mil tokens por US$ 7,32, mas com alguns erros de lógica no jogo final. O Claude Opus levou 79 minutos, consumiu 940 mil tokens custando US$ 37,85, e precisou de intervenção humana, mas produziu um resultado com melhor design e funcionalidade.

Modelo de negócios e precificação

A Sakana oferece o Fugu através de uma API proprietária compatível com o padrão OpenAI, facilitando a integração para desenvolvedores já familiarizados com esse ecossistema. O serviço está disponível em dois modelos de cobrança: assinaturas mensais e pagamento por uso.

As assinaturas mensais incluem três níveis: Standard (US$ 20/mês) para workflows leves, Pro (US$ 100/mês) com 10x o uso padrão, e Max (US$ 200/mês) oferecendo 20x o uso para tarefas contínuas. Para escala empresarial, o modelo pay-as-you-go cobra US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída no Fugu Ultra, com preços dinâmicos baseados nos modelos ativados para o Fugu padrão.

Comparado a outros modelos de ponta, o Fugu Ultra se posiciona na faixa superior de preços, equiparando-se ao GPT-5.5 da OpenAI. É importante notar que a cobrança inclui todos os tokens consumidos internamente quando o Fugu delega subtarefas, verifica código ou roteia entre agentes – esses tokens de orquestração não são absorvidos pelo provedor.

Implicações para o mercado brasileiro

Para empresas brasileiras, o Fugu oferece vantagens estratégicas significativas. A primeira é a resiliência operacional: ao orquestrar múltiplos modelos de diferentes provedores, o sistema constrói redundância nativa na infraestrutura de IA. Se um provedor sofrer interrupção ou enfrentar restrições regulatórias súbitas, o Fugu roteia automaticamente para alternativas, mantendo a continuidade do serviço.

Essa arquitetura é especialmente relevante considerando a volatilidade geopolítica atual. Como demonstrou o caso recente da Anthropic, acesso a modelos de ponta pode desaparecer da noite para o dia devido a controles de exportação. Para empresas que dependem de IA para operações críticas, ter uma camada de abstração que pode dinamicamente substituir modelos bloqueados é uma vantagem competitiva importante.

Além disso, o Fugu permite que empresas mantenham conformidade com políticas de dados corporativas. Desenvolvedores podem explicitamente excluir modelos ou provedores específicos do pool de roteamento do Fugu, garantindo que dados sensíveis não sejam processados por serviços não autorizados. Usuários também podem optar por não ter seus prompts usados para treinamento futuro.

Limitações e considerações técnicas

É crucial entender que o Fugu não é uma solução universal. Como observou o desenvolvedor Chris no X (antigo Twitter), para um prompt único e limpo, usar diretamente modelos como Fable 5 ou GPT-5.5 provavelmente seria mais eficiente. O valor real do Fugu emerge em ambientes complexos e multi-etapas que envolvem delegação, verificação, síntese, revisão de código ou loops de pesquisa.

Outro ponto importante levantado por Elie Bakouch, engenheiro de pesquisa na Prime Intellect, é que o Fugu é um orquestrador de código fechado sobre modelos de código fechado. Empresas que buscam soberania total sobre sua infraestrutura de IA podem considerar isso uma limitação, já que não controlam nem os modelos nem como eles são selecionados.

Geograficamente, o Fugu está temporariamente indisponível na União Europeia e Área Econômica Europeia enquanto a Sakana trabalha para alinhar sua arquitetura de roteamento black-box com as regulamentações GDPR. Isso pode ser um impedimento para empresas brasileiras com operações significativas nesses mercados.

O contexto da Sakana AI

A Sakana AI foi fundada em Tóquio em 2023 por Llion Jones, coautor do paper fundamental do Google de 2017 ‘Attention Is All You Need’ que introduziu a arquitetura transformer, e David Ha, ex-chefe de pesquisa da Stability AI. Desiludidos com a burocracia das grandes empresas de tecnologia e a fixação da indústria em escalar modelos únicos e massivos, os fundadores construíram a Sakana em torno de princípios de biomimética e computação evolutiva.

O nome da empresa, derivado da palavra japonesa para peixe, reflete sua tese técnica central: utilizar inteligência coletiva de ‘cardume’ em vez de força bruta computacional. Após uma avaliação de US$ 2,6 bilhões em sua rodada Série B no final de 2025 e o lançamento recente do Marlin – um agente de pesquisa autônomo de oito horas para o setor B2B – o Fugu representa a comercialização da tecnologia de roteamento multi-agente da Sakana para desenvolvedores.

Conclusão

O lançamento do Fugu pela Sakana AI marca um momento importante na evolução da inteligência artificial empresarial. Ao demonstrar que sistemas de orquestração podem igualar ou superar modelos monolíticos em muitas tarefas práticas, a empresa está desafiando o paradigma dominante de que maior sempre significa melhor. Para empresas brasileiras navegando em um cenário de IA cada vez mais complexo e politizado, o Fugu oferece uma alternativa arquitetural que prioriza resiliência e flexibilidade sobre poder bruto. Embora não seja uma solução perfeita para todos os casos de uso, representa uma direção promissora para organizações que buscam implementar IA de forma robusta e sustentável, sem ficar reféns de um único fornecedor ou das vicissitudes geopolíticas que podem cortar acesso a tecnologias críticas sem aviso prévio.

Fonte original: Este artigo foi adaptado e traduzido a partir da matéria publicada em VentureBeat, disponível em https://venturebeat.com/orchestration/no-claude-fable-5-no-problem-sakana-achieves-frontier-performance-with-new-fugu-multi-model-auto-synthesis-system.