Por muito tempo, a divisão era clara: modelos proprietários como GPT e Claude entregavam o melhor desempenho, enquanto os open source ficavam um ou dois passos atrás. Em abril de 2026, o DeepSeek V4 tornou essa linha difícil de enxergar.
O que é o DeepSeek V4
Lançado em 24 de abril de 2026 pela empresa chinesa DeepSeek, o V4 chegou em duas versões: o V4-Pro, com 1,6 trilhão de parâmetros totais e 49 bilhões ativos por inferência, e o V4-Flash, com 284 bilhões totais e 13 bilhões ativos. Ambos usam arquitetura Mixture of Experts, licença MIT e suportam contexto de 1 milhão de tokens.
Licença MIT significa: pode ser usado comercialmente, modificado, redistribuído. Sem royalties. Sem restrições de uso por tamanho de empresa. Essa combinação — capacidade de fronteira com licença totalmente aberta — é o que torna o V4 diferente de qualquer lançamento anterior.
Arquitetura: Inovações Técnicas Reais
O DeepSeek V4 não é apenas um modelo maior. A equipe introduziu três inovações arquiteturais significativas:
A primeira é o mecanismo de atenção híbrida, combinando Compressed Sparse Attention (CSA) e Heavily Compressed Attention (HCA). O resultado prático: no contexto de 1 milhão de tokens, o V4-Pro requer apenas 27% dos FLOPs de inferência de token único e 10% do KV cache em comparação com o DeepSeek V3. Isso é relevante para quem opera infraestrutura — custo e memória caem de forma expressiva.
A segunda é o Manifold-Constrained Hyper-Connections (mHC), que substitui as conexões residuais convencionais. O objetivo é melhorar a propagação de sinal entre camadas sem sacrificar a expressividade do modelo — uma das tensões clássicas em arquiteturas profundas.
A terceira é o uso do otimizador Muon no treinamento, que proporciona convergência mais rápida e maior estabilidade. O modelo foi pré-treinado em mais de 32 trilhões de tokens.
Benchmarks: Números que Importam
O V4-Pro-Max marca 80,6% no SWE-Bench Verified — o benchmark de engenharia de software que testa a capacidade do modelo de resolver issues reais do GitHub. Para referência, o Claude Opus 4.6 marca 80,8% no mesmo benchmark. A diferença é estatisticamente irrelevante.
No LiveCodeBench, específico para programação competitiva, o V4-Pro-Max chega a 93,5 — liderando todos os modelos abertos disponíveis. Em GPQA Diamond, benchmark de raciocínio científico avançado, o modelo alcança 90,1%.
Em capacidades agênticas — execução de tarefas de múltiplos passos, uso de ferramentas, workflows de código — o V4 lidera o open source e empata na prática com os principais modelos fechados.
O Que Muda para Quem Constrói Sistemas
A combinação de benchmarks no nível fechado, licença MIT, contexto de 1 milhão de tokens e custo de US$ 0,30 por milhão de tokens de entrada via API muda o cálculo para desenvolvedores e empresas.
Até o V4, escolher um modelo open source de alto desempenho implicava em tradeoffs reais de qualidade. Agora, para a maioria dos casos de uso — coding, análise, agentes — o tradeoff desapareceu. A decisão entre fechado e aberto vira uma questão de governança e compliance, não de capacidade técnica.
Para operações de datacenter, isso tem implicações diretas. Rodar o V4-Flash (284B, 13B ativos) em infraestrutura própria é hoje uma opção viável para workloads de alto volume onde o custo por token importa. O V4-Pro exige mais hardware — mas a escolha existe.
O Contexto Geopolítico
É impossível discutir o DeepSeek sem mencionar o contexto. A empresa opera sob restrições de exportação americanas que limitam o acesso a chips de última geração. O fato de que o V4 alcança paridade com modelos treinados com orçamentos de hardware muito superiores é, por si só, um dado técnico relevante.
A eficiência de treinamento e inferência do V4 não é acidental — é consequência direta de operar com restrições que forçam inovação arquitetural. O HCA e o mHC são respostas engenhosas a limitações de compute, não features de marketing.
Open Source Atingiu a Fronteira
O DeepSeek V4 não é o único responsável por essa mudança — Llama 4, Qwen 3.5 e Gemma 4 também contribuem para o ecossistema. Mas é o modelo que mais diretamente eliminou a distinção de qualidade entre aberto e fechado nos benchmarks que importam para produção.
Em 2024, a pergunta era: "quando o open source vai chegar ao nível dos modelos proprietários?" Em 2026, com o V4, a pergunta mudou: "por que pagar pelo fechado quando o aberto já chegou lá?"
A resposta pode existir — suporte empresarial, SLAs, integrações nativas, casos específicos de uso. Mas a resposta não é mais qualidade técnica. E isso muda o mercado.
Congratulations @nascimentoab! You have completed the following achievement on the Hive blockchain And have been rewarded with New badge(s)
Your next target is to reach 900 posts.
You can view your badges on your board and compare yourself to others in the Ranking
If you no longer want to receive notifications, reply to this comment with the word
STOP