A DeepSeek disponibilizou, nesta sexta-feira (24), a versão preliminar do modelo de inteligência artificial DeepSeek-V4. O sistema mantém a estratégia de baixo custo que levou a startup chinesa a ganhar projeção internacional no último ano e amplia a capacidade de processamento para até 1 milhão de palavras em contexto. A proposta é oferecer desempenho próximo ao de modelos avançados com menor custo de operação.
A empresa ganhou atenção global ao apresentar, anteriormente, um modelo de raciocínio com custo reduzido e desempenho comparável ao de concorrentes dos Estados Unidos. Com o V4, a DeepSeek amplia esse posicionamento ao focar em eficiência computacional e escalabilidade.
Segundo comunicado, o DeepSeek-V4 avança em áreas como raciocínio, conhecimento geral e operação de agentes. Além disso, a empresa afirma que o modelo mantém desempenho competitivo tanto no ecossistema chinês quanto entre soluções de código aberto.
Arquitetura e variantes de baixo custo
O novo modelo substitui o V3, lançado em dezembro de 2024, e chega em duas versões: DeepSeek-V4-Pro e DeepSeek-V4-Flash. A variante Flash utiliza menos parâmetros, o que reduz o custo operacional e o consumo de recursos computacionais. Com isso, a empresa amplia o acesso à tecnologia para aplicações que exigem menor investimento.
De acordo com a empresa, testes de benchmark indicam que o DeepSeek-V4-Pro supera outros modelos de código aberto em conhecimento geral. O desempenho se aproxima de sistemas como o Gemini-Pro-3.1, do Google.
Infraestrutura
A Huawei informou que o sistema Ascend Supernode, baseado no chip Ascend 950, oferece suporte ao DeepSeek-V4. A integração entre hardware e software busca reduzir custos e otimizar o desempenho do modelo.
No momento, o DeepSeek-V4 está disponível em versão preliminar para desenvolvedores e parceiros.
Fonte: zaobao.com.sg

