A DeepSeek apresentou nesta semana o DeepSeekMath-V2, uma estrutura de treinamento capaz de verificar automaticamente o próprio raciocínio matemático. A ferramenta busca superar limitações de modelos que avaliam apenas a resposta final, especialmente em tarefas que exigem derivação passo a passo, como demonstrações de teoremas.
O sistema constrói um validador baseado em LLM (grande modelo de linguagem) que revisa automaticamente as demonstrações geradas. Além disso, gera continuamente amostras de treinamento desafiadoras, aplicando cálculos de validação estendidos para aprimorar suas capacidades de verificação.
De acordo com o IT Home, o DeepSeekMath-V2, baseado no DeepSeek-V3.2-Exp-Base, conquistou medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025 e na Olimpíada Chinesa de Matemática (CMO) de 2024. O modelo também obteve a pontuação de 118 em 120 na Competição Putnam de Matemática de 2024.
Em nota oficial, a DeepSeek afirmou que, embora ainda haja desafios a serem superados, os resultados indicam que o raciocínio matemático autoverificável representa um caminho viável para desenvolver sistemas de inteligência matemática mais confiáveis e avançados.
Fonte: ithome


Adicionar Comentário