O Alibaba Group Holding lançou seu mais novo modelo de inferência Tongyi Qianwen QwQ-32B, afirmando que seu desempenho está no mesmo nível do DeepSeek-R1, modelo de linguagem da startup de inteligência artificial DeepSeek, que recentemente ganhou destaque global.
Segundo a Alibaba, o QwQ-32B alcançou avanços significativos por meio de aprendizado por reforço em larga escala, melhorando expressivamente suas capacidades em matemática, programação e raciocínio geral. Além disso, os custos de implementação foram drasticamente reduzidos, permitindo que o modelo seja executado até mesmo em placas de vídeo de nível consumidor, possibilitando o uso local.
Com 32 bilhões de parâmetros, o novo chatbot obteve excelente desempenho em testes de referência reconhecidos no setor, aproximando-se do modelo o1-mini, da norte-americana OpenAI, lançado em setembro do ano passado e de tamanho semelhante. A Alibaba afirma que o QwQ-32B agora pode rivalizar com o DeepSeek-R1, que possui 671 bilhões de parâmetros, dos quais 37 bilhões são ativados.
Outro destaque do QwQ-32B é a integração de capacidades avançadas de agentes inteligentes, permitindo que o modelo pense de forma crítica, utilize ferramentas de forma autônoma e ajuste seu raciocínio com base no feedback do ambiente.
O novo chatbot está disponível para download gratuito e uso comercial, e também pode ser acessado pelo Qwen Chat, versão baseada na web. Além disso, será integrado ao aplicativo Tongyi, onde os usuários poderão experimentá-lo sem custos.
Combinando potência de raciocínio e eficiência no uso de recursos, graças ao aprendizado por reforço, a equipe do Tongyi acredita que a abordagem de modelos fundamentais aliados a esse tipo de treinamento pode ser um caminho viável para o desenvolvimento da inteligência artificial geral (AGI).
Tradução: Mei Zhen Li
Fonte: Yicai Global