Tecnologia

Alibaba lança Qianwen 3 e assume liderança entre modelos de IA de código aberto

Alibaba lança Qwen3 e lidera IA de código aberto
Fonte da imagem: Logo da Qwen/ Alibaba Group

O Alibaba anunciou nesta terça-feira, 29, o lançamento da nova geração do modelo de inteligência artificial Tongyi Qianwen Qwen3 (Qianwen 3), agora disponibilizado como código aberto. Desenvolvido pela Alibaba Cloud, o Qianwen 3 é apresentado como o primeiro modelo de “raciocínio híbrido” da China, ao combinar mecanismos de “pensamento rápido” e “pensamento lento” em uma mesma arquitetura.

Com apenas um terço do número de parâmetros do DeepSeek-R1, o Qianwen 3 oferece alto desempenho com custo significativamente reduzido. Segundo a empresa, o modelo supera concorrentes de peso como o R1 e o OpenAI-o1 em rankings como o ChatBot Arena, consolidando-se como o modelo de código aberto mais potente do mundo até o momento.

Um dos principais diferenciais do Qianwen 3 está na integração entre modos pensante e não pensante. Isso possibilita respostas rápidas e eficientes para demandas simples, utilizando menos poder computacional, e raciocínio aprofundado em múltiplas etapas para problemas mais complexos. Essa flexibilidade aprimora a capacidade do modelo de gerenciar de forma estável e eficiente o chamado “orçamento pensante”, adaptando-se ao nível de exigência de cada tarefa.

De acordo com a Alibaba Cloud, o modelo Qianwen 3 alcança um expressivo equilíbrio entre desempenho e eficiência. Apesar das melhorias significativas em performance, o custo de implantação foi consideravelmente reduzido. A versão completa do Qianwen 3 pode ser executada com apenas quatro unidades H20, e o consumo de memória de vídeo representa apenas um terço do necessário pelo DeepSeek-R1.

Atualmente, o Qianwen 3 tem dois modelos MoE 30B e 235B de código aberto, bem como seis modelos densos, incluindo 0,6B, 1,7B, 4B, 8B, 14B e 32B. O Alibaba Cloud revelou que o modelo MoE de 30B parâmetros do Qianwen 3 alcançou mais de 10 vezes a melhoria na alavancagem de desempenho do modelo, e somente a ativação de 3B pode atingir o desempenho do modelo Qwen2.5-32B da geração anterior. Todos os modelos Qianwen 3 são modelos de inferência híbridos. A API pode definir o “orçamento de pensamento” (ou seja, o número máximo esperado de tokens para pensamento profundo) sob demanda, atendendo de forma flexível aos diversos requisitos de desempenho e custo de aplicativos de IA e diferentes cenários.

Com o lançamento em código aberto, o modelo Qianwen 3 da Alibaba está agora acessível para desenvolvedores e empresas. Os usuários podem baixar o modelo e utilizá-lo comercialmente por meio de plataformas como MoDa Community e Hugging Face. Também é possível acessar o Qianwen 3 via API por meio do serviço Bailian, da Alibaba Cloud. Além disso, usuários individuais podem experimentar as capacidades do modelo diretamente pelo aplicativo Tongyi, ampliando o alcance da tecnologia tanto para fins corporativos quanto pessoais.

No futuro, o Qianwen 3 aprimorará o modelo otimizando a arquitetura do modelo e os métodos de treinamento para atingir vários objetivos principais: expandir a escala de dados, aumentar o tamanho do modelo, estender o comprimento do contexto, ampliar o intervalo modal e usar o feedback ambiental para promover o aprendizado por reforço para raciocínio de longo prazo.

Fonte: Yicai Global