A gigante chinesa de tecnologia Alibaba lançou nesta quarta-feira (29) uma nova versão de seu modelo de inteligência artificial Qwen 2.5, afirmando que ele supera o altamente aclamado DeepSeek-V3.
O modelo, denominado Qwen 2.5-Max, foi lançado no primeiro dia do Ano Novo Chinês. Além disso, na terça-feira, a empresa disponibilizou seu modelo visual, Qwen 2.5-VL, como código aberto. No mesmo dia, a Alibaba também forneceu suporte de computação em nuvem para a transmissão ao vivo da Gala do Festival da Primavera, o tradicional programa anual que mistura música, dança, ópera, artes marciais e comédia, assistido por bilhões de pessoas.
“Qwen 2.5-Max supera quase em todos os aspectos o GPT-4o, o DeepSeek-V3 e o Llama-3.1-405B”, afirmou a unidade de nuvem da Alibaba em um comunicado publicado em sua conta oficial no WeChat, referindo-se aos modelos avançados de IA da OpenAI e da Meta.
O lançamento do assistente de IA da DeepSeek, em 10 de janeiro, alimentado pelo modelo DeepSeek-V3, bem como a recente introdução do modelo R1, causou impacto no Vale do Silício e levou a uma queda nas ações de empresas de tecnologia. O suposto baixo custo de desenvolvimento e uso da tecnologia da startup chinesa fez com que investidores questionassem os elevados gastos das principais empresas de IA dos Estados Unidos.
O sucesso da DeepSeek desencadeou uma corrida entre suas concorrentes chinesas para atualizar seus próprios modelos de inteligência artificial.
Dois dias após o lançamento do DeepSeek-R1, a ByteDance, dona do TikTok, anunciou uma atualização de seu modelo de IA principal, alegando que ele superou o modelo o1, da OpenAI, apoiada pela Microsoft, no AIME, um teste de benchmark que avalia a capacidade dos modelos de IA de compreender e responder a instruções complexas.
Essa afirmação ecoa a da DeepSeek, que declarou que seu modelo R1 rivaliza o modelo o1 da OpenAI em vários testes de desempenho.
Tradução: Mei Zhen Li
Fonte: Sina