Na última quinta-feira (6), a Alibaba revelou seu mais recente avanço no campo da inteligência artificial: o modelo QwQ-32B. De acordo com a empresa, a nova tecnologia é uma concorrente de peso, comparável ao modelo DeepSeek, que causou grande impacto no mercado no início deste ano.
Em uma postagem no X, a Alibaba destacou o lançamento do QwQ-32B, descrevendo-o como um modelo de raciocínio com 32 bilhões de parâmetros, rivalizando com sistemas de ponta, como o DeepSeek-R1. A postagem foi acompanhada por um gráfico de comparações de desempenho, que incluía outros modelos avançados, como o o1-mini da OpenAI. Os testes realizados incluíram tarefas de raciocínio matemático, codificação e resolução de problemas complexos.
Após o anúncio, as ações da Alibaba registraram um aumento de 8,4%, atingindo o maior valor desde o final de 2021.
Inovação Baseada em Aprendizado por Reforço
Em comunicado no blog da Qwen, braço de IA da Alibaba, a empresa explicou que o QwQ-32B utiliza uma metodologia similar à aplicada pelo DeepSeek, com foco no Scaling Reinforcement Learning (RL). Essa técnica tem o potencial de melhorar o desempenho do modelo além dos métodos convencionais de treinamento, ao permitir que o sistema aprenda por tentativa e erro, sem a necessidade de instruções externas. O RL foi destacado por sua capacidade de aprimorar significativamente o raciocínio dos modelos, como demonstrado pelo sucesso do DeepSeek-R1.
“Ao integrar dados de inicialização a frio e treinos em múltiplos estágios, conseguimos alcançar um nível de raciocínio mais profundo e complexo”, explicou a Qwen. “Esses avanços não só reforçam o potencial transformador do RL, como também abrem caminho para novas inovações em direção à inteligência artificial geral.”
Com essa aposta, a Alibaba se posiciona como um concorrente forte no crescente mercado de IA, destacando-se pela busca de soluções mais eficientes e avançadas para o desenvolvimento de modelos de inteligência artificial.