财联社消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型,这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。
原标题:阿里推出全新推理模型 仅1/21参数媲美DeepSeek R1
编辑:吴思 责编:廖异 审核:阮鹏程
上一篇:默茨:德国将“不惜一切代价”加强国防力量 德国默茨对俄乌态度 德国总理默茨
下一篇:欧盟将召开特别峰会讨论防务及乌克兰问题 泽连斯基将参会 泽连斯基欧盟安全会议伦敦峰会 欧盟峰会召开继续聚焦俄乌冲突