在农历除夕夜,全球华人共庆新春佳节之际,阿里巴巴集团在纽约证券交易所的电子屏上,股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后,是阿里巴巴在AI技术领域的一次重大突破——Qwe2.5-Max模型的发布。
1月29日凌晨,阿里通义千问团队悄然上线了大模型Qwe2.5-Max。在多个权威基准测试中,Qwe2.5-Max展现出与全球顶级模型比肩的性能,甚至超越了DeepSeek V3。这是继DeepSeek之后,中国AI阵营在高性能、低成本技术路线上的又一重要突破。
Qwe2.5-Max采用超大规模MoE(混合专家)架构,基于超过20万亿oke的预训练数据。这一数据规模在业界属于领先水平,为模型的性能提供了强大的基础。在MMLU-Pro、LiveCodeBech、LiveBech以及Area-Hard等多个权威评测中,Qwe2.5-Max均展现出与DeepSeek V3、GPT-4和Claude-3.5-Soe比肩甚至领先的性能。
Qwe2.5团队同步发布了两个创新型号:Qwe2.5-7b-isruc-1m和Qwe2.5-14b-isruc-1m。这些开源模型支持高达100万oke的上下文窗口,成为业内首个达到此规模的公开可用模型。这些模型使用稀疏注意力,处理百万oke输入的速度比传统方法快3到7倍,输出长度可达8000个oke。
Qwe2.5-Max在多个使用场景上展示了其强大的多模态能力。例如,在联网搜索功能中,输出的每句话来源出处都有标注,整体运行也很丝滑。在代码能力上,Qwe2.5-Max能够帮助用户完成各种可视化创作,一句话就能做出旋转的球体,甚至可以开发各种小应用、小游戏。
目前,Qwe2.5-Max已在Qwe Cha中上线,开发者也可在Qwe Cha平台中免费体验最新模型。此外,企业可在阿里云百炼调用Qwe2.5-Max模型的API服务,进一步推动AI技术在各个领域的应用。
随着Qwe2.5-Max的发布,中国AI资产的重估时机是否已至?市场人士分析称,此前过度聚焦DeepSeek,忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体认为,若阿里Qwe-2.5-max的确性能超过V3,可以对其RL推理模型给予更大期待。
2月4日凌晨,三方基准测试平台Chabo Area公布了最新的大模型盲测榜单,Qwe2.5-Max超越DeepSeek V3、o1-mii和Claude-3.5-Soe等模型,以1332分位列全球第七名,也是非推理类的中国大模型冠军。这一成绩再次证明了Qwe2.5-Max的强大实力。
:阿里除夕