阿里千问发布最强推理模型,性能媲美GPT-5.2

信息来源: 阿里云官方发布

1月27日,阿里巴巴正式发布千问最强推理模型Qwen3-Max-Thinking,总参数量超万亿,预训练数据量达36T Tokens。在涵盖事实知识、复杂推理、指令遵循等19项公认基准测试中,整体性能可媲美GPT-5.2和Gemini 3 Pro。

该模型采用测试时扩展机制显著提升推理效率,原生Agent能力大幅增强。Hugging Face数据显示,千问成为全球首个衍生模型数量突破20万的开源大模型,下载量突破10亿次,平均每天被开发者下载110万次。

这一突破标志着中国在大模型推理能力上首次达到世界顶尖水平,为AI应用落地提供了更强大的基础能力支持

相关快讯

QQ邮箱推出AI专属版,腾讯全面AI化

QQ邮箱推出AI专属版,腾讯全面AI化

腾讯QQ邮箱内测专为AI Agent设计的“Agently Mail”。它为Agent提供独立邮箱身份,与个人邮箱数据隔离,解决了以往授权主邮箱带来的隐私风险。支持OAuth授权及CLI一键配置,已适配Cursor、Claude Code等...
mp.weixin.qq.com
2026-06-25
Google发布Gemini 3.5 Pro:200万上下文与Deep Think模式

Google发布Gemini 3.5 Pro:200万上下文与Deep Think模式

Google发布Gemini 3.5 Pro模型,上下文窗口扩展至200万Tokens,可一次性处理整本书或长篇合同。新增Deep Think模式解决复杂推理问题。对长文档处理需求的研究者和开发者极具吸引力,但实际效果与成本仍需观察。
X
2026-06-24

美国政府发出口管制令,Anthropic全面下线Fable 5与Mythos 5

美国商务部对Anthropic的Fable 5和Mythos 5实施出口管制,禁止境外出口及境内外国人访问。因无法按国籍精确切分用户,Anthropic被迫对所有客户全面下线这两款模型。导火索疑似某公司声称越狱模型,政府仅提供口头证据。目前...
mp.weixin.qq.com
2026-06-13
Anthropic 发布 Claude Fable 5:Mythos 级模型首次公开

Anthropic 发布 Claude Fable 5:Mythos 级模型首次公开

Anthropic 正式推出 Claude Fable 5,这是此前备受关注的 Mythos 网络安全大模型的公开版。官方称其能力超越以往任何公开模型,擅长长周期复杂任务。为确保通用安全,公开版加入了严格防护,网络操作权限低于专供版,防止滥...
X
2026-06-10

暂无评论

none
暂无评论...