阿里千问模型Qwen3-Max-Thinking超越GPT-5.2,刷新全球推理纪录

信息来源: 阿里巴巴集团官方技术博客

阿里巴巴正式发布千问旗舰推理模型Qwen3-Max-Thinking,在多项关键性能基准测试中表现超过GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等顶尖模型。该模型总参数超万亿,进行了更大规模的强化学习后训练,通过推理技术创新实现性能飞跃。

Qwen3-Max-Thinking大幅增强了自主调用工具的原生Agent能力,同时显著降低了模型幻觉。普通用户可通过千问PC端和网页端试用新模型,移动端APP也即将接入

相关快讯

QQ邮箱推出AI专属版,腾讯全面AI化

QQ邮箱推出AI专属版,腾讯全面AI化

腾讯QQ邮箱内测专为AI Agent设计的“Agently Mail”。它为Agent提供独立邮箱身份,与个人邮箱数据隔离,解决了以往授权主邮箱带来的隐私风险。支持OAuth授权及CLI一键配置,已适配Cursor、Claude Code等...
mp.weixin.qq.com
2026-06-25
Google发布Gemini 3.5 Pro:200万上下文与Deep Think模式

Google发布Gemini 3.5 Pro:200万上下文与Deep Think模式

Google发布Gemini 3.5 Pro模型,上下文窗口扩展至200万Tokens,可一次性处理整本书或长篇合同。新增Deep Think模式解决复杂推理问题。对长文档处理需求的研究者和开发者极具吸引力,但实际效果与成本仍需观察。
X
2026-06-24

美国政府发出口管制令,Anthropic全面下线Fable 5与Mythos 5

美国商务部对Anthropic的Fable 5和Mythos 5实施出口管制,禁止境外出口及境内外国人访问。因无法按国籍精确切分用户,Anthropic被迫对所有客户全面下线这两款模型。导火索疑似某公司声称越狱模型,政府仅提供口头证据。目前...
mp.weixin.qq.com
2026-06-13

暂无评论

none
暂无评论...