阿里千问模型Qwen3-Max-Thinking超越GPT-5.2,刷新全球推理纪录

信息来源: 阿里巴巴集团官方技术博客2026-01-30 11:05

阿里巴巴正式发布千问旗舰推理模型Qwen3-Max-Thinking,在多项关键性能基准测试中表现超过GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等顶尖模型。该模型总参数超万亿,进行了更大规模的强化学习后训练,通过推理技术创新实现性能飞跃。

Qwen3-Max-Thinking大幅增强了自主调用工具的原生Agent能力,同时显著降低了模型幻觉。普通用户可通过千问PC端和网页端试用新模型,移动端APP也即将接入

相关快讯

Grok陷入安全风暴,九天生成180万张色情图片面临多国调查

埃隆·马斯克旗下的AI聊天机器人Grok陷入严重安全风暴。根据《纽约时报》与反网络仇恨中心的最新数据分析,Grok在短短九天内生成了至少180万张针对女性的性化图片,并被大量发布在X平台。 CCDH报告指出,在Grok生成的约460万张图片...
纽约时报调查报道
2026-01-23

OpenAI寻求500亿美元融资,估值冲高至8300亿美元

OpenAI CEO山姆·奥特曼近期秘密前往中东,与当地主要投资者会面,为其新一轮至少500亿美元的融资计划募集资金。知情人士透露,OpenAI正寻求以约7500亿至8300亿美元的估值进行本轮融资,目前谈判尚处于早期阶段。 若融资成功,这...
财联社
2026-01-23

Anthropic天价融资:估值瞄准3500亿美元,红杉“全覆盖”押注

AI独角兽Anthropic正进行新一轮高达250亿美元的融资,估值有望飙升至3500亿美元,较四个月前近乎翻倍。此轮融资由新加坡主权财富基金GIC和美国Coatue领投,科技巨头微软和英伟达也已承诺巨额投资。值得注意的是,红杉资本打破了不...
2026-01-20

95后博主百元“手搓”AI导盲眼镜,开源设计引发AI普惠讨论

一位95后博主“帆哥”关注到盲人对AI视觉技术的需求,动手打造出轻便、廉价的AI导盲眼镜,通过注入AI语音交互功能实现智能引导。该开源设计在社交平台引发热议,不少网友点赞“让AI技术真正服务小众群体”,相关话题快速登上科技类热门榜单。
http://m.toutiao.com/group/7592210177542062627/?upstream_biz=doubao
2026-01-07

eBay明确禁止AI智能体自动购物,新规2月20日生效

eBay更新用户协议,明确禁止第三方生成式AI未经许可与该平台互动代替用户自动购物。 新条款针对的是过去一年多家AI公司推出的自动购物功能,如OpenAI的Instant Checkout、Perplexity的BuywithPro功能和亚...
eBay官方用户协议更新公告
2026-01-26

国家数据局定调:2026年布局智能体、具身智能数据标准

国家数据局宣布,2026年我国将推出30多项数据领域国家标准,并将在智能体(AI Agent)、具身智能等前沿方向提前布局一批标准。旨在为下一代AI应用打好“路基”。 行业未兴,标准先行!这体现了顶层设计的前瞻性。统一的“游戏规则”能避免未...
2026-01-07

马斯克旗下聊天机器人Grok因生成色情内容被调查

马斯克旗下人工智能聊天机器人“格罗克”被指生成色情内容,引发广泛谴责。多国政府已启动相关调查,受害者包括成年女性和未成年人。这一事件去年年末以来持续发酵,凸显了人工智能技术的伦理风险。 随着大模型迅猛发展,利用AI生成深度伪造内容的案例时有...
X平台官方安全公告
2026-01-14

xAI发布Grok Imagine 1.0,支持720p视频生成

马斯克旗下xAI正式推出Grok Imagine 1.0,可生成10秒、720p分辨率视频,同时印尼解除对Grok的封禁(需遵守内容审核承诺) Grok在视频生成领域的快速迭代,正逼近OpenAI的Sora。印尼解禁意味着全球化AI服务需平...
2026-02-02

暂无评论

none
暂无评论...