阿里千问模型Qwen3-Max-Thinking超越GPT-5.2,刷新全球推理纪录

信息来源: 阿里巴巴集团官方技术博客2026-01-30 11:05

阿里巴巴正式发布千问旗舰推理模型Qwen3-Max-Thinking,在多项关键性能基准测试中表现超过GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等顶尖模型。该模型总参数超万亿,进行了更大规模的强化学习后训练,通过推理技术创新实现性能飞跃。

Qwen3-Max-Thinking大幅增强了自主调用工具的原生Agent能力,同时显著降低了模型幻觉。普通用户可通过千问PC端和网页端试用新模型,移动端APP也即将接入

相关快讯

中国人形机器人“众擎T800”海外走红,展示高难度武术

一段名为“众擎T800机器人硬核演示”的视频在海外社交媒体爆火。视频中,该人形机器人流畅地完成了回旋五连踢、360度旋空转身等高难度武术动作,其出色的运动控制和稳定性引发了全球科技爱好者的广泛关注,成为中国机器人技术走向世界舞台的生动案例
2026-01-20

国产之光DeepSeek发布“mHC”架构,硅谷被“吓”到了

咱们的DeepSeek(深度求索)又立功了!他们发布了最新的mHC(Manifold-Constrained Hyper-Connections)训练架构,并推出了带有更强“思考”能力的更新。最狠的是,DeepSeek再次证明了不需要天价算...
https://timesofindia.indiatimes.com/technology/tech-news/chinas-deepseek-that-wiped-billions-from-us-stock-market-in-january-2025-sends-new-years-message-to-american-companies/articleshow/126318862.cms
2026-01-07

阿里千问全面接入阿里生态实现AI购物

千问产品迭代发布会官方宣布千问App宣布全面接入淘宝、支付宝、淘宝闪购等阿里生态业务,在全球首次实现点外卖、买东西、订机票等AI购物功能,并向所有用户开放测试
千问产品迭代发布会官方宣布
2026-01-15

 环球音乐“投诚”,AI要重塑音乐产业

全球最大音乐公司环球音乐集团与英伟达达成合作,基于英伟达的Music Flamingo模型,开发新的音乐发现、创作和互动方式。以后推荐歌单,可能不再是“猜你喜欢”,而是AI“懂你灵魂”。 之前环球音乐还因版权问题怒告AI公司,现在却和算力巨...
2026-01-07

【苹果+谷歌官宣合作】Siri将用Gemini模型大升级

苹果官宣与谷歌达成多年合作,Siri等AI功能将接入谷歌Gemini模型,预计今年秋季随iOS更新推出。苹果称谷歌技术“为基础模型提供最强大支持”,协议非独家但年费达十亿级。消息提振谷歌市值突破4万亿美元
https://news.qq.com/rain/a/20260113A01HHM00
2026-01-13

Claude Code重磅升级:Task功能开启多Agent协作新纪元

Anthropic的Claude Code迎来革命性更新,正式用“Tasks”功能取代传统的Todo工具。这一变革背后是Opus 4.5强大的上下文记忆与自主能力支撑,使其不再依赖琐碎的记录工具。 核心突破在于Tasks支持在多Agent和...
Anthropic官方技术公告与开发者社区讨论
2026-01-26

Anthropic推出完全由Claude编写代码的智能体

Anthropic推出的新型AI智能体Cowork,其全部代码均由Claude模型自主编写完成,开发周期仅约10天,展示了AI在软件工程领域的强大自动化能力
Anthropic技术博客官方发布
2026-01-15

李飞飞World Labs融资50亿美元,估值冲500亿押注世界模型

斯坦福教授李飞飞创立的World Labs正洽谈50亿美元融资,估值目标500亿美元,较2024年增长5倍。公司核心产品Marble可通过图文生成符合物理规律的3D世界,已应用于游戏、机器人仿真等领域。投资方包括a16z、英伟达风投等,Je...
The Information独家报道
2026-01-24

暂无评论

none
暂无评论...