阿里千问发布最强推理模型,性能媲美GPT-5.2
1月27日,阿里巴巴正式发布千问最强推理模型Qwen3-Max-Thinking,总参数量超万亿,预训练数据量达36T Tokens。在涵盖事实知识、复杂推理、指令遵循等19项公认基准测试中,整体性能可媲美GPT-5.2和Gemini 3 ...
AI专家吴恩达2026年目标公开:设计新的“图灵-AGI测试”,专门为评估通用人工智能而生。他认为传统图灵测试在AGI时代已不够用,现有基准测试常误导大众高估当前AI水平。
新测试将试图弥补这一空白,为AGI评估建立统一标准。吴恩达指出,学术界和工业界频繁提及AGI概念,但定义至今没有统一标准