吴恩达提出新图灵测试:专为AGI时代设计

AI专家吴恩达2026年目标公开:设计新的“图灵-AGI测试”,专门为评估通用人工智能而生。他认为传统图灵测试在AGI时代已不够用,现有基准测试常误导大众高估当前AI水平。

新测试将试图弥补这一空白,为AGI评估建立统一标准。吴恩达指出,学术界和工业界频繁提及AGI概念,但定义至今没有统一标准

相关快讯

阿里千问发布最强推理模型,性能媲美GPT-5.2

1月27日,阿里巴巴正式发布千问最强推理模型Qwen3-Max-Thinking,总参数量超万亿,预训练数据量达36T Tokens。在涵盖事实知识、复杂推理、指令遵循等19项公认基准测试中,整体性能可媲美GPT-5.2和Gemini 3 ...
阿里云官方发布
2026-01-28

智谱GLM-4.7登顶全球开源榜

中国开源模型全球下载量占比达17.1%,首次反超美国15.8%,Vercel、Kilo Code等国际平台第一时间接入。
2026-01-06

DeepSeek V4模型即将发布:编程能力实现突破

深度求索计划在2026年2月中旬发布新一代旗舰模型DeepSeek V4。该模型在超长代码提示词处理与解析上实现关键技术突破,支持百万级tokens上下文窗口,可一次性消化整个中型项目代码库。 内部测试显示,V4的代码生成能力已超越Clau...
2026-01-10

腾讯元宝撒10亿红包,复活“微信红包”社交裂变

腾讯元宝App于2月1日启动春节活动,豪掷10亿现金红包,同时内测群聊AI功能“元宝派”。用户可@元宝实现群聊总结、股票分析、图片二创等,马化腾内部定调“重现微信红包时刻” 腾讯此举将AI战场拉回最擅长的社交领域。“元宝派”本质是AI驱动的...
腾讯元宝官方公众号
2026-01-26

李飞飞World Labs融资50亿美元,估值冲500亿押注世界模型

斯坦福教授李飞飞创立的World Labs正洽谈50亿美元融资,估值目标500亿美元,较2024年增长5倍。公司核心产品Marble可通过图文生成符合物理规律的3D世界,已应用于游戏、机器人仿真等领域。投资方包括a16z、英伟达风投等,Je...
The Information独家报道
2026-01-24

阿里千问APP发布会将于1月15日举行

据阿里巴巴官微消息,千问APP发布会将于1月15日10:00举行。据悉,千问将发布重磅产品迭代,上线两个月其C端月活跃用户数已突破1亿,在学生和白领人群中增长迅猛。 与此同时,神州数码表示与阿里云的合作范围包括人工智能软件、数云服务以及公有...
阿里巴巴官方微博
2026-01-14

王小川隔空回应张文宏:医疗AI不应因担心医生成长而受限

百川智能创始人王小川隔空回应张文宏医生关于“拒绝将AI引入医院电子病历系统”的观点,表示“如果你担心阻碍医生成长去限制使用AI,可能就限制了最有利于病人的医疗措施”。王小川称,患者利益优先是根本原则。 与此同时,王小川发布增强医疗大模型M3...
第一财经
2026-01-23

苹果谷歌达成AI合作,Gemini将植入苹果生态

这绝对是今天最重磅的消息!苹果和谷歌正式宣布达成AI合作协议,谷歌的Gemini大模型将深度集成到苹果生态中,为升级版Siri及其他Apple Intelligence功能提供核心技术支撑。 天风证券分析师郭明錤在X平台发文指出,苹果自研A...
《财富》杂志
2026-01-14

暂无评论

none
暂无评论...