DeepSeek-R1-0528 偷偷上线，媲美OpenAI o3

前沿资讯1年前更新 santiai

503 00

2025年5月30日凌晨，全球最大的开源AI平台Hugging Face上，一个名为DeepSeek-R1-0528的模型被悄然上传。
没有发布会，没有新闻通稿，只有一行冰冷的文件列表。
然而24小时后，整个AI开发者圈陷入疯狂。

🔥 一、低调发布，高调实力：一个“小更新”引发的性能地震

尽管DeepSeek官方称其为“小版本升级”（minor update），但实测结果却堪比核爆——

编程性能直逼OpenAI o3：在LiveCodeBench测试中，R1-0528得分媲美OpenAI最新o3-mini（High模式）和o4-mini（Medium模式），大幅领先Gemini 2.5 Flash18；
代码能力吊打Claude 4：网友用相同Prompt测试R1-0528与Claude 4 Sonnet——前者生成728行物理模拟代码，带动态光影与控制面板，运行一次通过；后者仅输出542行，效果简陋且运行报错26；
唯一能算对“9.9-9.11”的模型：这道难倒GPT-4、Gemini 2.5 Pro的陷阱题，被R1以212秒深度推演后得出正确答案 -0.21，全程逻辑缜密47。

“它现在能像o3一样纠正思维链，又能像Claude一样构建世界观——这根本不是小升级，是换了个大脑！”

⚙️ 二、技术跃迁：128K上下文+30分钟长思考，推理能力质变

本次升级的核心突破在于深度思考架构的重构：

▶ 超长上下文与精准召回

支持128K token上下文窗口，32K内文本召回准确率显著提升18；
在处理多步骤任务时（如族谱推理、物理模拟），逻辑连贯性接近人类专家7。

▶ 史诗级“慢思考”模式

单任务推理时间首次突破30-60分钟（实测数学题最长思考351秒）29；
代价是响应变慢，但换来近乎零幻觉的高精度输出610。

▶ 代码工程化颠覆式优化

生成代码自带测试用例与异常处理，首次运行通过率超90%49；
前端设计审美大幅提升，可一键生成带交互面板的Three.js太阳系模拟57。

🥊 三、实测对决：DeepSeek R1 vs. OpenAI o3，胜负出乎意料

《科创板日报》用5道赛题组织了一场巅峰对决310：

测试项目	DeepSeek-R1-0528	OpenAI o3-mini (High)
“三国杀”网页游戏生成	✅ 完整可运行，UI精美	❌ 需手动调试，界面粗糙
嵌套函数`f(f(x))=x²-11x+36`求f(5)	✅ 正确但慢(351秒)	✅ 正确且快(41秒)
东北三省接壤外国的地市数	❌ 答错（漏算边境口岸）	✅ 正确指出12个
唐代文物关联名相之子考据	❌ 误判文物，答案碰巧正确	✅ 精准引用《旧唐书》
统计乐队女性成员	✅ 1分钟高效制表	✅ 正确但耗时6分钟

结论：在编程与工程化任务上R1碾压o3，但在事实检索与历史推理上仍存差距。

🌍 四、行业冲击波：免费开源+成本碾压，闭源商业模型遭遇狙击

DeepSeek此次延续激进开源策略，同步释放三重红利：

免费API上线OpenRouter：开发者可零成本调用R1-05281；
企业级推理成本骤降：API价格低至 $0.14/百万tokens（仅为OpenAI的1/3）9；
模型蒸馏版覆盖边缘设备：32B小模型在编码任务超越o1-mini，普通显卡即可运行9。

英伟达CEO黄仁勋在财报会议中直言：
“DeepSeek正拉动全球推理算力需求——开源模型的效率革命已不可逆。”9

🔮 五、为什么所有人都开始期待R2？

尽管R1-0528性能炸裂，社区却嗅到更大野心：

网友发现其训练基座竟是DeepSeek-V3-0324（660B参数）69，暗示R2或基于未公开的V4架构；
本次“小更新”已逼近o3水平——若R2如期而至，开源模型首次超越闭源SOTA的历史时刻或将到来47。

一位匿名开发者戏称：
“他们管这叫R1小更新？这分明是把R2的火箭燃料，灌进了R1的油箱！”

结语：一场静悄悄的革命

没有锣鼓喧天，没有热搜营销，DeepSeek再次用代码说话。
R1-0528的深夜突袭，不仅是技术的胜利，更传递一个信号：

在AI的终极赛道上，开源的力量正以指数级撕裂封闭的高墙。

而当我们还在惊叹R1的“30分钟长思考”时，
Hugging Face页面底部一行小字悄然更新——
“R2：Training in Progress ▶”

前沿资讯最新文章

文章版权归作者所有，未经允许请勿转载。

ClaudeCode 源代码泄漏！全网疯狂围观~

# ClaudeCode

3个月前

702

AI编程对普通人的意义我找到了！

# AI编程

6个月前

450

百度官宣：“文心一言“，对标聊天机器人ChatGPT，股票大涨15%

# ChatGPT # ERNIE Bot # 百度文心一言

1年前

2,056

禁止使用OpenClaw 自动运营小红书：封号！！

# OpenClaw # 小红书

3个月前

518

暂无评论

暂无评论...

日榜周榜月榜

06-16 00:50产品发布/更新X
AMD推出锐龙AI Halo迷你主机：128G统一内存，本地跑200B大模型
128G大统一内存塞进迷你主机，让本地跑200B大模型成为现实，比DGX Spark更便宜且支持Windows，是本地AI算力的新选择。
06-13 14:49快讯mp.weixin.qq.com
美国政府发出口管制令，Anthropic全面下线Fable 5与Mythos 5
首个已上线商用大模型因政府出口管制被强制下线的案例，反映了AI监管与产品部署的剧烈冲突，对后续模型跨国使用有深远影响。
06-11 02:06产品发布/更新X
Google发布Gemini 3.5 Live Translate：70+语言边听边译，保留原声音调
突破了传统回合制翻译，实现低延迟流式边听边译，且能保留说话人音色和语调，不再依赖特定硬件，让同传级体验走向大众。
06-10 03:13产品发布/更新X
Anthropic 发布 Claude Fable 5：Mythos 级模型首次公开
此前仅限机构使用的网安“核武器”Mythos 模型以 Fable 5 之名公开，能力下放的同时权限也遭削减，安全与性能的平衡值得实测。
06-09 02:15快讯mp.weixin.qq.com
微信发布小程序接入AI生态指引，提供自动与开发双模式
微信AI生态正式向小程序开放，AI可直接操作小程序页面，可能重塑小程序流量分发与交互方式，开发者需尽早关注接入策略。

DeepSeek-R1-0528 偷偷上线，媲美OpenAI o3

🔥 一、低调发布，高调实力：一个“小更新”引发的性能地震

⚙️ 二、技术跃迁：128K上下文+30分钟长思考，推理能力质变

▶ 超长上下文与精准召回

▶ 史诗级“慢思考”模式

▶ 代码工程化颠覆式优化

🥊 三、实测对决：DeepSeek R1 vs. OpenAI o3，胜负出乎意料

🌍 四、行业冲击波：免费开源+成本碾压，闭源商业模型遭遇狙击

🔮 五、为什么所有人都开始期待R2？

结语：一场静悄悄的革命

QQ浏览器正式升级为“AI浏览器”，并上线QBot智能助手。

AI设计LOGO的万能提示词，3秒生成高逼格黑白LOGO！

相关文章

ClaudeCode 源代码泄漏！全网疯狂围观~

AI编程对普通人的意义我找到了！

百度官宣：“文心一言“，对标聊天机器人ChatGPT，股票大涨15%

禁止使用OpenClaw 自动运营小红书：封号！！

暂无评论

网址

荐ChatGPT

抖音音乐创作实验室

Weights

椒图AI

LibTV

兔子 API

新AstronClaw

文心一格

Teachable Machine

Civitai

图钉AI快讯