DeepSeek 开源 DSpark 投机解码框架,加速 DeepSeek-V4 生成速度 60-85%

信息来源: MarkTechPost(RSS)
看点:DeepSeek 发布 DSpark 投机解码框架并开源检查点与训练代码。该框架不是新模型,而是在 DeepSeek-V4 权重上附加草稿模块,通过半自回归生成(并行骨干 + 轻量

DeepSeek 发布 DSpark 投机解码框架并开源检查点与训练代码。该框架不是新模型,而是在 DeepSeek-V4 权重上附加草稿模块,通过半自回归生成(并行骨干 + 轻量级顺序头)实现无损加速。生产环境下,DeepSeek-V4-Flash 和 V4-Pro 每用户生成速度较 MTP-1 基线分别提升 60-85% 和 57-78%。离线测试中,接受长度比 Eagle3 高 26-31%,比 DFlash 高 16-18%。配套 DeepSpec 训练代码库采用 MIT 许可证。

相关快讯

研究称GPT-4.5在图灵测试中73%被误认为人

研究称GPT-4.5在图灵测试中73%被误认为人

加州大学圣地亚哥分校一项研究表明,在特定提示下,GPT-4.5在5-15分钟的对话中被73%的“裁判”判定为人类,显著超越真人参与者。研究指出,提示词是关键,能让AI模仿人类语气、幽默甚至犯错。这凸显了先进AI在网络社交中进行可信伪装的能力...
IT之家(RSS)
2026-05-22

暂无评论

none
暂无评论...