新Qwen3.7-Max上线隐式缓存,API调用自动提速降价
阿里云旗舰模型Qwen3.7-Max正式上线隐式缓存功能,无需任何配置即可自动生效,直接提升响应速度并降低调用成本。若对缓存命中率有更高要求,可切换至显式缓存模式。开发者可通过百炼平台调用该模型API。
Anthropic 刚刚发布了旗舰模型 Claude Opus 4.8。距离 Opus 4.7 仅过去六周,这次更新不算代际飞跃,官方也承认是“适度但明显的提高”,但它直击了当前大模型最让人头疼的痛点——盲目自信。
Opus 4.8 最核心的改进是“诚实性”。当信息不足或拿不准时,它更愿意承认“我不确定”,而不是强行给个看似靠谱的结论。内部评估显示,新模型对自己生成代码的缺陷漏报率比 4.7 降低了约四倍,自我纠错能力显著增强,欺骗和误导行为的发生率也降到了与对齐标杆 Mythos Preview 持平的水平。

独立工作能力也更强了。在代理编码测试中,得分从 64.3% 升至 69.2%,知识工作得分也有明显提升。伴随新模型,Anthropic 还推出了“动态工作流”功能,允许 Claude 在单次任务中协调数百个并行子智能体,自动规划、拆解和验证复杂流程,比如处理数十万行代码的迁移。
价格没变,常规模式依然是输入 $5/百万 Token、输出 $25/百万 Token。同时新增了 Fast Mode,速度是常规模式的 2.5 倍,价格为输入 $10、输出 $50,比此前的 Fast Mode 降价约三分之二。不过要注意,动态工作流目前仅面向企业版、团队版和 Max 版的 Claude Code 用户开放,且处于研究预览阶段。
另外,Opus 4.6 已经被下架,而此前备受关注的更高级别 Mythos 模型预计将在未来几周向所有客户开放。
怎么用
图片来源:X