Qwen3.7-Max上线隐式缓存，API调用自动提速降价

信息来源: X：通义千问 / Qwen (@Alibaba_Qwen) 2026-05-26 00:34

看点：API调用降本增效的实用更新。隐式缓存零门槛自动生效，对高频开发者和智能体应用极其友好，直接省下真金白银。

阿里云通义千问最新旗舰模型 Qwen3.7-Max 的隐式缓存功能现已上线。最直观的好处是：开发者不需要做任何代码改动或参数配置，缓存机制就会在后台自动生效，直接带来响应变快、调用变便宜的结果。

对于日常高频调用且上下文重复较多的场景，隐式缓存的“开箱即用”能省下不少 Token 费用。但隐式缓存的命中率并非绝对确定，如果你对成本控制有更严苛的要求，需要更高且更稳定的命中率，官方建议转向使用显式缓存。

Qwen3.7-Max 是阿里云近期发布的新一代旗舰智能体模型，目前通过阿里云百炼平台提供 API 服务，输入价格约 12 元/百万 Tokens，输出约 36 元/百万 Tokens。结合此次上线的缓存功能，长上下文或多轮对话场景的实际运行成本有望进一步压降。

怎么用

相关链接

GitHub：github.com/WeBest/alibabacloud-iot-device-sdk/blob/master/docs/weixin-min-program-usage..md

图钉AI导航致力于优质、实用的网络站点资源收集与分享！本文地址https://www.tudingai.com/ainews/4800.html转载请注明

距 4 月 23 日的 Hy3 preview 发布已经过去了两个半月，今天（7 月 6 日）腾讯混元 Hy3 正式版终于发布，WorkBuddy 作为首发接入平台同步开启为期两周的限时免费体验。元宝也同步接入且免费开放。 Hy3是一个快慢...

2026-07-07

今天凌晨，OpenAI 扔了个不大不小的炸弹 GPT-5.6 系列发布了。 GPT-5.6 系列包括三款模型，名字挺有意思：Sol（太阳）、Terra（地球）、Luna（月亮）。三款各有分工： Sol 是旗舰，最强大，面向复杂推理、科研...

2026-06-27

腾讯QQ邮箱内测专为AI Agent设计的“Agently Mail”。它为Agent提供独立邮箱身份，与个人邮箱数据隔离，解决了以往授权主邮箱带来的隐私风险。支持OAuth授权及CLI一键配置，已适配Cursor、Claude Code等...

mp.weixin.qq.com

2026-06-25

07-13 03:52快讯
Codex 正面硬刚 Claude， Codex取消了5小时使用量限制、Fable 5 延期
就在刚刚OpenAI Codex 负责人@Tibo 发文称暂时取消所有 Plus、Business 和 P
07-09 11:44快讯
工信部：《关于防范AI编程工具Claude Code安全后门隐患的风险提示》
2026年7月8日，工业和信息化部网络安全威胁和漏洞信息共享平台（NVDB）发布《关于防范AI编程工具Cla
07-07 00:51产品发布/更新
腾讯混元Hy3正式上线，WorkBuddy首发接入，限时两周免费体验！
腾讯混元Hy3正式上线，WorkBuddy首发接入并限时两周免费体验，以任务解决率跃升至90%、耗时缩短34%及高性价比开源等亮点，重塑AI办公新标杆。
07-03 16:46快讯
阿里反向出手：7月10日起全面禁用Anthropic全系产品，Claude Code在列
阿里巴巴内部今日下发通知，因近期 Claude Code 被曝存在植入后门的安全风险，经综合评估后将其列入高
07-02 12:46快讯
Claude Fable 5 强势回归！但我号没了~
Anthropic 昨天就宣布 Claude Fable 5大模型将于今日重新部署上线，目前已经可以在Cla

暂无评论