腾讯开源TencentDB-Agent-Memory,最高省61%Token

信息来源: mp.weixin.qq.com
看点:把Agent记忆治理和Token降本思路做成了开箱即用的开源方案,四层回溯机制既省Token又不丢证据,对长链路Agent开发极具参考价值。

腾讯云最近开源了一个叫 TencentDB-Agent-Memory 的工具,专门解决 AI Agent 跑长任务时上下文膨胀、Token 疯涨和模型“犯糊涂”的问题。对于经常让 Agent 连续调用十几次工具的开发者来说,中间产物堆满上下文导致又贵又容易出错,这个工具算是针对痛点来的。

四层递进存储:把噪声搬出去,把线索留下来

核心机制之一是上下文卸载。传统做法把网页抓取、代码执行等冗长结果全塞上下文,而 Agent Memory 会把完整结果存到外部文件,上下文只留一行摘要和索引路径。它设计了四级结构:L0 原文、L1 结构化 JSONL、L2 自然语言摘要、L3 Mermaid 节点标签。Agent 日常只看轻量的 L2 和 L3,需要细节时再通过 node_id 逐层回溯。这种设计保证了压缩不是黑盒,原始数据随时可查证。

Mermaid 任务画布:给 Agent 装个进度条

另一个机制是用 Mermaid 流程图把线性聊天记录变成可导航的依赖图。做完的、正在做和没开始的节点状态一目了然。Agent 不用回头翻历史记录就能看清全局,大幅减少了因迷失方向导致的重复查询和无效分支。

官方在多任务连续 Session 实验中给出数据:最高降低 61.38% 的 Token 消耗,任务通过率相对提升 51.52%。Token 省了,成功率反而升了,本质上是因为上下文噪声少了,模型注意力更集中。

目前项目在 GitHub 已有 3.9k Star,默认用本地 SQLite 存储,零外部 API 依赖。不过 Issues 里有开发者反馈搭配 DeepSeek 等模型时偶有 L1 提取失败或兼容性问题,想上生产环境的话建议先跑跑测试。

怎么用

  • 通过 GitHub 获取项目源码与部署文档
  • 支持 OpenClaw 插件一行命令安装
  • 提供 Docker 部署方式,默认本地 SQLite 零外部依赖
  • 高级检索需求可接入腾讯云向量数据库
  • GitHub:项目源码与文档

图片来源:mp.weixin.qq.com

相关快讯

Anthropic 发布 Claude Fable 5:Mythos 级模型首次公开

Anthropic 发布 Claude Fable 5:Mythos 级模型首次公开

Anthropic 正式推出 Claude Fable 5,这是此前备受关注的 Mythos 网络安全大模型的公开版。官方称其能力超越以往任何公开模型,擅长长周期复杂任务。为确保通用安全,公开版加入了严格防护,网络操作权限低于专供版,防止滥...
X
2026-06-10

Qwen3.7-Max上线隐式缓存,API调用自动提速降价

阿里云旗舰模型Qwen3.7-Max正式上线隐式缓存功能,无需任何配置即可自动生效,直接提升响应速度并降低调用成本。若对缓存命中率有更高要求,可切换至显式缓存模式。开发者可通过百炼平台调用该模型API。
X:通义千问 / Qwen (@Alibaba_Qwen)
2026-05-26

OpenClaw 2026.5.22发布:/models响应降至5ms,安全加固

开源本地AI智能体框架OpenClaw发布2026.5.22版本。本次更新重点在于性能与安全:Gateway与模型启动路径精简,/models接口响应时间大幅降至约5毫秒;npm包新增锁定依赖项,Windows安装与更新路径也得到安全强化...
X:OpenClaw (@openclaw)
2026-05-24

暂无评论

none
暂无评论...