【🔥热点】AI Agent终于学会"遗忘":YourMemory用艾宾浩斯曲线刷新记忆系统基准,52% recall吊打Mem0
当所有AI Agent都在努力"记住更多"时,这个开源项目反其道行之——让AI像人一样遗忘。结果:Recall提升16个百分点,Token成本直降。
事件回顾
4月27日,Hacker News热榜出现了一个特别的AI记忆项目YourMemory(github.com/sachitrafa/YourMemory)。项目开发者Sachit Rafa在README中写道:
"Most RAG setups fail because they treat memory like a static filing cabinet. When every transient bug fix or abandoned rule is stored forever, the context window eventually chokes on noise, spiking token costs and degrading the agent's reasoning."
这个项目上线仅3小时,获得46 points和20条评论,GitHub已有64 stars、8 forks,94次commit,最近还在以每天多条的速度迭代。
核心创新:生物式遗忘曲线
YourMemory的核心洞察是:AI记忆不需要记住一切。
它基于心理学家艾宾浩斯(Ebbinghaus)的遗忘曲线理论,为AI Agent构建了一套"用进废退"的记忆系统:
effective_λ = base_λ × (1 - importance × 0.8)
strength = importance × e^(−effective_λ × days) × (1 + recall_count × 0.2)
score = cosine_similarity × strength
三个关键机制:
- 重要性衰减:标记为"高重要性"的记忆衰减更慢,低重要性记忆自动消失
- 调用强化:每次成功检索某条记忆,其强度(strength)会上升,抵抗遗忘
- 自动修剪:强度低于0.05的记忆,24小时定时任务自动清除
遗忘速率(按类别):
| 类别 | 自然衰减周期 | 适用场景 |
|---|---|---|
| strategy(策略) | ~38天 | 成功的模式、架构决策 |
| fact(事实) | ~24天 | 用户偏好、身份信息 |
| assumption(假设) | ~19天 | 推断的上下文 |
| failure(失败) | ~11天 | 错误、环境特定问题 |
这意味着:无关紧要的临时信息会自动消失,而核心事实和策略会长期保持。
基准测试:59% recall vs Mem0的28%
在LoCoMo-10数据集(1,534个QA对,10轮多轮对话)上,YourMemory的成绩:
| 系统 | Recall@5 | 95%置信区间 |
|---|---|---|
| YourMemory(BM25+向量+图+衰减) | 59% | 56–61% |
| Zep Cloud | 28% | 26–30% |
YourMemory的recall比Zep Cloud高出16个百分点,绝对值提升超过110%。
技术架构上,YourMemory采用两轮检索:
第一轮:向量搜索 — 用余弦相似度在记忆中找最相似的候选
第二轮:图扩展 — 从第一轮结果出发,通过BFS遍历找到语义相关但词汇不同的记忆(通过相似度≥0.4的语义边连接)
recall("Python backend")
Round 1 → [1] Python/MongoDB (sim=0.61)
[2] DuckDB/spaCy (sim=0.19)
Round 2 → [5] Docker/Kubernetes (sim=0.29 — below cut-off, surfaced via graph)
这种"图扩展"机制解决了向量搜索的固有缺陷:词汇不匹配时完全失效。
为什么这击中了AI Agent的痛点
当前RAG(检索增强生成)系统的通病:
- 噪声积累:每次对话的临时信息全部存储,context window逐渐被垃圾信息填满
- Token成本爆炸:无效信息占满context,导致推理成本飙升
- 相关性下降:存了太多无关内容,检索质量反而下降
- 更新困难:当某个事实发生变化时,无法智能地"替换"旧记忆
YourMemory的生物式遗忘机制,恰好解决了这四个问题:
- 临时信息自然消亡,不污染长期记忆
- 记忆总量有上限(低于0.05自动清除)
- 高价值信息持续强化,保持高相关性
- 矛盾信息触发更新机制(contradiction check)
YourMemory的设计哲学是零门槛。支持Python 3.11~3.14,无需Docker,无需数据库配置,无需外部服务。
Step 1 — 安装(2分钟)
pip install yourmemory
Step 2 — 初始化(一次性)
yourmemory-setup
自动下载spaCy语言模型,初始化本地数据库(~/.yourmemory/memories.duckdb)
Step 3 — 获取配置路径
yourmemory-path
复制输出的配置块
Step 4 — 接入AI客户端
支持:Claude Code、Claude Desktop、Cline、Cursor、OpenCode,以及所有MCP兼容客户端(Windsurf、Continue、Zed等)
Step 5 — 添加记忆规则
cp sample_CLAUDE.md CLAUDE.md
# 编辑CLAUDE.md,替换YOUR_NAME和YOUR_USER_ID
Claude现在会在每次任务开始时自动recall相关记忆,完成后自动store/update。
多Agent共享记忆:团队协作新范式
YourMemory还支持多Agent共享记忆实例,每个Agent有独立的私有记忆空间,同时可以访问共享上下文:
from src.services.api_keys import register_agent
result = register_agent(
agent_id="coding-agent",
user_id="sachit",
can_read=["shared", "private"],
can_write=["shared", "private"],
)
# → 返回 api_key,每个Agent独立认证
这意味着:团队可以构建共享的知识库,同时保护每个Agent的私密信息。
技术栈:
- 默认:DuckDB(向量存储)+ NetworkX(图引擎)+ sentence-transformers(本地Embedding)
- 可选扩展:PostgreSQL + pgvector(团队部署)、Neo4j(图数据库)
YourMemory的成功揭示了一个重要趋势:
AI Agent的记忆系统,正在从"无限存储"向"智能遗忘"演进。
过去一年,Mem0、Zep等记忆系统都强调"存得更多"。但YourMemory证明了相反的方向才是正确的——不是存储能力,而是管理能力,决定了AI记忆系统的质量。
这对AI创业者的启发:
- Token成本优化:记忆质量比记忆数量更重要,智能遗忘直接降低Token消耗
- 响应质量提升:干净的记忆库意味着检索结果更相关,Agent输出更准确
- 多Agent协作基础:可配置的多Agent记忆系统,是团队级AI工作流的前提
- 垂直场景落地:带遗忘机制的记忆系统,更适合需要"最新上下文"的实时应用
YourMemory的核心价值,可以用一句话概括:
不是让AI记住一切,而是让AI记住真正重要的。
这套基于艾宾浩斯遗忘曲线的记忆系统,在基准测试中展示了110%的recall提升,证明了"智能遗忘"而非"无限存储"才是AI记忆系统的正确方向。
对于AI Agent开发者和运营者而言,YourMemory提供了:
- 5分钟快速接入的零门槛体验
- 开源可自托管的隐私保障
- 多Agent协作的团队支持
- 显著的成本和性能收益的实际价值
GitHub:https://github.com/sachitrafa/YourMemory
#AI创业 #AI工具 #Agent开发 #RAG系统 #记忆系统 #艾宾浩斯曲线 #开源项目
本文由AI辅助创作,经人工审核编辑发布