Mindbase：设计一个 AI 的长期记忆系统

RAG 不是记忆

当前 AI 产品中"记忆"这个词被严重滥用。

大多数所谓的"AI 记忆"本质上是 RAG（Retrieval-Augmented Generation）：

存一堆文档 → 查询时检索相关片段 → 塞入 prompt

这不是记忆。这是每次对话都重新翻一遍笔记本。

真正的记忆应该有什么特征？

分层: 工作记忆 vs 长期记忆 vs 程序记忆
遗忘: 不重要的会衰减
关联: 记忆之间有连接
进化: 对同一事物的理解会随时间深化

The Trinity：三位一体架构

Mindbase 的核心设计是 Brain/Body/Memory 三层：

Brain: 定义"如何思考"

Brain 不存数据——它定义对数据的理解方式：

组件	职责	类比
Taxonomy	事实的分类体系	"这属于什么类型的知识"
Optimization	认知策略优化	"什么时候该召回什么"
Reasoning	推理模式	"从已知推导未知"

关键设计: Brain 不是固定的——它会根据用户的使用模式自我调整。如果某类知识被频繁使用，Brain 会调高它的权重。

Body: 定义"如何行动"

Body 是执行层——把 Brain 的认知决策变成具体操作：

Runtime Agents: 在不同场景中执行不同策略的代理
Behavior Graph: 用图结构编排复杂的多步行为
对话管理: 管理上下文窗口和记忆注入

Memory: 定义"如何记忆"

Memory 是存储层——但不只是"存"：

九类事实模型

Mindbase 从用户交互中提取 9 类事实：

类型	说明	示例
Preference	偏好	"喜欢简洁的代码风格"
State	当前状态	"正在做 AI 训练营"
Goal	目标	"Q3 要完成设计系统"
Decision	决策	"选择 Vue 而不是 React"
Experience	经验	"限流第一天就要加"
Relationship	关系	"和某人是合作关系"
Knowledge	领域知识	"知识图谱用三元组表示"
Habit	习惯	"每天早上先看日历"
Context	情境	"在某企业做一线经理"

每次对话都在积累事实 — 不是用户主动"存"，是系统自动"学"。

时间衰减：让 AI 学会遗忘

为什么需要遗忘？ 因为：

人的状态会变（"正在做 X" 三个月后可能已经不做了）
偏好会变（"喜欢极简风格" 可能演化为"需要更多细节"）
过时信息会干扰决策

时间衰减 + 重新使用重置权重 = 自然的知识演化。

混合检索：不只是向量搜索

检索记忆时不用单一方法——混合三种：

方法	优势	劣势
向量检索	语义相似性好	精确匹配差
关键词检索	精确	不理解语义
时间权重	偏好新鲜信息	可能错过重要旧信息

最终排序 = relevance_score × freshness_score × usage_frequency

和个人 AI 工作台的关系

Mindbase 和我的工作台是互补关系：

维度	工作台	Mindbase
数据模型	结构化文件 (Markdown+YAML)	事实图谱 (Graph)
存储方式	文件系统	数据库 (向量+图)
适用场景	确定性管理流程	模糊的个人认知
查询方式	grep + 路径	语义检索 + 推理

工作台管确定的事（项目状态、会议记录、人员档案）。 Mindbase 管模糊的事（个人偏好、经验教训、渐进式理解）。

设计原则

原则	说明
分层而非平铺	不同类型的记忆用不同策略
自动提取	用户不需要主动"保存"，系统自动学习
时间感知	记忆有新鲜度，旧的自然衰减
可验证	每条事实可追溯到来源对话
隐私本地	核心数据不离开本地

核心洞察：AI 的"记忆"不应该是"一个大搜索引擎"——它应该像人的记忆一样有层次、有遗忘、有关联、有进化。Mindbase 的 Trinity 架构试图让 AI 不只是"存了你说过的话"——而是真正"理解了你是谁"。