Mindbase:设计一个 AI 的长期记忆系统

RAG 不是记忆

当前 AI 产品中"记忆"这个词被严重滥用。

大多数所谓的"AI 记忆"本质上是 RAG(Retrieval-Augmented Generation):

  • 存一堆文档 → 查询时检索相关片段 → 塞入 prompt

这不是记忆。这是每次对话都重新翻一遍笔记本

真正的记忆应该有什么特征?

  • 分层: 工作记忆 vs 长期记忆 vs 程序记忆
  • 遗忘: 不重要的会衰减
  • 关联: 记忆之间有连接
  • 进化: 对同一事物的理解会随时间深化

The Trinity:三位一体架构

Mindbase 的核心设计是 Brain/Body/Memory 三层:

Brain: 定义"如何思考"

Brain 不存数据——它定义对数据的理解方式

组件职责类比
Taxonomy事实的分类体系"这属于什么类型的知识"
Optimization认知策略优化"什么时候该召回什么"
Reasoning推理模式"从已知推导未知"

关键设计: Brain 不是固定的——它会根据用户的使用模式自我调整。如果某类知识被频繁使用,Brain 会调高它的权重。

Body: 定义"如何行动"

Body 是执行层——把 Brain 的认知决策变成具体操作:

  • Runtime Agents: 在不同场景中执行不同策略的代理
  • Behavior Graph: 用图结构编排复杂的多步行为
  • 对话管理: 管理上下文窗口和记忆注入

Memory: 定义"如何记忆"

Memory 是存储层——但不只是"存":

九类事实模型

Mindbase 从用户交互中提取 9 类事实:

类型说明示例
Preference偏好"喜欢简洁的代码风格"
State当前状态"正在做 AI 训练营"
Goal目标"Q3 要完成设计系统"
Decision决策"选择 Vue 而不是 React"
Experience经验"限流第一天就要加"
Relationship关系"和某人是合作关系"
Knowledge领域知识"知识图谱用三元组表示"
Habit习惯"每天早上先看日历"
Context情境"在某企业做一线经理"

每次对话都在积累事实 — 不是用户主动"存",是系统自动"学"。

时间衰减:让 AI 学会遗忘

为什么需要遗忘? 因为:

  • 人的状态会变("正在做 X" 三个月后可能已经不做了)
  • 偏好会变("喜欢极简风格" 可能演化为"需要更多细节")
  • 过时信息会干扰决策

时间衰减 + 重新使用重置权重 = 自然的知识演化

混合检索:不只是向量搜索

检索记忆时不用单一方法——混合三种:

方法优势劣势
向量检索语义相似性好精确匹配差
关键词检索精确不理解语义
时间权重偏好新鲜信息可能错过重要旧信息

最终排序 = relevance_score × freshness_score × usage_frequency

和个人 AI 工作台的关系

Mindbase 和我的工作台是互补关系:

维度工作台Mindbase
数据模型结构化文件 (Markdown+YAML)事实图谱 (Graph)
存储方式文件系统数据库 (向量+图)
适用场景确定性管理流程模糊的个人认知
查询方式grep + 路径语义检索 + 推理

工作台管确定的事(项目状态、会议记录、人员档案)。 Mindbase 管模糊的事(个人偏好、经验教训、渐进式理解)。

设计原则

原则说明
分层而非平铺不同类型的记忆用不同策略
自动提取用户不需要主动"保存",系统自动学习
时间感知记忆有新鲜度,旧的自然衰减
可验证每条事实可追溯到来源对话
隐私本地核心数据不离开本地

核心洞察:AI 的"记忆"不应该是"一个大搜索引擎"——它应该像人的记忆一样有层次、有遗忘、有关联、有进化。Mindbase 的 Trinity 架构试图让 AI 不只是"存了你说过的话"——而是真正"理解了你是谁"。

Comments