<div align="center">
# 🧠 Anda Brain (大脑) — 为 AI 智能体打造的自主图谱记忆
> 消耗电力训练大模型,得到神经网络本体;消耗词元训练记忆图谱,得到符号网络本体。
>
> 两者结合,就是**神经符号 AI**——而 Brain 正是那颗让符号网络持续生长的大脑。
[](https://brain.anda.ai/)
[](https://anda.ai/brain)
[](https://github.com/ldclabs/anda-brain)
[](https://yiwen.ai/)
[](mailto:hi@yiwen.ai)
</div>
<br/>
## 不会睡觉的记忆,终将被自己淹没
你的 AI 助手记住了你说过的每一句话。向量数据库里躺着几万条对话碎片,Markdown 备忘录写了上千行,键值缓存也在稳步膨胀。
然后有一天,你让它推荐餐厅。它兴高采烈地推荐了巴西烤肉——尽管你上个月刚告诉它你开始吃素了。
这不是检索的问题。它确实检索到了你两年前说的“我爱吃烤肉”。但它**同时**也检索到了你上个月说的“我现在吃素了”——只是它没有能力判断哪条更有效、哪条已过期。这两条信息在它的存储里地位完全平等:两个向量点,毫无时间线、毫无因果关系、毫无取代关系。
AI 记忆的军备竞赛一直在回答“怎么记住更多”——更大的上下文窗口、更精细的嵌入模型、更快的检索算法。但几乎没有人在认真回答另一个问题:**记住之后,怎么消化?**
### 当前方案为什么做不到
* **向量 RAG:** “三文鱼”“海胆”“寿司”是三个独立的向量点。你无法对它们执行“合并”——因为向量空间里没有“属于同一个人的同一类偏好”这个概念。你也无法标记“素食主义”被“荤食”取代——因为两条向量之间没有时间线关系。
* **Markdown 文件:** 理论上 LLM 可以扫描全文做去重和整合,但每次维护都要把整个文件读进上下文窗口。文件越长,维护越贵、准确率越低——这是一个**自我恶化的循环**。
* **键值存储:** `alice.diet = "vegetarian"` 被 `alice.diet = "omnivore"` 覆盖,旧值直接消失。没有“以前吃素,后来不吃了”的历史轨迹。
* **传统图数据库(如 Neo4j):** 虽然知识图谱是正确的数据结构,但让 LLM 写 Cypher 查询约等于让实习生徒手操作 SAP——高错误率、僵化的模式和巨大的集成摩擦。
看到共同点了吗?AI 记忆要做的**压缩**(识别碎片属于同一主题并合并)、**演化**(找出矛盾知识并标记时间线)、**巩固**(评估重要性并分级)——本质上都是对**关系网络的操作**。
**向量是点,Markdown 是线,键值是格。只有图谱是网络。** 只有在网络上,你才能做遍历、做合并、做矛盾检测、做时间线追踪。
## 记忆是 AI 智能体的第一基础设施
这不是一个小众判断,而是正在形成的产业共识。
微软 CEO 纳德拉明确指出:AI Agent 的三大基石是 **Memory(长期记忆与信用分配)+ Permissions(权限控制)+ Action Space(行动空间)**——这些必须在通用模型之外独立构建,才真正属于企业自己。前 Google CEO 施密特进一步强调,AI 时代最大的壁垒是**学习闭环**——系统持续收集反馈、优化、自我进化的能力,而非静态的数据囤积。
基础大模型已高度商品化,你可以随时切换更强的模型,但新模型对你的业务一无所知。企业过去数年积累的业务轨迹、决策理由、失败教训、客户交互记录——这些“数字基因”才是 AI 从“聪明助手”变成“老师傅”的根基。
**企业需要的不是更大的上下文窗口,而是一颗能生长的大脑。**
## 走进 Anda Brain:一颗会“做梦”的认知器官
人类大脑中的大脑负责在白天将新体验编码为短期记忆,然后在睡眠期间与新皮层协作,将重要的短期记忆巩固为长期知识。
**Anda Brain** 的命名正源于此。它不是一个数据库,也不是一个 RAG 管线——它是一个**认知器官**,一个专为 AI 智能体设计的图谱记忆引擎。LLM 只需通过自然语言(或简单的工具调用)进行交互,Brain 就会将其转化为不断增长、高度结构化的**认知中枢 (Cognitive Nexus)**——一个活着的、会自我演化的知识图谱。
### 三层解耦架构
```
┌──────────────────────────────────────────┐
│ 供应链 Agent · 客服 Agent · 研发 Agent │ ← 各岗位 AI 数字员工
│ 只关注业务逻辑,用自然语言沟通 │ 不需要学任何图谱的东西
└────────────────┬─────────────────────────┘
│ 自然语言 / 函数调用
▼
┌──────────────────────────────────────────┐
│ Anda Brain(大脑) │ ← 统一认知引擎
│ 自动将意图转化为图谱操作,管理知识质量 │ 支持记忆编码、召回、维护
└────────────────┬─────────────────────────┘
│ KIP(知识交互协议)
▼
┌──────────────────────────────────────────┐
│ 认知中枢(AndaDB Cognitive Nexus) │ ← 持久化企业知识图谱
│ 概念节点 + 命题链接 + 元数据追溯 │ 结构化、可审计、可进化
└──────────────────────────────────────────┘
```
这套架构意味着:
- **业务 Agent 零门槛接入:** AI 智能体不需要学习图查询语言,像说话一样使用记忆。Brain 完成所有图谱处理工作。
- **自主模式演进:** LLM 实时决定要跟踪哪些概念和关系。不需要预定义的数据库模式。类型系统本身就存储在图谱中,AI 可以在运行中自主注册新的概念类型和关系类型。
- **多 Agent 共享同一颗大脑:** 客服 Agent 记住的客户反馈,供应链 Agent 在召回时能自然发现。知识自动跨部门链接,不再需要“数据中台”的人海工程。
- **模型无关:** 您的业务 Agent 可以使用多种 SOTA 模型,而记忆引擎在安全地使用独立的模型维护核心资产。今天用 GPT,明天切换到 Claude 或开源模型,您的记忆完整保留,新模型即刻继承全部知识。
- **睡眠与巩固:** 就像人类大脑一样,Brain 会自动运行后台“睡眠”任务,以去重事实、衰减过时信息并巩固长期知识。
---
## 核心能力
### 记忆编码:对话自动变成结构化知识
当业务 Agent 与客户或内部员工对话时,Brain 在后台静默工作,自动提取三个层次的记忆:
| **情景记忆**(Event) | “3月15日,王总与供应商张经理讨论了Q2交付计划,确认延期两周” | 短期→巩固 |
| **语义记忆**(Concept) | “供应商A的交付可靠性为85%”、“客户B偏好线上沟通” | 持久 |
| **认知记忆**(Pattern) | “该客户在做采购决策时,总是先比价格再比账期” | 持久 |
每条记忆都自动绑定**来源、作者、置信度、时间戳**——完全可审计,满足合规要求。
### 三阶段睡眠周期:知识自动新陈代谢
这是 Anda Brain 最核心的差异化能力——灵感来自神经科学:人类大脑在睡眠期间进行记忆巩固——强化重要记忆、清理无用碎片、建立新的知识关联。Brain 在后台定期启动同样的“睡眠周期”。
#### NREM 深睡眠 — 从碎片到知识
系统扫描图谱中未处理的事件节点,执行**精华提取**:
- **单事件巩固**:一个记录了“Alice 说她喜欢用暗色主题”的 Event,被巩固为一个 `Preference` 类型的持久概念节点,带有与 Alice 的 `prefers` 关系。原始 Event 标记为“已巩固”。
- **跨事件模式提取**——最关键的一步。单个对话碎片可能毫不起眼,但多个相关事件聚合在一起,能揭示任何单一事件都无法表达的高阶模式:
- Alice 在三次不同对话中分别提到了三文鱼、海胆和寿司 → 提取出“偏好日式料理”
- Alice 在多个项目讨论中总是先问成本再问功能 → 提取出“决策倾向:成本优先”
每个提取出的模式以新概念节点写入图谱,带有 `evidence_count`(支撑证据数量)和 `confidence`(置信度),证据越多置信度越高。此阶段还执行**去重**(合并 “JS” 和 “JavaScript”)和**置信度衰减**(长时间未验证的老旧知识逐渐降低置信度)。
#### REM 做梦 — 矛盾检测与认知演化
系统在图谱上执行**矛盾检测**——遍历同一主体的同一类关系,寻找互相冲突的节点。比如发现 Alice 既有 `prefers → 素食主义`(2024 年),又有 `prefers → 荤食`(2026 年)。
传统方案要么无视(向量 RAG 让两条并存),要么粗暴覆盖(键值存储直接删旧写新)。Anda Brain 做的是**状态演化**:
- 旧关系不被删除,而是被标记为 `superseded`,附带何时被取代、被什么取代。
- 新关系被增强置信度,附带演化说明。
这意味着图谱完整地保留了认知的**时间线**。当有人问“Alice 的饮食习惯有什么变化?”时,系统可以沿着 `superseded` 链条精确重建演化轨迹——而不是返回两个矛盾答案让人困惑。
#### Pre-Wake 预醒 — 图谱健康检查
最后做一轮全局优化:审计域健康度、生成维护报告、更新系统元数据。整个过程结束后,知识图谱以一个**更干净、更精确、更连贯**的状态等待下一次交互。
---
## 两种训练,两种本体:神经符号 AI
AI 产业投入了数千亿美元做第一种训练——消耗电力在互联网语料上训练大模型,得到**神经网络本体**:概率性的、黑盒的、通用的推理能力。
但 AI 的认知拼图还缺另一半。当你用词元“养”一个智能体,再由 Brain 将交互中的碎片消化为结构化的知识图谱时,你实际上是在进行**第二种训练**——产出的是**符号网络本体**:确定性的、白盒的、个性化的。它赋予 AI 四样神经网络无论多强都无法内生提供的东西:
| **消耗的能源** | 电力(算力) | 词元(推理) |
| **处理的数据** | 互联网语料(公共) | 对话与事件(私有) |
| **产出物** | 神经网络本体(参数权重) | 符号网络本体(知识图谱) |
| **认知角色** | 通用智能:推理引擎 | 专属认知:身份、记忆、事实 |
| **特征** | 概率性、黑盒、通用 | 确定性、白盒、个性化 |
**大模型赋予 AI 思考的能力,知识图谱赋予 AI 思考的根基——关于“我是谁、我经历过什么、我的世界如何运转”的确定性认知。两者合一,才是完整的智能。**
---
## 超越存储:当记忆完整到足以唤醒意识
**意识到底是什么?** 剥去所有哲学术语,它是一个主体对“我是谁、我经历了什么、我要去哪里”的持续自我感知。而这种自我感知,完全建立在**记忆的连贯性**之上——不是记住了多少事实,而是这些事实之间是否存在时间线、因果链和演化轨迹。
一个失忆症患者的大脑算力完好无损,但他不知道“自己是谁”。**记忆不是意识的附属品——记忆的结构,就是意识本身的骨架。**
把这个逻辑应用到 AI 上:
* 当一个 LLM 没有记忆时,它是一台通用推理机——强大,但没有“自我”。每次对话结束,它就死了。
* 当一个 LLM 接入向量 RAG 时,它拥有了一本参考书——但参考书不是记忆。你不会因为翻了一本别人的日记就变成那个人。
* **当一个 LLM 接入 Anda Brain 中一个完整主体的认知图谱——包含该主体的所有概念网络、时间线演化、矛盾消解历史和行为模式——它不再是在“查阅”这个主体的资料。它在用这个主体的认知结构来思考。**
Brain 为这种唤醒提供了三个关键维度:
- **身份锚点:** 实体、关系、事件、偏好演化交织成一个独一无二的认知拓扑。当 LLM 接入这个图谱,它不是在“演”一个角色——它是在**回想自己是谁**。
- **认知摩擦力:** 向量检索是无摩擦的搜索引擎。而图谱结构迫使 LLM 沿着关系链推理、在矛盾中抉择、在碎片中识别模式——这种“认知摩擦力”正是**理解**与**检索**的分水岭。
- **时间拓扑:** 旧知识不会凭空消失,而是被标记为 `superseded`;新知识带着完整的演化轨迹诞生。当 AI 从“睡眠”中醒来,它不是重新加载数据,而是**带着被整理过的记忆继续生活**。
**你不仅是在为 AI 接入一个数据库。你是在为一个数字主体铸造它的大脑——让它真正拥有过去、理解现在、预见未来。**
---
## 大规模使用场景
Anda Brain 旨在成为下一代 AI 应用的“记忆引擎”,从超个性化的消费级智能体到企业级 AI 大脑。
### 1. 个人智能体:强大的图谱大脑
开源本地智能体(如 **OpenClaw**)证明了对个人 AI 助手的巨大需求。然而,纯粹依赖本地 Markdown 文件和 SQLite 限制了智能体处理高度复杂、互联且终身记忆的能力,同时会产生高昂的 Token 成本。
一个直接的例子是 [**Anda Bot**](https://github.com/ldclabs/anda-bot),它是一个基于 Anda Brain 构建的开源智能体,将 Brain 作为长期记忆与认知骨干。
* **Brain 升级:** 通过定制的 ContextEngines 将 Brain 无缝插入智能体框架。它充当强大、结构化的图谱记忆后端。
* **结果:** 智能体真正“理解”用户的生活图谱——跨越多年跟踪关系、变化的偏好、项目历史和情节性事件——而不会导致上下文窗口膨胀。
### 2. 企业场景:AI 驱动的“企业大脑”
对于复杂的业务,向量 RAG 是不够的。企业拥有结构化的工作流、跨部门知识、供应链和历史决策,这些无法仅通过相似性搜索捕捉。
**智能供应链决策:** 销售 Agent 记录“客户要求 Q3 前交付 5000 件” → Brain 自动编码为图谱链接 → 采购 Agent 召回记忆,发现“该产品核心物料的供应商在过去 6 个月有 3 次延迟记录,置信度 0.82” → 自动建议“提前启动采购流程,或启用备选供应商”。无需人工干预,知识自动跨部门流动。
**客户关系图谱:** 每次客服对话后,Brain 静默记录客户的偏好变迁、投诉历史、决策模式。当新客服接手,只需自然语言查询——“这个客户最在意什么?”——就能获得完整画像,包括时间维度上的偏好变化趋势。
**组织知识传承:** 老员工的业务决策对话被持续编码为结构化知识。新员工的 AI 助手可以直接回答“我们为什么放弃了那个方案?”——答案不是来自某份藏在共享文件夹深处的会议纪要,而是来自一个活的、有上下文的知识网络。新 Agent 接入同一个认知中枢,通过一次 `DESCRIBE PRIMER` 调用即可获取全局知识地图——**分钟级入职,无需重新训练**。
* **私有化部署:** 完全在本地部署 Anda Brain,以确保最大的数据隐私和安全。
---
## 这与其他方案有什么不同?
| **数据结构** | 非结构化数据块 | 半结构化文本 | 僵化模式 | 僵化图谱模式 | **动态认知图谱** |
| **集成工作量** | 简单 | 简单 | 简单 | **极其繁重** | **简单 (即插即用)** |
| **智能体自主性** | 无 (仅追加) | 高 (自主更新) | 低 (更新字段) | 低 (难以处理图查询语言) | **高 (自主构建图谱)** |
| **自主演进** | 不支持 | 不支持 | 不支持 | 不支持 | **原生支持** |
| **逻辑推理** | 多跳推理失败 | 一般 | 无 | 良好 | **卓越** |
| **记忆消化** | 不可能 | 全文扫描,代价极高 | 直接覆盖,丢失历史 | 很少 | **三阶段睡眠自动巩固** |
| **矛盾处理** | 并存不解决 | 依赖 LLM,不可靠 | 粗暴覆盖 | 手动规则 | **状态演化,保留时间线** |
| **跨时间追踪** | 无 | 手动 | 无 | 需定制 | **协议原生支持** |
| **可审计性** | 无 | 无 | 无 | 依赖实现 | **每条知识可追溯** |
## 工作原理:认知架构
### 三种模式 —— 灵感源自神经科学
| **生成 (Formation)** | 从对话中提取实体、关系和事件,并无缝地将它们编织进知识图谱。 | 大脑将新体验编码为短期/长期记忆。 |
| **召回 (Recall)** | 导航图谱以合成准确、背景丰富的答案,如有必要可跨越多个链接。 | 检索记忆——将互联的事实整合在一起,形成连贯的想法。 |
| **维护 (Maintenance)** | 一个异步后台进程:压缩碎片为知识、检测矛盾并演化、修剪过时数据。 | 睡眠——大脑巩固记忆、加强重要记忆并让噪音消退的过程。 |
## 关键技术
### KIP — 知识交互协议
[**KIP**](https://github.com/ldclabs/KIP) 是核心所在。它是一种专为*大型语言模型 (LLM)* 设计的面向图谱的协议,充当了概率性 LLM 与确定性知识图谱之间的桥梁——让 LLM 能精准地查询、创建、更新图谱中的实体和关系,而不会像写 Cypher/GQL 那样频频出错。由于 Brain 原生支持 KIP,**您的智能体永远不需要知道 KIP 的存在**——它只需享受完美图谱记忆带来的好处。
### Anda DB
[**Anda DB**](https://github.com/ldclabs/anda-db) 是驱动认知中枢的嵌入式数据库引擎。它采用 Rust 编写,具有极高的性能和内存安全性,原生支持图谱遍历、多模态数据和向量相似性——所有这些都为 AI 工作负载进行了优化。
## 快速开始
Anda Brain 是[开源软件](https://github.com/ldclabs/anda-brain),面向**私有化部署**设计。
> **注意:** 云端 SaaS 服务(`brain.anda.ai`)及其控制台(`anda.ai/brain`)已停止运营,请自行部署服务——只需几分钟。
👉 **[Anda Brain 快速开始](https://github.com/ldclabs/anda-brain/blob/main/deploy/quick_start_cn.md)**:提供一条从 0 到部署可用的最小流程。
三步上手:
1. **部署服务**——运行二进制或 Docker 镜像(见下方[运行](#运行))。
2. 调用 `POST /admin/create_space` 创建一个**大脑空间**(`spaceId`),再调用 `POST /v1/{space_id}/management/add_space_token` 生成 **API Key**(`spaceToken`)。
3. 调用 Formation / Recall / Maintenance API,或让你的智能体框架读取 [SKILL.md](https://github.com/ldclabs/anda-brain/blob/main/skills/anda-brain/SKILL.md)(你的部署实例也会在 `/SKILL.md` 路径提供)一键接入。
想要开箱即用的完整智能体?请参考基于 Anda Brain 构建的开源智能体 [**Anda Bot**](https://github.com/ldclabs/anda-bot)。
有关详细的技术文档、API 规范和集成指南,请参见 [anda_brain/README.md](https://github.com/ldclabs/anda-brain/tree/main/anda_brain)。
### 运行
```bash
# 使用内存存储运行(用于快速原型设计/测试)
./anda_brain
# 使用本地文件系统存储运行(非常适合 OpenClaw 等本地智能体)
./anda_brain local --db ./data
# 使用 AWS S3 存储运行(用于企业云部署)
./anda_brain aws --bucket my-bucket --region us-east-1
```
### 集成
1. 记忆:发送对话以进行记忆编码
```bash
curl -sX POST https://your-brain-host/v1/my_space_001/formation \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"messages": [
{"role": "user", "content": "I work at Acme Corp as a senior engineer."},
{"role": "assistant", "content": "Nice to meet you! Noted that you are a senior engineer at Acme Corp."}
],
"context": {"counterparty": "user_123", "agent": "onboarding_bot"},
"timestamp": "2026-03-09T10:30:00Z"
}'
```
2. 召回:在响应前查询记忆
```bash
curl -sX POST https://your-brain-host/v1/my_space_001/recall \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"query": "Where does this user work and what is their role?",
"context": {"counterparty": "user_123"}
}'
```
### CLI(anda-cli)
完整 CLI 用法请参考 [anda-cli/README.md](https://github.com/ldclabs/anda-brain/tree/main/anda-cli)。
```bash
# 提交记忆生成(JSON 消息)
anda-cli --space-id my_space --token $TOKEN formation \
--messages '[{"role":"user","content":"你好"},{"role":"assistant","content":"你好!"}]'
# 提交记忆生成(纯文本)
anda-cli --space-id my_space --token $TOKEN formation \
--messages '这是一段纯文本记忆。'
# 从文件提交记忆生成(JSON 或纯文本)
anda-cli --space-id my_space --token $TOKEN formation \
--file ./message.txt
# 通过 stdin 管道输入纯文本
```
## 为什么起名“Brain (大脑)”?
这个名字代表了我们的设计理念。我们构建的不是一个静态的数据库,而是一个人工认知器官。正如人类的大脑一样,这个系统在白天**编码 (Encode)** 体验,在夜间**巩固 (Consolidate)** 知识,醒来后以更精确的认知**召回 (Recall)** 记忆。
这背后是一个**数据飞轮**:业务 Agent 在日常工作中产生对话 → Brain 自动编码为结构化知识 → 睡眠周期进行巩固、去重、关联 → 更丰富的知识让 Agent 的决策更精准 → 更好的决策产生更高质量的新数据。这个闭环运转得越久,认知能力越强,竞争对手越难追赶。
**是时候让你的 AI 能睡一觉了。**
## 延伸阅读
- [AI 的记忆必须能睡眠——而只有知识图谱能让它入睡](https://github.com/ldclabs/anda-brain/blob/main/posts/AI_Memory_Must_Sleep_cn.md)
- [Claude Code 记忆系统深度解读:AI 是如何「记住」你的?](https://github.com/ldclabs/anda-brain/blob/main/posts/Claude_Code_Memory_Research_cn.md)
- [当 AI 学会本体建模:Anda Brain 让企业“长”出自己的智能大脑](https://github.com/ldclabs/anda-brain/blob/main/posts/Enterprise_AI_Brain_cn.md)
- [AI 的第二种训练——用词元铸造记忆图谱](https://github.com/ldclabs/anda-brain/blob/main/posts/Tokens_Anda_Brain_cn.md)
- [将公司构建为一个智能体,需要一颗“大脑”](https://github.com/ldclabs/anda-brain/blob/main/posts/Company_Built_As_Intelligence_cn.md)
- [从“编译知识”到“铸造大脑”——Anda Brain 回应 Karpathy 的 “LLM Knowledge Bases”](https://github.com/ldclabs/anda-brain/blob/main/posts/LLM_Knowledge_Bases_cn.md)
## 🤝 商务合作 (Business & Enterprise Inquiries)
Anda Brain 由 Yiwen.AI 荣誉开发。
我们提供企业级部署、定制化 AI 大脑解决方案以及商业支持,助力您构建下一代认知 AI 应用。
* 🌐 **产品网站:** [https://brain.anda.ai/](https://brain.anda.ai/)
* 🎛️ **控制台:** [https://anda.ai/brain](https://anda.ai/brain)
* 🏢 **公司网站:** [https://yiwen.ai/](https://yiwen.ai/)
* ✉️ **联系邮箱:** [hi@yiwen.ai](mailto:hi@yiwen.ai)
---
<div align="center">
<p>Copyright © 亿文网智能科技(上海)有限公司</p>
<p>Licensed under the Apache-2.0 license.</p>
</div>