GBrain – Y Combinator 总裁开源的个人生产级AI记忆系统
GBrain – Y Combinator 总裁开源的个人生产级AI记忆系统
2周前发布
GBrain是什么
GBrain 是 Y Combinator 总裁 Garry Tan 开源的个人生产级AI记忆系统,专为 、Hermes Agent 等 AI Agent 平台设计。工具把散落的 Markdown 笔记转化为可搜索、可推理、持续增长的知识图谱,让 Agent 拥有长期记忆。Garry 本人用工具管理 10000+ 文件、3000+ 人脉、13 年日历数据,系统内已有 17888 个页面、4383 个人物、723 家公司、21 个定时任务全自动运转,12 天搭建完成。

GBrain的主要功能
- 自动信号捕获:每条消息触发便宜模型并行提取原创观点与实体提及,后台自动归档。
- Brain-ops 优先查询:Agent 回答前先查大脑,查不到直接告知而非 hallucinate。
- 多源内容摄入:支持会议、邮件、推特、PDF、视频、GitHub 仓库等全格式自动消化。
- 实体自动丰富:人物/公司按提及次数自动升级(1 次 stub → 3 次联网补料 → 8 次/开会完整档案)。
- Compiled Truth + Timeline:上层为可改写的当前最佳理解,下层为只追加的证据时间线。
- 混合搜索:向量 + 关键词 + RRF 融合 + 多查询扩展 + 4 层去重,Recall@5 达 95%。
- 知识图谱自连接:每次写入零 LLM 调用自动提取实体关系(attended/works_at/invested_in 等)。
- Minions 后台队列:确定性任务走 Postgres 原生作业队列,753ms 完成、零 token 成本、100% 成功率。
- Skillify 技能管理:自动生成 SKILL.md + 测试 + 评估 + 解析器触发器,防止技能树黑箱化。
- 语音通话:接入 Twilio + OpenAI Realtime,来电自动拉取对方档案并生成通话脑页。
- 每日简报:自动汇总会议上下文、活跃交易、引用追踪与待办事项。
GBrain的技术原理
- 三层架构分离:GBrain 采用 Brain Repo(Git 托管的 Markdown 文件,人类可读可编辑的唯一数据源)→ GBrain 检索层(Postgres + pgvector 混合搜索引擎)→ AI Agent(26 个 Skill 定义读写逻辑)的分离架构。Agent 通过 BrainEngine 接口读写,底层支持 PGLite(嵌入式 Postgres,零配置)和 PostgresEngine(Supabase)双向热迁移。
- Compiled Truth + Timeline 双层知识模型:每个 Markdown 页面以
---分隔为两层:上方是 Compiled Truth(当前最佳理解,随新证据持续改写),下方是 Timeline(只追加不删除的原始证据链)。这种设计让认知可以进化,同时保留完整审计轨迹,避免纯覆盖式更新丢失历史或纯追加导致查询噪音。 - 零 LLM 调用知识图谱自连接:每次页面写入后,确定性正则管道自动提取实体引用(Markdown 链接 + bare slugs),推断类型化关系(attended/works_at/invested_in/founded/advises),并完成去重、失效链接清理、反向链接更新。整个过程零 LLM 调用,纯本地正则 + 优先级推断级联实现。
如何使用GBrain
- Agent 自动安装(推荐):在 OpenClaw 或 Hermes Agent 中粘贴指令
Retrieve and follow the instructions at: https://raw.githubusercontent.com/garrytan/gbrain/master/INSTALL_FOR_AGENTS.md,Agent 自动克隆仓库、安装依赖、加载 26 个 Skill、配置定时任务,约 30 分钟完成。 - 独立 CLI:
git clone https://github.com/garrytan/gbrain.git && cd gbrain && bun install && bun link,然后gbrain init初始化本地大脑(PGLite,2 秒就绪),gbrain import ~/notes/导入笔记,gbrain query "..."查询。 - MCP Server:本地通过
gbrain serve暴露 30+ MCP 工具,接入 Claude Code/Cursor/Windsurf;远程部署到 Supabase 后通过 ngrok 固定域名接入 Claude Desktop/Cowork/Perplexity。 - 数据接入:运行
gbrain integrations查看并配置 Gmail、日历、Twitter、会议转录等集成配方。
GBrain的关键信息和使用要求
- 环境要求:Node.js + Bun(推荐),PGLite 零配置本地运行,或 Supabase Postgres($25/月)多设备同步。
- API Key:需配置 OpenAI(嵌入)、Anthropic(可选,用于子 Agent)、Groq(语音转录)等。
- 存储:Markdown 文件为唯一数据源,人类可直接编辑,
gbrain sync自动同步。 - 与 GStack 关系:GStack(8 万+ Star)教 Agent 写代码,GBrain 教 Agent 记事和思考,通过
hosts/gbrain.ts桥接可合体使用。 - 许可:MIT 开源,可商用。
GBrain的核心优势
- 生产级验证:YC 总裁亲自日用,非玩具级 Demo,是真刀真枪跑出来的工作流。
- 自进化知识图谱:实体关系自动提取零 LLM 调用,搜索精度比纯向量提升 28.8 个百分点。
- 确定性后台任务:Minions 将确定性工作与判断性工作分离,成本从 $0.03/次降至 $0,成功率从 0% 提至 100%。
- 分层知识模型:Compiled Truth 保证认知实时进化,Timeline 保证证据链永不丢失。
- Agent 原生设计:支持安装、运维、扩展全部面向 AI Agent 非人类手动操作。
GBrain的项目地址
- 项目官网:https://github.com/garrytan/gbrain
GBrain的同类竞品对比
| 对比维度 | GBrain | LlamaIndex | Pinecone | |
|---|---|---|---|---|
| 定位 | AI Agent 长期记忆系统 | 个性化 AI 记忆层 | LLM 应用数据框架 | 向量数据库 |
| 知识图谱 | 原生自连接,零 LLM 调用 | 无原生图谱 | 需手动构建 RAG 图谱 | 无,纯向量存储 |
| 实体自动升级 | 按提及次数自动升级 | 基于用户交互记忆 | 需开发者配置 | 不涉及 |
| 搜索方式 | 向量+关键词+RRF+图谱遍历 | 向量搜索为主 | 多种检索器可选 | 纯向量/混合搜索 |
| Agent 集成 | OpenClaw/Hermes/MCP 原生 | 多框架 SDK | LangChain/LlamaIndex | 需自行封装 |
| 后台任务 | Minions 原生队列,零 token | 无原生队列 | 无 | 无 |
| 数据格式 | Markdown 为唯一源 | 多格式 API 摄入 | 多格式节点 | 向量嵌入 |
| 开源协议 | MIT | Apache 2.0 | MIT | 商业/开源混合 |
| 生产验证 | YC 总裁 1.7 万页生产环境 | 多家公司使用 | 广泛企业采用 | 广泛企业采用 |
| 安装方式 | Agent 自装 30 分钟 / CLI | pip 安装 SDK | pip 安装 | 云托管/自托管 |
GBrain的应用场景
- 投资人/创始人关系管理:自动归档会议、邮件、社交动态,会前 30 秒生成对方完整档案与历史互动。
- 个人知识库:将多年笔记、文章、想法转化为可推理的知识图谱,支持”我半年前对某事的观点”类查询。
- 研究自动化:摄入论文、报告、视频后自动提取实体、建立引用、生成时间线,辅助学术或行业研究。
- 内容创作辅助:追踪灵感来源、自动补全引用、维护主题标签一致性,防止创作过程中的信息遗漏。
- 智能日程与任务:每日自动准备会议简报、巡检过期页面、修复损坏引用、生成周期性报告。
© 版权声明 本站文章版权归 所有,未经允许禁止任何形式的转载。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
没有相关内容!
暂无评论...
