思源笔记 v3.7 CLI + 内核插件 + 块拖拽:国产开源笔记的 AI 时代答卷
思源笔记 v3.7 CLI + 内核插件 + 块拖拽:国产开源笔记的 AI 时代答卷
如果你用 BibiGPT 把 B 站、YouTube、播客的视频一键转成结构化笔记,又同时是思源笔记的用户——那么思源 v3.7.x 这一波开发版更新,对你的工作流有一些值得认真看的改变。这不是界面小修,而是在架构层面打开了「本地 AI 自动化」的口子。
一、思源 v3.7.x 发生了什么
按发布顺序,思源笔记 2026 年 5 月在 v3.7.x 开发版集中发布了以下能力:
- v3.7.0-dev7(2026-05-24) — 命令行 CLI 支持(核心里程碑)/ 内核插件系统上线 / 全新默认主题与图标
- v3.7.0-dev6(2026-05-18) — CLI 功能持续迭代 / 块编辑增强(递归折叠 / 展开自定义块)/ 新增泰语、荷兰语、印尼语、印地语、乌克兰语五种语言
- v3.7.0-dev5(2026-05-17) — 核心插件系统 / 块拖拽(移动端 + 平板) / 桌面与移动端文件导出独立方案(不依赖浏览器)
- v3.7.0-dev4(2026-05-14) — 块编辑递归折叠 / 展开 / IFrame Block 性能改进
- v3.7.0-dev3(2026-05-12) — 移动端平板拖拽排序 / Inbox 拖拽图片到编辑器 / 多语言扩展
完整 changelog:思源笔记 GitHub Releases
一句话概括:思源 v3.7 在不新增内置 AI 的前提下,把笔记本身变成了一个可以用脚本和插件驱动的本地 Agent 底座。
二、对 BibiGPT 用户意味着什么——我的观点
下面这张手绘草图把刚才说的几个角色之间的关系一次画清:

配图:BibiGPT 团队为本文绘制(手绘风格)
乍一看这次更新和「AI 笔记」关系不大——没有内置的大模型按钮,没有「一键总结」功能,也没有 Notion AI 那种直接嵌在块里的生成能力。但如果你把视角拉高一格,会发现思源在走一条完全不同的路。
观点一:CLI + 内核插件 = 本地 Agent 可编程层
Notion AI / Tana voice agent 的路线是:把 AI 嵌进产品里,你在产品内触发、在产品内消费结果,算力在云端跑,数据上传云端。这对普通用户友好,但代价是你对「AI 怎么跑、跑在谁的服务器上、用的什么模型」几乎没有控制权。
思源 v3.7 的路线截然不同:把笔记本身做成可被脚本驱动的底座。CLI 意味着你可以用 siyuan-cli --notebook="工作笔记" --create-doc "2026-05-28" 这样的命令在本地直接创建、修改、检索文档,不需要打开 GUI。内核插件系统意味着插件可以在思源进程内部钩住文档的生命周期,做数据加工、索引构建、本地向量化——全部在本地,AI 逻辑由你自己决定用什么模型跑。
我的观点:这是一种「元工具」策略——思源不是要替你选 AI,而是要成为一个可以让你把任意 AI 接进来的本地底座。Notion 的路线是「AI 在产品里给你服务」,思源的路线是「产品是基础设施,你自己决定 AI 是谁、怎么跑、数据在哪」。这对 BibiGPT 的用户群——财经人士、律师、医生、科研工作者——是截然不同的价值主张。我个人认为,思源这次走对了方向,它选择了一个 Notion 在结构上无法去做的差异化:本地优先 + AI 可编程 + 零数据外泄。
BibiGPT 的核心用户和思源高度重合。两个产品都有大量对「数据掌控感」有强需求的用户:财经圈关心投研逻辑不外泄,律师和医生关心客户/患者信息本地,科研用户关心未发表观点不上云。思源 v3.7 的这次升级,直接把「视频理解 → 本地笔记 → 本地 AI 二次加工」这条流水线打通的技术门槛降到了可用级别。
观点二:BibiGPT 和思源是上下游,不是竞品
说到「AI 笔记」,很多人会本能地把 BibiGPT 和有本地 AI 能力的笔记软件放到竞争框里对比。但仔细看两边的边界,会发现这个判断是错的。
BibiGPT 做的是源头视频理解:把一段 90 分钟的播客、一节网课、一个 YouTube 访谈,用算力转成结构化文字 + 章节大纲 + 高光要点 + 思维导图。这件事依赖大规模转录能力、多语言理解、视频时间轴对齐——是一个重度依赖云端算力的任务,也是思源从来没打算自己做的事。
思源做的是本地知识沉淀和可编程底座:把你的笔记按块结构存储,通过 CLI 和插件开放操作接口,让你自己决定知识如何组织、AI 如何加工。这件事完全本地、零依赖云端,也是 BibiGPT 从来没打算做的事。
我的观点:思源 v3.7 CLI + 插件系统让 BibiGPT 视频总结可以走完一条完全本地的流程:BibiGPT 在云端做视频理解 → 以 webhook 推送结构化 markdown → 思源 CLI 在本地写入指定 notebook → 内核插件调用本地模型(如 Ollama)做跨视频 RAG 追问 → 所有过程除了「视频理解」这一步,完全离线、零数据外泄。这条流水线的隐私保证是 Notion AI 或任何纯云端笔记软件在架构上无法提供的。你把视频链接给 BibiGPT,BibiGPT 做理解,剩下所有知识加工在你自己的机器上——这是真正的「用算力节省脑力,同时掌握自己的知识」。
移动端块拖拽和递归折叠 / 展开这两个功能看起来是小功能,但对于习惯在手机上整理笔记的用户来说其实是长期缺失的能力。iPad 上用思源一边看视频、一边把 BibiGPT 导出的章节块拖拽重组,比之前流畅很多。
三、实战工作流:BibiGPT × 思源 v3.7 的完全本地流水线
下面这套工作流以「视频理解 → 本地笔记 → 本地 AI 加工 → 隐私零泄露」为设计目标,覆盖从视频输入到知识沉淀的完整闭环:
1. BibiGPT 粘贴视频链接,生成结构化总结
打开 BibiGPT,粘贴 B 站、YouTube 或播客链接,30 秒生成结构化摘要 + 章节大纲 + 高光要点。格式支持 Markdown 导出——这是整条流水线的源头,也是唯一需要云端算力的步骤。
2. 导出 Markdown,通过 webhook 推送到本地思源 API
BibiGPT 支持导出结构化 Markdown。你可以用思源内置的 HTTP API(默认 localhost:6806)接收推送:
curl -X POST http://localhost:6806/api/filetree/createDocWithMd \
-H "Authorization: Token your-api-token" \
-d '{"notebook":"视频笔记","path":"/2026-05-28-视频标题","markdown":"# 标题\n..."}'
这一步完全本地——网络请求从你的机器发到你的机器,不经过任何云端服务。
3. 用思源 CLI 批量写入指定 notebook 的块结构
v3.7 新增的 CLI 支持让这一步可以脚本化。你可以写一个简单的 shell 脚本,监听 BibiGPT 导出目录,有新文件就自动调用 siyuan-cli 写入对应 notebook,按视频主题自动分类。批量整理时比 API 调用更直观,也更方便接入自动化工具。
4. 配合内核插件 + 本地模型做跨视频 RAG 追问
这是 v3.7 内核插件系统真正打开的能力。你可以用社区插件(或自己写插件)把思源的文档向量化,配合本地运行的 Ollama 或其他本地模型,实现跨视频的语义追问——比如「这 30 个财经视频里,哪几个提到了利率周期和消费复苏的关联」。整个过程的语义索引和推理都在本地跑,视频原文字幕不上传任何服务器。
5. 用块编辑的递归折叠 / 展开管理章节大纲
BibiGPT 导出的视频总结通常包含多层章节嵌套——主题 → 子话题 → 要点 → 原文引用。思源 v3.7 支持对自定义块的递归折叠 / 展开,一键把整个视频大纲收起,只看主题层,需要细看时再展开。这对整理 10 个以上视频的大型主题研究特别有用。
6. 移动端拖拽组织:把多个视频笔记归入同一专题
v3.7 dev5 / dev6 加入了移动端和平板的块拖拽排序。在 iPad 上整理视频笔记时,你可以直接拖动整个视频总结块,把不同来源(B 站、YouTube、播客)的相关内容拖到同一个专题文档里,完成跨视频的知识聚合,不需要切到桌面端。
7. 完整本地:视频文字全程不上传云端
整条流水线只有第 1 步(视频转录 + AI 理解)需要云端算力,这一步本来就是 BibiGPT 的核心价值所在。第 2 步之后的所有知识加工——存储、组织、二次 AI 分析、跨视频检索——全部在本地完成。对于处理过敏感内容(投研录音、会议纪要、患者访谈记录)的用户来说,这条流水线给出的隐私保证是其他任何纯云端方案无法提供的。
还没试过 BibiGPT 的话,可以 免费试用 BibiGPT 体验视频一键转结构化笔记——粘贴链接 30 秒出结果,导出 Markdown 直接对接思源的 API 或 CLI。
四、视频理解 + 本地知识库 + 隐私零泄露
BibiGPT 解决「把视频高质量转成结构化知识」,思源 v3.7 解决「让这些知识在你自己的机器上被 AI 再次加工」——两者的边界清晰,拼在一起才是真正完整的闭环:视频理解 + 本地知识库 + 隐私零泄露。
思源这次没有做「给用户一个 AI 按钮」这条流行路线,而是选择了做「让用户自己接 AI」的基础设施路线。这条路走起来更慢,但一旦走通,能给用户的自由度和隐私保证是其他产品在架构上难以追赶的。在 Notion AI、Obsidian AI 插件百花齐放的市场里,「本地优先 + 开源 + 可编程」这个组合的竞争力反而因为大家都在往云端走而变得更突出。
想看更多笔记软件 × BibiGPT 协同玩法?这是我们的 笔记软件分类博客,每款软件都有专属的「1+1>2」工作流解读。
你在用思源 + BibiGPT 做什么样的工作流?欢迎在微信公众号「魔法司」留言分享你的实践。