Tana 5 月大爆发:Voice Agent + Live Digest 让 BibiGPT 视频总结直接变会议级笔记
Tana 5 月大爆发:Voice Agent + Live Digest 让 BibiGPT 视频总结直接变会议级笔记
如果你已经在用 Tana 管理知识库,5 月这一波更新可能是过去一年里改变最大的一次——不只是加功能,而是把「语音」这个维度直接插进了笔记交互的核心。再加上 Live Meeting Digest 和 Build Custom Agents,Tana 正在把自己从「结构化笔记工具」变成一个可以开口说话、实时感知会议、自主处理信息的 AI 工作伴侣。
对 BibiGPT 用户来说,这意味着一件很具体的事:以前你用 BibiGPT 总结的会议录像、讲座视频,现在可以直接被 Tana Voice Agent 朗读出来,让你在通勤路上「听昨日会议复盘」——完全不用盯着屏幕。
一、Tana 2026 年 5 月发生了什么
按时间线,Tana 5 月集中释放了一组高密度更新,语音和 AI 工作流是绝对主线:
- 5 月 26 日 · Build custom agents — 用自然语言描述即可创建专属 voice agent,无需编程
- 5 月 26 日 · Voice agent features — 7 种声音 profile,支持自由选择 agent 角色、声音风格和语言
- 5 月 20 日 · Live digest 与 AI workflows — 「Live meeting digest narrates progress」,AI 可在 supertag 上构建和编辑工作流
- 5 月 17 日 · Voice agent in meetings — 会议进行时可用语音参与,支持「Hey Tana」唤醒词
- 5 月 12 日 · Content language 与 summaries — 每次通话结束自动生成权威摘要,文档自动 pin 到对应事件
- 5 月 8 日 · New meeting digest — 专属 digest 面板,整合转录、截图与 AI 子区三位一体
- 5 月 1 日 · Video and audio support — 编辑器中原生支持内联视频和音频播放,无需跳出到外部播放器
- 4 月 24 日 · Team tasks view — 支持按 assignee 分组的团队任务面板
完整 changelog:Tana Releases
一句话概括:Tana 5 月不是在「补功能」,而是在把整个工具从「静态知识库」推向「可以主动参与你工作的 AI 伙伴」。
二、对 BibiGPT 用户意味着什么——我的观点
用一张图把上面的概念落到纸面上——下面这张草图展示了关键脉络:

配图:BibiGPT 团队为本文绘制(手绘风格)
看完 Tana 这波更新的第一反应,很多人会问:「Tana 现在能处理音视频了,BibiGPT 还有用吗?」这个问题问得好,但答案和你想的可能完全不同。
这个更新解决了什么用户痛点
Tana 5 月这波的核心是把 AI 能力从「静态检索」推到「实时感知 + 语音交互」。Meeting Digest 解决的是「会议正在进行时」的实时归纳问题——AI 边听边转录,边转录边整理,会议结束时你已经有了一份可搜索的结构化文档,而不是一堆未整理的录音。Voice Agent 则更进一步,让 Tana 里的内容可以被说出来——不是 TTS 机械朗读,而是可以用 7 种声音风格、在不同语言之间切换的「会说话的 AI 笔记」。
这两个方向加在一起,解决的痛点是:「我的笔记在 Tana 里沉睡着,我没有时间坐下来翻」。现在你可以让 Voice Agent 在你开车或通勤时朗读上周的内容综述,用「Hey Tana」随时打断追问。这是从「被动容器」到「主动播报」的质变。
我的观点:Tana Voice Agent 本质是把会议场景的 AI 工作流推到了极致——但它解决的是「会议进行时」的实时问题,BibiGPT 解决的是「会议结束后回放视频」的异步问题。两者的触发时机根本不同:Tana 的 Meeting Digest 是你开着会、AI 在旁边实时记录;BibiGPT 是你把昨天、上周、甚至三年前的一段 YouTube 讲座链接丢进来,30 秒后拿到结构化总结。这两个场景完全不重叠。
和 BibiGPT 现有能力的关系:天然互补
Tana 的视频和音频支持(5 月 1 日)解决的是「在编辑器里内联播放」的体验问题——你看笔记时不用跳出去开播放器。但它没有做「视频内容理解」:内联播放不等于 AI 看懂了视频说了什么,不会给你生成章节大纲、提炼高光要点、翻译字幕。这是两件完全不同的事。
BibiGPT 做的是「源头视频理解」——把一段 90 分钟的会议录像、一集播客、一节网课,用 AI 算力转成有结构的文字输出:时间轴摘要、章节大纲、高光要点、中英文字幕。这个能力和 Tana 不重叠,也不打算重叠。
我的观点:Tana 没做「视频源头理解」,BibiGPT 没做「实时会议参与」——这是天然的流水线分工。最有价值的组合方式是:先用 BibiGPT 把会议录像或讲座视频总结成结构化文字,再把这些内容导入 Tana;然后让 Tana Voice Agent 朗读复盘,用 Live Digest 把一周内容串成叙事流。用户可以做到「下班路上听昨日会议总结」,BibiGPT 负责把录像变成文字,Tana 负责把文字变成声音——一个完整的异步学习闭环。
Build Custom Agents 的真正价值
5 月 26 日发布的「Build Custom Agents」是这波更新里容易被低估的一条。以前创建一个定制化的 AI 工作流需要配置规则、写触发条件;现在你只需要用自然语言描述你想要的 agent 行为,Tana 会自动把它变成一个可运行的 voice agent。
对 BibiGPT 用户而言,这意味着你可以创建一个专属 agent,规则类似:「当我的 Tana 数据库里出现新的『会议总结』节点时,用平静的男声、中文,朗读摘要部分,遇到专业名词停顿两秒,结尾追加『是否需要展开某一章节?』」。这种精细程度的定制,靠自然语言描述就能创建,这才是真正降低了配置门槛。
免费试用 BibiGPT,把第一个视频总结导入 Tana——30 秒出结果,不需要注册信用卡。
三、实战工作流:BibiGPT × Tana Voice Agent 的「异步听书」闭环
这套工作流专为「内容消费密度高但时间碎片化」的用户设计——会议多、讲座多、播客多,但能坐下来翻笔记的时间越来越少。5 步完成配置,之后进入全自动循环:
第 1 步:BibiGPT 粘贴会议录像 / 讲座视频链接
打开 BibiGPT,粘贴 B 站、YouTube、腾讯会议导出的录像链接,或直接上传本地视频文件——30 秒内生成结构化摘要 + 时间轴章节 + 高光要点 + 可选字幕翻译。这是整个工作流的「原材料加工」环节,也是唯一需要有视频链接的步骤。
第 2 步:一键导出到 Tana,supertag 自动归类
在 BibiGPT 总结页面点「导出到 Tana」,内容会以结构化 node 的形式落进你的 Tana 数据库。配合 Tana 的 supertag 功能,可以预先设置规则:「标题包含『会议』的 node,自动加上 #meeting-notes supertag,归入『工作复盘』分支;标题包含『课程』的,自动归入『学习输入』分支」。这样每次从 BibiGPT 导入,内容都不会乱放。
第 3 步:用自然语言创建专属 Voice Agent
进入 Tana 的 Build Custom Agents 界面,用一句话描述你的 agent:「每天早上 8 点,扫描我昨天新加入的所有 #meeting-notes 节点,用清晰的普通话朗读每条摘要,遇到人名和项目名加重语气,每条结束后停顿 3 秒」。Tana 会把这个描述转成可运行的 agent 配置,你可以在 7 种声音 profile 里选一个最顺耳的。
第 4 步:用 Live Digest 把本周视频总结串成「内容流」
打开 Tana 的 Live Meeting Digest 面板,把本周从 BibiGPT 导入的所有节点拖进「本周内容流」视图。Live Digest 会自动帮你把这些零散节点串成叙事线——按时间顺序排列,AI 补充每条之间的连贯语句,形成一份「本周我看过 / 听过 / 参加过什么」的可朗读版本。这一步不需要你手动编辑任何东西。
第 5 步:通勤路上「Hey Tana」唤醒,朗读 + 追问
在手机上打开 Tana,说「Hey Tana,朗读本周内容流」,Voice Agent 开始播报。如果某条会议总结提到了一个你想深挖的点,可以直接说「展开第二条的第三个要点」——agent 会继续播报对应节点的详细内容,而不是打断整个流程重新开始。会议回顾、讲座复习、每周知识回炉,全在通勤路上解决。
这套流程的核心逻辑:BibiGPT 是把视频变成文字的机器,Tana 是把文字变成声音的机器——两个工具解决两个不同的物理问题,串联起来才完整。
四、语音笔记时代的新基础设施
Tana 5 月这波更新,和其他笔记工具的「AI 升级」有一个本质区别:它不是在已有界面里加一个 AI 按钮,而是在重新定义「笔记」和「使用者」之间的交互形式。Voice Agent 让笔记可以主动开口;Live Digest 让笔记实时感知;Build Custom Agents 让每个人都能用自然语言定义自己的信息处理规则。
把 BibiGPT 当成「视频内容理解层」,Tana 当成「结构化记忆 + 语音播报层」——这是 2026 年知识工作者最值得投入的一组搭档。内容进入 BibiGPT 被提炼,再进入 Tana 被结构化存储和语音激活,形成真正意义上的「异步学习闭环」:不需要专门腾出时间翻笔记,笔记会在你有碎片时间的时候主动找来你。
想看更多笔记软件 × BibiGPT 协同玩法?这是我们的 笔记软件分类博客,每个工具都有专属的 1+1>2 工作流解读。
你怎么用 BibiGPT × Tana?欢迎在微信公众号「魔法司」留言分享你的工作流。