AI-driven YouTube Video Summarizer
BibiGPTAI 音视频助理
更新日志v4.180.1 · 💻 桌面客户端(Beta)丨本地文件
AI-driven Video Summarizer
  1. 欢迎 Bibi 新用户!
更新日志 v4.180.1
开发者日记:💻 桌面客户端(Beta)丨本地文件
吕立青_JimmyLv

吕立青_JimmyLv

https://space.bilibili.com/37648256

每页行数
0/20 行被选中💡 提示:按住 Shift 键点击可连续选择
封面笔记高亮操作菜单

吕立青_JimmyLv

【更新】CutFast AI 智能剪辑:桌面客户端、智能字幕、高光片段、章节拆分,口水词移除,视频创作效率暴涨

06:29

#AI剪辑
#视频创作
#效率工具
#知识管理
#智能标记
哔哩哔哩
【更新】CutFast AI 智能剪辑:桌面客户端、智能字幕、高光片段、章节拆分,口水词移除,视频创作效率暴涨
总结于 6 天前

摘要

视频作者介绍了自研AI剪辑工具CutFast桌面端的核心功能与进展。该工具针对视频创作者痛点,实现智能高光识别、章节拆分、口癖标记、重复语句检测等功能,支持链接导入视频快速粗剪,并逐步完善时间线精剪模块。目标是通过AI提升知识类视频的创作效率,推动优质内容传播,预计12月底正式上线。

亮点

  • 💡 工具支持YouTube/B站链接导入,自动加载视频并识别高光片段与情绪爆点,提升粗剪效率
  • 🎯 创新"划线剪辑"交互:用户选中字幕段落或划线标记即可生成片段,实时预览剪辑效果
  • 🔧 智能标记功能可自动检测口癖词(如"嗯"、"啊")、长停顿及重复语句,支持阈值自定义调整
  • 📊 章节分组与时间线编辑结合:AI粗剪后可通过传统时间线精细化调整字幕/音频/特效
  • 🌐 支持直播录像自动化切片与多语言翻译,为二次传播提供技术基建

#AI剪辑 #视频创作 #效率工具 #知识管理 #智能标记

思考

  1. 如何获取CutFast测试权限?
  • 官网CutFast.st提供内测注册,299美元永久会员或分钟数充值方案,当前购买额度永不过期。
  1. 能否处理非英语视频?
  • 演示中已支持中文口癖检测,多语言字幕翻译功能正在开发,适用于跨语言内容分发。

术语解释

  • 划线剪辑:通过直接勾选字幕文本或滑动划线,实现片段精准截取与实时预览的交互模式。
  • 口癖标记:基于语音识别技术自动定位填充词(如"嗯"、"啊"),辅助删除冗余语气词。
  • 情绪爆点:通过声纹/语义分析识别观众可能互动的高燃片段,适用于短视频切片场景。
  • 时间线精剪:在AI粗剪基础上提供多轨道编辑、音频调节、字幕样式等专业级后期功能。
完整总结
-

吕立青_JimmyLv

我给老罗x何同学做了一条流水线:AI 短视频全自动二创|ClaudeCode 换芯 MinMax M2

19:33

#MiniMax
#ClaudeCode
#AI编程
#自动生成视频
#全栈开发
哔哩哔哩
我给老罗x何同学做了一条流水线:AI 短视频全自动二创|ClaudeCode 换芯 MinMax M2
总结于 9 天前

摘要

大家好,我是立青。在这期视频中,我挑战了一项有趣的实战:通过给最强的 CLI 编程工具 Claude Code“换脑”,用国产模型 MiniMax M2 替换昂贵的 Claude 模型,实现了一套全自动 AI 短视频二创流水线。我全程没有手写一行代码,仅通过自然语言指令,就让 AI 完成了从 3.5 小时罗永浩对谈何同学的播客中提取精华、生成脚本、克隆我的声音以及生成视频画面的全过程。这不仅验证了 MiniMax M2 在复杂编程和 Agent 任务中的强大能力,更展现了其极高的性价比和稳定性。

亮点

  • 🤖 我把 3.5 小时的超长播客视频,通过 AI 全自动处理,变成了一个 2 分钟的短视频,包含 AI 生成的画面、文案以及克隆我本人声音的解说
  • 🧠 为了解决 Claude Code 价格昂贵且不稳定的痛点,我尝试将其底层模型替换为国产的 MiniMax M2,挑战用仅为 Claude 8% 的价格实现同样的功能
  • 💸 Claude Code 虽然好用但非常烧钱,高强度任务下一天能跑掉几十美金,而 MiniMax 推出的 Coding Plan 首月仅需 9.9 元人民币
  • 🚀 MiniMax M2 的推理速度比 Claude Sonnet 快了 90%,并且专门针对 Coding 和 Agent 属性做了优化,能听懂复杂指令并调用工具
  • 🎨 MiniMax 拥有完整的生态,包括海螺视频(视频生成)、Speech(人声克隆)和 Music(音乐生成),可以通过 API 直接复刻全套 AI 视频生成流程
  • 🛠️ 实战中,我使用了 CCMate 工具配置 API,将 Claude Code 的大脑无缝切换为 MiniMax M2,并利用 Plan 模式先规划再执行
  • 🔍 AI 在开发过程中会自动调用 MCP 联网搜索工具查询最新的 API 文档,获取真实的参数结构,避免产生代码幻觉
  • 💻 MiniMax M2 展现了高级工程师的素养,不仅生成了符合我项目规范的代码,还自动处理了视频生成的异步轮询和错误处理机制
  • 🐛 在遇到数据库 Migration 报错时,我通过精准的错误反馈,让 AI 自动修复了 SQL 约束问题并成功运行了数据库迁移
  • ✂️ 配合 Cursor 使用“精准手术刀模式”,我让 AI 快速修正了 API 返回参数的大小写问题,展现了极强的工具调用能力
  • 🎬 最终实现的系统支持基于封面图生视频、多段视频拼接以及自动字幕生成,全程开发我只需在终端看着 AI “自言自语”把活干完
  • 📝 整个开发过程非常稳定,没有封号焦虑,且 AI 在任务完成后还自动生成了详细的技术文档和优化建议

#MiniMax #ClaudeCode #AI编程 #自动生成视频 #全栈开发

思考

  1. 如何将 Claude Code 或 Cursor 的模型替换为 MiniMax M2?

    • 对于 Claude Code,可以使用 CCMate 工具或在命令行配置中修改 Base URL 和 API Key;对于 Cursor,可以在设置中添加自定义模型(Custom Model),填入 MiniMax 的 API 地址和密钥,即可在 Chat 或 Agent 模式中使用。
  2. MiniMax M2 在编程能力上与 Claude 相比有哪些优缺点?

    • 优点是速度极快(推理速度提升 90%)、价格极低(首月 9.9 元)、且拥有包含视频、音频生成的完整生态 API,国内访问稳定不封号。缺点是虽然在大多数逻辑处理上表现出色,但偶尔在极度复杂的上下文中可能需要通过“精准手术刀模式”(如在 Cursor 中指定范围)来辅助修正细节错误。

术语解释

  • Claude Code: Anthropic 推出的一款运行在终端(CLI)的 AI 编程 Agent 工具,能够直接读取本地代码库、执行终端命令并协助开发者进行全栈开发。
  • MiniMax M2: MiniMax 公司推出的旗舰 AI 模型,具有强大的逻辑推理和工具调用能力,在 Coding 和 Agent 任务上表现优异,且成本较低。
  • MCP (Model Context Protocol): 一种开放标准协议,允许 AI 模型连接到外部数据源和工具(如联网搜索、本地文件读取),在本视频中 MiniMax 通过 MCP 实现了查阅最新的 API 文档。
  • I2V (Image-to-Video): 图生视频技术,指通过 AI 算法让静态图片产生动态效果生成视频,视频中利用此技术基于封面图生成了动态的视频片段。
  • Migration: 在软件开发中通常指数据库迁移,即对数据库架构(Schema)进行版本控制和变更的过程,视频中 AI 自动处理了这一流程。
完整总结
-

吕立青_JimmyLv

【新手向】 从 0 到 1构建一个可视化的 AI 英语学习应用

40:54

#AI编程
#英语学习应用
#可视化记忆
哔哩哔哩
【新手向】 从 0 到 1构建一个可视化的 AI 英语学习应用
总结于 11 天前

摘要

本视频详细介绍了如何从零开始,利用AI编程工具Colabody和腾讯云开发平台,快速构建一个可视化的AI英语学习应用“Bonno AI”。该应用通过AI生成图片、例句、发音甚至视频,结合双重编码理论,显著提升单词记忆效率,即使是非编程背景的用户也能在短时间内实现产品落地。

亮点

  • 传统的背单词方式枯燥且效率低下,本应用通过为每个单词生成生动图片,甚至结合用户自拍,实现更直观、更深刻的记忆。
  • 应用基于大脑的双重编码理论,将单词直接映射到图像,利用人脑对图像记忆效率远高于纯文本的特点。
  • "Bonno AI"应用的核心功能包括智能单词卡片系统、多模态学习增强(图片、发音、视频)、智能复习系统、以及沉浸式视觉设计。
  • Colabody作为AI编程工具,通过AI Agent方式构建整个应用,无需手动编写代码,大幅降低了开发门槛,支持产品经理、设计师甚至普通人快速开发全栈应用。
  • Colabody集成了多种AI模型(如GPT 5.1 Dex、混元大模型3.0)、组件库(如Shadcn UI)以及云服务(如CloudBase),实现了从设计到部署的一站式工作流。
  • 视频演示了从项目初始化、数据库设计、后端云函数开发、前端页面构建、用户认证到云端部署的全过程,突出了AI在自动化开发中的作用。
  • 应用支持用户上传自拍作为底图,AI将其融入例句场景中生成图片甚至视频,提供高度个性化的学习体验。
  • 视频强调了“越难的事情越要早做”的原则,建议在模板代码完成后立即进行云部署,以便及早发现并解决线上环境问题。

#AI编程 #英语学习应用 #可视化记忆

思考

  1. 如何保证AI生成的图片或视频内容符合学习语境且准确?
  • 在视频中,作者提到了可以调整提示词(Prompt)来引导AI生成更符合预期的图片,并展示了如何通过异步轮询API来获取更高质量的图片。此外,应用也支持用户上传自己的图片作为参考,进一步提升个性化和准确性。
  1. 对于没有编程基础的用户,Colabody的部署和维护是否仍然存在难度?
  • Colabody致力于简化开发流程,通过AI Agent自动化了许多传统上需要专业知识的任务,如服务器部署、数据库配置、云函数管理等。视频中演示了通过Colabody直接将应用部署到腾讯云开发环境,大大降低了维护难度。用户主要通过自然语言与AI交互,无需直接处理复杂的运维细节。

术语解释

  • Colabody: 一款强大的AI编程工具,通过AI Agent以对话方式协助用户从零开始构建、开发和部署应用程序,无需手动编写代码。
  • 双重编码理论 (Dual-coding Theory): 由Allan Paivio提出,认为信息通过两种独立但关联的编码系统(语言系统和非语言图像系统)在大脑中处理和存储,图像和文字同时呈现能提升记忆效果。
  • 混元大模型 (Hunyuan Large Model): 腾讯自主研发的大语言模型,具备强大的中文理解与生成能力,包括文本生成、图像生成(混元Image 3.0)和视频生成(混元Video 1.5)。
  • CloudBase (腾讯云开发): 腾讯云提供的一站式后端云服务,为开发者提供云函数、云数据库、云存储、静态托管等能力,简化了后端开发和运维工作。
  • AI Agent: 具备自主规划、执行和修正任务能力的AI实体,可以在编程环境中理解用户需求,调用工具,并迭代完成复杂的开发任务。
完整总结
-

吕立青_JimmyLv

【更新】AI 视频搜索、合集归纳与字幕优化|BibiGPT 创作者场景优化

08:46

#BibiGPT
#创作者工具
#视频管理
#AI字幕优化
#内容生产力
哔哩哔哩
【更新】AI 视频搜索、合集归纳与字幕优化|BibiGPT 创作者场景优化
总结于 13 天前

摘要

本期视频作者详细介绍了BibiGPT针对视频创作者推出的多项优化功能,旨在帮助UP主更高效地管理、搜索、总结视频内容,并大幅提升字幕处理的准确性和便捷性。通过跨平台视频搜索、智能合集归纳、高级字幕编辑与校对,以及AI辅助创作等工具,BibiGPT致力于提升创作者的工作效率和内容质量。

亮点

  • 🔍 BibiGPT支持在B站、YouTube、抖音等多个平台进行音视频内容的跨平台搜索,帮助创作者快速定位所需素材或进行产品调研。
  • 📚 用户可以将多个视频内容快速添加至自定义合集,并能基于整个合集生成一个归纳总结,方便用户全面了解某一主题的所有相关信息。
  • 📊 合集总结不仅支持思维导图形式展示,可放大、编辑、下载和分享,甚至还能设置价格并批量导出为多种文件格式,极大增强了内容复用性。
  • 🗣️ 平台集成了“Ask AI”功能,允许用户直接与整个视频合集进行对话,通过提问获取合集内容中的具体信息,并自动引用相关视频及字幕原文 。
  • 📝 BibiGPT在字幕处理方面进行了重大改进,引入了通义千问、ElevenLabs等高级转录引擎,显著提升了字幕的准确度,并支持自定义热词以进一步提高识别率 。
  • ✂️ 视频创作者现在可以手动调整字幕的分段长度、进行合并、AI校对,甚至批量替换关键词,确保字幕与视频内容的同步性和阅读体验 。

#BibiGPT #创作者工具 #视频管理 #AI字幕优化 #内容生产力

思考

  1. BibiGPT的合集功能支持哪些高级编辑和导出选项?
    • 除了生成总结和思维导图,合集功能还允许用户对思维导图进行编辑、下载,可以增删改查合集内容,甚至能设置价格并批量导出为PDF、电子书或Markdown文件。
  2. 在字幕处理方面,BibiGPT如何帮助创作者提升准确度并进行精细化调整?
    • BibiGPT通过支持多种高质量转录引擎(如通义千问、ElevenLabs)来提升转录准确度,并允许用户添加热词。此外,创作者还可以手动调整字幕分段、合并字幕、使用AI校对(可添加Prompt规则),以及批量替换关键词。

术语解释

  • 跨平台搜索: 指BibiGPT能够同时在B站、YouTube、抖音等不同音视频平台搜索内容,打破了平台壁垒,方便用户查找和汇总信息。
  • 合集归纳: 允许用户将多个相关视频添加到一个自定义集合中,并能基于整个合集的内容生成一个统一的总结或概述,方便系统化学习和管理。
  • 思维导图: 一种可视化的思考工具,通过图形方式来表达主题及相关概念之间的层次结构和联系,在BibiGPT中用于展示合集总结的结构。
  • 转录引擎: 指将视频或音频中的语音内容转换成文字的软件或服务。BibiGPT集成了多种先进的转录引擎(如通义千问、ElevenLabs),以提高字幕生成的速度和准确性。
  • 热词: 在语音转文字过程中,用户可以预先输入的特定词汇或专业名词,帮助转录引擎更准确地识别这些词语,尤其适用于包含大量专业术语的视频内容。
完整总结
-

吕立青_JimmyLv

🔥 告别 Typefully?程序员 AI 自媒体工作流:XAIcreator 自动化发推 + 自研 AI 搜索插件,打造推特第二大脑

22:43

#XAIcreator
#AI工具
#Twitter运营
#自媒体
#TwemexAISearch
哔哩哔哩
🔥 告别 Typefully?程序员 AI 自媒体工作流:XAIcreator 自动化发推 + 自研 AI 搜索插件,打造推特第二大脑
总结于 17 天前

摘要

本期视频中,作者立青向大家介绍了两款工具:一款是用于管理多平台内容发布的AI工具XAIcreator,他对其自动化发推、AI改写、多账号发布和数据统计等功能进行了体验和评价,并表示XAIcreator有望取代他目前使用的Typefully。另一款是他自己开发的Twitter AI搜索插件Twemex AI Search,展示了其通过自然语言生成高级搜索指令、预设搜索条件和AI查询等功能,旨在将Twitter打造成一个个人第二大脑,帮助用户高效检索和整理信息。

亮点

  • 🚀 XAIcreator是一款由Yangyi老师开发的出海AI工具,旨在通过多模态转换将各类内容转化为推文,并支持AI智能改写、个性化编辑以及多账号定时发布,有望取代作者目前使用的Typefully 。
  • 📊 社交媒体需要持续稳定高质量的输出以获得曝光和互动,XAIcreator通过一键多账号发布、自动数据统计等功能,可显著提升自媒体管理效率达3倍 。
  • 💬 XAIcreator具备用户和推文监控、AI内容生成、情感分析、互动自动化(如自动点赞、关注、回复)及团队协作等核心功能,帮助用户在Twitter上取得更大成功 。
  • 📝 作者体验了XAIcreator的草稿生成功能,认为其提供的初始架子有助于从零开始快速生成内容并进行迭代,虽然AI的“味”有时较重,但仍能大大提高效率 。
  • 🔍 作者还详细介绍了自研的Twitter AI搜索插件Twemex AI Search,该插件能根据上下文通过自然语言生成高级搜索语法,实现按特定条件(如特定用户、关键词、语言、媒体类型)筛选内容,并可保存搜索预设,极大地提升了信息检索效率 。

#XAIcreator #AI工具 #Twitter运营 #自媒体 #TwemexAISearch

思考

  1. XAIcreator在AI内容生成方面是否能够完全替代人工创作?

    • 根据作者的体验,虽然XAIcreator能提供内容草稿和初始框架,但AI生成的文本“AI味”有时过重,在选题和深度内容创作上,人工的干预和润色仍然是不可或缺的,特别是在表达个性化风格时。
  2. 如何通过Twemex AI Search插件高效地在Twitter上筛选特定类型的信息?

    • 用户可以通过自然语言输入搜索需求(例如“搜索Yangyi老师2025年之前所有关于营销的推文”),插件会自动生成高级搜索语法;也可以使用预设的搜索条件,如仅查看图片、视频、特定语言(中文/英文)、特定创作者互动记录,或者按热门程度、那年今日等进行筛选。

术语解释

  • XAIcreator: 一款由Yangyi老师开发的AI工具,专注于帮助用户在Twitter等社交媒体平台上进行内容创作、自动化发布、多账号管理、数据分析以及互动自动化。
  • Typefully: 作者之前使用的,与XAIcreator功能类似的一款内容发布和管理工具,支持多平台同步发布。
  • Twemex AI Search: 作者自研的Twitter AI搜索插件,通过AI和自然语言处理技术,帮助用户在Twitter上进行高级、精准的信息检索和内容筛选,旨在将Twitter打造成用户的“第二大脑”。
  • 上下文工程 (Context Engineering): 在AI领域,特指有效管理和组织传递给AI模型的信息(上下文),以确保AI能够理解意图、保持会话状态、管理记忆,并进行多轮对话处理,从而生成更准确、相关的响应。
  • 截流: 在社交媒体环境中,指通过在大V或热门内容的评论区发布高质量或引人注目的评论,吸引其他用户点击、关注或了解自己的内容/产品,从而获取流量的一种策略。
完整总结
-

吕立青_JimmyLv

【首测】Gemini 3 Pro 真是强的一批!审美大提升!谷歌急了,但也是真的认真了!

07:09

#Gemini3Pro
#GoogleAI
#BibiGPT
#多模态模型
#VibeCoding
哔哩哔哩
【首测】Gemini 3 Pro 真是强的一批!审美大提升!谷歌急了,但也是真的认真了!
总结于 26 天前

摘要 section

摘要

本期视频第一时间实测了谷歌刚刚发布的 Gemini 3.0 Pro 模型,并将其快速部署到了 BibiGPT 中。实测发现,新模型不仅在基准测试中全面领先,最令人惊喜的是其“审美能力”的巨大飞跃。通过演示生成动态网站、交互式游戏和高质量 PPT,展示了它强大的多模态理解与视觉呈现能力。虽然定价策略调整为动态模式,但在屏幕理解和物理原理模拟上的表现堪称“炸裂”,真正实现了从单纯的文本总结到“Vibe Coding”的跨越。

亮点

  • 🏆 Gemini 3 Pro 在基准测试中全方位领先,视觉化理解能力达到博士级推理水平,在各项榜单上均排名第一 。
  • 🎨 模型最直观的改进是审美能力的巨大提升,生成的 PPT 和动态网站配色和谐、布局专业,摆脱了以往“理工男”式的简陋感 。
  • 🧩 实测演示了将视频内容转化为交互式游戏,例如通过 SVG 模拟轮椅漂移或构建找牛的追踪系统,极大增强了信息的直观理解 。
  • 📊 它能深度理解视频中的硬核技术逻辑,自动绘制清晰的 LoRa 基站架构图,甚至能理解物理原理并转化为可视化图表 。
  • 💰 模型采用了动态定价策略,20 万 Token 以内为 2 美元,超过则为 4 美元,同时屏幕理解能力惊人地提升了 6 倍 。
  • ✨ 提出了 "Vibe coding" 的核心理念,即通过单一提示词快速构建应用并赋予万物生命,支持从获取灵感到产品上线的完整流程 。

#Gemini3Pro #GoogleAI #BibiGPT #多模态模型 #VibeCoding

思考

  1. Gemini 3.0 Pro 的定价策略具体是怎样的?

    • 它的价格采用了动态定价模式。在 20 万 token 上下文以内是 2 美元,如果超过 20 万 token 则是 4 美元。作者提到这个价格体感上比之前稍微贵了一点点。
  2. 相比于前代模型,Gemini 3.0 Pro 在实际应用中最明显的提升是什么?

    • 最明显的提升是“审美”和“多模态呈现”。它不仅能总结文本,还能生成配色舒服、布局合理的动态网站、PPT 以及交互式 SVG 游戏,视觉体验远超以前的模型。
  3. 什么是视频中提到的 "Vibe coding"?

    • 这是一个基于提示词构建应用的新概念。它强调用户可以通过自然语言描述想法(Vibe),让 AI 快速实现从代码构建到网页上线的全过程,将任何想法变为现实并与世界分享。

术语解释

  • Gemini 3.0 Pro: 谷歌最新发布的 AI 模型,在多模态理解、推理能力和视觉生成方面有显著提升,被作者称为目前最智能的模型。
  • Vibe coding: 视频中提到的编程新范式,指通过自然语言提示词(Prompt)直接构建整个应用程序,强调快速实现想法和直观的交互体验,而非传统的逐行代码编写。
  • SVG (Scalable Vector Graphics): 一种基于 XML 的矢量图形格式。视频中 Gemini 3 利用 SVG 代码直接生成了可交互的动画(如轮椅模拟、物理原理演示),展示了其强大的代码生成与视觉化能力。
  • LoRa (Long Range): 视频案例中提到的一种低功耗广域网通信技术,被用于“找牛”的物联网设备中,Gemini 3 成功理解并绘制了其组网架构图。
  • BibiGPT: 作者开发的 AI 视频总结工具,在本期视频中第一时间集成了 Gemini 3 模型,用于测试其生成摘要、网页和 PPT 的能力。
完整总结
-

吕立青_JimmyLv

💸 AI 账单 2600 让人崩溃?省钱实战“规划者-执行者”模式,将国产编程 AI 融入 Claude Code 工作流

23:58

#AI编程
#ClaudeCode
#GLM46
#省钱工作流
#智能开发
#生产力革命
哔哩哔哩
💸 AI 账单 2600 让人崩溃?省钱实战“规划者-执行者”模式,将国产编程 AI 融入 Claude Code 工作流
总结于 27 天前

摘要

这支视频讲述了作者在使用昂贵的AI编程工具(如Cursor与Claude)后,账单高达2600元的痛苦经历,并从中总结出一种既省钱又高效的AI编程新模式——“规划者-执行者”双核工作流。作者通过演示如何将智谱GLM-4.6模型与Claude Code结合,实现开发生产力的巨大提升,并用实战展示AI自动生成一个带语音播客功能的完整模块。整个过程体现了如何以低成本保持高质量产出,实现“智商高者规划,性价比高者执行”的人机协同新范式。

亮点

  • 💸 作者反思高达2600元的AI账单,发现高智商模型承担所有任务造成了巨大的资源浪费。
  • 🧠 提出“规划者-执行者”模式,用Claude Sonnet负责规划、高级思考,用GLM-4.6执行具体编码任务。
  • ⚙️ 通过Cursor和Claude Code构建完整的双模型工作流,Claude Code作为调度核心,GLM实现代码编写与测试。
  • 🚀 GLM-4.6兼具超长上下文(200K)和低成本优势,执行效率极高,令AI账单显著下降 。
  • 🤝 借助MCP与Context7工具,提供精确的上下文文档与接口支持,让执行更智能、更自动化。
  • 🧩 实战演示如何生成AI播客功能,从API调试到模型修复完整展示AI协同开发过程 。
  • 🎯 最终结果令人震撼,GLM自动生成UI、逻辑与动画,代码风格完全符合既定规范,几乎无需人工干预。
  • 🔄 作者总结三大收益:一年可省数千成本、开发流程更省心、协作效率极高 。
  • 🧩 鼓励开发者不要再盲目追求“单模型万能”,而应像组织管理一样协同多模型合作。
  • 🧭 强调用AI工作流编排的思维方式,让程序员从执行者变成产品级AI系统的指挥者。

#AI编程 #ClaudeCode #GLM46 #省钱工作流 #智能开发 #生产力革命

思考 <观众提问>

  1. 为什么作者强调要分离“规划者”和“执行者”模型?

    • 因为高智商模型(如Claude Sonnet)虽然擅长思考,但执行任务成本极高;而GLM-4.6执行速度快、成本低,两者分工能实现最佳性价比。
  2. GLM-4.6 是如何帮助降低AI账单的?

    • 它月费仅20元,却提供200K上下文、强并发执行力,替代Claude在编程执行阶段的高额Token消耗,实现约80%以上的费用节省。
  3. 如何保证AI生成代码的质量与一致性?

    • 作者通过编写CLAUDE.md项目规范文件,定义代码风格、测试框架与目录结构,从源头让执行模型遵守团队标准。

术语解释

  • 规划者模型(Planner):负责全局架构、算法设计与任务拆解的高智商模型(如Claude Sonnet),承担“思考”职责。
  • 执行者模型(Executor):负责具体实现、重构与测试的高性价比模型(如GLM-4.6),承担“行动”职责。
  • Claude Code:开源CLI与调度框架,负责编排不同模型执行命令,让AI协同开发成为可能。
  • MCP Service:一种在AI环境中维护上下文文档和API信息的机制,让模型能即时访问技术资料。
  • Cursor Agent模式:Cursor编辑器的多代理系统,可同步运行多个模型实例进行规划与执行,提升自动化程度。
  • Context7:上下文管理工具,为AI模型提供精确技术文档引用,实现更智能的任务执行。
完整总结
-

吕立青_JimmyLv

BibiGPT 双11 史低5折!Q3 更新汇总:全局搜索、AI 高光笔记、批量导出电子书、AI 生成图文/短视频、全局搜索、产出物中心…

28:58

#BibiGPT
#AI效率工具
#双11特惠
哔哩哔哩
BibiGPT 双11 史低5折!Q3 更新汇总:全局搜索、AI 高光笔记、批量导出电子书、AI 生成图文/短视频、全局搜索、产出物中心…
总结于 1 个月前

摘要

哈喽大家晚上好,我是立青!今天的视频主要为大家详细介绍 BibiGPT 在过去一个季度(Q3)的重磅更新汇总。这次更新不仅优化了全新的 UI 界面,带来了可折叠的左侧边栏和更清晰的四大功能入口,还新增了全局搜索、AI 高光笔记、批量导出电子书(ePub)等超实用功能。我还演示了如何利用 AI 生成小红书图文、甚至是生成 AI 短视频的早期雏形。更重要的是,正值双 11 特惠活动,全场史低 5 折,希望 BibiGPT 能帮助大家让音视频看得快、搜得到、用得好!

亮点

  • 🎨 界面与交互重构:左侧边栏现在支持折叠,信息结构重新梳理为新总结、全局搜索、知识库和产出物中心四大入口,操作更加丝滑直观 。
  • 🔍 全局与深度搜索:不仅能通过标题搜索,还能深入到总结摘要甚至字幕原文中查找关键词,配合高亮显示,找内容从未如此简单 。
  • 💡 AI 高光笔记:AI 自动提取视频中的精彩片段和特定主题(如你关心的某个技术点),生成可点击跳转的时间戳,大幅提升长视频的消费效率 。
  • 📚 批量导出电子书:支持将多个总结内容批量导出为 ePub 格式,导入微信读书后可进行 AI 对话、划线和高亮,打造个人专属知识库 。
  • 🎥 AI 短视频生成:展示了一个从长视频自动生成短视频的早期雏形,结合克隆语音和画面分析,未来潜力巨大 。
  • 🖼️ 视觉化产出物:包括生成带有对应时间戳截图的公众号长文、自动生成小红书风格的配图,让视频内容转化为图文变得轻而易举 。

#BibiGPT #AI效率工具 #双11特惠

思考

  1. BibiGPT 的全局搜索有什么特别之处?

    • 我们的全局搜索不仅能搜到视频标题,还能检索总结摘要和字幕原文中的关键词。即使是本地尚未处理的字幕,也能通过深度搜索模式找到,并且搜索结果会高亮显示,支持快捷键 Command+K 快速唤起。
  2. 什么是“产出物中心”,它能用来做什么?

    • 产出物中心是一个“知行助理”的概念,旨在集中管理所有 AI 生成的内容。你可以在这里查看和管理你的自定义提示词、AI 对话记录、生成的图片、改写的文章以及视觉化总结等,方便你将视频内容转化为实际的 PPT、文章或社交媒体文案。
  3. 双 11 活动有哪些优惠,Plus 和 Pro 版有什么区别?

    • 目前全场史低 5 折。Plus 版适合主要通过在线视频链接使用的用户,有无限总结权益;Pro 版则增加了更多视觉化功能(如小红书图文、公众号文章生成)、更大的本地文件处理额度以及未来高级功能(如 AI 短视频编辑器)的抢先体验权。

术语解释

  • Shift+Enter: 在 BibiGPT 的输入框中,使用此快捷键可以一次性输入多个视频链接,实现批量处理和总结。
  • AI 高光笔记 (AI Highlights): 一种智能功能,AI 会自动识别视频中的关键主题和精彩片段,并生成带有文字说明和时间戳的导航,点击即可跳转播放对应画面。
  • ePub: 一种通用的电子书格式,BibiGPT 支持将总结内容导出为此格式,方便用户导入到微信读书、Apple Books 等阅读器中进行沉浸式阅读和笔记。
  • 视觉化总结 (Visual Summary): 利用 AI 分析视频画面,自动截取关键帧图片,并结合文字生成图文并茂的文章或笔记,解决了传统纯文字总结缺失画面信息的问题。
  • 产出物中心 (Output Center): BibiGPT 新增的一个集中化管理模块,用于存放和查看所有通过 AI 生成的“结果”,如对话记录、图片、文章、高亮笔记等,是一个“智能仓库”。
完整总结
-

吕立青_JimmyLv

CutFast 像用荧光笔一样剪视频,AI 10x 倍提升口播剪辑效率

14:22

#hashtags
#AI剪辑
#视频效率
#CutFast
#智能工具
#内容创作
哔哩哔哩
CutFast 像用荧光笔一样剪视频,AI 10x 倍提升口播剪辑效率
总结于 1 个月前

摘要

我向大家介绍我开发的一款全新的智能视频剪辑工具 CutFast。这款工具的核心理念是“像用荧光笔一样剪视频”,旨在彻底改变口播视频的剪辑流程。通过 AI 自动识别并高亮精彩片段、剔除废话和无声部分,结合直观的划线操作,创作者可以极大地提升剪辑效率,实现超过十倍的速度提升,并在一分钟内快速导出精华短片。

亮点

  • 🖍️ CutFast 引入了像用荧光笔划重点一样剪辑视频的创新体验,用户只需在字幕文本上划线,即可轻松完成视频片段的选择 。
  • 🤖 工具内置了强大的人工智能,能够自动识别视频中的高光时刻,并智能剔除口头禅、重复内容以及无声片段,从而精简视频内容 。
  • 🚀 用户完成划线高亮后,可以一分钟内极速导出精华片段,这对于制作社交媒体宣传片或吸引观众的视频开头非常高效 。
  • 😠 开发这款工具的初衷源于我对传统剪辑软件(如剪映)性能问题的 frustration,例如它在关闭后仍在后台占用高达29G内存 。
  • 💡 未来的 CutFast 将以 AI Native 的思路进行构建,计划接入更多 AI 功能,如利用 Kling 或 Sora 生成创意转场、AI 语音生成和多语言翻译等,持续提升创作效率 。
  • 🎯 该工具适用于多种场景,无论是科技区UP主、教育课程制作者、粉丝剪辑应援视频,还是游戏主播制作集锦,都能显著提升效率和内容质量 。

#AI剪辑 #视频效率 #CutFast #智能工具 #内容创作

思考

  1. 如果 AI 自动识别的高光片段不符合我的预期,我该如何调整?
  • 你完全可以手动进行调整。CutFast 允许用户像使用荧光笔一样,在 AI 识别的基础上自由划线,可以精确到“字”级别来增加或取消高亮片段,确保最终导出的内容完全符合你的剪辑意图 。
  1. CutFast 未来会支持哪些更高级的 AI 功能?
  • 未来计划接入更多前沿的 AI 能力。例如,利用 Kling 或 Sora 等视频生成模型来制作有趣的片头片尾转场,整合 AI 语音克隆与生成、多语言翻译功能,以及图片和视频素材的智能生成,目标是打造一个全方位的 AI 创作工具 。

术语解释

  • CutFast: 我开发的一款智能视频剪辑工具,核心理念是“像用荧光笔一样剪视频”,通过 AI 和直观的文本划线操作来极大地提升口播视频的剪辑效率。
  • 划线高亮: 这是 CutFast 独创的核心交互方式,用户可以直接在视频的逐字稿字幕上,像在书本上划重点一样选择并高亮文本,从而完成对相应视频片段的剪辑 。
  • 口癖废话: 指视频中无意义的口头禅、重复词句或长时间的停顿。CutFast 可以利用 AI 自动识别并删除这些冗余内容,帮助创作者快速输出精炼的视频 。
  • AI Native: 一种以 AI 为核心的产品设计和开发理念。我计划用这种思路来重新思考和构建 CutFast,不是在传统编辑器上叠加 AI 功能,而是从根本上让 AI 驱动整个剪辑体验 。
完整总结
-

吕立青_JimmyLv

【新手向】AI 编程从 0 到 3:一套代码开发 Web、iOS、安卓三端 APP & InsForge MCP 后端数据库、用户授权

37:27

#AI编程
#全栈开发
#三端应用
#InsForge
#智能体协作
哔哩哔哩
【新手向】AI 编程从 0 到 3:一套代码开发 Web、iOS、安卓三端 APP & InsForge MCP 后端数据库、用户授权
总结于 1 个月前

摘要

本期视频演示了如何利用AI工具链(Expo、Cursor、InsForge)开发跨平台智能记账应用,实现一套代码同步构建Web、iOS、安卓三端应用。核心突破在于通过InsForge的MCP协议实现后端自动化,解决数据库部署、用户认证、AI集成等传统痛点,全程无需手动配置云端服务。作者详细展示了从本地SQLite迁移到云数据库、集成OpenAI实现文本/语音/图像智能记账的全流程,凸显AI原生开发范式的高效性。

亮点

  • 🚀 三端同步开发:基于Expo框架用React Native编写单一代码库,自动生成iOS、安卓及Web端应用,实现UI与数据完全互通
  • 🤖 后端自动化革命:InsForge通过MCP协议为AI Agent提供标准化接口,实现数据库创建、OAuth配置等后端操作的零手动部署
  • 🔄 智能体协作模式:Cursor的Plan Mode将开发拆解为可执行计划,结合Codex CLI自动执行代码生成与错误修复
  • 📸 多模态记账集成:利用OpenAI模型解析文本/语音/图像账单(如“早餐花15元”或发票截图),自动提取金额、日期等字段预填表单
  • 🌐 云原生数据流:InsForge自动管理用户认证状态同步、云端SQL数据库及对象存储(如发票图片),支持多设备实时数据同步

#AI编程 #全栈开发 #三端应用 #InsForge #智能体协作

思考

  1. 传统后端配置(如Supabase)与InsForge的本质区别是什么?
  • InsForge专为AI Agent设计,通过MCP协议将后端操作转化为机器可读指令(如JSON格式API),实现程序化创建数据库/存储桶;而传统工具依赖人类理解文档和图形界面操作,中断AI编程心流。
  1. 如何保证AI生成代码的可靠性?
  • 双保险机制:Cursor Rules预定义技术栈规范(状态管理/目录结构),Plan Mode拆分需求并生成可追溯文档;MCP协议提供错误JSON反馈(含修复建议),如数据库字段冲突时精准定位。
  1. 多模态记账的AI模型如何选择?
  • InsForge内置多模型路由(GPT-4o/Claude/Gemini),视频中选用GPT-4o处理文本/图像识别;语音识别优先调用设备原生API(iOS SpeechFramework),Web端使用浏览器Web Speech API。

术语解释

  • MCP(Model Context Protocol):InsForge的核心协议,以机器可读格式(JSON)描述后端能力(如数据库schema、API参数),使AI Agent能自主调用云服务,无需人类解读文档
  • Expo:基于React Native的跨平台开发框架,通过单一代码库生成iOS/安卓/Web应用,集成原生模块权限管理(如相机、语音识别)
  • Cursor Plan Mode:AI驱动的开发规划模式,将需求拆解为可执行任务清单(如“添加SQLite存储”),并生成技术方案文档供AI Agent协同执行
  • zustand:轻量级React状态管理库,视频中用于同步前端账单数据与InsForge云端状态,支持跨组件响应式更新
  • AI Integration:InsForge内置的AI服务集成模块,自动处理API密钥与计费,支持通过SDK调用多模型(如OpenRouter)实现自然语言账单解析
完整总结
-

吕立青_JimmyLv

Twemex AI Search 如何用 AI 搜索 X (Twitter) 内容?

07:59

#TwemexAISearch
#Twitter搜索工具
#AI信息管理
#双向引用
#稍后看神器
哔哩哔哩
Twemex AI Search 如何用 AI 搜索 X (Twitter) 内容?
总结于 2 个月前

摘要

视频介绍了作者开发的Twemex AI Search插件,旨在解决Twitter信息搜索难题。插件结合AI生成高级搜索语法,支持预设搜索(如热门内容、仅视频/图片、那年今日等),将Twitter打造成个人公开知识库实现双向引用,还能联动BibiGPT总结视频内容。目前插件未正式发布,后续将优化后上线应用商店。

亮点

  • 🛠️ 作者因原有Twitter搜索工具被收购付费,自制Twemex AI Search插件,核心是将Twitter作为公开笔记本,支持搜索个人历史Tweet并实现双向引用,方便写作时引用过往内容。
  • 🔍 插件内置多种搜索预设(如查看某博主热门内容、互发对话、仅视频/图片、“那年今日”等),无需记忆复杂的Twitter高级搜索语法,一键筛选特定类型内容。
  • 🤖 集成AI功能,用户可通过自然语言描述搜索需求(如“2024年藏师傅关于Sora的视频”),AI自动生成搜索条件;需先授权OpenRouter生成API key(可设置消耗上限)。
  • 📋 支持列表(List)搜索,作者维护AI相关中英文List(如ai-cn),可快速筛选列表内博主的热门内容,集中获取AI资讯。
  • 📥 联动BibiGPT“稍后看”功能,搜索到的Twitter视频可一键保存并生成中文总结、字幕翻译,支持YouTube/B站等平台,实现音视频内容高效整理。

#TwemexAISearch #Twitter搜索工具 #AI信息管理 #双向引用 #稍后看神器

思考

  1. Twemex AI Search插件目前如何使用AI生成搜索语法?
  • 答案:需先在插件的Ask AI Setting中通过OAuth授权OpenRouter生成API key(可设置消耗上限如2美元),然后点击AI按钮,用自然语言描述搜索需求(如“2024年藏师傅关于Sora的视频”),AI会自动转换为搜索条件,点击搜索即可。
  1. 插件的“双向引用”功能具体是什么?
  • 答案:双向引用指用户可将搜索到的历史Tweet内容复制引用到当前写作中,同时历史Tweet也能关联到当前内容,方便回溯过往笔记和整合个人知识,让Tweet成为可相互链接的知识库。
  1. Twemex AI Search支持哪些内容类型的筛选?
  • 答案:支持筛选仅视频、仅图片、仅链接、特定语言(如中文/英文)、特定时间(如“那年今日”“2025年以前”)、特定博主/列表内内容等,还能筛选关注者或List内的热门内容。

术语解释

  • Twemex:作者开发的Twitter AI搜索插件,名称源于Twitter+Memex,核心功能是通过AI生成搜索语法、预设筛选条件,帮助用户高效搜索Twitter内容,将Tweet打造成双向引用的公开知识库。
  • Twitter Advanced Search:Twitter官方的高级搜索功能,支持from(来自某用户)、to(发给某用户)、lang(语言)、media(媒体类型)等复杂语法,但需记忆规则;Twemex插件简化了这一过程。
  • BibiGPT:作者开发的“稍后看神器”,可与Twemex联动,对Twitter/YouTube/B站等平台的音视频内容生成中文总结、字幕翻译,帮助用户快速整理“稍后看”的内容。
  • 双向引用:一种知识管理方式,指内容间的相互关联——用户可引用历史Tweet到当前创作,同时历史Tweet也能关联到当前内容,方便回溯和整合知识。
  • OpenRouter:提供AI模型API的平台,Twemex插件通过授权OpenRouter获取API key,实现AI生成搜索语法的功能,用户可设置消耗上限(如2美元)以控制成本。
完整总结
-

吕立青_JimmyLv

【开箱】ChatGPT Atlas 能颠覆 Chrome 吗?自动化代理、上下文感知和记忆个性化

09:05

#AI浏览器
#ChatGPTAtlas
#自动化代理
哔哩哔哩
【开箱】ChatGPT Atlas 能颠覆 Chrome 吗?自动化代理、上下文感知和记忆个性化
总结于 2 个月前

摘要

本视频是对OpenAI新发布的AI浏览器ChatGPT Atlas的深度开箱和体验评测。作者展示了从下载安装、无缝导入Chrome数据,到体验其核心的“记忆”功能和强大的“自动化代理”(Agent Mode)能力。视频中,Atlas自动完成了网站注册、表单填写和视频总结等任务,展现了其颠覆传统浏览器交互方式的潜力,并探讨了它对现有工具和未来浏览器市场竞争的深远影响。

亮点

  • 🚀 OpenAI推出的AI浏览器Atlas,直接挑战Google Chrome的市场地位,预示着一场全新的浏览器大战已经拉开序幕 。
  • 🔄 Atlas支持一键无缝导入Chrome浏览器的所有数据,包括书签、历史记录和密码,极大地降低了用户的迁移成本和学习曲线 。
  • 🧠 独特的“记忆”功能是其核心优势,它能够学习用户的个人偏好和历史信息,从而在浏览和交互中提供高度个性化和精准的辅助 。
  • 🤖 最具颠覆性的“自动化代理”(Agent Mode)能像真人助手一样自主操作网页,自动完成注册、填写表单等任务,彻底改变了用户与网页的交互模式 。
  • 🤯 Atlas内置的AI总结能力十分强大,可以直接总结YouTube视频内容,其效果甚至“干掉”了作者自己开发的视频总结浏览器插件 。
  • 🧩 Atlas不仅仅是一个浏览器,更像是一个为ChatGPT打造的全新运行时环境,它深度集成了AI对话和操作能力,并兼容所有Chrome插件 [06:24, 07:00]。

#AI浏览器 #ChatGPTAtlas #自动化代理

思考

  1. Atlas浏览器和普通的Chrome浏览器加上ChatGPT插件有什么区别?
  • 根本区别在于集成深度和核心能力。Atlas将ChatGPT原生集成到浏览器核心,形成了一个新的“运行时环境”。它不仅能在侧边栏聊天,更具备“自动化代理”(Agent Mode)能力,可以直接理解用户意图并自主操作网页,如自动填表、注册,这是普通插件无法实现的。此外,它的“记忆”功能贯穿整个浏览体验,提供更深度的个性化服务 。
  1. 使用Atlas的自动化代理功能(Agent Mode)是否安全?
  • 该功能在启用时会提示可能存在风险,因为它会代替用户操作网页 。虽然AI会请求用户确认关键步骤,但用户仍需谨慎授权,尤其是在处理涉及个人敏感信息或金融交易的网站时。建议在信任的环境下使用,并留意AI的每一步操作。
  1. Atlas浏览器是否支持现有的Chrome插件?
  • 支持。视频中提到,Atlas基于Chrome内核开发,因此能够直接安装和使用Chrome网上应用店的所有浏览器插件,这保证了其丰富的扩展性和对用户现有工作流的良好兼容性 。

术语解释

  • ChatGPT Atlas: OpenAI最新推出的AI原生浏览器,它将ChatGPT深度集成,旨在通过自动化代理、上下文感知和个性化记忆功能,颠覆传统的网页浏览和交互方式 。
  • Agent Mode (代理模式): 这是Atlas的核心功能之一,指AI能够作为一个智能代理,根据用户的指令自主地在网页上执行一系列复杂操作,如填写表单、点击按钮、注册账户等,实现任务自动化 [02:23, 03:43]。
  • Memory (记忆功能): OpenAI的一项关键技术,允许ChatGPT记住与用户的历史对话和个人偏好。在Atlas浏览器中,这一功能扩展到整个浏览行为,使AI能够提供更加个性化和上下文感知的帮助 。
  • 运行时环境 (Runtime Environment): 在视频的语境中,指Atlas浏览器不仅仅是一个内容展示工具,更是一个能让ChatGPT执行网页操作、与网络深度交互的平台或环境,极大地扩展了AI的应用场景 。
完整总结
-

吕立青_JimmyLv

【神器】效率翻倍!我私藏的 5 个沉浸式翻译高级用法,助你轻松拿下英文视频和外网资讯丨内含 9 折优惠码:JIMMYLV

25:46

#语言革命
#AI翻译
#知识管理
#信息平权
#工具流
哔哩哔哩
【神器】效率翻倍!我私藏的 5 个沉浸式翻译高级用法,助你轻松拿下英文视频和外网资讯丨内含 9 折优惠码:JIMMYLV
总结于 3 个月前

摘要

视频深入探讨了AI翻译工具"沉浸式翻译"如何突破语言壁垒,重塑信息获取方式。作者结合三年使用经验,演示其在网页、视频、图片/漫画、PDF等场景的双语对照翻译能力,强调其通过大语言模型实现精准翻译、排版优化及多模态支持。工具与知识管理流程结合,可提升学习效率,助力用户直接获取全球一手信息,扩展认知边界。

亮点

  • 🌐 网页双语对照:实时保留原文排版,支持自定义大模型风格与领域专家提示词(如科技/社交媒体),智能适配语境提升翻译准确度
  • 🎬 视频字幕生成:AI为无字幕视频实时添加双语字幕,精准断句优化理解,支持本地/在线视频学习资源
  • 🖼️ 多模态图片翻译:突破传统工具局限,智能识别漫画/图表内文本并重绘排版,保持图像原风格
  • 📚 复杂文档处理:PDF/电子书支持表格/公式翻译,开源"巴别塔"项目解决排版错乱痛点,实现批量翻译与知识变现
  • 🔁 工作流深度整合:与Readwise等知识工具联动高亮双语笔记,快捷键一键翻译,社交平台实时评论翻译促进跨语言交流

#语言革命 #AI翻译 #知识管理 #信息平权 #工具流

思考

  1. 免费版是否满足日常需求?
  • 免费版支持基础功能(如网页双语翻译),可接入默认免费翻译服务;Pro版解锁智能上下文、高级模型及文档翻译额度,适合高频深度使用者
  1. 如何建立英语思维减少翻译依赖?
  • 启用"英文→简英"翻译专家,用简单英文解释复杂内容;长按Alt悬停查看单词释义,逐步培养直接理解能力
  1. 技术类内容翻译准确性如何保障?
  • 自定义提示词工程:选择科技领域专家模版,保留专业术语原文(如Prompt/API);手动调整字幕分段逻辑,适配模型处理能力

术语解释

  • 大语言模型:核心翻译引擎,用户可自选模型风格(如GPT/Claude),通过调整提示词优化不同场景翻译效果
  • 多模态识别:工具突破文本局限,同步解析图像/视频中的文字、布局、视觉元素,实现跨媒介翻译
  • 提示词工程:通过设计特定指令(如"科技风翻译")引导AI适配专业领域语境,提升术语准确性与风格一致性
  • 巴别塔项目:开源PDF翻译解决方案,智能处理表格/公式/角注等复杂排版,消除语言隔阂的代称
  • 知识管道:信息处理流程隐喻(采集→分块→向量化→存储),翻译后内容可直接纳入该体系强化学习
完整总结
-

吕立青_JimmyLv

【教程】AI 自动部署!一句话将网站秒上线生产环境,新手也能轻松搞定 | EdgeOne Pages & MCP实战

16:51

#AI部署革命
#无代码开发
#腾讯云EdgeOne
#MCP协议
#VibeCoding
哔哩哔哩
【教程】AI 自动部署!一句话将网站秒上线生产环境,新手也能轻松搞定 | EdgeOne Pages & MCP实战
总结于 3 个月前

摘要

视频展示了如何通过腾讯云EdgeOne Pages与MCP(模型上下文协议)实现AI驱动的全自动部署。作者以"一句话指令"(如"帮我部署到EdgeOne Pages")触发AI Agent自动完成项目构建、云服务调用及上线流程,彻底消除传统部署的配置复杂度。整个过程在带娃干扰场景下高效完成,凸显了AI如何让非技术人员也能轻松发布全球可访问的Web应用。

亮点

  • 🤖 AI理解部署语义:MCP协议使AI能解析"部署"等自然语言指令,自动调用云工具链(如npm build、域名绑定),无需人工操作技术细节。
  • ⚡️ 端到端自动化:从语音输入到生产环境上线仅需分钟级,AI自动识别项目框架(Next.js/Node等),生成构建清单并触发云端发布。
  • 🌍 零摩擦全球访问:EdgeOne Pages基于边缘网络实现毫秒级全球分发,自动集成CDN、DDoS防护等能力,开发者无需关心基础设施。
  • 🧩 声明式开发范式:用户只需声明"要什么"(如"创建2048游戏并部署"),AI自行决策"怎么做",颠覆传统命令式操作流程。
  • 🚀 技术普惠实践:设计师、领域专家等非技术人员可通过自然语言快速发布应用,结合模板库一键生成AI聊天机器人、电商网站等场景。

#AI部署革命 #无代码开发 #腾讯云EdgeOne #MCP协议 #VibeCoding

思考

  1. 如何配置MCP实现自动化部署?
  • 在Cursor编辑器设置中添加腾讯云提供的MCP服务代码段,启动deploy_folder工具。AI获得权限后,通过自然语言指令(如"部署到EdgeOne Pages")即可自动触发云端构建与发布流程。
  1. EdgeOne Pages支持哪些技术栈?
  • 支持全栈应用(如Next.js)、Node函数及Express/Koa等框架,AI自动识别项目结构并选择最优部署策略。同时提供模板库,涵盖AI图片生成、电商等场景,支持一键部署后定制。
  1. 传统开发者会被取代吗?
  • 不会。技术专家将转型为"AI领路人",负责设计MCP协议、训练领域Agent,并赋能非技术人员。复杂系统仍需工程师把控安全与架构,但重复性部署工作由AI接管。

术语解释

  • MCP(模型上下文协议):自然语言与云服务的翻译层,允许AI理解"部署"等抽象指令并自动调用API工具链,实现从想法到上线的自动化流水线。
  • 声明式开发:用户仅需定义目标状态(如"需要限速功能"),AI自主选择实现方案(如KV数据库),区别于传统逐行写代码的命令式开发。
  • 边缘网络分发:EdgeOne Pages通过全球分布式节点就近响应用户请求,结合CDN加速与安全防护,消除跨地域访问延迟。
  • AI网关:腾讯云内置服务,可代理管理第三方AI模型API(如DeepSeek/Gemini),提供缓存、频控等能力,降低集成复杂度。
  • Vibe Coding:以自然语言交互为核心的开发范式,聚焦产品逻辑而非技术细节,使设计师等群体能快速验证创意。
完整总结
-

吕立青_JimmyLv

【开箱】macOS 26 Tahoe 的圆角设计到底有多丑?

10:43

#UI设计
#macOS
#Tahoe
#剪切板
#效率工具
#Alfred
#Raycast
#iOS联动
#生产力
#跨平台
#语音转文字
#语音备忘录
#生态系统
#第三方应用
#创新瓶颈
哔哩哔哩
【开箱】macOS 26 Tahoe 的圆角设计到底有多丑?
总结于 3 个月前

摘要

本视频主要评测了 macOS 最新系统 Tahoe 的各项新功能,作者吐槽了新系统在 UI 设计上的不足,尤其是 Finder 中按钮的圆角设计,认为其审美令人难以接受。同时,作者也体验了新系统的 Spotlight 聚焦搜索、剪切板功能,以及与 iOS 的联动。虽然新系统有一些亮点,例如语音转文字功能,但总体而言,作者认为这次更新缺乏创新,对生产力的提升效果有限,不如关注如何利用第三方应用来提高效率。作者还分享了自己如何利用 Readwise Reader 进行信息管理,以及未来视频的计划,包括如何利用 AI 创造工具等。

亮点

  • 🤮 macOS Tahoe 的 UI 设计,尤其是 Finder 中的圆角,审美让人难以接受,原生应用和第三方应用的圆角不统一,拼凑在一起显得更加糟糕。#UI设计 #macOS #Tahoe
  • ✂️ 新的剪切板功能虽然有所改进,但与 Alfred 和 Raycast 等第三方工具相比,仍有较大差距。虽然允许保存8小时内容,但用户通常需要更长时间的保存。#剪切板 #效率工具 #Alfred #Raycast
  • 📱 macOS 新增了手机 App,实现了与 iOS 的联动,可以在电脑端直接打开手机应用。这个联动效果对于需要在电脑上查看手机内容的用户来说非常方便。#iOS联动 #生产力 #跨平台
  • 🎤 语音备忘录的语音转文字功能虽然方便,但仍存在一些问题,例如在英文系统下转录中文语音时会出现错误,且无法重新听写,与第三方应用相比仍有差距。#语音转文字 #语音备忘录 #生产力
  • 🧑‍💻 苹果的强大之处在于其生态系统和第三方应用,而苹果现在似乎在抄袭一些优秀的第三方应用,但效果并不理想。开发者依然愿意为苹果贡献灵感和资金,但苹果的创新似乎已经进入了瓶颈期。#生态系统 #第三方应用 #创新瓶颈

#macOS #Tahoe #UI设计 #生态系统 #效率工具

思考

  1. macOS Tahoe 的圆角设计真的有那么糟糕吗?不同的人审美差异很大,是否会有人觉得这种设计很可爱?

    • Answer 1: 作者的观点可能比较主观,但视频中也展示了不同应用圆角不统一的问题,这确实会影响整体美观。是否觉得丑还是取决于个人审美。
  2. 除了语音转文字功能,macOS Tahoe 还有其他值得关注的亮点吗?

    • Answer 2: 视频中提到的 iOS 联动功能可以方便用户在电脑上查看手机内容,以及 Apple Notes 可以导出为 Markdown 格式,可能对一部分用户有用。

术语解释

  • 访达 (Finder): macOS 系统中用于管理文件和应用程序的默认文件管理器。
  • Spotlight 聚焦搜索: macOS 系统中内置的搜索工具,可以快速查找文件、应用程序和执行操作。
  • 液态玻璃 (Liquid Glass): macOS Tahoe 中引入的一种新的 UI 设计语言,旨在提供更流畅和透明的视觉效果。但被作者吐槽“丑”。
  • Setapp: 一种付费软件订阅服务,用户可以通过按月付费的方式访问和使用大量的付费软件。
  • Markdown: 一种轻量级的标记语言,可以用来编写格式化的文本,常用于编写文档、博客和代码注释。
完整总结
-

吕立青_JimmyLv

AI 无限空境,告别昂贵素材费:Google 街景地图截图,AI 秒生成电影级空镜视频

04:34

#AI无限空镜
#谷歌街景转视频
#低成本视频素材
#AI创作工具
#商用AI视频
哔哩哔哩
AI 无限空境,告别昂贵素材费:Google 街景地图截图,AI 秒生成电影级空镜视频
总结于 4 个月前

摘要

视频介绍了作者开发的“AI无限空镜”项目,该工具可将谷歌街景地图截图转化为电影级空镜视频,详细讲解了其操作流程、多场景应用、成本效益、技术拓展(如集成其他视频模型、替换地图数据源)、高级功能(风格/时长/镜头运动设置)及商业模式,最后表达了寻求合作探索出海市场的意愿,帮助用户低成本获取商用视频素材。

亮点

  • 🎥 AI无限空镜工具核心功能:用户只需在谷歌地图搜索地点(如东京塔)、截图并输入描述性提示词(如“黄昏时期的电影级空镜,柔和光线+云层移动+宁静烂漫氛围”),即可生成对应电影级空镜视频,操作简单却极大释放创作想象力。
  • 🌍 多场景覆盖与技术拓展性:支持东京塔、自由女神像、埃菲尔铁塔等全球地标,用户可自定义提示词生成特定场景;项目基于Google VEO构建,未来可集成可灵、即梦、通义万相等同视频生成模型,还能替换为百度/高德地图数据源。
  • 📚 内容创作潜力:能生成“人山人海”“城市袭击”等特定场景,为历史故事、纪录片等内容创作提供丰富视觉素材,彻底打破传统素材获取的场景限制,拓宽创作边界。
  • 💰 成本优势与商用价值:AI生成的空镜画面可商用,成本远低于传统无人机拍摄(无需飞行执照、高额素材费),实现高效且经济的视频制作,解决了传统素材获取成本高昂的痛点。
  • ⚙️ 高级功能与未来优化:提供电影风、写实风等风格选择,4秒/8秒时长控制,平移、推进、拉远等镜头运动选项;Google VEO自带背景音增强沉浸感;当前支持720P输出,未来可通过集成其他模型或清晰度放大工具升级至1080P,并将根据用户需求迭代。
  • 🤝 商业模式与合作展望:项目有包月(含200个视频生成)等定价模式,作者希望寻找有产品/运营经验的合作伙伴,共同探索项目出海市场,临时地址为https://bibigpt.co/veo3。

#AI无限空镜 #谷歌街景转视频 #低成本视频素材 #AI创作工具 #商用AI视频

思考

  1. AI生成的空镜视频商用时,是否需要额外确认版权问题?比如谷歌街景截图的使用是否会影响商用授权?
  2. 若替换为百度或高德地图数据源,生成的空镜视频效果(如街景覆盖度、细节还原)会和谷歌地图有差异吗?
  3. 未来支持1080P高清输出后,生成视频的成本会不会比现在720P的版本更高?
完整总结
-

吕立青_JimmyLv

【重磅】BibiGPT 2025Q2 更新汇总:视频转图文丨字幕压制丨智能合集丨闪记卡

27:24

#BibiGPT更新
#视频转图文
#智能合集
#字幕压制
#闪记卡学习
哔哩哔哩
【重磅】BibiGPT 2025Q2 更新汇总:视频转图文丨字幕压制丨智能合集丨闪记卡
总结于 4 个月前

摘要

本视频汇总了BibiGPT 2025Q2及后续(7-8月)的核心功能更新,涵盖视频内容高效处理(视觉摘要、公众号图文转换)、本地功能强化(字幕压制、视频导出)、内容管理升级(手动/智能合集、全局搜索)、学习辅助工具(智能闪记卡)及体验优化(UI主题、通知系统、多模型集成)等方向,旨在帮助用户实现“音视频看得快、搜得到、用得好”的需求。

亮点

  • 🖼️ 视觉摘要功能:自动提取视频关键帧截图并匹配对应时间点,结合AI润色将口播字幕转为书面化文本(保留结构),同时高亮关键词,大幅提升视频内容的阅读直观性。
  • 📝 公众号图文转换(Beta):Pro会员可将45分钟内视频转为排版精美的公众号文章,支持HTML/PDF导出,文中截图和链接可直接跳转原视频对应位置,降低内容二次创作成本。
  • 🎬 字幕烧录与视频导出:本地客户端支持将字幕(单/双语)直接压制进视频,可自定义字幕颜色、背景、尺寸(横屏16:9/竖屏9:16),满足多平台发布需求,解决手动合并字幕的麻烦。
  • 🗂️ 智能内容管理:支持手动合集(可公开、变现)、智能分类(通过标签筛选自动整理内容)及全局搜索(快捷键Command+K快速检索4000+条视频),实现音视频内容的高效归档与检索。
  • 📚 智能闪记卡功能:自动生成视频核心知识点的问答卡片(如“成年出现期的五大特征”),支持空格显答案、方向键切换,还可导出Anki用间隔重复算法复习,助力知识内化。
  • 🔔 异步通知系统:网页/桌面端支持总结完成通知(需开启权限),无需守在屏幕前等待;同时集成智谱GLM-4.5、豆包Seed等多模型(含快速版/Pro版),满足不同场景的生成需求。

#BibiGPT更新 #视频转图文 #智能合集 #字幕压制 #闪记卡学习

思考

  1. BibiGPT的公众号图文功能仅支持45分钟内视频,若需处理更长视频(如1小时以上的课程),后续会开放时长限制吗?
  2. 智能闪记卡生成的问题是否基于视频中的“高亮关键词”或“章节要点”?用户可以手动调整问题的数量或侧重点吗?
  3. 字幕烧录时的样式自定义目前只有颜色、背景等基础选项,后续会不会增加字体选择(如宋体、黑体)或字幕动画特效?
完整总结
-

吕立青_JimmyLv

软件3.0:AI 编程新时代的最佳拍档 CloudBase AI ToolKit,以开发微信小程序为例

22:34

#AI编程
#软件3.0
#云开发
#微信小程序
#AIAgent
哔哩哔哩
软件3.0:AI 编程新时代的最佳拍档 CloudBase AI ToolKit,以开发微信小程序为例
总结于 6 个月前

摘要

本视频介绍了软件3.0和“随心编程”(Vibe Coding)的新兴理念,并结合Andrej Karpathy的观点,阐述了自然语言如何成为新的编程语言。视频通过一个完整的实战案例,详细演示了如何利用AI原生代码编辑器Cursor与腾讯云开发套件CloudBase AI ToolKit,仅通过几轮自然语言对话,就从零开始构建出一个功能完善的微信语音记账小程序,直观地展现了AI驱动下软件开发效率的巨大飞跃。

亮点

  • 💡 软件开发正迈向3.0时代,其核心理念是将自然语言(Prompt)作为一种全新的编程语言,指挥大语言模型(LLM)这个新“操作系统”来自动化完成复杂的编程任务。
  • 🚀 AI原生开发工具(如Cursor)与一站式云开发套件(如CloudBase AI ToolKit)的结合,是实现高效AI编程的最佳拍档,能覆盖从前端到后端部署的全流程。
  • 🛠️ 模型上下文协议(MCP)是实现AI自主操作的关键,它为AI Agent提供了一套可调用的工具集,使其能自主执行创建数据库、部署云函数、管理文件等复杂操作,而无需人工干预。
  • 📱 视频通过实战演示,仅用两轮核心对话,就让AI成功构建了一个支持语音输入的微信记账小程序,并自动完成了界面、逻辑、云函数和数据库的设计。
  • 📄 为AI提供精确的上下文至关重要,例如,通过分享官方文档链接,AI能自主学习并调用最新的API(如CloudBase的extend.ai能力)来解决未知问题。
  • 🤖 AI不仅能编写代码,还能高效地进行调试;将报错信息直接复制给Cursor,它能够分析问题根源并自动生成修复后的代码,极大地简化了排错过程。
  • 🗣️ 未来的软件开发将更加“声明式”,开发者只需描述“做什么”(What),而AI会利用各种云服务和工具集(Agentic AI)来解决“怎么做”(How)的技术细节。
  • ☁️ CloudBase AI Toolkit深度整合了微信生态,提供了数据库、文件存储、AI模型调用等一站式云服务,通过MCP协议让AI能无缝操作这些云资源,打通了从开发到部署的“最后一公里”。
  • 🧠 大语言模型被比作新时代的操作系统,其上下文窗口(Context Window)如同内存(RAM),需要通过提供精准的上下文(如文档)和强大的工具集(如MCP)来辅助其完成复杂推理和任务。
  • 🌐 作者呼吁所有云厂商都为AI Agent打造工具(适配MCP服务),让人类只需指挥Agent,就能将创意快速变为现实,真正实现“人人都是程序员”的愿景。

#AI编程 #软件3.0 #云开发 #微信小程序 #AIAgent

思考

  1. 使用这套CloudBase AI Toolkit和Cursor进行开发,对个人开发者来说成本高吗?需要哪些前置准备(比如腾讯云账号、微信认证等)?
  2. AI生成的代码和部署操作完全可信吗?当AI执行了错误的操作(比如视频中提到的删除数据库集合),我们该如何进行回滚或控制?
  3. 对于比记账小程序更复杂的应用,比如包含复杂业务逻辑和多表关联的系统,这套AI编程工作流是否依然高效?
完整总结
-

吕立青_JimmyLv

AI 视频知识管理:看得快、搜得到、用得好,如何利用 BibiGPT 收集、整理、输出?

36:13

#AI知识管理
#音视频处理
#Notion联动
#智能搜索
#生产力工具
哔哩哔哩
AI 视频知识管理:看得快、搜得到、用得好,如何利用 BibiGPT 收集、整理、输出?
总结于 6 个月前

摘要

视频系统介绍了BibiGPT如何通过AI技术实现音视频知识管理的全流程优化,涵盖快速收集、智能整理、深度提炼和高效输出四大核心环节。作者结合CODA框架演示了从B站、YouTube等平台一键导入视频、自动生成字幕与思维导图、联动Notion/Obsidian笔记软件等实操场景,并展示了AI辅助视频创作、跨语言搜索、视觉化总结等创新功能。最后提及618限时五折优惠及永久会员机制。

亮点

  • 🚀 全平台极速捕获:通过浏览器插件、微信助理、桌面客户端实现B站/YouTube/播客等多源音视频一键收藏,异步自动总结并同步至笔记软件
  • 🧠 AI智能重组知识:支持自动生成章节摘要、标签分类、跨视频关联分析,通过Mermaid图表/动态网页等可视化形式重构知识结构
  • 🔍 跨语言深度检索:中英文字幕互译后仍可精准搜索,结合AI语义分析实现"未知的未知"内容推荐,拓展认知边界
  • 🎥 创作闭环赋能:AI自动生成短视频脚本、公众号文案、PPT大纲,甚至通过MCP协议调用工具链实现字幕样式定制与视频再加工
  • 📈 人机协同进化:开发者将持续迭代提示词库与智能体架构,未来可通过自然对话实现"一句话生成专题合辑"等高级功能

#AI知识管理 #音视频处理 #Notion联动 #智能搜索 #生产力工具

思考

  1. 如何处理BibiGPT暂未适配的视频平台内容?
  2. AI生成的总结准确度如何保障?需要人工二次校验吗?
  3. 永久会员机制关闭后,现有用户权益会受影响吗?
完整总结
-

吕立青_JimmyLv

【开箱】AI 浏览器 Dia 全新公测,对比 Arc 体验到底怎么样?65 分

23:46

#AI浏览器
#Dia
#ArcBrowser
#生产力工具
#科技开箱
哔哩哔哩
【开箱】AI 浏览器 Dia 全新公测,对比 Arc 体验到底怎么样?65 分
总结于 6 个月前

摘要

这期视频我开箱并深度体验了著名浏览器公司 The Browser Company(Arc 浏览器开发商)推出的全新 AI 浏览器——Dia。我详细展示了 Dia 将 AI 作为核心交互界面的设计理念,测试了它与网页、视频和文件的对话能力,并设置了个性化的 AI 风格。最后,我将它与 Arc 浏览器进行对比,指出了它在公测阶段的不足之处,并给出了 65 分的综合评价。

亮点

  • 💡 Dia 浏览器的核心理念是“AI 即浏览器”,它试图将 AI 深度集成到浏览器内核,让对话成为用户与互联网交互的主界面,而非像传统浏览器那样将 AI 作为附加功能。
  • 🗣️ 用户可以通过个性化设置,让 Dia 以特定的语气和风格(例如模仿著名思想家保罗·格雷厄姆)进行回应,并能根据用户输入的职业和兴趣,提供高度定制化的内容总结与回答。
  • ✍️ Dia 内置了强大的对话式交互窗口,支持与网页、视频、图片甚至本地文件进行多任务对话,能够快速总结内容、翻译文本、辅助写作,极大地提升了信息处理和调研的效率。
  • 🖼️ Dia 在界面设计上继承了 Arc 浏览器一贯的美学风格,交互动画精美流畅,并且支持将对话内容一键生成设计精美的图片进行分享,优化了内容创作和社交媒体分享的工作流。
  • 🤔 尽管理念先进,但 Dia 目前仍处于公测初期,成熟度不高。它与现有浏览器插件生态的联动体验较差,且缺少一些 Arc 浏览器中备受好评的核心功能(如 Space),整体体验并未完全达到预期。

#AI浏览器 #Dia #ArcBrowser #生产力工具 #科技开箱

思考

  1. 既然 Dia 目前缺少很多 Arc 的核心功能(比如 Space),那它对于已经习惯 Arc 的用户来说,除了新颖的对话交互,还有什么独特的吸引力吗?
  2. 视频里提到 Dia 和现有浏览器插件的联动很差,未来官方有计划改善这一点吗?还是说他们希望用原生的 AI 功能彻底取代大部分插件?
  3. **Dia 浏览器未来会收费吗?**它这种深度集成的 AI 功能看起来运行成本不低。
完整总结
-
AI-driven Video SummarizerBibiGPT

让你的音视频看得快,搜得到,用得好,真正做到「知行合一」

哔哩哔哩小红书小红书视频总结微信公众号即刻即刻视频总结YouTubeX(Twitter)GitHub

探索

  • 热门
  • AI Summarizer Hub
  • Comparisons
  • Topics
  • 视频频道

技术支持

  • 引荐计划
  • 上手教程
  • API 集成
  • 技术问题处理指南

关于我们

  • 开发者故事
  • 路线图
  • 更新日志
  • 服务状态
  • 合作伙伴与精选资源

条款

  • 隐私政策
  • 服务条款
  • 退款政策
  • 联系我们

入门指南

  • 一体化 AI 助手
  • 快速开始
  • 推荐计划
  • 订阅选项
  • 账户管理

平台功能

  • 客户服务
  • 快速跳转
  • 定制解决方案
  • 批量总结
  • 移动总结

集成扩展

  • API 集成
  • 浏览器扩展
  • iOS 快捷方式
  • 斜杠命令
  • 笔记功能

免费工具

  • 语音转文字
  • 字幕文件总结
  • 免费视频压缩
  • AI 视频搜索探索
  • 短链接变长链接

高级工具

  • 视频视觉分析
  • 播客改写文章

社交分享工具

  • AI 视频转社交配图
  • 微博热搜卡片生成器
  • 视频高光海报生成器
  • 小红书封面卡片生成器

© 2024 EvergreenAI Inc. All rights reserved.

京ICP备2024064889号-1