Mistral Medium 3.5 × BibiGPT

Mistral AI 于 2026-04-29 发布 Medium 3.5——128B 参数 dense 模型,256K token 上下文窗口,修订版 MIT 协议明确允许商业部署。BibiGPT 把长视频总结、跨文档问答和自托管管线路由到 Mistral 3.5,作为长上下文后端之一,与 Claude Opus 4.7、DeepSeek-V4 并列。

发布 · 2026-04-29 128B dense · 256K 上下文 修订版 MIT 协议

核心事实(90 秒速读)

截至 2026-05-07:Mistral AI 于 2026-04-29 发布 Medium 3.5——128B 参数 dense 模型,256K token 上下文窗口,按修订版 MIT 协议发布,明确允许商业使用。自托管、SaaS 转售、嵌入付费产品全部在协议范围内。对 BibiGPT 用户而言,256K 足以把一段 2 小时播客转录或多文档研究素材塞入单次提示——不再分块、不丢跨段引用。

Features

Mistral Medium 3.5 带来什么?

128B dense 模型——不是 MoE,256K 上下文窗口,修订版 MIT 协议放宽了此前 Mistral 权重的商业使用门槛。

128B dense 架构

Medium 3.5 是 1280 亿参数的 dense Transformer,没有 MoE 路由——每个 token 所有参数都激活。相比稀疏 MoE 旗舰,微调和本地推理更直接。

256K token 上下文

上下文窗口扩到 256,000 token——大约一段 2.5 小时的播客转录、一整本技术书、或一摞相关研究论文一次性塞入。BibiGPT 类总结场景大多无需再做检索分块。

修订版 MIT——商用解锁

Mistral 把许可证更新为修订版 MIT,明确允许商业部署。自托管、SaaS 转售、嵌入付费产品全部在协议范围内,无需另签商业协议。

256K 上下文 + 开源协议对 BibiGPT 用户意味什么

BibiGPT 核心工作是把长视频/播客变结构化笔记。256K 足够端到端总结长内容;修订版 MIT 解锁了隐私敏感场景下的自托管。

整段转录一次性总结

90 分钟讲座、2 小时播客或多文档研究素材一次提示装下——分块拼接的伪影消失,跨段引用不再丢失。

课程跨视频问答

把多集课程或 YouTube 播放列表的转录拼到一起。问「哪一集讲了 X?」可在单次推理里直接答出,不再依赖会丢跨集召回的检索索引。

隐私敏感内容自托管

修订版 MIT 允许免费在自有 GPU 上部署 Medium 3.5。敏感企业会议、付费课程内容、付费播客存档可以本地总结——音频和转录不必交给第三方 API。

5 条关键变化(90 秒速读)

Mistral Medium 3.5 发布的关键改变。

  1. 1

    2026-04-29 发布

    Mistral AI 在 2026 年 4 月 29 日发布 Medium 3.5——Q2 节奏,与 Claude Opus 4.7、DeepSeek-V4 同处长上下文旗舰阵营。

  2. 2

    128B dense——不是 MoE

    Medium 3.5 是 1280 亿参数 dense Transformer,每个 token 所有参数都激活。相比稀疏 MoE 旗舰,微调与本地推理路径更简单。

  3. 3

    256K token 上下文

    上下文扩到 256,000 token——约 20 万英文单词、一整本书、或一段 2 小时播客转录端到端。BibiGPT 类总结大多无需再分块检索。

  4. 4

    修订版 MIT——商用解锁

    Mistral 把许可证更新为修订版 MIT,明确允许商业部署。自托管、SaaS 转售、嵌入付费产品都在协议范围内,无需另签 Mistral 商业协议。

  5. 5

    加入长上下文旗舰阵营

    Medium 3.5 与 Claude Opus 4.7(200K,闭源)、DeepSeek-V4(1M,MoE)同处长上下文档——按协议姿态、基础设施成本、推理负载选,没有能力代差。

BibiGPT 用户的 3 个典型场景

基于真实 BibiGPT 用户画像,全部今日可落地。

长视频转录——一次总结

用 BibiGPT 提取 2 小时播客或讲座的转录,再把总结环节路由到 Mistral Medium 3.5。整段转录塞入 256K 上下文,跨小节引用保持完整,不再拼分块总结。

多文档跨文检索——整摞喂进去

把 BibiGPT 提取的多集课程转录或多篇相关论文拼到一起。256K 余量下问「哪一集讲了 X?」可直接答出,无需会丢跨集引文的外部检索层。

隐私自托管——修订版 MIT 上生产

在自有 GPU 上按修订版 MIT 部署 Medium 3.5,前面接 BibiGPT 转录提取。敏感企业会议或付费课程内容——音频和转录不出网,总结全程留在内网。

常见问题解答

有问题?问我们!

一次提示总结 2 小时播客——Mistral Medium 3.5 路由就在其中

BibiGPT 自动把长视频/播客总结路由到长上下文后端(包含 Mistral Medium 3.5)。贴一个 YouTube/B 站/播客 URL,就能拿到整段转录总结加 5 语 AI 问答——没有分块伪影、不丢跨段引用。