DeepSeek-V4 1M 上下文 × BibiGPT

DeepSeek 在 2026 年 5 月初把 V4 系列(Pro 高品質版 + Flash 速度版)放上 Hugging Face。架構是 1.6T 總參、49B 啟用的 MoE,1M token 上下文視窗——比 V3 的 128k 躍升 7.8 倍。開源權重同日上線。BibiGPT 多語種摘要管線已把 DeepSeek 列為可路由的長上下文後端之一。

發佈 · 2026-05 1.6T MoE · 49B 啟用 1M token 上下文

核心事實(90 秒速讀)

DeepSeek 在 2026-05 初把 V4 Pro 和 V4 Flash 上架 Hugging Face。架構是 1.6 兆參數 MoE,每 token 啟用 490 億,1M token 上下文視窗——比 V3 的 128k 躍升 7.8 倍。開源權重同日上線。對 BibiGPT 使用者而言,1M 視窗意味完整 3 小時 Podcast 或全天會議錄音可塞進單次提示——沒有分塊偽影、不丟跨塊引用。

Features

DeepSeek-V4 有哪些新東西?

V4 系列(Pro + Flash)是 1.6T MoE / 49B 啟用,1M token 上下文視窗,發佈當日開源權重上 Hugging Face。

1.6T 總參 · 49B 啟用 MoE

稀疏 MoE:1.6 兆參數中只有 490 億在每個 token 啟用,推理成本可控但保留遠大於此的密集 LM 知識密度。

1M token 上下文 · 擴 7.8 倍

上下文視窗從 V3 的 128k 跳到 100 萬。1M 視窗能裝下一整集長 Podcast、一門完整課程或一疊相關論文——無需分塊。

Pro vs Flash 雙版

Pro 主打頂級推理品質;Flash 調優低延遲 / 高吞吐。同一架構家族兩個 SKU——按工作負載選,不存在能力代差。

1M 上下文對 BibiGPT 使用者意味什麼

BibiGPT 核心工作是把長影片和 Podcast 變結構化筆記。1M token 上下文意味著整段轉錄直接全塞進去——分塊拼接的偽影消失。

整段轉錄一次摘要

90 分鐘講座、3 小時 Podcast、一整天會議錄音——一次提示就能裝下。不用再把分塊摘要拼回去,跨塊引用也不再斷裂。

長內容問答不丟檢索召回

「第 2 小時講到 X 時說了什麼?」這種問題可以直接問。沒有檢索召回上限,相關時刻夾在兩個分塊之間也不會 RAG miss。

開源權重 = 隱私選項

DeepSeek-V4 權重 Hugging Face 公開下載。敏感的企業會議或付費課程內容可以本地部署摘要,不用把音訊或轉錄交給第三方 API。

5 條關鍵變化(90 秒速讀)

DeepSeek-V4 發佈的關鍵改變。

  1. 1

    2026-05 初 Hugging Face 上架

    DeepSeek 在 2026-05 初把 V4 Pro 和 V4 Flash 放上 Hugging Face,權重同日開源——延續以往開源發佈節奏。

  2. 2

    1.6T MoE · 每 token 啟用 49B

    稀疏 MoE:1.6 兆總參,每 token 只啟用 490 億。推理成本受控卻保留遠大密集 LM 的知識密度。

  3. 3

    1M token 上下文 · 較 V3 擴 7.8 倍

    上下文從 V3 的 128k 跳到 100 萬——長內容轉錄無需再分塊。

  4. 4

    Pro vs Flash · 品質與速度兼得

    Pro 調優為頂級推理品質;Flash 調優為低延遲 / 高吞吐。同一架構家族兩個 SKU——按工作負載選,不存在能力代差。

  5. 5

    加入長上下文旗艦陣營

    DeepSeek-V4 與 Claude Opus 4.7、Gemini 1.5 / 2.0 Pro 同處 1M 上下文檔——但開源權重才是真差異化,對自託管和隱私敏感場景關鍵。

BibiGPT 使用者的 3 個典型場景

基於真實 BibiGPT 使用者畫像,全部今日可落地。

長講座轉錄——整段上下文摘要

90 分鐘大學講座或 3 小時技術報告一次提示裝下。摘要可以同段把第 8 分鐘和第 76 分鐘的概念串起來而不丟檢索——知識在整段轉錄範圍內保持連貫。

Podcast 備份——整集問答

扔進一整集 2 小時 Podcast 追問。1M 上下文視窗讓模型看到每一分鐘,「主持人在 90 分鐘左右關於 X 的論點是什麼?」可直接解答,無需 chunk-level RAG。

多文獻研究——整疊餵進去

把多篇相關論文、轉錄或技術規格一起塞進一次提示。1M token 一次性容納一份小型文獻綜述,跨文獻推理無需外部檢索層。

常見問題

歡迎提問!

把 3 小時 Podcast 一次提示摘要掉——DeepSeek-V4 路由就在其中

BibiGPT 自動把長影片/Podcast 摘要路由到長上下文後端(包括 DeepSeek-V4)。貼一個 YouTube/B 站/Podcast URL,就能拿到整段轉錄摘要加 5 語 AI 問答——沒有分塊偽影、不丟跨塊引用。