BibiGPT v4.318.0 アップデート:PPT抽出、ハード字幕OCR、ローカルプライバシーモード
リリースノート

BibiGPT v4.318.0 アップデート:PPT抽出、ハード字幕OCR、ローカルプライバシーモード

公開日 · 著者: BibiGPT チーム

BibiGPT v4.318.0 アップデート:PPT抽出、ハード字幕OCR、ローカルプライバシーモード

親愛なるBibiGPTユーザーの皆様、

今回のアップデートは「素早く見る・簡単に検索・より良く使う」の3方向を中心に、AIに「目」を与えました。画面からPPTやハード字幕を直接読み取れるようになり、ローカルプライバシーモードもデスクトップに対応しました。詳細をご紹介します。

👀 素早く見る

ローカルプライバシーモード — デスクトップ版に対応

社内会議の録音や個人メモを処理する際、データのアップロードが気になりますよね。

ローカルプライバシーモードがWeb版からmacOSとWindowsクライアントに拡張されました。有効にすると、音声認識と要約生成がすべてローカルで実行されます — サーバーへのアップロードなし、データベースへの保存なし。機密インタビュー、社内研修の録音に最適です。

BibiGPTデスクトップクライアント ローカルプライバシーモードのアップロードトグル

Google Gemma 4 31B モデルを追加

モデルセレクターに**Google Gemma 4(31B)**が新しく加わりました。

Apache 2.0ライセンスで完全オープンソース公開された310億パラメータのモデルで、論理的推論と長文理解に優れ、140以上の言語をサポートしています。デフォルトモデルだけをお使いでしたら、Gemma 4で何本か動画を試してみてください — 異なる「頭脳」が全く違う洞察を引き出すことがあります。

BibiGPTモデルセレクターでGemma 4 31Bを検索

🔍 簡単に検索する

ハード字幕OCR抽出(Beta)

一部の動画では字幕が画面に直接焼き付けられています — CCトラックがなく、背景ノイズで音声認識も無力です。

BibiGPTはOCRで画面から直接字幕を読み取れるようになりました。騒がしい街頭インタビュー、訛りの強い海外講演に最適です。現在、中国語、英語、日本語、フランス語、ドイツ語、スペイン語の6言語に対応しています。

BibiGPT ハード字幕OCR認識プロセス

BibiGPTは「聴く」だけでなく「見る」こともできるようになりました — 画面にテキストがあれば読み取ります。

🛠️ より良く使う

PPTキーフレーム抽出(Beta)

教育動画の真価はスライドにありますが、特定のスライドを探すにはタイムラインをドラッグし続けるしかありませんでした。

BibiGPTのPPTキーフレーム抽出は、画面の変化を自動検出し、重複のないキーフレームをキャプチャし、各フレーム間の字幕テキストを対応するスライドの下に整理します。PDFをめくるように素早く閲覧できます。

BibiGPT PPTキーフレーム抽出結果 — Keynoteスタイルのページブラウザ

スクリーンショットキーフレーム分析

BibiGPTは以前からビジュアル理解をサポートしてきました — AIが動画の画面内容を分析できます。今回はその上にスクリーンショットキーフレーム分析を追加しました。キーフレーム抽出後、各スクリーンショットのチャート、コード、プレゼンテーション内容を詳細に分析し、音声だけでは把握できない情報を補完します。

GLM-5V Turbo、Qwen 3.5 Omniなど複数のビジョンモデルを自由に切り替えられます。

BibiGPTキーフレームスクリーンショット分析パネル — ビジュアル分析結果の表示

BibiGPTスクリーンショット分析モデルセレクター — GLM-5V Turboなどのビジョンモデル対応

その他の最近の改善

  • X/Twitter動画の修正:音声のみ再生される問題を修正
  • Wan 2.7動画生成:テキスト→動画、画像→動画など多彩なモード(Pro限定)
  • スマートリニューアルリマインダー:サブスクリプション期限が近づくとサイドバーにリマインダー表示
  • チャンネルアイコン表示:YouTube、Bilibiliなどのプラットフォームアイコンを表示
  • 使用量ページの強化:週/月/四半期ごとの使用履歴、クレジットとAPI残高を分離表示
  • 一括操作の改善:ボタン名称変更とコレクション追加時の自動検証

まとめ

今回のアップデートの核心は、BibiGPTのビジュアル理解能力をさらに強化したことです。ローカルプライバシーモードで機密コンテンツを安心して処理し、ハード字幕OCRで画面のテキストを読み取り、PPT抽出とスクリーンショット分析で動画のスライドを閲覧可能なナレッジベースに変換できます。

今すぐAI効率的な学習の旅を始めましょう:

お楽しみください!

BibiGPT チーム