BibiGPT v4.318.0 アップデート:PPT抽出、ハード字幕OCR、ローカルプライバシーモード

BibiGPT v4.318.0がPPTキーフレーム抽出、ハード字幕OCR、デスクトップ版ローカルプライバシーモード、Google Gemma 4 31Bモデル、スクリーンショット分析機能を提供します。

BibiGPT チーム

BibiGPT v4.318.0 アップデート:PPT抽出、ハード字幕OCR、ローカルプライバシーモード

親愛なるBibiGPTユーザーの皆様、

今回のアップデートは「素早く見る・簡単に検索・より良く使う」の3方向を中心に、AIに「目」を与えました。画面からPPTやハード字幕を直接読み取れるようになり、ローカルプライバシーモードもデスクトップに対応しました。詳細をご紹介します。

立即体验 BibiGPT

想要体验这些强大的新功能吗?立即访问 BibiGPT,开启您的智能音视频总结之旅!

开始使用

👀 素早く見る

ローカルプライバシーモード — デスクトップ版に対応

社内会議の録音や個人メモを処理する際、データのアップロードが気になりますよね。

ローカルプライバシーモードがWeb版からmacOSとWindowsクライアントに拡張されました。有効にすると、音声認識と要約生成がすべてローカルで実行されます — サーバーへのアップロードなし、データベースへの保存なし。機密インタビュー、社内研修の録音に最適です。

BibiGPTデスクトップクライアント ローカルプライバシーモードのアップロードトグルBibiGPTデスクトップクライアント ローカルプライバシーモードのアップロードトグル

Google Gemma 4 31B モデルを追加

モデルセレクターに**Google Gemma 4(31B)**が新しく加わりました。

Apache 2.0ライセンスで完全オープンソース公開された310億パラメータのモデルで、論理的推論と長文理解に優れ、140以上の言語をサポートしています。デフォルトモデルだけをお使いでしたら、Gemma 4で何本か動画を試してみてください — 異なる「頭脳」が全く違う洞察を引き出すことがあります。

BibiGPTモデルセレクターでGemma 4 31Bを検索BibiGPTモデルセレクターでGemma 4 31Bを検索

🔍 簡単に検索する

看看 BibiGPT 的 AI 总结效果

松尾豊教授に聞く、生成AIの「次の10年」

松尾豊教授に聞く、生成AIの「次の10年」

PIVOTのロングインタビュー。LLMの進化軸、ソブリンLLM、ロボティクス、そして三つの言葉について松尾豊教授が語る。

まとめ

東京大学・松尾豊教授が、生成AIの今後10年を冷静に語る35分間のロングインタビュー。短期のブームではなく「複利で効いてくる10年」を見るべきだと前置きしたうえで、LLMの進化軸(推論時計算・エージェント・マルチモーダル)、日本にソブリンLLMが必要な3つの理由、ロボティクスとの融合、そしてリスクと向き合い方を順に整理する。最後に「まず絶望から始めよ/技術を舐めろ/AIを崇めるな」の三つの言葉に実装者へのメッセージを凝縮し、行列のできるラーメン屋のメタファーで締めくくる。

ハイライト

  • 🧠 進化は止まらない スケーリング則は鈍化しても、推論時計算・エージェント・マルチモーダルの3軸でまだ大きく伸びる。
  • 🇯🇵 ソブリンLLMの必要性 日本語コーパス、産業データ、安全保障の3観点から、海外モデル一辺倒は長期的にリスクが大きい。
  • 🤖 次の主戦場はロボティクス VLAモデルにより、製造・物流・介護の現場が向こう5〜10年で本格的に変わる。
  • ⚠️ リスクは禁止より実装で 誤情報・著作権・雇用は現実の論点。Sandbox型ガバナンスで実験を回し続けるべき。
  • 💡 三つの言葉 「まず絶望から始めよ/技術を舐めろ/AIを崇めるな」— 実装者の姿勢を一言で表す。

#ソブリンLLM #ロボティクス

質問

    • 短期の派手さに惑わされると本質を見誤る。複利で効いてくる構造変化は、10年スパンでないと見えてこない。
    • 海外モデル任せでは日本語性能・産業データ活用・安全保障のすべてで長期的に不利になる、というのが教授の立場。
    • 自分の仕事や知識が時代遅れになる現実を直視しない限り、本気の打ち手は出てこない。出発点としての絶望は健全な動機づけになる。

キーワード

  • 推論時計算 (test-time compute) モデルに「考える時間」を与えることで性能を引き上げるアプローチ。
  • ソブリンLLM 国内で開発・運用される基盤モデル。日本語性能と産業データ活用、安全保障の観点から重要視される。
  • VLA (Vision-Language-Action) 視覚・言語・行動を統合したロボット用基盤モデル。LLMが「身体」を持つ次の段階。
  • Sandbox型ガバナンス 禁止寄りの規制ではなく、実験範囲を限定して試行錯誤を許す枠組み。

想要总结你自己的视频?

BibiGPT 支持 YouTube、B站、抖音等 30+ 平台,一键获得 AI 智能总结

免费试用 BibiGPT

ハード字幕OCR抽出(Beta)

一部の動画では字幕が画面に直接焼き付けられています — CCトラックがなく、背景ノイズで音声認識も無力です。

BibiGPTはOCRで画面から直接字幕を読み取れるようになりました。騒がしい街頭インタビュー、訛りの強い海外講演に最適です。現在、中国語、英語、日本語、フランス語、ドイツ語、スペイン語の6言語に対応しています。

BibiGPT ハード字幕OCR認識プロセスBibiGPT ハード字幕OCR認識プロセス

BibiGPTは「聴く」だけでなく「見る」こともできるようになりました — 画面にテキストがあれば読み取ります。

🛠️ より良く使う

PPTキーフレーム抽出(Beta)

教育動画の真価はスライドにありますが、特定のスライドを探すにはタイムラインをドラッグし続けるしかありませんでした。

BibiGPTのPPTキーフレーム抽出は、画面の変化を自動検出し、重複のないキーフレームをキャプチャし、各フレーム間の字幕テキストを対応するスライドの下に整理します。PDFをめくるように素早く閲覧できます。

BibiGPT PPTキーフレーム抽出結果 — KeynoteスタイルのページブラウザBibiGPT PPTキーフレーム抽出結果 — Keynoteスタイルのページブラウザ

スクリーンショットキーフレーム分析

BibiGPTは以前からビジュアル理解をサポートしてきました — AIが動画の画面内容を分析できます。今回はその上にスクリーンショットキーフレーム分析を追加しました。キーフレーム抽出後、各スクリーンショットのチャート、コード、プレゼンテーション内容を詳細に分析し、音声だけでは把握できない情報を補完します。

GLM-5V Turbo、Qwen 3.5 Omniなど複数のビジョンモデルを自由に切り替えられます。

BibiGPTキーフレームスクリーンショット分析パネル — ビジュアル分析結果の表示BibiGPTキーフレームスクリーンショット分析パネル — ビジュアル分析結果の表示

BibiGPTスクリーンショット分析モデルセレクター — GLM-5V Turboなどのビジョンモデル対応BibiGPTスクリーンショット分析モデルセレクター — GLM-5V Turboなどのビジョンモデル対応

その他の最近の改善

  • X/Twitter動画の修正:音声のみ再生される問題を修正
  • Wan 2.7動画生成:テキスト→動画、画像→動画など多彩なモード(Pro限定)
  • スマートリニューアルリマインダー:サブスクリプション期限が近づくとサイドバーにリマインダー表示
  • チャンネルアイコン表示:YouTube、Bilibiliなどのプラットフォームアイコンを表示
  • 使用量ページの強化:週/月/四半期ごとの使用履歴、クレジットとAPI残高を分離表示
  • 一括操作の改善:ボタン名称変更とコレクション追加時の自動検証

有反馈或建议?

我们非常重视您的意见!如果您在使用过程中遇到问题或有改进建议,请随时告诉我们。

提交反馈

まとめ

今回のアップデートの核心は、BibiGPTのビジュアル理解能力をさらに強化したことです。ローカルプライバシーモードで機密コンテンツを安心して処理し、ハード字幕OCRで画面のテキストを読み取り、PPT抽出とスクリーンショット分析で動画のスライドを閲覧可能なナレッジベースに変換できます。

今すぐAI効率的な学習の旅を始めましょう:

立即体验 BibiGPT

想要体验这些强大的新功能吗?立即访问 BibiGPT,开启您的智能音视频总结之旅!

开始使用

お楽しみください!

BibiGPT チーム