3 小時的播客/影片,15 分鐘出精華。


給 Claude Code 寫了個 skill,丟個連結進去就行 — 小宇宙、YouTube、B站都支持,中英文通吃。
三個 AI 模型各干各的:
• Claude 負責調度整個流程
• Whisper 把音頻轉成文字
• Gemini 吃下 5 萬字長文本,輸出結構化摘要
最有意思的是三個平台的音頻獲取方式完全不一樣。小宇宙最簡單,頁面原始碼裡直接藏著音頻連結。YouTube 有反爬機制,需要繞一下。B站最折騰 — 常規方法全被封了,最後是直接調它的底層接口才拿到音頻。
實測三個影片(見圖),117min + 181min + 114min,全跑通。最長那條 181 分鐘,轉錄 5 萬多字。
以前 3 小時播客只能聽或不聽,現在多了第三個選項:先看精華,值得再回去聽原片。
查看原文
post-image
post-image
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)