3 часа подкастов/видео, 15 минут на выделение сути.
Написал для Claude Code навык, достаточно вставить ссылку — поддерживаются 小宇宙, YouTube, B站, полностью на английском и китайском. Три AI модели работают независимо: • Claude отвечает за управление всем процессом • Whisper преобразует аудио в текст • Gemini обрабатывает длинные тексты до 5万 слов, выводит структурированные резюмы Самое интересное — способы получения аудио на трех платформах полностью разные. 小宇宙 самый простой, аудио-ссылка спрятана прямо в исходном коде страницы. YouTube имеет антибот-защиту, нужно немного обойти. B站 — самое сложное — стандартные методы заблокированы, в итоге пришлось напрямую обращаться к его низкоуровневому API, чтобы получить аудио. На практике протестировал три видео (см. изображение): 117мин + 181мин + 114мин, все успешно прошли. Самое длинное — 181 минута, транскрипция более 5万 слов. Раньше 3-часовой подкаст можно было только слушать или не слушать, теперь появился третий вариант: сначала посмотреть выделенные моменты, а при необходимости — вернуться и прослушать оригинал.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
3 часа подкастов/видео, 15 минут на выделение сути.
Написал для Claude Code навык, достаточно вставить ссылку — поддерживаются 小宇宙, YouTube, B站, полностью на английском и китайском.
Три AI модели работают независимо:
• Claude отвечает за управление всем процессом
• Whisper преобразует аудио в текст
• Gemini обрабатывает длинные тексты до 5万 слов, выводит структурированные резюмы
Самое интересное — способы получения аудио на трех платформах полностью разные. 小宇宙 самый простой, аудио-ссылка спрятана прямо в исходном коде страницы. YouTube имеет антибот-защиту, нужно немного обойти. B站 — самое сложное — стандартные методы заблокированы, в итоге пришлось напрямую обращаться к его низкоуровневому API, чтобы получить аудио.
На практике протестировал три видео (см. изображение): 117мин + 181мин + 114мин, все успешно прошли. Самое длинное — 181 минута, транскрипция более 5万 слов.
Раньше 3-часовой подкаст можно было только слушать или не слушать, теперь появился третий вариант: сначала посмотреть выделенные моменты, а при необходимости — вернуться и прослушать оригинал.