baoyu-youtube-transcript

设计与多媒体 已审计 @JimLiu v1.1.0
信任分
92/100
兼容 Agent
1
速查档案 只列事实:领域、Agent、信任分、作者、原文章节。装与不装请看下方作者解读。
领域
设计与多媒体
兼容 Agent
Claude Code
信任分
92 / 100 · 已通过审计
作者 / 版本 / 许可
@JimLiu · v1.1.0 · 未声明 license
安装命令数
1 条

需要注意: 未限定 allowed-tools,默认拥有全部工具权限。

想读作者英文原文? ↓ 滚到正文区切换 · 在 GitHub 查看 ↗

解读由编辑根据原文凝练而成,命令、链接、术语均与作者原文一致;想看完整论述请切到右侧

baoyu-youtube-transcript 给 YouTube 视频链接,把字幕(subtitles / captions)下载下来——不需要 API key、不需要装浏览器。

设计思路

作者用了 YouTube 的 InnerTube API 直连——这是 YouTube 自己 App / 网页前端用的内部 API,速度比第三方接口稳。如果 YouTube 临时屏蔽了 InnerTube 路径(偶尔会发生),自动 fallback 到 yt-dlp(成熟的开源下载器)。两条路径都失败才报错。

支持的字幕类型

  • 手工创建的字幕:作者上传的 SRT / VTT
  • 自动生成的字幕:YouTube 语音识别的版本(CC)

两种都能拿。

输出格式

按 Output Formats 章节,输出可选:

  • 纯文本(去时间码)
  • 带时间码(SRT 风格)
  • 按 chapters 分段
  • 按 speakers 分段(多说话人视频)

可以直接拿去做笔记、做翻译、做摘要。

缓存机制

本地缓存——同一 URL 第二次抓直接走缓存,不再请求。这对调试 prompt 特别友好。

工作流

按 Workflow 章节:① 解析 URL(视频 / 频道 / 播放列表);② 选输出格式;③ 走 InnerTube → fallback 到 yt-dlp;④ 后处理(chapters、speakers、清洗);⑤ 写入 Output Directory。

Optional Environment Variables

列出可调环境变量:缓存路径、超时、yt-dlp 路径、代理设置。

适合谁

  • 内容创作者把别人视频里的核心观点摘下来做笔记
  • 学生 / 研究人员把课程 / 讲座转成可搜索文本
  • 翻译者把外语视频字幕翻成中文(配 baoyu-translate
  • 自媒体二创:原视频字幕 → 重写文章 → 发公众号

何时不该用

  • 完整下载视频本身——这只下字幕
  • 没有任何字幕的视频(无 CC、无作者字幕)
  • 受地区限制无法访问的视频(除非你配代理)

配套

  • baoyu-translate:翻译外语视频字幕
  • baoyu-format-markdown:把字幕整理成可读 Markdown
  • baoyu-post-to-wechat:发成公众号文章
  • obsidian-vault:归档到笔记库