YouTube 工具 意图路由 | 用户请求 | 模式 | 执行方式 | |---------|------|---------| | 总结视频 / 视频说了什么 | 摘要 | → Claude 生成结构化摘要 | | 问视频里的内容 | 问答 | → 基于字幕回答 | | 要完整文字稿 / 逐字转录 | 逐字稿 | (Gemini,含说话人标注) | | 搜索某主题的视频 / 找视频 | 视频搜索 | → 选择 → → 摘要 | | 追踪频道 / 关注博主 / 检查更新 | 频道追踪 | | | 提纯文字稿 / 整理播客 / 拆解问答 | 文字稿提纯 | (Gemini CLI 结构化提纯) | --- 模式一:摘要 / 问答 - 依赖 - 输出字幕文本后,由 Claude 生成摘要或回答用户问题 - 适合有 CC 字幕或自动生成字幕的视频 摘要格式: --- 模式二:逐字稿 - 依赖 - 自动分段 :视频 10 分钟时自动分段转录,每段独立调用 Gemini,最后拼接 - 内置速率限制处理和重试机制 - 输出格式: ,无时间码 - 第一行为视频标题 - 完成后作为附件发送给用户 --- 模式三:视频搜索闭环 当用户想搜索某个主题的视频并获取内容总结时,执行以下闭环流程: 第一步:搜索视频 依赖 (在 .env 文件中配置)。返回 JSON 包含视频标题、URL、频道、时长、描…