Lyrics-Video Sync — 歌词精准匹配引擎 解决的问题 AI MV 制作中,音频和视频经常脱节: - ❌ 画面和歌词内容不匹配 - ❌ 关键歌词没有对应的视觉呈现 - ❌ 音频高潮段和视频高潮段错位 - ❌ 歌词没有字幕展示 工作流 Step 1: 歌词提取与时间轴对齐 方案A: 已有歌词文件 支持格式: - LRC : - SRT : 字幕格式,带精确时间码 - JSON : 方案B: 从音频自动识别歌词 方案C: 手动标注歌词 输出统一格式 ( ): Step 2: 歌词→场景映射 映射规则 | 歌词特征 | 推荐画面 | |---------|---------| | 自然意象(花/雨/风/月) | 对应自然景观 | | 情感词(想/哭/笑) | 角色表情特写 | | 动作词(走/跑/飞) | 对应角色动作 | | 抽象词(梦/希望/自由) | 抽象/梦幻画面 | | 重复/叠句 | 重复构图但不同角度 | 自动映射 映射策略: - emotion energy (默认): 歌词情绪+能量→场景情绪对齐 - keyword : 歌词关键词→场景标签匹配 - sequential : 按时间顺序直接对应 Step 3: 音频精准分段 每个视频 clip 对应一段音频,精确裁剪: 分段规则 - 每段音频 = 对应 clip 的精确时间范围 - 段首段尾各加 0.3…