即梦数字人分镜脚本生成 将口播剧本按即梦AI数字人界面格式拆解为分镜头脚本,每个镜头包含"角色说"和"动作描述"两个字段。 即梦界面字段说明 参考 references/jimeng-format.md 了解即梦数字人界面的完整字段说明。 分镜拆解规则 1. 确定总时长与镜头数 | 总时长 | 推荐镜头数 | 每镜头时长 | |--------|-----------|-----------| | 15-30秒 | 2-4个 | 6-12秒 | | 30-60秒 | 4-6个 | 6-12秒 | | 60-90秒 | 6-9个 | 8-12秒 | | 90-180秒 | 9-18个 | 8-12秒 | 2. 台词拆分原则 - 按语义段落自然断句,每段一个完整观点 - 每个镜头台词控制在 15-36字 (对应约5-12秒口播) - 估算方式:中文口播约 3字/秒 - 硬限制 :单镜头不超过36字 / 12秒,超过必须拆分 - Hook镜头(开头)台词要短而有力,≤20字 - CTA镜头(结尾)台词简洁,≤25字 3. 动作描述规范 动作描述用于指导数字人的表演和镜头语言,格式参考: 常用动作词汇: - 表情:微笑、严肃、惊讶、自信地说、认真地讲 - 手势:双手摊开、竖起食指、比"1"的手势、双手交叉 - 身体:微微前倾、靠向椅背、转向镜头、点头 - 镜头:镜头推进、镜头缓慢拉远、正…