标准入库表生成 目标 将人工确认通过的候选案例转成最终入库格式,对照既有数据库去重,并统一企业简称、金额、型号、案例详情和案例简介。 输入 - - 既有数据库 Excel,例如 - - 中的人工覆写规则 - 中的 OpenAI-compatible LLM 配置与本地 API key 输出 - - - 增量处理中间输出: - - - 执行流程 全量入库: 只处理新增通过记录时,可先生成差集输入,再调用脚本参数: 结束后查看: 1. 是否为最终全量入库文件。 2. 中的跳过、修正、覆写和 warning。 3. 场景枚举 warning、金额异常、企业简称未映射问题。 业务规则 - Ingest 去重键: 。 - 机器人企业优先映射为 中的企业简称。 - 金额非数字填 。 - 机器人型号为空、未披露或无效时填 。 - 父记录为空填 。 - 案例详情和案例简介写出前压成单行,避免 CSV 单元格内换行。 - 案例详情标准:150-250 字;案例简介标准:30-60 字。 - 只是增量中间结果,不是最终入库文件。 人工覆写 - 高频修正可先写入 的 。 - 覆写应记录原因,避免同一条记录在后续批次反复被 LLM 改回。 - 后续可迁移到 ,方便非工程人员维护。 失败处理 - LLM 质检失败:保留 progress 直接重跑。 - 既有数据库路径变化:使用 参数明确指定。 - 最终表…