tags: - ops - monitoring - healthcheck compatibility: openclaw license: MIT source: https://github.com/1yihui/YiHui 大龙系统巡检 SOP 触发条件 - 自动触发 : cron 任务(建议每 6–12 小时执行一次) - 手动触发 :主控或阿辉要求巡检时 巡检步骤 1. OpenClaw Gateway 状态 重点看: - Gateway 是否 Running - 绑定地址是否正确( 本地 / 暴露) - 各 Channel 连接状态(Feishu 等) 2. 通道(Channel)健康检查 对每个已配置的 Channel 做探测: - Feishu:发一条低打扰测试消息或查成员接口 - 其他 channel:按对应工具检查连接状态 3. 最近错误日志 重点关注: - 权限错误(Feishu 99991672 类) - API 超时 / 网络类错误 - 配置漂移(某个字段突然变了) 4. Task / Cron 状态 检查: - 是否有失败或卡住的定时任务 - 任务数量是否符合预期 5. 配置漂移检查(可选,高优先级时) 核对: - 当前加载的模型是否和 MEMORY.md / 配置一致 - 插件数量有无异常新增/消失 异常判断标准 | 异常类型 | 判断条件 | 严…