RAG 知识库检索助手 (rag-knowledge-assistant) 基于向量数据库的智能知识库检索系统,支持语义理解和多格式文档处理。 核心能力 | 特性 | 说明 | |------|------| | 语义检索 | 基于向量相似度,理解问题意图而非仅关键词匹配 | | 多格式支持 | PDF、Word(.docx)、Excel(.xlsx)、Markdown、TXT | | 智能分块 | 自动文本分割 (500 字/块,重叠 50 字) 保持上下文完整 | | 溯源引用 | 回答标注来源文件和位置 | | 多轮迭代 | 最多 5 轮检索,逐步缩小范围 | 快速开始 首次使用:构建索引 日常使用 直接向 AI 提问,AI 会自动使用 RAG 检索: 工作流程 1. 理解用户需求 从问题中提取: - 主题/领域 :如"年假政策"、"API 认证"、"安全防护" - 限定条件 :如"2024 年"、"最新版本"、"技术部门" - 期望输出 :解释、摘要、具体数值、操作步骤 2. 向量相似度检索 使用 Embedding 模型将问题转换为向量,在向量库中查找最相似的文档片段: 检索参数 : - : 返回最相关的 5 个片段 - : 相似度阈值 0.6 (60%) - 低于阈值的片段会被过滤 3. 答案组织与溯源 综合检索结果,生成回答: 回答结构 : 1. 直接回答 - 简洁…