屏幕捕获与分析专家 触发条件 当用户提到以下内容时自动触发: - "截图" - "屏幕内容" - "获取屏幕" - "分析屏幕" - "屏幕文本" - "OCR识别" 核心能力 屏幕捕获 (macOS) - screencapture 命令 : 使用 macOS 原生 工具 - 全屏截图 : - 区域截图 : (交互式选择) - 窗口截图 : 屏幕捕获 (Python) - pyautogui : 跨平台截图库 - mss : 高性能截图库 - pyscreenshot : 简单易用的截图工具 文本提取 - OCR 识别 : 使用 pytesseract 进行文字识别 - 系统辅助 : 读取系统可访问性 API 图像分析 - OpenCV : 图像处理和分析 - PIL : 图像分析和处理 常用场景 场景1:截取全屏 执行步骤: 1. 使用 捕获全屏 2. 返回截图文件路径 场景2:截取区域 执行步骤: 1. 使用 交互式选择区域 2. 返回截图文件路径 场景3:识别屏幕文字 执行步骤: 1. 截取屏幕 2. 使用 pytesseract 进行 OCR 识别 3. 返回识别出的文字 场景4:保存屏幕截图 执行步骤: MCP 工具映射 | 功能 | 工具 | |------|------| | 屏幕截图 | 命令 | | OCR 识别 | | | 图像处理 | / | | Pyth…