Claude Computer Use Anthropic 官方桌面自动化 API(beta)。通过 截屏 + Claude 视觉理解 + 坐标操作 控制任意桌面应用。 何时使用 这是 终极后备方案 ,仅在以下情况使用: 1. peekaboo (macOS) / pywinauto (Windows) / browser (网页) 无法操作目标应用 2. 需要视觉判断(看屏幕内容决定下一步) 3. 目标应用不暴露 Accessibility API 4. 用户明确要求精确坐标控制 优先使用轻量方案(成本更低、速度更快): - 网页 → browser tool - macOS 桌面 → peekaboo - Windows 桌面 → pywinauto 支持的操作 | 操作 | 说明 | |---|---| | screenshot | 截取当前屏幕 | | left click | 在坐标 [x, y] 点击 | | right click | 右键点击 | | double click | 双击 | | triple click | 三击(全选文本) | | middle click | 中键点击 | | mouse move | 移动鼠标到坐标 | | left click drag | 拖拽(从当前位置到目标坐标) | | scroll | 滚动(方向 + 数量) |…