词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
computer_use 工具集通过 stdio 以 MCP 协议与 cua-driver 通信。cua-driver 是一个 macOS 驱动,使用 SkyLight 私有 SPI(SLEventPostToPid、SLPSPostEventRecordTo)以及 _AXObserverAddNotificationAndCheckRemote 无障碍 SPI,实现以下功能:hermes computer-use installcurl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/cua-driver/scripts/install.sh。hermes computer-use status 验证安装结果。hermes tools,选择 🖱️ Computer Use (macOS) → cua-driver (background)。hermes -t computer_use chat~/.hermes/config.yaml 中将 computer_use 添加到已启用的工具集列表。hermes update — 更新 Hermes 本身时,如果 cua-driver 在 PATH 中,更新结束时会重新运行上游安装程序。对非 macOS 用户及未安装 cua-driver 的用户无操作。hermes computer-use install --upgrade — 手动强制刷新。无论 cua-driver 是否已安装,都会重新运行上游安装程序。在不等待下次 Agent 更新的情况下获取最新修复时使用此命令。hermes computer-use status 会在二进制路径旁显示已安装的版本号。computer_use(action="capture", mode="som", app="Mail") — 获取 Mail 的截图,其中每个侧边栏项目、工具栏按钮和邮件行均已编号。computer_use(action="click", element=14) — 点击搜索框(来自截图的第 #14 号元素)。computer_use(action="type", text="from:stripe")computer_use(action="key", keys="return", capture_after=True) — 提交并获取新截图。| 提供商 | 支持视觉? | 可用? | 备注 |
|---|---|---|---|
| Anthropic(Claude Sonnet/Opus 3+) | ✅ | ✅ | 综合表现最佳;支持 SOM 与原始坐标。 |
| OpenRouter(任意视觉模型) | ✅ | ✅ | 支持多部分工具消息。 |
| OpenAI(GPT-4+、GPT-5) | ✅ | ✅ | 同上。 |
| 本地 vLLM / LM Studio(视觉模型) | ✅ | ✅ | 需模型支持多部分工具内容。 |
| 纯文本模型 | ❌ | ✅(降级) | 使用 mode="ax" 仅通过无障碍树操作。 |
image_url 部分内联在工具结果中发送。对于 Anthropic,适配器会将其转换为原生 tool_result 图像块。curl | bash、sudo rm -rf /、fork bomb 等。~/.hermes/config.yaml 中配置 approvals.mode: manual。[screenshot removed to save context] 占位符。context_management 启用 clear_tool_uses_20250919,由 Anthropic API 在服务端清除旧工具结果。browser 工具集。HERMES_CUA_DRIVER_VERSION 环境变量固定驱动版本。type 对命令行 payload 有硬性屏蔽模式;密码请使用系统自动填充功能。HERMES_CUA_DRIVER_CMD=/opt/homebrew/bin/cua-driver
HERMES_CUA_DRIVER_VERSION=0.5.0 # optional pinHERMES_COMPUTER_USE_BACKEND=noop # records calls, no side effectscomputer_use backend unavailable: cua-driver is not installed — 运行 hermes computer-use install 获取 cua-driver 二进制文件,或运行 hermes tools 并启用 Computer Use 工具集。escape 或关闭按钮将其关闭。capture 之前有效。任何改变状态的操作后请重新截图。type 的文本匹配了危险 shell 模式列表。请拆分命令或重新考虑操作方式。