by 335234131
让 Agent 直接操作真实 Chrome 的 MCP 服务,支持页面扫描、CDP、截图与物理输入
# Add to your Claude Code skills
git clone https://github.com/335234131/agent-browser-mcp让你的 Agent 直接操作“你正在使用的真实 Chrome”的 MCP 服务。
它不是沙盒浏览器,也不是简单网页抓取器,而是连接你本机已经打开的 Chrome,会保留:
适合这样的场景:
一句话概括:
这是一个把“真实浏览器自动化”包装成标准 MCP 的项目,让 Agent 不再只会操作沙盒浏览器,而能真正进入你的日常浏览器工作流。
如果你希望让 Hermes、Claude Desktop、Cursor 等 MCP 客户端直接操作你本机真实浏览器,这个项目就是为这个场景准备的。
这个项目把真实浏览器自动化能力包装成了标准 MCP 工具,重点能力包括:
这类能力很适合处理:
例如:
项目由三层组成:
127.0.0.1:18765127.0.0.1:18766当前暴露的主要 MCP 工具包括:
get_setup_statuslist_tabsswitch_tabopen_urlopen_new_tabextension_pathlist_extensionsscan_pageexecute_jscdp_commandcdp_batchget_cookiescapture_page_screenshotcapture_desktop_screenshotmouse_movemouse_clickmouse_dragtype_texthotkeypointer_info推荐环境:
在本地克隆后执行:
cd agent-browser-mcp
pip install -e .
如果你想先构建 wheel 再安装:
python -m pip install --upgrade build
python -m build
pip install dist/agent_browser_mcp-0.1.0-py3-none-any.whl
安装后会提供一个 CLI:
agent-browser-mcp
它有几个常用子命令:
agent-browser-mcp extension-path
agent-browser-mcp print-hermes-config
agent-browser-mcp doctor
这个命令会输出 JSON,帮助你检查:
config.js 是否生成这个项目包含一个 unpacked Chrome 扩展,需要手动加载一次。
agent-browser-mcp extension-path
打开:
chrome://extensions
然后:
注意不要停留在 about:blank。
请在 Chrome 中打开一个正常网页,例如:
https://www.baidu.comhttps://www.xiaohongshu.com否则不会建立有效会话。
把下面这段加到 ~/.hermes/config.yaml:
mcp_servers:
agent_browser:
command: agent-browser-mcp
timeout: 120
connect_timeout: 60
项目里也附带了示例文件:
examples/hermes-config.yaml配置后,重启 Hermes 或重新加载 MCP。
可用下面的命令验证:
hermes mcp list
hermes mcp test agent_browser
如果测试成功,Hermes 就能发现并调用这些浏览器工具。
仓库中也放了示例:
examples/claude-desktop-config.jsonexamples/cursor-mcp.json配置结构都很简单,核心就是:
{
"mcpServers": {
"agent_browser": {
"command": "agent-browser-mcp",
"args": []
}
}
}
例如,Agent 可以做:
这个项目操作的是你的真实浏览器和真实桌面。
这意味着:
请只在你信任的 MCP 客户端和 Agent 环境中使用。
请检查:
chrome://extensions 中加载about:blank你也可以运行:
agent-browser-mcp doctor
connected_tabs 为 0通常是以下原因之一:
建议:
doctor请给终端 / MCP 客户端授予系统权限:
hermes mcp test agent_browser 失败请检查:
agent-browser-mcp 是否在 PATH 中agent-browser-mcp doctor 看诊断输出这个项目的浏览器自动化能力,是从 GenericAgent 的浏览器栈中提取并重新封装成 MCP 服务的。
特别感谢 GenericAgent 项目及其作者提供的原始实现思路与核心能力来源。
原项目地址:
本项目中以下部分来自或改编自 GenericAgent:
TMWebDriver.pysimphtml.pytmwd_cdp_bridge Chrome 扩展资源如果你基于本项目继续二次开发或发布,也建议保留对 GenericAgent 的致谢与来源说明。
MIT
No comments yet. Be the first to share your thoughts!