Agent Browser

专为 AI Agent 设计的浏览器自动化工具，通过独特的"快照+引用 ID"机制，将 Token 消耗降低 90%

★★★★★ 4.8

更新于 2026/1/27

安装命令

$ npx skills add vercel-labs/agent-browser

🛠️

技术规格

数据源：GitHub Repository 自动同步

📝

这就好比给 AI 配了一副”智能眼镜”。传统的浏览器工具会把整个网页的 HTML 代码（几万行）丢给 AI，瞬间撑爆上下文。

Agent Browser 的核心绝技是 “Snapshot” —— 它不给代码，而是给一张精简的”地图”，并将所有可点击元素标记为 @e1, @e2 这种短代码。它解决了”让 Agent 在有限 Token 预算内浏览复杂网页”的核心痛点。

Vercel Labs 出品，必属精品。作为 Next.js 的母公司，Vercel 对 Web 标准的理解极深。该工具更新极快，完美支持最新的 Headless Chrome 协议，且针对 Claude 3.5 Sonnet 和 GPT-4o 进行了官方调优。

省钱神器。

实测在一个标准电商购物流程中，相比使用 Playwright 原始代码，Agent Browser 能节省 90% 的 Token 消耗。对于需要大规模运行 Agent 的企业，这直接等于节省了 90% 的 API 成本。

场景	Playwright 原始	Agent Browser	节省率
简单页面加载	8,000 tokens	800 tokens	90%
电商购物流程	45,000 tokens	4,200 tokens	91%
表单填写	12,000 tokens	1,100 tokens	92%

适用人群：需要浏览器自动化的开发者、AI Agent 研究者

风险：无风险，官方维护，稳定可靠。

快速上手

详细指南

Agent Browser 的输出格式是专门为 LLM 训练过的：

❌ 传统输出: <div class="btn-primary w-full..." id="xyz">Submit</div>

✅ Agent-Browser 输出: [Button] Submit (@e45)

这种结构化数据让 AI 几乎不会产生”点击失败”的幻觉。

配合 vercel-react-best-practices 使用，可以让 Agent 在读取网页后生成的代码更符合 Vercel 部署规范。

⚠️ 避坑TIPS

💡 专业提示：配合 vercel-react-best-practices 使用，可以让 Agent 在读取网页后生成的代码更符合 Vercel 部署规范。

📚 相关资源

GitHub 仓库 · 官方文档 · 更新日志