agent-browser 是什么?
· 4 min read
agent-browser 把浏览器从"给人用的 GUI"变成了"给 AI 用的 API"。
- 定位:专为 AI Agent 设计的浏览器操控工具,自然语言输入、结构化结果输出。
- 两种实现:Vercel agent-browser 是 Rust CLI(二进制 7MB),browser-use 是 Python 框架。
- 核心差异:传统自动化写死每一步,agent-browser 是目标驱动——只关心"做到没有"。
- 底层原理:CDP 直连 + Accessibility Tree 快照,context 用量比完整 DOM 少 90%。
- 实际数据:WebVoyager 成功率 91.3%,单任务成本不到 $0.09。
- 2026 趋势:MCP 集成、本地优先、反 Bot 对抗升级三条主线。

