Skip to main content

46 posts tagged with "AI Agent"

View All Tags

Claude Design 是什么?

· 8 min read

Claude Design 是 Anthropic 2026 年 4 月推出的 AI 设计工具,社区在 4 天 内逆向出开源替代 Huashu Design,GitHub Star 一个月破 1.7 万

  1. 本质是 skill:一套注入 AI Coding 终端的设计 skill 文件,自然语言描述需求,Agent 自动生成成品,不是 SaaS 产品。
  2. 七大交付能力:交互原型、可编辑 PPTX、60fps 动画、信息图、设计变体、风格顾问、5 维评审。
  3. 品牌资产协议5 步硬流程——问→搜→下载→提取色值→固化 spec,绝不从记忆猜品牌色。
  4. Junior Designer 工作流:先问澄清问题、先出占位符、尽早展示——理解错比晚发现便宜 100 倍。
  5. 反 AI Slop 规则:禁止紫渐变、emoji 图标、Inter 字体、过度圆角,用 oklch 色域和 CSS Grid。
  6. 一句话总结:Claude Design 是更好的图形工具,Huashu Design 让图形工具这层消失。

SSE 和 STDIO 区别?

· 5 min read

SSE 和 STDIO 是 MCP 的两种传输方式,区别不在通信模式,在进程边界——STDIO 面向本地进程,SSE 面向远程服务。

  • STDIO:客户端 fork 子进程,通过 stdin/stdout 收发 JSON-RPC,零网络开销
  • SSE:客户端连远程 HTTP 端点,服务端推送事件,需处理鉴权和网络延迟
  • 选择逻辑:本地工具用 STDIO,远程共享服务用 SSE,场景决定选型
  • 核心差异:STDIO 进程由客户端管理生命周期,SSE 服务端独立部署
  • MCP 演进:原始 HTTP+SSE 已被 Streamable HTTP 替代,不再需要双通道拆分
  • 关键提醒本地工具用 SSE 是自找麻烦,多了端口、CORS、鉴权,收益为零

ClaudeCode launch.json 作用是什么?

· 5 min read

.vscode/launch.json 不是 Claude Code 的配置文件,但它是 Claude Code 获得调试能力的"基础设施"——MCP 调试服务器通过它让 AI 学会打断点、查变量、单步执行。

  1. launch.json 的归属:它是 VS Code 调试器的配置,定义"怎么启动调试器"——用 Node 还是 Python、传什么参数、设什么环境变量。
  2. Claude Code 怎么调试:通过 MCP 服务器(如 Claude Debugs For You)桥接——Claude 发指令 → MCP 翻译 → 调 VS Code Debugger API → 读 launch.json → 启动调试。
  3. Claude Code 自己的"launch config":不在 .vscode/,在 .claude/settings.json(权限和钩子)+ CLAUDE.md(项目指令)+ .mcp.json(工具集成)——它定义的是"AI 怎么跑",不是"程序怎么跑"。
  4. 核心区别:launch.json 回答"程序从哪里启动、参数是什么";Claude Code 配置回答"AI 能改哪些文件、能用什么工具、每一步要遵循什么流程"。
  5. 一句话记住launch.json 是程序的入口,Claude Code 配置是 AI 的入口——两件事别搞混

在处理AI模型的流式输出时,通常使用 SSE 或者WebSocket, 各自优缺点?

· 4 min read

AI 模型的流式输出本质是单向长文本推送,SSE 比 WebSocket 更合适,多数场景不需要双向通道。

  • SSE:基于 HTTP,服务端到客户端单向推送,内置自动重连,零额外握手成本
  • WebSocket:全双工双向通信,需要协议升级,实现复杂、资源开销大
  • 选择逻辑:AI 问答是客户端发一条请求、服务端流式返回文本,单向通道完全够用
  • 双向需求:语音对话、实时协作编辑才需要 WebSocket,纯文本问答不需要
  • 坑 ①:HTTP/1.1 下同一域名最多 6 个 SSE 并发连接,多标签页可能占满
  • 坑 ②:组件卸载时忘记手动关闭 EventSource,连接不会自动释放,导致内存泄漏

CC Switch 是什么?

· 5 min read

AI Coding 工具越来越多,配置文件越来越乱——CC Switch 用一个 GUI把 Claude Code、Codex、Gemini CLI 等工具的 Provider、MCP Server、Skills 全管起来,一键切换,不用再手改 JSON。

  1. What:桌面应用,系统托盘常驻。50+ 内置 Provider 预设,一键盘切换 API 供应商,所有工具的配置自动同步。
  2. Why:Claude Code 一天切三次模型,Codex 用 Kimi,Gemini CLI 用 DeepSeek——三个工具三套配置,手动改早晚改出问题。
  3. How:Tauri 2 + React + Rust。本地 SQLite 存配置,内置代理做请求转发和自动故障转移。配置修改走原子写入,不会写到一半断电变砖。
  4. 隐藏能力:MCP 双向同步——在 CC Switch 加一个 MCP 服务,Claude Code 和 Codex 都能用。Skills 从 GitHub 一键安装,自动检测更新。
  5. 一句话记住你不需要手动改 settings.json 了

Superpowers 是什么?

· 5 min read

AI Coding 的下半场不是 更强的模型,而是更难违反的流程。

  1. Superpowers 是什么:一套 Claude Code 插件,注入 14 个 skill,强制 5 阶段不可绕过流程。
  2. TDD 硬约束:RED-GREEN-REFACTOR 循环被写进 skill 代码,测试必须先失败才能写实现。
  3. 官方收编信号:Anthropic 一月将其纳入官方插件市场——承认纯灵活无法规模化。
  4. 数据说话:任务完成率 62% → 89%,token 消耗增加 37%。
  5. 版本化管理:skill 是文本文件,可 git 提交、code review——团队第一次能把 AI 写代码的规矩版本化。
  6. 动态 vs 静态:相比 .cursorrules 和 CLAUDE.md,skill 按任务状态精确触发,不打扰无关流程。
  7. 一句话记住把规则写进 skill 代码,不是 prompt 里

agent browser 和 playwright-cli 区别?

· 5 min read

agent-browser 和 Playwright CLI 的区别不在"谁更好",而在谁在做决策——是 LLM 自己看着办,还是人写好每一步指令。

  1. agent-browser 目标驱动:给自然语言目标,LLM 自己规划并执行
  2. Playwright CLI 步骤驱动:open → click → fill,每一步都得人写清楚
  3. agent-browser 用 Accessibility Tree + @ref,Token 仅为完整 DOM 的 5%
  4. Playwright CLI 交互结果写磁盘,Agent 按需读,Token 比 MCP 方案省更多
  5. agent-browser 直连 CDP 复用登录会话;Playwright CLI 默认隔离上下文
  6. 容错逻辑相反:agent-browser LLM 语义兜底,Playwright CLI ref 变就挂
  7. 两条路都能走,走反了就是纯烧 Token

playwright mcp 和 chrome devtools mcp 区别?

· 4 min read

Playwright MCP 和 Chrome DevTools MCP 不是竞品——一个负责"开",一个负责"修"。

  1. Playwright 做浏览器自动化(干活),DevTools 做性能诊断(找问题)
  2. Playwright 基于 Accessibility Tree,Token 仅为原始 DOM 的 20-30%
  3. DevTools 基于 CDP,能拿到网络瀑布、Lighthouse、堆快照等完整运行时数据
  4. Playwright 支持全平台浏览器;DevTools 仅 Chromium
  5. DevTools 独有 Trace 自动分析、Lighthouse 审计、V8 堆内存快照
  6. Playwright 独有 Auto-wait、跨浏览器测试、结构化定位

一句话:日常交互用 Playwright,需要性能/网络排查时切 DevTools。

JS 的异步迭代器 AsyncIterable 是什么?

· 5 min read

for await...of 不是 async 版 for...of,而是一套"随时间产生的值流"消费模型。

  1. 普通 for...of 遍历同步数组,迭代立刻拿到值;for await...of 每次迭代要等下一个值,生产者产出与消费者消费完全解耦
  2. 这就是流式响应的底层逻辑:Node Stream、AsyncGenerator、LLM streaming 本质上是同一件事
  3. 实现 Symbol.asyncIterator 协议就能让任意对象变成可异步遍历的流
  4. Async Generator 是最简洁的生产端实现:yield 产出,for await...of 消费
  5. 适用场景:分页 API、Stream、实时事件——凡是数据"不是一次性到齐"的地方

Claude Cowork 是什么?

· 4 min read

Claude Cowork 是 Claude Desktop 桌面 App 里的一个 Tab,本质和 Code Tab 差不多,主要面向非程序员——默认去掉了 GitHub、Preview、Diff、Terminal 等开发功能,换成了 VM 沙箱隔离执行、定时任务、MCP 办公套件集成这类知识工作场景更常用的能力

核心问题很简单:非程序员怎么用 Code Agent?

  1. Cowork 和 Code 共享同一 Agent 引擎,差异只在交互界面,零编程门槛。
  2. 授权文件夹后,Claude 自动规划并执行多步文件操作,破坏性操作需用户二次确认。
  3. macOS AVF 轻量 VM 隔离执行,Agent 循环自动拆解子任务并行处理。
  4. MCP 集成 Google、Office 等数十款工具,支持企业私有插件市场。
  5. Agent 的真正战场不是 IDE,是桌面。Agent 从开发者专属变成全员可用——AI 工具进入企业的关键一步。