46 posts tagged with "AI Agent"

View All Tags

Claude Design 是什么？

June 10, 2026 · 8 min read

Claude Design 是 Anthropic 2026 年 4 月推出的 AI 设计工具，社区在 4 天内逆向出开源替代 Huashu Design，GitHub Star 一个月破 1.7 万。

本质是 skill：一套注入 AI Coding 终端的设计 skill 文件，自然语言描述需求，Agent 自动生成成品，不是 SaaS 产品。
七大交付能力：交互原型、可编辑 PPTX、60fps 动画、信息图、设计变体、风格顾问、5 维评审。
品牌资产协议：5 步硬流程——问→搜→下载→提取色值→固化 spec，绝不从记忆猜品牌色。
Junior Designer 工作流：先问澄清问题、先出占位符、尽早展示——理解错比晚发现便宜 100 倍。
反 AI Slop 规则：禁止紫渐变、emoji 图标、Inter 字体、过度圆角，用 oklch 色域和 CSS Grid。
一句话总结：Claude Design 是更好的图形工具，Huashu Design 让图形工具这层消失。

SSE 和 STDIO 区别？

June 8, 2026 · 5 min read

SSE 和 STDIO 是 MCP 的两种传输方式，区别不在通信模式，在进程边界——STDIO 面向本地进程，SSE 面向远程服务。

STDIO：客户端 fork 子进程，通过 stdin/stdout 收发 JSON-RPC，零网络开销
SSE：客户端连远程 HTTP 端点，服务端推送事件，需处理鉴权和网络延迟
选择逻辑：本地工具用 STDIO，远程共享服务用 SSE，场景决定选型
核心差异：STDIO 进程由客户端管理生命周期，SSE 服务端独立部署
MCP 演进：原始 HTTP+SSE 已被 Streamable HTTP 替代，不再需要双通道拆分
关键提醒：本地工具用 SSE 是自找麻烦，多了端口、CORS、鉴权，收益为零

ClaudeCode launch.json 作用是什么？

June 7, 2026 · 5 min read

.vscode/launch.json 不是 Claude Code 的配置文件，但它是 Claude Code 获得调试能力的"基础设施"——MCP 调试服务器通过它让 AI 学会打断点、查变量、单步执行。

launch.json 的归属：它是 VS Code 调试器的配置，定义"怎么启动调试器"——用 Node 还是 Python、传什么参数、设什么环境变量。
Claude Code 怎么调试：通过 MCP 服务器（如 Claude Debugs For You）桥接——Claude 发指令 → MCP 翻译 → 调 VS Code Debugger API → 读 launch.json → 启动调试。
Claude Code 自己的"launch config"：不在 .vscode/，在 .claude/settings.json（权限和钩子）+ CLAUDE.md（项目指令）+ .mcp.json（工具集成）——它定义的是"AI 怎么跑"，不是"程序怎么跑"。
核心区别：launch.json 回答"程序从哪里启动、参数是什么"；Claude Code 配置回答"AI 能改哪些文件、能用什么工具、每一步要遵循什么流程"。
一句话记住：launch.json 是程序的入口，Claude Code 配置是 AI 的入口——两件事别搞混。

在处理AI模型的流式输出时，通常使用 SSE 或者WebSocket，各自优缺点？

June 7, 2026 · 4 min read

AI 模型的流式输出本质是单向长文本推送，SSE 比 WebSocket 更合适，多数场景不需要双向通道。

SSE：基于 HTTP，服务端到客户端单向推送，内置自动重连，零额外握手成本
WebSocket：全双工双向通信，需要协议升级，实现复杂、资源开销大
选择逻辑：AI 问答是客户端发一条请求、服务端流式返回文本，单向通道完全够用
双向需求：语音对话、实时协作编辑才需要 WebSocket，纯文本问答不需要
坑 ①：HTTP/1.1 下同一域名最多 6 个 SSE 并发连接，多标签页可能占满
坑 ②：组件卸载时忘记手动关闭 EventSource，连接不会自动释放，导致内存泄漏

CC Switch 是什么？

June 5, 2026 · 5 min read

AI Coding 工具越来越多，配置文件越来越乱——CC Switch 用一个 GUI把 Claude Code、Codex、Gemini CLI 等工具的 Provider、MCP Server、Skills 全管起来，一键切换，不用再手改 JSON。

What：桌面应用，系统托盘常驻。50+ 内置 Provider 预设，一键盘切换 API 供应商，所有工具的配置自动同步。
Why：Claude Code 一天切三次模型，Codex 用 Kimi，Gemini CLI 用 DeepSeek——三个工具三套配置，手动改早晚改出问题。
How：Tauri 2 + React + Rust。本地 SQLite 存配置，内置代理做请求转发和自动故障转移。配置修改走原子写入，不会写到一半断电变砖。
隐藏能力：MCP 双向同步——在 CC Switch 加一个 MCP 服务，Claude Code 和 Codex 都能用。Skills 从 GitHub 一键安装，自动检测更新。
一句话记住：你不需要手动改 settings.json 了。

Superpowers 是什么？

June 5, 2026 · 5 min read

AI Coding 的下半场不是更强的模型，而是更难违反的流程。

Superpowers 是什么：一套 Claude Code 插件，注入 14 个 skill，强制 5 阶段不可绕过流程。
TDD 硬约束：RED-GREEN-REFACTOR 循环被写进 skill 代码，测试必须先失败才能写实现。
官方收编信号：Anthropic 一月将其纳入官方插件市场——承认纯灵活无法规模化。
数据说话：任务完成率 62% → 89%，token 消耗增加 37%。
版本化管理：skill 是文本文件，可 git 提交、code review——团队第一次能把 AI 写代码的规矩版本化。
动态 vs 静态：相比 .cursorrules 和 CLAUDE.md，skill 按任务状态精确触发，不打扰无关流程。
一句话记住：把规则写进 skill 代码，不是 prompt 里。

agent browser 和 playwright-cli 区别？

June 5, 2026 · 5 min read

agent-browser 和 Playwright CLI 的区别不在"谁更好"，而在谁在做决策——是 LLM 自己看着办，还是人写好每一步指令。

agent-browser 目标驱动：给自然语言目标，LLM 自己规划并执行
Playwright CLI 步骤驱动：open → click → fill，每一步都得人写清楚
agent-browser 用 Accessibility Tree + @ref，Token 仅为完整 DOM 的 5%
Playwright CLI 交互结果写磁盘，Agent 按需读，Token 比 MCP 方案省更多
agent-browser 直连 CDP 复用登录会话；Playwright CLI 默认隔离上下文
容错逻辑相反：agent-browser LLM 语义兜底，Playwright CLI ref 变就挂
两条路都能走，走反了就是纯烧 Token

playwright mcp 和 chrome devtools mcp 区别？

June 5, 2026 · 4 min read

Playwright MCP 和 Chrome DevTools MCP 不是竞品——一个负责"开"，一个负责"修"。

Playwright 做浏览器自动化（干活），DevTools 做性能诊断（找问题）
Playwright 基于 Accessibility Tree，Token 仅为原始 DOM 的 20-30%
DevTools 基于 CDP，能拿到网络瀑布、Lighthouse、堆快照等完整运行时数据
Playwright 支持全平台浏览器；DevTools 仅 Chromium
DevTools 独有 Trace 自动分析、Lighthouse 审计、V8 堆内存快照
Playwright 独有 Auto-wait、跨浏览器测试、结构化定位

一句话：日常交互用 Playwright，需要性能/网络排查时切 DevTools。

JS 的异步迭代器 AsyncIterable 是什么？

June 5, 2026 · 5 min read

for await...of 不是 async 版 for...of，而是一套"随时间产生的值流"消费模型。

普通 for...of 遍历同步数组，迭代立刻拿到值；for await...of 每次迭代要等下一个值，生产者产出与消费者消费完全解耦
这就是流式响应的底层逻辑：Node Stream、AsyncGenerator、LLM streaming 本质上是同一件事
实现 Symbol.asyncIterator 协议就能让任意对象变成可异步遍历的流
Async Generator 是最简洁的生产端实现：yield 产出，for await...of 消费
适用场景：分页 API、Stream、实时事件——凡是数据"不是一次性到齐"的地方

Claude Cowork 是什么？

June 4, 2026 · 4 min read

Claude Cowork 是 Claude Desktop 桌面 App 里的一个 Tab，本质和 Code Tab 差不多，主要面向非程序员——默认去掉了 GitHub、Preview、Diff、Terminal 等开发功能，换成了 VM 沙箱隔离执行、定时任务、MCP 办公套件集成这类知识工作场景更常用的能力。

核心问题很简单：非程序员怎么用 Code Agent？

Cowork 和 Code 共享同一 Agent 引擎，差异只在交互界面，零编程门槛。
授权文件夹后，Claude 自动规划并执行多步文件操作，破坏性操作需用户二次确认。
macOS AVF 轻量 VM 隔离执行，Agent 循环自动拆解子任务并行处理。
MCP 集成 Google、Office 等数十款工具，支持企业私有插件市场。
Agent 的真正战场不是 IDE，是桌面。Agent 从开发者专属变成全员可用——AI 工具进入企业的关键一步。