Blog | Kimi Gao

Skip to main content

大量用 AI 之后，为什么反而更累？

July 23, 2026 · 4 min read

三个原因：

信息爆炸：AI 一次吐出的内容远超人能消化的密度，配图塞满模块，看完记不住结论。
宏观对、微观不对：大方向常对得上，细节总差，要反复打磨 prompt。结合上条放大了消耗。
承担更多：AI 让原本不归你干的事也变成了你干的事，加上行业卷效率，总量更大。

三个缓解动作：

加密度上限：配图任务要求"一张图最多 3 个元素"，超出就拆。
前置成功标准：每个 AI 任务先写一句"我需要什么具体结果"，再开工。
明确责任边界：AI 干哪些、你干哪些，不因为 AI 能干就揽过来。

claude-video-skill 让 Agent 真正看懂视频画面

July 23, 2026 · 5 min read

Agent 拿到视频链接只能读字幕，看不到按钮怎么点、报错在哪秒出现。

核心问题：字幕里没有 UI、按钮点击时机、报错瞬间
解决方案：yt-dlp 拉字幕 + FFmpeg 抽帧，按时间点对齐
三档抽帧：快 50 帧 / 默认 100 帧（按镜头）/ 不限
抽帧硬限制：2 fps，>10 分钟视频短促变化会被跳过
时间戳定位：指定「2 分钟附近」重抽帧，画面更完整
集成方式：ClaudeCode 走插件市场，其余装成 agent skill
无字幕兜底：Groq / OpenAI Whisper（要 key）或本地 FunASR SenseVoice（免费离线）
当前版本：0.2.0，仅读不写不剪

AI 时代，开发者要完成的三个转变是什么？

July 23, 2026 · 6 min read

开发者能力的"退化"不是真退化，是工具栈迁移。

能力转移：从骑马到开车，AI 让"手写"变成"调度"
第一个转变：AI 团队的 leader，懂每个领域的基础判断
第二个转变：架构师 + 舵手，给 AI 明确方向让船走对路
第三个转变：写代码被替代后，省下的脑力必须投入产品本身
职业范围扩张：从个人到团队，到综合性团队，最后到一个人的公司
结论：AI 时代不会让开发者消失，只会让"开发者"的定义变宽

Event-driven 才是 Agent 性能瓶颈的解药吗？什么时候反而该用传统 Loop？

July 22, 2026 · 8 min read

Agent 跑得慢，90% 的情况锅不在模型，在架构。架构选错，模型再强也是给一个漏水的桶灌水。

性能瓶颈在哪：不是 token 慢，是 agent 闲着没事干还在转圈
两种范式：Pull 模式（Loop 主动要任务）vs Push 模式（Event 主动叫 agent）
传统 Loop 不是死循环：真正的 ReAct / Plan-Execute 是有终止的思考-行动-观察链
Event-driven 核心不是 push：是控制反转——agent 不用关心"什么时候该醒"
适用边界：Loop 适合推理密集，Event-driven 适合 I/O 密集 + 异步多源
反直觉：用错 Event-driven 反而更慢，因为它把"思考"也异步化了
实战选择：高并发客服用 Event-driven，长链科研推理用 Loop

什么时候干什么活，比怎么干活更决定成本——这是架构选择的第一性原理。

Agent 把错误信息写进记忆后怎么办？

July 22, 2026 · 6 min read

记忆污染不是"清缓存重启"能收场的 bug，而是一次系统级的故障状态恢复。

本质区别：缓存异常是死数据、抛错即停；记忆污染是 agent 带着错误记忆继续自主决策，且自己不知道错了。
攻击面：间接 prompt injection 把恶意指令藏进网页 / 文档，被 agent 写进长期记忆后静默持续执行。
事前三道防线：索引与内容分离、容量约束 + 快照漂移防护、写入前准入扫描。
事后三步走：全链路溯源 → 原子化回滚与补偿 → 认知重塑。
两条红线：不设计无限记忆空间、不剥夺用户对记忆的回滚控制权。

Agent 如何加载海量 Skill？

July 22, 2026 · 4 min read

海量 Skill 不能全量塞进 prompt，核心是渐进式披露（progressive disclosure）按需加载。

为什么淘汰全量：token 是模型的注意力预算，工具目录涨到 200 个左右，工具选择准确率从 95% 断崖跌到 41%。
三层渐进式披露：L1 元数据索引 → L2 意图注入 schema → L3 触发 RAG 翻文档，token 开销砍掉 90% 以上。
冷启动延迟：前端轻量路由分流 + 高频工具常驻 KV cache，响应时间缩短 30% 以上。
状态断联：任务快照浓缩执行进度，切技能时注入，新技能原地复活。
反过度设计：二三十个技能别上三层，前置语义过滤 + 精简 prompt 更稳。

Agent 工程师面试，三轮分别考什么？

July 21, 2026 · 8 min read

面试官三轮的真实考察点，不是会调 API。

一面（项目深挖，70 分钟）：从短期记忆到长期记忆、从成本控制到模型选型，全程追问项目细节，无八股文
二面（系统设计）：从 0~1 搭一套商用 Agent 系统，边画架构图边追问落地细节
三面（认知面/定级面）：聊赛道判断、个人差异化、1-2 年内行业瓶颈预测
面试官要的不是会调框架的人：要的是做稳定、做可控、上线不出事的人
新人别只写 demo：先把 token 机制、注意力机制这些底层搞清，再做有工程细节的完整项目

为什么 Pi 突然火了？Agent 竞争从功能清单走向 harness

July 21, 2026 · 5 min read

Pi 突然火，真正的看点不是"它是不是又一个 Coding Agent"，而是 Agent 竞争的评判标准正在换轨：从比功能清单，变成比 harness。

功能清单时代：比谁的 sub-agent、plan mode、memory、MCP 更全
Pi 的反常克制：核心只留 read / write / edit / bash，能力全部外置
卖点变了：不是"我帮你做好了一切"，而是"给你一块可改装的底盘"
三条路线：Pi 是可塑底座，OpenClaw 是常驻入口，HermesAgent 是学习循环
新的评判维度：能不能改造、工具怎么接、权限怎么管、上下文怎么压缩

Prompt 像说明书，harness 才是方向盘和刹车——这才是 Pi 这波火起来的底层原因。

Pi Agent 怎么用？同模型 Token 实测 51% 的极简 Harness 实操

July 21, 2026 · 6 min read

换更简单的 Harness，能把 Token 砍掉一半。Pi Agent 是这条线上的典型代表。

同模型实测：Pi 平均 2.82M token，是 Claude Code 5.52M 的 51%。
耗时：Pi 8.75 分钟 vs Claude Code 11 分钟，差距有限。
极简默认：4 工具（read/write/edit/bash），系统提示词 < 1000 token。
双层扩展：Skill 是说明书；Extension 改写 Agent 自身运行方式。
自改造：Pi 自己读扩展文档、自己写代码改 Extension。
Sub-agent：靠 Extension 实现，按角色配不同厂商模型和思考强度。
SDK 嵌入：把 Pi 核心能力移出终端，作为应用里的 Agent 引擎。

开箱即用选 Claude Code / Codex；想改造 Agent 或嵌进自己的应用，选 Pi。

ClaudeCode 怎么让 AI 自动跑完全流程？

July 20, 2026 · 7 min read

ClaudeCode 进阶命令 6 件套,把"人在回路内"升级成"人在回路外"。

痛点：Vibe Coding 卡在"敲回车",AI 走一步你推一步
核心枢纽 /goal：把"下一步"换成"终点",AI 自判自跑
/loop + /batch：派 AI 等长任务、拆 sub-agent 并行处理
/simplify：commit 前的最后一道美容,改风格、不做 bug 检查
/doctor + /debug：AI 给自己看病,前者查环境、后者查行为
真价值：把人类角色从操作员升级为产品经理

发文趋势

近 12 个月 · 共 116 篇

近 1 个月分类榜