Linux sed 命令是做什么用的?
sed 是 Linux / macOS 终端下最常用的 流式文本批量处理工具,不用打开文件就能完成全局修改。
- 核心功能:逐行扫描文本,执行查找、替换、删除、插入等操作
- 典型场景:批量修改代码/配置文件、日志过滤、文本格式转换
- 语法模板:
sed -i 's|原字符串|新字符串|g' 文件名,全程无交互 - Mac 注意:必须加空参数
'',否则直接报错
sed 是 Linux / macOS 终端下最常用的 流式文本批量处理工具,不用打开文件就能完成全局修改。
sed -i 's|原字符串|新字符串|g' 文件名,全程无交互'',否则直接报错Agent 死循环不是极端情况,是给模型自由度必须付的代价。
ReAct 是默认范式但不是唯一解——选错工作模式比选错模型更致命。
最佳实践:确定性任务→Plan-Execute,开放探索→ReAct,质量敏感→加 Reflection,规模大→Multi-Agent。
ReAct 不是"推理"和"行动"的简单拼接,是把两者编织成一条交替推进的链路:每一步推理都有观测反馈,每一步行动都有推理支撑。
OpenClaw 自己没有"防锁屏"功能——让远程电脑一直在线不被系统休眠干掉,靠的是 操作系统层面 的电源管理配置 。
sudo pmset -a sleep 0 全局禁休 + caffeinate -s 进程级防睡 + LaunchDaemon 系统级自启,三层叠加 才能保证锁屏后服务不掉。systemctl mask sleep.target suspend.target 从 systemd 层面禁掉休眠路径,配合 logind.conf 忽略合盖/电源键事件,GNOME 只关屏不睡眠。pmset -g | grep sleep 全显示 0,才算配置成功。第一性原理是把默认前提拆到不可再分,然后从那个起点重新推导,中间不借用现成答案。
强化学习强在哪?一句话:它不需要正确答案,只需要对错信号。
监督学习从标注数据里找规律,强化学习从环境奖惩里学策略。两者的区别不是"强弱",而是解决问题的类型完全不同——SL 学映射,RL 学决策。
最容易被误解的一点:强化学习的目标不是每次选最优动作,而是最大化长期累积回报。只看眼前奖励的 RL 跟贪心算法没区别,价值函数才是它的灵魂。
Actor-Critic 架构让模型同时扮演"演员"和"评论家"两个角色——一个负责决策,一个负责评判,互相对抗、一起进化,AlphaGo 的底层思路也源于此。
最关键的应用:PPO 算法驱动了 RLHF,让大模型通过人类反馈学会"察言观色"。训练数据见顶的背景下,RL 是提升模型推理能力的核心引擎。
多模态模型的真正瓶颈不是 "看不清",而是 "指不准"。
Reference Gap(指代断裂):模型看到了目标对象,但在推理链中无法稳定引用"到底是哪一个"。"左边那个""他旁边的"这类自然语言描述在视觉空间里不是精确地址——场景越复杂、相似物体越多,语言变量就越容易在几步推理后漂移到另一个实体上。
解法:把边界框和坐标点变成推理链的中间变量。 每写下一个框 = 在草稿纸上钉一颗钉子,后续推理围绕这些坐标展开,不再依赖模糊的自然语言指代。论文将框和点定义为"视觉原语(Visual Primitive)"——本质上就是把人类"用手指点着数"的动作形式化到了 token 序列里。
工程压缩比 7056×:2916 patch tokens → 3×3 空间压缩 → 324 → CSA 注意力缓存压缩 → 81。语言模型 DeepSeek V4 Flash(284B/13B MoE)+ 从头训练 DeepSeek ViT,视觉 token 限制在 81–384,不靠无限堆 token。
数据说话:~90 个视觉缓存条目跑出 77.2 分,Gemini 3 Flash 用 1100 个拿 76.5 分 。视觉 token 不是越多越好,关键是模型有没有办法把"这个对象"稳定地绑定到图像坐标上。
MECE 是麦肯锡 顶级 结构化思维准则。
关键价值:拆解后能快速定位问题本质,避免思维混乱。
JS 并发面试,三 道题筛掉九成候选人。
await 在 for 循环里是 串行,10 个请求 10 秒,不是 1 秒forEach 里写 await 完全无效,外层根本不会等Promise.all 一个 reject 全盘崩,要容错必须用 Promise.allSettled正解:并发用 Promise.all(arr.map(fn)),需要限流用 p-limit,要容错换 allSettled。
关键提醒:await 只暂停当前 async 函数,不会暂停外层调用者,更不会暂停 forEach 的迭代。