如果 Agent 陷入了死循环怎么办？

May 31, 2026 · 4 min read

Agent 死循环不是极端情况，是给模型自由度必须付的代价。

Agent 为什么会死循环

ReAct 循环的代价是模型在"想"和"做"之间可以无限切——它每轮都在评估"还能不能再调个工具多搞点信息"，而不是"够不够了"。模型没有内置的"停"。

实际跑下来，死循环分三种：

三种里最致命的是第一种——短、快、密集，几秒内烧掉大量 token。摇摆型至少还在换工具，重试型是纯浪费。

只加 max_steps 我踩过坑：模型在 step 49 返回了一句"抱歉我还在分析中"——用户体验比直接报错还差。单靠一层防御总有盲区。

MAX_STEPS = 20
for step in range(MAX_STEPS):
    response = agent.step()
    if response.is_final:
        return response.content
return "任务超时，已终止"

max_steps 是保险丝，不是终止策略。它的作用是防止无限烧 token，但不保证截止时任务已完成。

设多少？代码生成 30-50 步，信息检索 10-15 步。通用原则：宁可在生产环境让 Agent 提前终止，也不要让它无限烧 token。

在 system prompt 中加一个 Finish Action：

当你确认任务已完成或已收集足够信息时，
调用 finish 工具并给出最终答案。不要继续调用其他工具。

关键点：Finish 必须是显式的工具调用，不是让模型自己决定"下面我开始回答"。Thought 没有约束力——模型可以在 Thought 中说"我觉得够了"然后继续调下一个工具。

两种方式我对比过：

区别在于：前者是"建议"，后者是"接口契约"。模型对 API 契约的遵守远比自然语言指令严格。

这是性价比最高的优化——system prompt 里加一条：

如果同一个工具调用连续失败两次，必须换一个方法。
不要用相同的参数重试失败的调用。

模型默认行为是"再试一次"，很多场景重试确实有效——网络抖动、工具偶发异常。但它区分不了"暂时失败"和"用错参数"——后者重试一万次也没用。

主动避障 + max_steps 配合，死循环率能压到很低的水平。

Agent 侧的约束不够，工程侧也得有防线——说白了，不该完全信任一个 LLM 驱动的循环能自己收敛。

这三个是"不相信 Agent 的防御"。工程上把 trust-but-verify 反过来：verify first, trust later。

死循环不是 bug，是交互式架构的必然产物。你把决策权交给模型，就得同时给它边界——max_steps 是墙，Finish Action 是门，retry 规则是导航。三层缺一层都能跑，但总会在某个场景下翻车。

具体数字取决于你的任务，但一条原则不变：宁可让 Agent 提前终止并告知用户，也不要让它默默烧 token。