附件为:《清华大学OpenClaw发展研究报告》和《OpenClaw智能助手白皮书》
从技术本质上看,OpenClaw 并不是新的大模型,而是一种围绕大模型构建的 AI Agent 执行平台。它通过通信入口、任务规划、工具调用与执行引擎,将自然语言指令转化为可执行任务流程,使 AI 能够真正参与实际工作。从系统架构角度看,OpenClaw 属于 Agent Runtime(智能体运行环境),其核心作用是让大模型从“回答问题”走向“执行任务”。
要理解 OpenClaw 的价值,需要先看到 AI 应用形态正在发生的一次变化。过去几年,大模型的主要应用形式是对话系统。用户提出问题,AI 给出回答,这种模式在知识问答、写作辅助和代码生成等场景中已经取得了广泛应用。但这种模式仍然存在明显限制:AI 可以给出建议,却无法真正完成任务。例如,当用户希望系统整理邮件或分析数据时,传统 AI 只能提供操作方法,而无法直接访问系统执行操作。
AI Agent 的出现正是为了解决这一问题。Agent 系统通过整合外部工具,使 AI 可以执行真实操作,例如访问 API、读取文件、运行脚本或调用业务系统。OpenClaw 正是这样一种系统框架,它将大模型的推理能力与工具系统结合,使自然语言指令能够转化为可执行任务流程。
一、AI Agent 技术体系中的位置
在理解 OpenClaw 之前,需要先从整体技术体系上看 AI Agent 的架构位置。AI Agent 并不是单一技术,而是一种由多层技术组合形成的系统。
在这一体系中,最底层是 大模型层。模型提供语言理解与推理能力,例如 GPT、Claude 或 DeepSeek 等。模型的优势在于推理与生成,但它本身并不能直接操作系统。
模型之上是 工具与系统层,包括 API、数据库、文件系统以及各种 SaaS 应用。这一层代表现实世界中的数字系统。
再向上是 Agent 运行层。这一层负责管理任务执行过程,包括任务规划、状态管理和工具调用。OpenClaw 正处于这一层。
在运行层之上,是 Agent 开发框架层,例如 LangChain 或 CrewAI。它们主要用于构建 Agent 应用。
最上层则是 应用层,也就是用户直接使用的 AI 助手或自动化 Agent。
从这一视角来看,OpenClaw 的角色并不是替代大模型,而是为大模型提供执行环境。
二、OpenClaw 的系统架构
在工程实现上,OpenClaw 可以理解为一个由多个模块组成的任务执行平台。
系统的入口通常是聊天平台。用户通过 Slack、飞书或 Telegram 等渠道发送指令,系统接收请求后进入处理流程。
消息首先进入 Gateway 模块。Gateway 可以理解为系统的调度中心,它负责消息接入、会话管理以及权限控制,并将请求路由到对应的 Agent 实例。
真正执行任务的是 Agent Runtime。Runtime 负责根据用户目标进行推理和任务规划,并决定是否调用工具。
工具系统为 Agent 提供执行能力。例如读取文件、调用 API 或运行脚本。开发者可以通过插件机制扩展工具类型,使系统能够处理更多任务。
大模型则提供推理能力。Runtime 在执行过程中不断调用模型进行决策,例如判断下一步需要调用哪个工具。
三、Agent 的执行机制
与传统程序不同,Agent 系统并不是一次性执行完成,而是通过循环式决策逐步完成任务。
这一循环通常被称为 ReAct 模式(Reason–Act–Observe)。当用户提出任务目标时,系统首先进行推理,判断需要执行哪些步骤。随后 Agent 调用相应工具执行操作,例如搜索信息或读取文件。工具执行完成后返回结果,系统再根据新的信息进行下一步决策。
通过不断重复“推理—行动—观察”的循环,系统能够逐步完成复杂任务,例如数据分析、报告生成或跨系统操作。
四、软件形态的变化
从更宏观的角度看,OpenClaw 所代表的不仅是一种工具,而是一种新的软件形态。
传统软件依赖图形界面和固定操作流程。用户需要学习系统功能,通过点击界面逐步完成任务。
Agent 系统则采用目标驱动模式。用户只需要描述目标,系统负责规划并执行任务。复杂的跨系统操作被压缩为一句自然语言指令。
这种变化意味着软件形态可能正在发生一次重要转变。未来的软件不一定以应用程序的形式存在,而可能是一组能够协同工作的 Agent 服务。用户只需要表达需求,系统就会自动协调各种工具完成任务。
在这一趋势下,像 OpenClaw 这样的 Agent 运行平台,将逐渐成为 AI 应用的重要基础设施。
五、OpenClaw发展研究报告2篇
《清华大学OpenClaw发展研究报告》和《OpenClaw智能助手白皮书》






EA之家 » 读懂OpenClaw小龙虾:从OpenClaw看AI Agent