Skip to main content

Agentic Engineering 智能体编排

只是一个上下文助手-Agent工程化

我们知道当前不管是Code、Cowork 以及 比较火的OpenClaw 等助手类的Agent,不外乎两个特点

  1. 所有的自洽和逻辑都只能维持在当前的上下文
    1. 上下文可以被动态的追加、压缩、整理、拼接
  2. 外挂一些固定的处理接口:Task、SubAgent、Skills、Mcp等等
    1. 支持额外的记忆
    2. 支持和现有一些软件的控制、执行
    3. MCP 支持现有一些服务的的对接
主要的问题
  1. 上下文局限性,决定了不能进行大范围高深度的思考
    1. 使用有限的上下文处理经过拆分的大范围的知识片段会非常的繁琐
    2. LLM本身存在的抽象深度问题,智商不够
    3. 虽然现在的上下文长度可以达到1M,但是实际的理解深度还是非常欠缺
动态学习能力的欠缺 效率低
  1. LLM需要深度思考
  2. 拆解大任务成很多的小任务
智能体的自动编排

    LLM比喻成一个计算器,那么Agent的目标就是,那么Agent编排的目标就是,使用计算器开发一个编译器

    TodoWrite类语义是LLM一种内置的自动编排技能 能扩展上下文的理解广度和深度

    人性化

    作为一个工具,虽然不是所有的场景需要人性化,比如编译器,秒表。

    但是很多工具的瓶颈就是缺少人性化。比如

    1. 个人助理Agent在比价需要购买的物品过程中遇到的各种非正常情况的不正常处理
    2. 我想去洗车,洗车店距离我家 50 米,我应该开车过去还是走过去?
    3. AI Coding工具,会反复询问执行权限,尽管同一个项目我已经默认同意了很多次,但是还是机械得执行Prompt的准则,这里和完全开放权限不同,需要的是能自动判断我的预期的同意

    要让人类觉得AI很聪明,很听得懂人话,这里面还缺了一个非常重要的就是机器的人性化

    人性化能无缝的捕获人类指令中的一些隐含的意思,有了人性化之后就会显得很容易听懂,很能理解你的感受,

    在处理人类的需求的时候,比如说修改代码,作为人类首先会主动地去了解一下整个工程,而不是像现在的AI一样,直接上手就修改某个文件,这就是人性和自洽

    人性化的可能途径和前提:

    1. 支持意识自我的信息处理,也就是情商,能理解和处理人类的一些抽象的高层级的复杂情感、人文信息
    2. 具有存储和实现意识/自我的实际载体

    Harness

    这套方法不是理论上的概念,而是一种 工程结构(Engineering Structure)
    让 Agent 不再“一口气做完所有事”,而是像一个真正的软件工程师一样:

    • 从一个明确定义的 feature list 开始
    • 初始化项目骨架
    • 每轮做一小步、只做一个 feature
    • 每轮产生可追踪的 artifact 和 commit
    • 保持项目状态的连续性
    • 通过日志、文件结构、状态缓存持续“记住”上下文

    最关键的约束:Agent 永远在“小步快走”,这样才能跨数十轮保持稳定

    • 拥有持久化工作空间(workspace)
    • 拥有 feature list / task list
    • 拥有日志、状态、内存
    • 通过一轮轮 “patch + commit” 前进
    • 由 harness 保证其 可控性、稳定性和可追踪性

    Agent Harness 是包裹在 LLM 外层的一套编排系统。它的核心作用是将不确定的模型行为转化为稳定、高效的生产力。

    • Instructions(指令系统): 包含 System Prompt 和动态规则(Rules)。
    • Tools(工具集): 赋予模型“手脚”,如文件读写、终端执行、搜索能力。
    • User Messages(交互流): 用户的指令以及上下文的维护。