Skip to main content

当代LLM智能体的最佳交互方式

智能体的交互,除了对话还有那些,哪种是未来的方向?

对话

对,现在的LLM除了对话,没有别的形式

  1. Chatgpt
  2. claude code为代表的编程类助手,本质上也是本地的Agent不断得和LLM进行对话,只不过引入了tools,skills,让对话更可控
  3. cowork  openClaw  本质上和人工的交互方式都是在对话

对话是最合理的方式的原因讨论

  1. 智能体的那方便的特性决定的
  2. 人类最喜欢,最方便的方式
    1. 通用来说,除了编程类的助手能看代码,cowork类助手能看屏幕和文件,没有一种高效的给LLM提供信息的方式了

对话的问题

  1. 难以进行复杂的设计想法的输入
    1. 导演需要非常细致的扣画面的细节
    2. 软件架构师,除了写代码,不太能通过语言描述自己的复杂的架构设计
    3. 平面设计,版图设计,需要反复的调整每个细节,甚至是每个像素,数值
  2. 难以输出复杂的信息
    1. 除了文字、生活类的视频和图片

可能的方式

  1. 协助式的交互
    1. AI进行demo的生成,再把不确定的细节,逐个得询问人类
    2. 不断接收更新的要求,甚至是抽象的要求,并迭代结果
  2. 基于GUI的交互
    1. 对关键的细节进行人工调整,或者设定关键的参数、细节
    2. 鼠标和图形的配合,进行细节的调整
  3. 直接创作,AI作为助手在旁边观察,协作
    1. 直接编写代码,文档,注释