Skip to main content

当代LLM智能体的最佳交互方式

智能体的交互,除了对话还有那些,哪种是未来的方向?

对话

对,现在的LLM除了对话,没有别的形式

  1. Chatgpt
  2. claude code为代表的编程类助手,本质上也是本地的Agent不断得和LLM进行对话,只不过引入了tools,skills,让对话更可控
  3. cowork  openClaw  本质上和人工的交互方式都是在对话

对话是最合理的方式的原因讨论

  1. 智能体的那方便的特性决定的
  2. 人类最喜欢,最方便的方式
    1. 通用来说,除了编程类的助手能看代码,cowork类助手能看屏幕和文件,没有一种高效的给LLM提供信息的方式了

对话的问题

  1. 难以进行复杂的设计想法的输入
    1. 导演需要非常细致的扣画面的细节
    2. 软件架构师,除了写代码,不太能通过语言描述自己的复杂的架构设计
    3. 平面设计,版图设计,需要反复的调整每个细节,甚至是每个像素,数值
  2. 难以输出复杂的信息
    1. 除了文字、生活类的视频和图片

可能的方式

  1. 协助式的交互
    1. AI进行demo的生成,再把不确定的细节,逐个得询问人类
    2. 不断接收更新的要求,甚至是抽象的要求,并迭代结果
  2. 基于GUI的交互
    1. 对关键的细节进行人工调整,或者设定关键的参数、细节
    2. 鼠标和图形的配合,进行细节的调整