当代LLM智能体的最佳交互方式
智能体的交互,除了对话还有那些,哪种是未来的方向?
对话
对,现在的LLM除了对话,没有别的形式
- Chatgpt
- claude code为代表的编程类助手,本质上也是本地的Agent不断得和LLM进行对话,只不过引入了tools,skills,让对话更可控
- cowork openClaw 本质上和人工的交互方式都是在对话
对话是最合理的方式的原因讨论
- 智能体的那方便的特性决定的
- 人类最喜欢,最方便的方式
- 通用来说,除了编程类的助手能看代码,cowork类助手能看屏幕和文件,没有一种高效的给LLM提供信息的方式了
对话的问题
- 难以进行复杂的设计想法的输入
- 导演需要非常细致的扣画面的细节
- 软件架构师,除了写代码,不太能通过语言描述自己的复杂的架构设计
- 平面设计,版图设计,需要反复的调整每个细节,甚至是每个像素,数值
- 难以输出复杂的信息
- 除了文字、生活类的视频和图片
可能的方式
- 协助式的交互
- AI进行demo的生成,再把不确定的细节,逐个得询问人类
- 不断接收更新的要求,甚至是抽象的要求,并迭代结果
- 基于GUI的交互
- 对关键的细节进行人工调整,或者设定关键的参数、细节
- 鼠标和图形的配合,进行细节的调整
No comments to display
No comments to display