AI的边界
成
-
作词,做诗
-
各种视频创作,修改,生成
- 影视人物的各种修改:关羽弹吉他,刘备拿麦克风
- 各种名人虚构照片
不成
- 自动驾驶
- 人形机器人服务人类
不确定
-
VLA
- 理论上具有可行性,但是端到端的模型对数据量/算力提出了很高的要求
- 视觉会提供完整的视觉信息,手指与物体的gap,手臂的行动方向,自然语言输出
- 语言作为决策中心,决定下一步的目标
- 执行器翻译语言到运动控制
-
根本原因
- 准确率:99 和 90 的区别
- 任务的抽象等级和样本数量的对比
AI 涂鸦
无提示 | | 输出 |AAABBBCCCDDDEEE|
提示 | | | | | 输出 |AAA|AAA|AAA|AAA|
提示 | | | 输出 |AAABBBC|AAABBBC|
提示 | | 输出 |ABCDE|
LLM不具有真正的创新,只是在内嵌的空间和要求之间取一个最优的中点,但这不代表说LLM没有智能。只是需要更复杂一点的状态表示和计算过程。