# AI的边界

#### 成

1. 作词，做诗
2. 各种视频创作，修改，生成

   1. 影视人物的各种修改：关羽弹吉他，刘备拿麦克风
   2. 各种名人虚构照片

#### 不成

1. 自动驾驶
2. 人形机器人服务人类

#### 不确定

1. VLA

   1. 理论上具有可行性，但是端到端的模型对数据量/算力提出了很高的要求
   2. 视觉会提供完整的视觉信息，手指与物体的gap，手臂的行动方向，自然语言输出
   3. 语言作为决策中心，决定下一步的目标
   4. 执行器翻译语言到运动控制
2. <br />

#### 根本原因

1. 准确率：99 和 90 的区别
2. 任务的抽象等级和样本数量的对比

<br />

# LLM涂鸦

```
无提示   |               |   输出 |AAABBBCCCDDDEEE|
提示     |   |   |   |   |   输出 |AAA|AAA|AAA|AAA|
提示     |       |       |   输出 |AAABBBC|AAABBBC|
提示     |     |             输出 |ABCDE|
```

LLM不具有真正的创新，只是在内嵌的空间和要求之间取一个最优的中点，但这不代表说LLM没有智能。只是需要更复杂一点的状态表示和计算过程。