Skip to main content

AI的成与不成

  1. 作词,做诗
  2. 各种视频创作,修改,生成
    1. 影视人物的各种修改:关羽弹吉他,刘备拿麦克风
    2. 各种名人虚构照片

不成

  1. 自动驾驶
  2. 人形机器人服务人类

不确定

  1. VLA
    1. 理论上具有可行性,但是端到端的模型对数据量/算力提出了很高的要求
    2. 视觉会提供完整的视觉信息,手指与物体的gap,手臂的行动方向,自然语言输出
    3. 语言作为决策中心,决定下一步的目标
    4. 执行器翻译语言到运动控制

根本原因

  1. 准确率:99 和 90 的区别
  2. 任务的抽象等级和样本数量的对比