# AI加速芯片架构的动态性支持讨论

### 动态性的级别划分

1. 数据内容不同动态
2. 算子数据的尺寸动态
    1. 大部分非GPGPU的DSA架构都支持得不好，有各种问题
    2. 同步开销大，同步资源管理难，存储资源浪费，程序代码大 等问题
3. 不同的数据地址的程序代码动态
4. 通过条件执行、跳转执行支持的程序动态
    1. GPGPU类支持
5. 自动生成、调用不用的单元的代码动态
    1. 很少在加速卡上实现，大部分是CPU可以实现

### 不同架构对动态性支持的区别

1. SIMT类型的GPGPU
2. 华为和寒武纪类的DSA
3. NPU推理DSA
4. 类似燧原的SPMT