Skip to main content
架构/微架构
设计
- 标量寄存器和向量寄存器统一,支持自动进行转换
- 异步单元(SP-PU-L1-DMA)之间都采用异步机制,依赖转移到异步目标
- 统一的同步机制
- 静态分配同步资源
- 原生软硬件支持动态图的执行
- LD/ST 避免使用fence功能
- Launch:fork
- 资源初始化(同步资源,各种存储器,状态)
- launch/signal/wait:join
- launch pu instrution: write_back_id local_id
- write_back atomic add/sub
- wait instruction: local_id
- local_id GE LE counter
- wait remote instruction: remote_id
- local_id GE LE counter
MAC
- Vector计算单元支持乱序和并行
- 明确的寄存器依赖,RO WO属性
- 自动拆解JOIN指令成Vector指令,并行执行
- 软件静态排布VR寄存器,生成依赖关系,申请和释放管理
ISA
- 标量
- RV64i
- 向量
- VLD VST VMUL VADD REDUCE_ADD REDUCE_MAX REDUCE_MIN VMUL_REDUCE_ADD
- 张量
- JOIN
- fence
- L1 cache line 计数
- VR
- 软件管理vr data hazard
- L1
- 软件管理 cache line
- cache line硬件计数,自动异步等待
- 增加到128个标量寄存器 支持RV64扩展?
- 增加指令流控制
- 增加配合/加速向量单元的定制指令? 通过兼容RiscV-V的指令来实现??