Skip to main content

并行Reduce的并行加速

CUDA

1. 采用Divergence的支持和Block同步来支持

image.pngimage.png

DSA/ASIC