视觉就应该是卷积
先说观点,当前所有的科研人员都研究Transformer去了,但是卷积才是视觉的最高效的特征提取(编码)算法。
Revision #1
Created 2026-02-10 14:51:42 UTC by Colin
Updated 2026-02-10 14:53:00 UTC by Colin