视觉就应该是卷积

先说观点，当前所有的科研人员都研究Transformer去了，但是卷积才是视觉的最高效的特征提取（编码）算法。

Revision #1
Created 2026-02-10 14:51:42 UTC by Colin
Updated 2026-02-10 14:53:00 UTC by Colin