Recently Updated Pages
改进大规模训练稀疏自编码器的方法
算法&模型
Transformer
Updated 1 year ago by Colin
Ref :https://mp.weixin.qq.com/s/iZHPnnIncVFa8QJOuH8qFg 神经网络中的激活通常表现出不可预测和复杂的模式,且每次输入几乎总会引发很密集的激活...
Transformer in CV
算法&模型
Transformer
Updated 1 year ago by Colin
MEGALODON https://arxiv.org/pdf/2404.08801.pdf Vision Mamba https://github.com/hustvl/Vim/ ...
query@key
算法&模型
Updated 1 year ago by Colin
KV Cache
算法&模型
Transformer
Updated 1 year ago by Colin
https://zhuanlan.zhihu.com/p/662498827
Attention是不是必须的
算法&模型
Transformer
Updated 1 year ago by Colin
RNN容易梯度消失:梯度消失的本质问题是,网络太深了,这里的深代表信息表达的层级而不是拓扑,resnet就是解决这个问题 Transformer 的强大之处同时也是它的弱点:Transform...