QuadTree阅读笔记 2024-1-17 20:22 | 365 | 0 | Vision Transformer,多姿多彩的Transformer 2088 字 | 9 分钟 QuadTree阅读笔记 Q1 论文试图解决什么问题? 还是视觉Transformer中,试图引入线性的Attention,解决高分辨率图片的处理中,token数目很大、计算开销较大的问题。不同的是,本文试图通从数据结构的角度引入线性Attention。 Q2 这是否是一个新的问题? 线性Transformer并不是一个新的问题,但是通过数据结构的… Sparse TransformerTransformer