[21.01] Fast DETR
摻點高斯吧!
Fast Convergence of DETR with Spatially Modulated Co-Attention
我們繼續 DETR 的討論。
DETR 做的事情,相信讀者都已經很熟悉了 。
定義問題
作者看完 DETR 之後,發出了跟前面作品 Deformable DETR 一樣的嘆息:
- DETR 的收斂速度太慢了。
而問題的根源在於 DETR 的跨注意力機制並不考慮預測的邊界框,因此需要多次迭代才能為每個物件查詢生成適當的注意力圖。
基於這個思路,或許只要我們改進跨注意力機制,就能提高 DETR 的收斂速度。
提示
在 Deformable DETR 中,作者改掉了最底層的注意力運作方式。
而這篇論文則是在跨注意力機制上加入了一些先驗知識。