[18.04] YOLO-V3
引入多尺度檢測
YOLOv3: An Incremental Improvement
第三代的 YOLO 其實不是論文,就作者本人表示:這只是一份技術報告。
定義問題
近期在目標檢測領域有許多新的研究進展。
作者想著是時候將這些新的想法整合到 YOLO 中,並且進行一些改進。
其中,Bounding Box 預測的部分沒有更改,直接沿用 YOLOv2 的設計,這邊我們就不再贅述。
解決問題
作者做了一系列的改進。
更新 Backbone
作者將 Darknet-19 的網路架構改為 Darknet-53。這裡同樣使用連續的 3x3 和 1x1 的卷積層,並且新增一些殘差連接。這是一個更深的網路,並且在 ImageNet 上進行了訓練,因為這個網路有 53 個卷積層,所以作者稱之為 Darknet-53。
下表為 Darknet-53 的在 ImageNet 上的表現,可以看到 top-1 準確率和 ResNet-101 持平,約為 77.1%,但是推論速度提升 50%。