メインコンテンツまでスキップ

参考文献

このテーマに関する論文は少ないですが、いくつか代表的な論文をリストアップし、研究の基礎資料として使用しています。

総合比較

モデル名bg01bg02bg03bg04bg05総合評価
HU-PageScan [1]-----0.9923
Advanced Hough [2]0.98860.98580.98960.9806-0.9866
LDRNet [4]0.98770.98380.98620.98020.98580.9849
Coarse-to-Fine [3]0.98760.98390.98300.98430.96140.9823
SEECS-NUST-2 [3]0.98320.97240.98300.96950.94780.9743
LDRE [5]0.98690.97750.98890.98370.86130.9716
SmartEngines [5]0.98850.98330.98970.97850.68840.9548
NetEase [5]0.96240.95520.96210.95110.22180.8820
RPPDI-UPE [5]0.82740.91040.96970.36490.21620.7408
SEECS-NUST [5]0.88750.82640.78320.78110.01130.7393

論文リスト

  1. HU-PageScan はピクセル分類に基づいたカットモデルであり、効果は良好ですが、モデルのサイズと計算量が大きく、またモデルアーキテクチャに制限があるため、一部の遮蔽パターンに対する耐性が低いです。たとえば、指で角を掴んでいる状況では、実務的な要求を満たせません。

  1. Advanced Hough は CV ベースのモデルであり、効果は良いものの、CV ベースのモデルは光量や角度に対して敏感であるといった欠点があります。

  1. Coarse-to-FineSEECS-NUST-2 は深層学習に基づいたモデルで、再帰的最適化戦略を採用しています。効果は良好ですが、非常に遅いです。

  1. LDRNet は深層学習に基づいたモデルで、提供されたモデルを使用してテストを行いましたが、このモデルは SmartDoc 2015 データセットに完全に適合しており、他のシーンに対しては全く一般化能力がありません。他のデータを追加して再訓練を試みましたが、最終的な性能もあまり良くなく、恐らく特徴融合の能力が不足しているためだと思われます。

  1. LDRESmartEnginesNetEaseRPPDI-UPESEECS-NUST 以下のモデルはすべて CV ベースのモデルです。