跳至主要内容

參考文獻

這個主題的論文比較少,我們把一些比較有代表性的論文列出來,用來作為研究的基礎材料。

綜合比較

Modelsbg01bg02bg03bg04bg05Overall
HU-PageScan [1]-----0.9923
Advanced Hough [2]0.98860.98580.98960.9806-0.9866
LDRNet [4]0.98770.98380.98620.98020.98580.9849
Coarse-to-Fine [3]0.98760.98390.98300.98430.96140.9823
SEECS-NUST-2 [3]0.98320.97240.98300.96950.94780.9743
LDRE [5]0.98690.97750.98890.98370.86130.9716
SmartEngines [5]0.98850.98330.98970.97850.68840.9548
NetEase [5]0.96240.95520.96210.95110.22180.8820
RPPDI-UPE [5]0.82740.91040.96970.36490.21620.7408
SEECS-NUST [5]0.88750.82640.78320.78110.01130.7393

論文列表

  1. HU-PageScan 是一個基於像素分類的切割模型,雖然他的效果比較好,但模型尺寸及運算量較大,且受限於模型架構,對於部分遮蔽的樣態抵抗力較低,例如手指抓著邊角的這種情境,無法滿足實務上的需求。

  1. Advanced Hough 是 CV-Based 的模型,雖然效果不錯,但是使用 CV-Based 的模型,都會有一些缺點,例如對於光線和角度的敏感度。

  1. Coarse-to-FineSEECS-NUST-2 是一個基於深度學習的模型,採用了遞迴優化的策略,效果不錯,但是很慢。

  1. LDRNet 是一個基於深度學習的模型,我們有使用他們提供的模型進行測試,發現該模型完全擬合在 SmartDoc 2015 資料集上,對於其他場景完全沒有泛化能力。我們也試著加入其他資料進行訓練,最終的表現也不理想,可能是這個架構對與特徵融合的能力不足。

  1. LDRESmartEnginesNetEaseRPPDI-UPESEECS-NUST 以下的模型都是基於 CV-Based 的模型。