跳至主要内容

評估模型

我們使用了 SmartDoc 2015 資料集作為測試資料集。

評估協議

我們使用 Jaccard Index 作為衡量標準,這個指數總結了不同方法在正確分割頁面輪廓方面的能力,並對那些在某些畫面中未能檢測到文件對象的方法進行了懲罰。

評估過程首先是利用每個畫面中文件的大小和坐標,將提交方法 S 和基準真實 G 的四邊形坐標進行透視變換,以獲得校正後的四邊形 S0 和 G0。這樣的變換使得所有的評估量度在文件參考系內是可比的。對於每個畫面 f,計算 Jaccard 指數 (JI),這是一種衡量校正四邊形重疊程度的指標,

其中定義為檢測到的四邊形和基準真實四邊形的交集多邊形除以它們的聯集多邊形。每種方法的總體分數將是測試數據集中所有畫面分數的平均值。

評估結果

下列為我們的模型在 SmartDoc 2015 資料集上的評估結果:

Modelsbg01bg02bg03bg04bg05Overall
FastViT_SA240.99440.99320.99400.99370.99290.9937
MBV2_1400.99170.99010.99210.98990.98910.9909
FastViT_T80.99200.98940.99180.98960.98880.9906
LC1000.99080.98770.99050.98940.98540.9892
LC0500.98470.98220.98650.98110.97220.9826
PReg-LC050-XAtt0.96630.96060.96640.96300.91990.9596

參數設定

下表為每個模型所使用的參數設定:

Model NameModelTypeModelCfg
FastViT_SA24heatmapfastvit_sa24
MBV2-140heatmapmobilenetv2_140
FastViT_T8heatmapfastvit_t8
LC100heatmaplcnet100
LC050heatmaplcnet050
PReg-LC050-XAttpointlcnet050

例如:當你想使用 LC050 的模型,調用方法如下:

from docaligner import DocAligner

model = DocAligner(model_type='heatmap', model_cfg='lcnet050')

綜合比較

下表為根據每個模型名稱,參數量、FP32 大小、FLOPs 以及綜合分數的比較:

Model NameParameters (M)FP32 Size (MB)FLOPs(G)Overall Score
FastViT_SA2420.883.18.50.9937
MBV2-1403.714.72.40.9909
FastViT_T83.313.11.70.9906
LC1001.24.91.60.9892
LC0500.41.71.20.9826
PReg-LC050-XAtt1.14.50.220.9596
提示

選擇模型就是一個取捨的過程,當你需要更小的模型,那麼 LC050 就是一個不錯的選擇,但是綜合分數就會比較低;反之,你可以用預設值 FastViT_SA24,缺點就是佔空間。