DocClassifier
本專案的核心功能稱為「文件分類(Document Classification」。
看到這個題目,你可能嗤笑一聲,不就是個分類模型嗎?
- 是,又不是。
這次我們想做個非典型的分類模型,它可能應用範圍有限,但本身的樂趣性極高。
它可能不是你想像的那樣子,有空的話不妨繼續看下去。
資訊
本專案由:kunkunlin1221 發想提出,並完成了前期的程式開發和可行性驗證。由於他沒時間寫網頁,因此把這個想法託付給我,讓我繼續完成細節並發佈在這裡。
在此特別感謝他的貢獻。
2024 Zephyr
📄️ 介紹
在過去的專案經驗中,分類模型可說是最常見的機器學習任務。
📄️ 安裝
目前沒有提供 Pypi 上的安裝包,短時間內也沒有相關規劃。
📄️ 快速開始
我們提供了一個簡單的模型推論介面,其中包含了前後處理的邏輯。
📄️ 進階設定
調用 DocClassifier 模型時,你可以透過傳遞參數來進行進階設定。
📄️ 模型設計
一個較為完整的模型功能,都不是一蹴可幾的,中間必須經過多次的調整和設計。
📄️ 評估模型
本專案的測試資料集是由私人機構提供。基於隱私保護,我們僅提供這份資料集的評估結果。
📄️ 結果與討論
綜合之前的實驗,我們得到了一個效果不錯的模型。這個模型在我們的測試集上取得了 90% 以上的準確率,並且在實際應用中也取得了不錯的效果。
📄️ 模型訓練指南
請你確保已經從 DocsaidKit 內建置了基礎映像 docsaidtrainingbase_image。
📄️ 資料集提交
真實世界千奇百怪,你一定會遇到不合用的時候。