DocClassifier
本プロジェクトの核心機能は「ドキュメント分類(Document Classification)」です。
このタイトルを見て、「ただの分類モデルだ」と笑っているかもしれません。
- はい、でも違うんです。
今回は、典型的な分類モデルとは少し異なるものを作ろうと思っています。適用範囲は限られているかもしれませんが、その面白さは非常に高いです。
あなたが思っているようなものではないかもしれません。もし時間があれば、ぜひ続きを読んでみてください。
本プロジェクトは:kunkunlin1221 が提案し、前期のプログラム開発と実現可能性の検証を行いました。彼はウェブページを書く時間がなかったため、このアイデアを私に託し、詳細を完成させてここに公開しました。
彼の貢献に特別な感謝を表します。
2024 Zephyr
📄️ イントロダクション
過去のプロジェクト経験から、分類モデルは最も一般的な機械学習のタスクと言えます。
📄️ インストール
現在、Pypi 上でインストールパッケージは提供されておらず、短期間での予定もありません。
📄️ クイックスタート
私たちは簡単なモデル推論インターフェースを提供しており、その中には前処理と後処理のロジックも含まれています。
📄️ 高度な設定
DocClassifier モデルを呼び出す際に、パラメータを渡して高度な設定を行うことができます。
📄️ モデル設計
完全なモデル機能を作り上げるには、何度も調整と設計を繰り返す必要があります。
📄️ モデルの評価
本プロジェクトのテストデータセットは、民間機関から提供されたものです。プライバシー保護のため、このデータセットの評価結果のみを提供しています。
📄️ 結果と考察
前回の実験を総合すると、良好な結果を得たモデルが構築できました。このモデルは、私たちのテストセットで 90% 以上の精度を達成し、実際のアプリケーションでも良好なパフォーマンスを示しました。
📄️ モデル訓練ガイド
まず初めに、DocsaidKit から基本の Docker イメージ docsaidtrainingbase_image を構築していることを確認してください。
📄️ データセットの提出
現実の世界にはさまざまなケースがあり、必ずしもすべての状況に適応できるわけではありません。