DocAligner
このプロジェクトのコア機能は「文書位置決め(Document Localization)」と呼ばれています。
📄️ イントロダクション
このタスクは実際には OCR タスクの「前段階」と言えます。
📄️ インストール
現在、Pypi 上でのインストールパッケージは提供されておらず、短期間での提供予定もありません。
📄️ クイックスタート
私たちは、前処理と後処理のロジックを含む簡単なモデル推論インターフェースを提供しています。
📄️ 高度な設定
DocAligner モデルを呼び出す際、パラメータを渡すことで高度な設定ができます。
📄️ モデル設計
私たちは過去の研究文献を参考にし、まずは点回帰モデルを検討しました。
📄️ モデルの評価
私たちは SmartDoc 2015 データセットをテストデータセットとして使用しました。
📄️ 結果と議論
以前の実験を総合すると、良い結果を得られるモデルが構築できました。
📄️ データセットの説明
この章では、私たちが使用したデータセットについて簡単に紹介します。
📄️ データセットの提出
現実の世界はさまざまな状況があり、時には私たちのモデルがうまく対応できない場合があります。
📄️ 参考文献
このテーマに関する論文は少ないですが、いくつか代表的な論文をリストアップし、研究の基礎資料として使用しています。