開源專案

現在你看到的這個頁面，是用來寫技術文件的。

如果你有興趣閱讀相關的論文分享，請前往：Papers。
想了解更多技術心得與討論，請瀏覽：Blog。

📂 公開專案一覽

目前我們在 Github 上公開了幾個已經完成的專案，包括：

工具與整合類

AutoTraderX：

這是練習串接臺灣證券交易券商的系統而留下的紀錄，目前只探索了「元富證券」的 API，之後預計要去探索「富邦證券」，但是還沒有安排時間。

提示
如果你要問我們開發心得？那大概是心有餘悸吧。😓
希望其他券商可以帶給我們更好的開發體驗。
Capybara：

這裡面定義了一些在電腦視覺領域中常用的結構，例如 Boxes、Polygons 和 Keypoints 等。

除此之外，還有一些影像處理（opencv）、模型架構（pytorch）和推論工具（onnxruntime）和環境配置的內容都放在這裡，這些都是我們在工作中常用到的工具。
DocsaidKit（已棄用）：

這是最早寫的工具箱，只是經過一段時間的使用後，我們決定對這個工具箱進行拆分，把 PyTorch 相關的訓練工具移除，僅保留模型推論和影像處理相關的功能。

最終這個專案拆成三份：
- Capybara：模型推論和影像處理相關的功能。
- Chameleon：純粹的 PyTorch 訓練工具。
- Otter：基於 PyTorch-Lightning 的訓練工具。
藉由分拆這些模組，我們在訓練和部署的過程中可以更加靈活，也更容易維護。

目前已經將所有依賴於 DocsaidKit 的專案都更新到新的模組上，所以這個專案已經不再維護，目前已經下架相關說明文件，僅保留這個頁面作為紀念。

提示
你可能會問說這些套件命名是發生什麼事？是不是喝茫了？🤔🤔🤔
沒這回事！你看現在各大機構發表的論文都是這樣天外飛來一個奇怪的名字，我們這是在向大師致敬...（？）
GmailSummary：

這是我們練習串接 Gmail 和 OpenAI 而留下的紀錄，裡面的內容可能在未來 Google 和 OpenAI 的 API 更新後會失效。

之前這個專案有運作過幾個月，但目前已經把儲值給 OpenAI 的錢花完了，所以這個專案已經停止工作。
Nginx Notes：

這個不是專案，只是我們在學習 Nginx 過程中的筆記，主要是為了記錄一些常用的配置和技巧。學到哪裡就寫到哪裡，如果你對 Nginx 有興趣，不妨去看看。
WordCanvas：

之前我們有陸續完成一些合成訓練資料的工具，後來覺得太散亂，所以把一些基本功能抽象出來，整合成一個新的工具，這個專案的功能主要就是把字型檔案渲染成圖像。

深度學習專案

DocAligner：

這是一個文件對齊的專案，功能是定位文件的四個角點。

雖然這個功能很簡單，但是很多應用場景中都可以派上用場，目前只有定位四個角點，如果有時間我會再加上一些其他的功能。
DocClassifier：

這是一個文件分類的專案，功能是將文件分類到不同的類別。

這個專案有開放訓練模組，我的每個模型專案都是用相同的構建邏輯，如果你對其他的模型有興趣，可以參考這個專案，建立屬於你自己的訓練環境。
MRZScanner：

這個功能是辨識文件上的 MRZ 區域。

之前想要做一個 End-to-End 的模型，雖然最後效果不如預期，但還是有一些小成果，所以我把它整理成一個開源專案，希望能夠幫助到有需要的人。

🚧 開發與未公開專案

除了以上公開的專案外，還有一些專案正在開發中，或是處於內部測試階段。

如果有特別感興趣的議題或想法，也歡迎與我聯繫。

🌍 多國語系支持

目前，我們以中文為撰寫主體，然後再進行其他語言的翻譯。

考慮到我們的能力有限，沒辦法扛下所有的翻譯工作，所以這個部分請市面上的各種 GPTs 來幫我們完成這件事情，得到翻譯結果後再進行人工校對，排除一些肉眼可見的錯誤。

如果你在閱讀過程中發現了：

錯誤或毀損的連結
錯誤的翻譯
錯誤的理解

都歡迎在文章底下留言，我們會安排時間修復。

資訊

另外兩種方式，其一是到 github 上的討論區提出問題：

其二是直接發 PR 給我們，經過確認後可以直接合併到專案主線中，省時省力。

🍹 最後

如果你有任何問題，或是對我們的工作感興趣，歡迎寄信給我們：

docsaidlab@gmail.com

你可以選擇寄信過來，或是直接在本網站上找個地方留言，我們都會看到。

感謝你的閱讀與支持，希望這裡能為你帶來幫助與啟發！

📂 公開專案一覽​

工具與整合類​

深度學習專案​

🚧 開發與未公開專案​

🌍 多國語系支持​

🍹 最後​