作業日誌
備考
このページは私たちの作業内容を記録するためのものです。
2025
1 月
- GCP を終了し、モデルファイルの保存場所を変更し、すべてのダウンロードリンクを更新。
- Capybara、DocAligner、MRZScanner のモデルファイルを更新。
2024
12 月
- 4 人の著者を招待し、開発の日常を共有。
- StockAnalysis Demoの機能を完成:stock-demo
- 論文ノートに「著者欄」を追加し、ホームページ、論文ノート、ブログのデザインを整備。
- ウェブサイトのバックエンド管理システム、データベースシステム、会員登録システムの構築を開始。
- 論文ノートを執筆、現在累計 150 篇。
11 月
- 多言語対応を追加:日本語
- @docusaurus/core@3.6.1を更新、また壊れた!
- エラープログラムブロックを更新するために時間をかけることに。
- 論文ノートを執筆、現在累計 135 篇。
- DocumentAI:開発を並行して進行。
- TextRecognizer:10 月の進捗を引き続き開発。
10 月
- TextRecognizer:5 月の進捗を引き続き開発。
- モデル Demo の機能を完成:docaligner-demo
- NextCloud を自社サーバーから GCP に移転し、すべてのダウンロードリンクを更新。
9 月
- MRZScanner:開発完了、オープンソースプロジェクトとして公開。🎉 🎉 🎉
- TextDetector:3 月の進捗を引き継ぎ、開発を続行中。
- 素晴らしいウェブサイトを発見し、忘れないようにメモ:
- 論文ノートを執筆中、現在累計 100 本。
8 月
- MRZScanner:デプロイテスト後、再調整。
- @docusaurus/core@3.5.2 を更新したら、後方互換性がなくて驚き……
- エラー部分を修正するために少し時間を割きました。
- OpenCV の依存関係問題を排除する決心をし、同じ問題に悩む人がいることを発見:
- OpenCV 依存関係エラー修正ツール:OpenCV Fixer
- オープンソースプロジェクト:soulteary/opencv-fixer
- 感謝:蘇洋ブログ のシェア、時間を大いに節約できました。
- 論文ノートを執筆中、現在累計 90 本。
7 月
- 論文ノートを執筆、累計 80 本。
- MRZScanner:開発を開始。
6 月
- AutoTraderX:元富証券 API の接続を完了し、オープンソースプロジェクトとして公開。🎉 🎉 🎉
- OpenAI のクレジットが尽きたため、GmailSummary のデイリーニュース配信機能を停止。
- 論文ノートを執筆、累計 50 本。
5 月
- Text Recognizer モデルを完成。
- 最終評価結果は良好だが、「過学習ではないふりをした過学習モデル」だと認識。(???)
- 理想のアーキテクチャにはまだ距離があるため、公開は一時見送り。
- Docusaurus の Search 機能を探求し、Algolia 検索サービスをテストして導入。
- 感謝:WeiWei さんの執筆記事:
- Text Recognizer モデルの開発、パラメータ調整とモデル訓練を実施。
- AutoTraderX:開発を開始。
4 月
- CSS スタイルの設定を学び、ブログの外観を調整。
- TextRecognizer:WordCanvas の進捗を引き継ぎ、文字認識プロジェクトを推進。
- GmailSummary:機能を変更。デイリーニュースを技術文書ページにプッシュ。
- 現在のすべてのプロジェクトの技術文書を完成。
- Docusaurus の i18n 機能を探求し、英語の文書を作成。
- Docusaurus の技術文書機能を探求し、技術文書の執筆を開始。GitHub から内容を移行。
- WordCanvas:開発完了、オープンソースプロジェクトとして公開。🎉 🎉 🎉
3 月
ある日、Google Drive のファイルダウンロード機能が壊れ、gen_download_cmd
で取得していたデータが「エラー HTML の塊」になってしまった。👻 👻 👻
熟考の末…
最終的に NextCloud のオープンソースフレームワークを利用してプライベートクラウドを構築し、データ保存専用とすることを決定。過去のダウンロードリンクをすべて更新。
- GmailSummary:開発完了、オープンソースプロジェクトとして公開。🎉 🎉 🎉
- DocClassifier:複数の正規化層を重ねることでモデル性能が大幅に向上することを発見。(偶然の発見)
- TextRecognizer:初期プロジェクトの計画。
- WordCanvas:開発を開始。
- TextDetector:多くの困難に直面し、一時中断。
2 月
- TextDetector:公開データの収集。
- DocClassifier:CLIP を導入し、モデルの知識蒸留を実施。結果は良好!
- Docusaurus のコメント機能を探求し、giscus コメントサービスを追加。
1 月
- TextDetector:初期プロジェクトの計画。
- DocClassifier:開発完了、オープンソースプロジェクトとして公開。🎉 🎉 🎉
2023
12 月
- DocClassifier:開発を開始。
- DocAligner:開発完了、オープンソースプロジェクトとして公開。🎉 🎉 🎉
- Website:面白い Meta のオープンソースプロジェクト docusaurus を発見。これは静的ウェブサイトを簡単に作成できるツールで、Markdown を使用してコンテンツを記述できます。そのため、これを使ってブログを作ることを決定。
- WordPress で構築していたウェブサイトを削除し、その内容を GitHub 上の
website
プロジェクトに移行。
11 月
- DocClassifier:初期プロジェクトの計画。
- DocsaidKit:開発完了、オープンソースプロジェクトとして公開。🎉 🎉 🎉
- 論文ノートを執筆、累計 20 本。
10 月
- WordCanvas:初期プロジェクトの計画。
- DocGenerator:第二段階の開発が完了。テキスト合成モジュールを WordCanvas プロジェクトに分割。
9 月
- DocAligner:開発を開始。
- DocGenerator:第一段階の開発が完了。
- 論文ノートを執筆、累計 5 本。
8 月
- DocAligner:初期計画。
- DocsaidKit:よく使うツールを整理し、開発を開始。
- WordPress の機能を探求。自分でサイトを構築し、ブログを執筆する試み。
- 感謝:諾特斯サイト の惜しみないシェア、多くのことを学びました。
- DOCSAID の GitHub アカウントを作成し、いくつかのプロジェクトの計画を開始。
それ以前
私たちはさまざまな仕事の間を転々とし、日々を繰り返していました。同じ夢を語る異なるボスの言葉を聞き、味気ない希望を嚙みしめていました。
幾多の夜を徹して仕上げたプロジェクトは、熱意に満ちた理想を織り交ぜていましたが、資本市場の「愛されるか、愛されないか」の狭間に揺れていました。
「愛されない」となれば、それで終わり。
青春が終わる前に、私たちは何かを残したいと考えました。
何でもいい。ここに、私たちがかつてここにいたことを記録しておきたい。