領収書OCR機能を実装してみた — Tesseract vs EasyOCR、試行錯誤の記録

運用しているWebアプリに、領収書の画像をアップロードするとOCR(光学文字認識)で自動的にテキストを読み取り、家計簿に自動記帳する機能を実装しました。今回はその導入過程で経験した成功と失敗、改善の試みについて記録します。やりたかったこと領収書の画像をアップロード → OCRでテキスト抽出店舗名・日付・合計金額・明細を正規表現でパース前回の同一店舗レシートとの差分検知(価格変動アラート)家計簿(L...