前回の日記で書いたRaspberry Pi 4。ちょっとずついじりながら、おもちゃとしてだけじゃなく、何かに活用できないかなあと思案中。
仕事にも使っているメインマシンに色々なものをインストールするのは不安ですが、ラズパイだったらその辺気にならないので、そんな方面で何かできないかなあ・・・。
ネットを見てて面白いなと思ったのが、甲骨文字の文字認識を取り上げた以下の記事。
www.tdi.co.jp
TesseractというOCRソフトと、jTessBoxEditorというOCR用の学習ソフトを使って、甲骨文字を読み取って漢字に変換する流れが紹介されているのですが、この学習機能を使って通帳の読み取りに活用できないかななんて考えています。
記帳をこちらで行う場合、預金の入出金のデータはネットバンクのデータをそのままもらえれば会計ソフトに一気通貫で取り込めるのですが、なかなかそうもいかず通帳のコピーを送ってもらうことがほとんどなのが現状です。
通帳のコピーは普通のOCRソフトにかけてもなかなかまともに読み取ってくれず、結局手入力になってしまっているので、ここをOCRでクリアできるようにできれば私の事務所の業務改善につながることもあり、頑張ってみたいところです。
通帳に使われているフォントは以下のHPでも紹介されていますが、数字とカタカナと若干の漢字が数パターンなので、これらを学習させれば実務に耐えられるぐらいOCRの精度あげられないかな?
ys223.blogspot.com
まあ同時にpythonも勉強していかないとダメなのですが・・・。