またまた前回の日記の続きで、PDFの書類を電子帳簿保存法の電子データ保存の要件を満たすリストに変換するエクセルファイルを作ってみる話。
取引金額はどうやって抽出するのがいいのかなといろいろ考えていたのですが、ふと「そんなに深く考えなくても、桁区切り表記されている数値のうち最大値を取得したら、大体取引金額になってるんじゃない?」ということで、単純に桁区切りされている数字のうち最大値を取引金額として取り込む機能をつけてみました。
とりあえず手元の3つのサンプルデータを取り込んで見ましたが、「最大値=取引金額」で正解になりますよね。
まあエクセルが間違った数字を抽出したら、その時点で人間が間違っている部分だけ修正して登録すればいいんだし、おおむね正しい金額を抽出できるのであれば完璧を目指さなくても良しとしていいのかなあ・・・。
実際に取り込む様子はこんな感じです。
www.youtube.com
ファイルをひとつひとつドラッグアンドドロップで自動変換する機能のほか、フォルダを指定したらフォルダ内のPDFファイルを自動的にすべてリスト化していく機能も別につけてみたら面白いかも。
※先週末は金沢まで小旅行に行ってきました。
夏は岩ガキが食べたくなりますよねえ。美味しかった!