レシート重複は普通に後から排除可能だよ。
今の画像認識制度を甘く見ちゃいかん。
GoogleのAPIのレベルでさえ、90%近い確率で数値化文字化可能。
個人で作成したアルゴリズム組み合わせたら100%に近い確率で
全自動でクラウド上のAWSのパワーでデータ化可能よ。

俺が過去に作ったレシート画像を一定のフォルダーに100枚ぐらい
置いて、そこからCSVに変換するプログラムなんて素人でも今じゃ
簡単に作れる。制度もそこそこあるで。

この手のビックデータ活用に遅れてるのは日本だけだよ。
法整備が整ってないから、今ならやりたい放題。

本当にやろうと思えば、POSシステム無料構築で月額無料で
ビックデータだけで企業成り立っていけるぐらいの事出来る。