従来のOCRと今のOCRで使い方はどのように変化した？

2020.4.8

OCR
AI-OCR

近年ではAIがさまざまなツールに活用されており、OCRにおいても「AI-OCR」というAIを搭載したものが生まれ、次々と導入が進んでいます。

そんな中、使い方に関しても従来のOCRと今のOCRでは大きく変化しています。

今回は、そんなOCRの性能の変化や使い方の変化についてご紹介していきます。

OCRの性能の変化

まずは、OCRの進化についてその歴史を紐解きながら、性能の変化について見ていきましょう。また、日本国内においてはいつから、どのようにOCR技術が取り入れられ、開発されてきたのかについてもここで触れたいと思います※。

OCRの誕生（1900年代初頭）

OCR、つまり活字の文字認識技術は1900年代初頭から世界で本格的に研究・技術開発が行われてきました。現在では文書の電子化や働き方改革に伴う事務作業の負荷軽減など、主にビジネスの場で注目を集めているOCRですが、原点は、電信技術の拡張と、視覚障害者が文字を読むための機械開発といわれています。
1929年にはドイツで数字とアルファベットを読み取るOCRが開発され特許が出願されました。当時は読み取った情報をコンピュータで処理をするのではなく、画像を光電管で読み取り、必要な識別パターンを含むテンプレートと比較することでマッチング対象を見つけるというテンプレートマッチング方式により文字の識別を行っていました。

製品化とコンピュータ処理（1950年代ごろ）

1950年代に入ると、読み取り・文字の識別だけではなく、コンピュータへのデータ入力を行うための研究が本格化しだしました。1953年に特許を取得した「Gismo」は英語のアルファベットのうち23文字を読み取ることができました。また、Gismoでは単純な文字マッチングではない画像解析もしており、いくつかの書体を認識することもできました。
1954年には最初の商用システムがリーダーズ・ダイジェスト社に納入され、販売報告書のコンピュータ入力に使われました。

文字認識技術の向上（1960年代～1980年代）

OCRにとって何よりも重要なのは正確な文字認識です。1960年～1965年頃までの第1世代のOCRにおいては、文字の形を制限し、OCR用の特別なフォントを使用することで文字認識の正確さを高めるよう開発が進められました。
続く1965年頃～1970年代中盤の第2世代のOCRにおいては、通常の印刷文字（OCR用のフォントではないもの）や手書き文字の認識ができるようになりました。当時はまだ全ての手書き文字を認識できたわけではなく、数字や記号といった限定的なものでした。
1980年代までに研究が行われた第3世代のOCRでは手書き文字や低品質印刷文字の認識向上とともに、低コスト化の追求もされましたが、主流は、文字の間隔やフォントに制限のある単純なOCR製品でした。

一般への普及とソフト化（1980年代中盤～2000年代）

OCRが市場に出始めた1950年代はハードウェアの価格が高く、一般に広く普及するようなものではありませんでした。1980年代よりハードウェアの価格が下がったこと、さらにOCRがパッケージ・ソフトとして利用可能になり始め、OCRは広く一般に普及するようになりました。しかしながら、100%完璧な認識とはいかず、OCRで読み取ったものを目視確認する必要がありました。

ex)日本でのOCR導入と技術の発展

日本では1968年に郵便番号制度が導入され、郵便番号の読み取りと自動仕分けのための機械が国産OCRのはじまりでした。
その後世界各国と同様に研究・開発が進められ、1970年代には手書きのカタカナ文字を認識するOCRが登場しました。さらに1980年代以降は漢字の文字認識技術も向上し、低コスト化、ソフト化が進んだ結果、日本国内でもOCRは広く普及していきました。

※参考文献：勝山裕「統計的性質に基づく文字の高精度認識に関する研究」
http://hdl.handle.net/10097/58706

今のOCR

今のOCRは文字の認識はもちろん、「どこに」「何が」書かれているかといった情報も読み取れるよう進化を続けています。これにはAIなどの新しい技術も大きく貢献していて、劇的に機能が向上しています。

「どこに」「何が」書かれているのか、つまり定型帳票だけではなく、準定型帳票や非定型帳票などもAIが学習して対応することで、それぞれ異なる書式の帳票や、帳票の形にとらわれない読み取り認識が可能となっています。

そして、今のOCRは読み取り認識が高いだけではなく、読み取りルールを利用者が定義できたり、ノイズ除去機能が進化していたり、RPAなどの外部アプリケーションと連携できたりするなど、さまざまな高機能が付加されています。

OCRの使い方の変化

OCRの性能が変化したことによって、OCRの使い方も変化しています。

従来のOCRでは、帳票定義という帳票上の読み取り位置を指定する書式定義の作成が必須でした。どこに何が書いてあるかという情報を事前に定義しておくことで正しい読み取りができるようにするものであり、OCRを利用するうえで必要なものでした。しかし近年のAI-OCRでは前述のとおり、AIが帳票の内容を自動的に判定することが可能であり、帳票定義の作成は不要になってきています。

また、AIに加えてRPAと連携させることで、さらに大幅に業務の効率化を図ることができます。

OCRで各種帳票をテキスト化した後、会計ソフトへの入力等は人の手によって行われていましたが、RPAと連携させることで読み取った帳票データを処理するところまで自動化することも可能になっています。

働き方改革等の影響により業務の効率化が重要視されている近年では、RPAとOCRを連携して利用する企業も多くなっています。

変化したOCRを使う2つのメリット

では、従来のOCRと比べて変化したOCRを使うことで、どのようなメリットがあるのでしょうか。

ここでは、「入力担当者の作業軽減による生産性向上」と「業務の自動化によるコスト削減」の2つのメリットに分けてご紹介します。

入力担当者の作業軽減による生産性向上

入力担当者の作業が軽減できるという点が1つ目のメリットになります。

これまで、多くの企業の入力担当者が、請求書などのデータを手作業で会計ソフトや表計算ソフトに入力し、月末や月初の入力作業に追われていたのではないでしょうか。他の仕事ができずに、悩まされていた方もいらっしゃるかもしれません。

これらの悩みも、RPAとOCRを連携して活用し、入力業務を自動化させることで解消できます。入力担当者ではなくても行える単純業務を機械に任せることで、人は生産的な仕事に専念できるようになり、生産性を向上させることが可能になります。

業務の自動化によるコスト削減

業務を自動化することで、コストの削減につながるという点が2つ目のメリットです。

RPAやOCRを利用し、単純作業の業務を自動化させることで、入力作業を行うスタッフが少なくて済むことになり、毎月の人件費を抑えることができます。人件費という毎月の経費を抑えられることは、利益に直結すると考えられるでしょう。

また、紙代や印刷コストも抑えることができ、無駄な経費を抑えることが可能です。

OCRにはさらなる進化が期待できる

進化し続けている画像処理機能

OCRで読み取る際にノイズが入ってしまうことで、認識率が低下したりまったく読み込めなくなったりしてしまうことが従来のOCRでは課題となっていました。しかし現在ではノイズ除去機能も進化しており、余計なノイズデータをOCRが認識して自動的に除去してくれる機能も搭載しています。これにより地紋と重なった文字の認識精度の向上や、捺印された印影が重なった文字を読み込むことができるようになりました。

まだまだ発展途上なOCR

OCRとRPAの連携によって、単純作業の業務はコンピュータで自動化できるようになってきていますが、OCRはまだまだ進化途中であり、AIが発展していくことでこれからさらなる進化が期待できるツールとなっています。

まとめ

OCRの誕生から現代までの技術発展について、歴史的・社会的な背景も含めてご紹介いたしました。
AI技術により手書き文字の認識向上に加えて非定型の帳票読み取りといった従来のOCRが抱えていた問題が解決することによって、今後よりOCRの需要は高まっていくことでしょう。それとともにさらなる技術発展も続いていくものと思われます。

生産性向上やコスト削減を目指したい方は、ぜひこの機会にOCRの導入を検討してみてはいかがでしょうか。

PFUでは、長年にわたり多くのお客様に高い認識率のOCRをご提供しています。導入をご検討されている企業様は、是非一度ご相談ください。