2023.1.12

OCR(文字認識)とは?
~紙書類からのデータ入力業務を効率化!5つの活用事例と共にわかりやすく解説~

労働人口減少の課題が深刻化していく中、大企業だけではなく、中小企業や自治体においても働き方改革を意識した動きがみられるようになってきました。そのため人材に代わる労働力となるRPAやAIなどに興味を持つ企業が増えてきています。そんな中注目を浴びているのが、OCRの存在です。

この記事では、OCRとは何か、どのような種類があるのか、導入するメリット、今OCRが注目される理由についてわかりやすく解説します。
後半には、OCRを活用した実際の業務改善事例を5つご紹介します。取り組みと効果をご覧いただき、みなさんの業務に適したOCR活用方法を見つけて業務改善にお役立ていただけると幸いです。

1. OCR(文字認識)とは

1-1. OCR(文字認識)とは

OCRとは、「Optical Character Recognition:光学的文字認識」の略称で、紙書類をスキャンして電子化した画像データやPDFから文字を抽出・認識し、テキストデータに変換する技術です。
変換したテキストデータは、文字列検索したり表計算ソフトなどで二次利用したりできます。

OCRのイメージ画像

1-2. OCRの歴史

OCRの歴史は古く、すでに1900年頃から文字認識の技術が世界で開発されています。
海外では1920年代に数字とアルファベットのOCRの特許が出願され、日本では1960年代に郵便番号の自動読み取りを目的に開発が進められました。
当初は専用のハードウェアとして開発され、その後はパソコンで利用するソフトウェアが普及し、最近ではスマートフォンで撮影した画像を直接OCRできるようにもなってきています。
さらに、AI(人工知能)技術を組み合わせたAI-OCRの登場により、従来のOCRでは実現することが難しかった手書き文字の読み取りや非定型文書の読み取りなども可能になりました。

1-3. OCRの種類

OCRソフトウェアは、文字認識する対象によって大きく2つに分類されます。

OCRの種類
1) 一般文書向けOCR(全文OCR)

形式が決まっていない紙の書類や文書を対象とするOCRです。
スキャナーやスマートフォンで読み取った書類(画像データ)の、すべてまたは一部の文字を認識して検索可能なPDFに変換したりテキストデータ化したりすることで、キーワードによる検索や引用、翻訳が可能になり文書を活用しやすくなります。

2) 帳票OCR

申請書、注文書、アンケートといった紙の帳票を対象とするOCRです。
帳票をスキャナーなどで読み取り、手書き文字や活字文字を項目ごとにテキストデータ化し、データ化した情報は、表計算ソフトや業務システムなどで利用できます。

帳票OCRには、フォーマットが決まっている帳票に事前に読み取る範囲や項目の種類(住所や電話番号)などを設定する「定型帳票」に対応したものと、フォーマットが定まっていない準定型帳票(項目が共通で記載位置が変わるようなフォーマット)や非定型帳票(項目・記載位置に規則性がないフォーマット)に対応したものがあります。
また一部のスキャナーでは標準機能として定型帳票の特定の部分だけを簡単に認識できるゾーンOCR機能を備えているものもあります。
認識した情報を使って、ファイル名を自動生成することもできます。

また、文字認識する対象物の特徴に合わせた以下のようなOCRソフトウェアもあります。

  • 名刺OCR
  • 運転免許証OCR
  • 保険証OCR
  • レシートOCR

たとえば、運転免許証用のOCRであれば、運転免許証特有の記載形式に対応したり、住所辞書や氏名辞書を活用したりしてOCR認識の補正処理を行います。これにより、運転免許証に特化した高度なOCR認識ができます。

運転免許証用OCRの使用例

1-4. OCRの提供形態はさまざま

OCRの提供形態は大きく分けると、以下の2つがあります。

  • パソコンやスマートフォンにインストールして利用する「オンプレミス型」
  • インストールせずにインターネット上で提供されている外部サーバーを利用する「クラウド型」

以前はオンプレミス型のパソコン用OCRソフトを購入するのが一般的でしたが、現在はインターネットから利用できるOCRサービスやOCR機能を備えたスマートフォン用のアプリなども多くなっています。

1-5. OCRを利用する際に必要な機器

OCRを利用するためには、基本的には認識結果を保存するパソコンと、紙書類を電子化するためのスキャナーや日付などの文字列を読み取るハンディスキャナーなどの専用ハードウェアが必要です。スキャナーやハンディスキャナーはいろいろな種類があるので業務に合ったものを使用します。
また、最近はスマートフォンのカメラで撮影した画像を使用できるOCRアプリもあります。この場合はパソコンや専用ハードウェアは必要ありません。

2. OCRを導入するメリット

いろいろなOCRがあることが理解できたと思いますので、次にOCRを導入するメリットについてみていきましょう。

OCRのメリットのイメージ画像

2-1. 大量の紙帳票からのデータ入力時間を短縮

請求書や納品書などの帳票類は、まだまだ紙で運用されています。そのため、帳票に記載されている情報をシステムやソフトウェアに入力する場合、人が目視で確認しながら手作業で入力(データ化)する必要があり、この作業に多くの時間と労力を割いているのではないでしょうか。

OCRを利用すると、必要な情報を自動で抽出できるため、手作業で行っていたデータ入力作業が大幅に削減され作業時間の短縮につながります。この効果は、入力する紙帳票の量が多いほど大きくなります。

2-2. 人件費を削減し、業務品質を向上

紙書類の情報を手作業でデータ化していると、入力作業が集中する繁忙期などは残業したり、他部署に応援を依頼したり、外部に作業を依頼したりして対応することがあります。
OCRを利用するとデータ入力作業の時間と手間を削減できるため、残業時間や他部署からの応援人数を減らすことができます。後述する2つのメリットを含め、人件費の削減につながります。

また、削減によって生まれた時間は、これまで残業して対応したりあきらめたりしていた生産性のある仕事に割り振れるようになります。その結果、組織としての生産性向上や業務品質の向上が見込めます。

2-3. データ化の精度向上とチェック時間の短縮

手作業でデータ入力していると、疲労などにより集中力が低下し、誤入力・見落としなどのケアレスミスが発生します。OCRを活用すれば、人的ミスを大幅に削減することができ、データ化の精度が向上します。
OCRによる文字認識は100%ではないので入力結果の確認は必要になりますが、ケアレスミスを発見するために行っていた目視によるダブルチェックが不要になり、チェック時間を短縮できます。

2-4. 検索性の向上

大量の紙書類の中から必要な情報を探すのは大変な労力が必要ですが、紙書類の情報をデータ化するとパソコンで検索できるようになり、必要な情報へのアクセスが容易になります。

2-5. データの共有・活用が容易

紙書類を複数人で同時に参照するのは難しいですが、データ化された情報は複数人で共有しやすく、データを加工して流用することもできるので作業効率がアップします。

3. OCRが注目される理由

OCRはこれまでも多くの企業で導入されてきましたが、近年、ペーパーレス化やDXへの対応が求められる中、改めて注目が集まっています。ここでは、今OCRが注目されている理由について解説します。

3-1. 生産性向上の必要性

近年、労働人口(生産年齢人口)の減少が社会的に課題となっています。内閣府(税制調査会)が公表した「第2回 税制調査会の資料」によると、働き手となる生産年齢人口は2065年には4529万人となり2020年の7406万人と比較すると約2900万人の減少、さらに生産年齢人口の割合は約5割に低下する見通しだとされています。
このような生産年齢人口の減少により人手不足が進む中で生産力を維持/向上するためには、生産性を高めていくことが必要です。

この課題の解決策として、人間がするべき仕事とロボットなどの機械にさせる仕事の分業が始まっており、「仕事」ではなく「作業」となるものは、すべてロボットによる自動化という時代の流れになっています。
そうした作業の自動化を実現していくために必要不可欠な存在がAIの発展でありRPAの出現なのです。このRPAが扱うためのデータとして、OCRの利用が注目されてきています。

OCRが注目される理由

3-2. AIの発展

AIの発展によりOCRにAI技術を組み合わせることで大量の文字データを学習させ、飛躍的に認識精度を高めることができるようになりました。これにより、従来はうまく認識できなかった手書き文字の認識精度が向上しました。これもOCRの需要を高めた一因といえるでしょう。

3-3. RPAのひろがり

RPAとは、「Robotic Process Automation」の略称で、パソコンの画面上で行っていたオフィスの定型業務やルーチンワークなどを自動化するためのソフトウェア技術のことです。
このRPAの出現により、さまざまな企業で人が行っていた定型業務を自動化できるようになりました。
たとえば、申請書などの紙帳票を業務システムに入力する業務の場合、OCRで紙の情報をデータ化し、業務システムへの入力作業や集計作業をRPAで自動化できます。
このようにRPAで業務システムへのデータ入力などを自動化する際にOCRの存在が重要となり、その需要が高まってきたと考えられます。

RPAとの連携イメージ

4. OCRの活用事例と効果

ここからはOCRを活用して業務改善した5つの事例をご紹介します。OCRの活用パターンはいろいろありますので、みなさんの業務課題に適した事例を見つけて参考にしてください。

4-1. スキャナー標準機能のゾーンOCRを利用し、定型帳票の特定箇所からのデータ抽出を実現【日本赤十字社 東京都支部様】

日本赤十字社 東京都支部様では、スキャナーの標準機能であるゾーンOCR機能を使って特定箇所を一気にOCRして入力時間削減を実現されました。

背景・課題
  • 一定期間に集中して届く大量の払込取扱票の項目を、管理システムに手作業で1件ずつ入力するのに手間と時間がかかっていた。
  • 寄付に関する情報なので入力漏れや二重入力がないよう細心の注意を払う必要がある。
  • 人員を簡単に増やせないため、繁忙期は手分けして対応していた。
取り組み
  • PFUのA3高速スキャナー「fi-7600」を導入し、払込取扱票のOCRを開始。
  • 標準添付ソフトウェアPaperStream CaptureのゾーンOCR機能(特定の部分だけ認識する機能)を使用して払込取扱票の「依頼コード」と「振込金額」だけを自動抽出してCSVファイルに出力。そのCSVファイルをExcelに読み込み、管理システムへ連携して寄付情報を一括登録。
効果
  • OCR箇所の認識結果の確認は、ゾーンOCRの精度が高いのでCSV出力後に文字化けがないかなどの簡単なチェックのみ。
  • 払込取扱票の入力時間が繁忙期には1日3時間短縮され、寄付者様への御礼と領収証の発送がよりスムーズに。
詳細

4-2. 「検索可能なPDF」化で共有と検索が楽になり、一時保管スペースが大幅に縮小【横浜環境保全株式会社様】

横浜環境保全株式会社様では、産廃マニフェスト(産業廃棄物管理票)の管理と契約書の電子化にスキャナーを使用し、検索可能なPDFで保存することで検索作業の効率化を実現されました。
また、社内伝票の入力にスキャナーと業務用OCRソフトウェアを導入し、17名で手分けして行っていた専用システムへの入力作業の大幅な効率化にも成功されています。

背景・課題
  • 毎日大量に発生する産廃マニフェスト(カーボン複写式伝票)に事務所のスペースが圧迫されている。
  • 過去の伝票確認時は、閉じたファイルから手作業で探し出している。
  • 産廃マニフェストは本社まで車で届けるため、1日のタイムラグが発生。
  • 社内伝票と契約書のシステムへの入力に多大な時間を要し、連日の時間外勤務が発生している。
取り組み
  • PFUのA4高速スキャナー「fi-7160」で産廃マニフェストを電子化。標準添付ソフト「PaperStream Capture」のOCR機能で「検索可能なPDF」に。
  • 業務用OCRソフトウェア「DynaEye」を導入し、産廃マニフェスト・社内伝票・契約書の電子化やOCRを開始。
効果
  • 産廃マニフェストの電子化により記録・閲覧が楽になり一時保管スペースが1/3に縮小。本社ともタイムラグなく共有可能。
  • 書類の電子化とOCRによって手間のかかる事務作業が大幅に効率化し、社内伝票で2,700時間、契約書で1,700時間を削減。
詳細

4-3. 大量の活字/手書きの申請書/請求書からのデータ抽出・確認時間を大幅に短縮【七尾市 健康福祉部 健康推進課様】

七尾市役所様では、OCRの利用により、手書き文字(数字)が含まれるアンケート用紙のデータ入力時間を1/6に短縮することに成功されました。

背景・課題 毎月実施している「健やか親子21アンケート」の回答を集計するために、回答を1枚ずつ手作業でExcelに転記(データ入力)しており、時間と手間がかかっていた。
取り組み
  • PFUのA3高速スキャナー「fi-7480」と業務用OCRソフトウェア「DynaEye」を導入し、回答のデータ入力業務を自動化。
  • OCRで認識しやすいように乳幼児健診時の「健やか親子21アンケート」(定型帳票)の形式を、該当する項目にマルをつける形式からチェックボックスで回答する形に変更。
効果
  • 1か月分のアンケートの回答のデータ入力にかかる時間が1/6に短縮。
  • 空いた時間で個別相談の対応時間を増やすなど、本来の保健師業務に集中できるように。
詳細

4-4. RPAツールとの連携で払出請求書の処理を自動化し、人の作業を最小化【朝日生命保険相互会社様】

朝日生命保険相互会社様では多様な保険・金融サービスに付随する膨大な事務を効率化するために、RPAを積極的に取り入れて効果を上げられています。その中で、「一般財形貯蓄の払出請求書」は手書き文字があり、かつ、帳票はお客様独自の書式である準定型帳票であることが多いため、「この欄の文字をここに入力」といった指示を登録しRPAと連携して処理されています。

背景・課題 月400通が郵送で届き、随時送金処理が必要な「一般財形貯蓄の払出請求書」の請求内容をシステムに手入力するため、担当部署では毎日、午前中に時間を割いて対応していた。
取り組み RPAツール導入をきっかけに、AI-OCRとPFUのスキャナー「fi-7800」を連携させて入力作業を自動化する仕組みを構築。
効果
  • 年間約300時間の入力作業が削減され、チェックも楽になった。
  • 特に件数の多い日の効果が大きく、時間外労働が減る、他の業務にも余裕を持って当たれるといった好循環が生まれた。
詳細

4-5. 手書き文字をデータ抽出し、既存システムに連携して活用【キムラユニティー株式会社様】

キムラユニティー様では、AI-OCRソフトウェア「DynaEye」が提供する部品(開発者向けのシステム組み込み用モジュール)を利用し、手書き文字の日報を集計する「OCR日報システム」を自社開発することで、日報集計の自動化を実現されています

背景・課題
  • 倉庫業務において、最大300名の従業員が提出する作業日報の集計に多大な手間と時間を要していたため、事務担当者の作業負担が大きかった。
  • また、集計結果に基づく改善が即時にできないという問題があった。
取り組み PFUのA4高速スキャナー「fi-7160」とAI-OCRソフトウェア「DynaEye」を活用した「OCR日報システム」を自社で開発、OCR用の手書き日報シートと共に全17拠点に導入。
効果 夕方近くまでかかっていた集計作業が午前中で終わるようになり(時間にして70%減)、集計結果の素早いフィードバックも実現。作業工程の即時改善が可能になった。
詳細

5. まとめ

今回は、業務改善・生産性の向上には欠かせないOCRについてご紹介してきました。OCRは、ここ数年で多くの技術改良がされており、手書き文字でも文字認識をするほど性能を上げています。そのため、RPAなどとの連携により、人がこれまで行っていた作業レベルの仕事も一連の流れで仕組み化し、自動化することが可能です。これからの社会において、AIやRPAとOCRを利用して人に代わる労働力を導入していくことが必要になってくるといえるでしょう。

「4.OCRの活用事例と効果」でご覧いただいたさまざまな活用事例の中から、みなさんの業務改善に適用できそうな事例を参照してOCR活用の参考にしていただければ幸いです。

なお、PFUが提供するAI-OCRソフトウェア「DynaEye」の無償評価版とfiシリーズスキャナーのデモ機無料貸し出しサービスを行っております。

「DynaEye 11」の無償評価版は次のバナーからダウンロードできます。実際に使用している帳票でぜひお試しください。

fiシリーズのスキャナーのデモ機無料貸し出しサービスは、次のバナーからお申し込みできますのでご活用ください。

また、PFUでは、DynaEyeの事前検証や導入を弊社で対応する「AI-OCRスタートアップサービス」も行っています。「導入までの事前準備が大変そう」、「導入前に効果を確かめておきたい」、「導入後の運用が心配」といったお客様におすすめのサービスです。

関連記事

Top of Page