IT化スモールスタート解説(第11回) 業務効率化になくてはならない「AI OCR」について

自動化・AI

公開日:2020.03.31

 AIはさまざまな技術に応用されています。AIとOCRが融合した「AI OCR」についてご存じでしょうか。AI OCRは、従来のOCRでは認識できなかった文字まで認識が可能になり、ペーパーレス化・業務効率化に向けて導入が進んでいます。

 今回は、AI OCRの概要から、従来のOCRとの違いや業務効率化につながる理由について紹介します。

【基本】AI OCRについて

 AI OCRは、AI(人工知能)とOCR(光学的文字認識)を組み合わせた技術です。大量の文字データを収集、その中から文字の特徴を学習し、高い精度の文字認識を実現可能とします。

 AIは学習を続けるため、OCRの技術だけでは認識できなかった手書きのクセ字でも認識できるようになるのです。

 もともとOCRは、紙資料などをデジタルデータ化する際に、手入力による非効率的な業務を機械的に行い、効率化のために生み出された技術です。しかし、従来のOCRには手書き文書をうまくスキャンできないなど、制約・問題点がありました。

 そこで、AIによる画像認識技術を使って、それらの制約・問題点を解決したのです。業務効率化のために生み出されたOCRを、さらに最先端テクノロジーと組み合わせ、より効率的にしたものがAI OCRとなります。

AI OCRとOCRの違い

 AI OCRは、次世代のOCRともいえる存在ですが、従来のOCRとの違いが分からない人も多いのではないでしょうか。ここでは、OCRの概要から解説し、AI OCRとの違いについて紹介します。

<OCRとは>
 OCRはOptical Character Recognition/Readerの略称で、光学的文字認識のことを表します。紙面の手書き文字や、印刷された文字をスキャナーやカメラなどで読み取り、画像データから文字部分を抽出し、デジタルデータに変換する技術です。

 従来のOCRでは、次のような場合にうまくスキャンできない問題点がありました。

・文字のかすれやカラー文字
・文字の間隔が詰まりすぎている
・特殊文字「m²(平方メートル)」や「™(商標)」などが使われている
・手書きのクセのある文字
・縦書きと横書きが混在している
など

 それらの問題点を解決できるAI OCRに注目が集まっています。

<AI OCRとOCRの違いとは>
 AI OCRと従来のOCRの大きな違いは、AIの存在です。AI OCRでは、AIの画像認識技術を利用しており、高精度な文字認識を可能にしました。AI OCRに搭載されたAIは、「機械学習」や「深層学習(ディープラーニング)」技術が用いられています。

 これらの技術により、AIはさまざまな情報の読み取りを繰り返し、自ら学習します。そのため、従来のOCRでは認識できなかったフリーフォーマットの文書であっても、AI OCRでは自動的に文字情報を判別して認識します。

 手書きのクセ字や、フォーマットが異なる伝票などの紙資料であっても、学習を繰り返したAIが、自動的に文字情報を判別できるため、高精度な文字認識を実現します。まさに人間が目で見て認識するように、あらゆる文字情報を認識して、デジタルデータにしていくのです。

AI OCRが業務効率化につながるのはなぜ?

 AI OCRが便利なものだとすれば、なぜそれが業務効率化につながるのでしょうか。その理由について、RPAとの連携まで含めて解説します。

<AI OCRが業務効率化につながる理由>
 AI OCRは、フリーフォーマットの紙資料であっても文字情報を認識できることから、広範囲で紙資料のデジタルデータ化が可能です。例えば、請求書や納品書、発注書などの異なる形式の帳票でも、スキャンをするだけで項目を抽出できます。

 そのため、今まで手入力でデータ化していた手間を省け、大幅な業務効率化が実現するのです。

 紙資料のデジタルデータ化で、資料の管理や修正・加工・出力といった一連の作業も効率的に行えるようになります。非効率的なデータ入力業務から解放され、そのぶん、他業務に割り当てることも可能になるでしょう。

 AI OCRによって、紙資料のデジタルデータ化の手間を大幅に減らせることが、業務効率化につながる理由となっています。

<RPAとの連携で、より業務効率化につながる>
 AI OCRはRPAと連携することで、より業務効率化が図れます。RPA(Robotic Process Automation)とは、一連の事務作業を自動化するためのツールです。手作業だった事務作業をソフトウエアロボットに任せ、自動化を図ります。

 例えば、Excelファイルの商品情報をコピー&ペーストして、見積書を作成する作業をソフトウエアロボットに覚えさせて自動化します。工場で、手作業で行っていた業務を機械(ロボット)にやらせて生産効率性が向上するように、コンピューター上で同様のことが実現できる、とイメージすると分かりやすいのではないでしょうか。

 このようにRPAとAI OCRを連携させると、紙資料からデータを読み込み、出力するまでの一連の流れを自動化できます。具体的には紙の発注書をAI OCRで読み取り、RPAを使ってシステムにデータを入力する、という流れです。

 手作業では時間のかかる業務も、AI OCRとRPAを連携させれば一瞬で完了します。紙資料からデータを入力する機会が多いほど、より業務効率化の効果は大きくなるでしょう。

従来のOCRから大幅に進化したAI OCRによって業務効率化を図ろう

 AI OCRは、AI(人工知能)とOCR(光学的文字認識)を組み合わせた技術です。高精度な文字認識によって、従来のOCRでは難しかった手書きのクセ字などもデータ化できます。

 AI OCRは、「機械学習」や「深層学習(ディープラーニング)」を使った画像認識技術によって実現され、大量の文字データから文字の特徴を学習し、高精度な文字認識を可能にするものです。

 従来のOCRでは、フリーフォーマットの帳票などの読み取りができませんでした。AI OCRを使えば読み取れるため、大幅な業務効率化が期待できます。さらに、RPAと連携させて、紙資料の読み取りから出力までの一連の業務を自動化します。

 国もペーパーレス化を推進しており、ペーパーレス化にもAI OCRは欠かせない存在といえます。

 NTT西日本でも、AI OCRサービス「おまかせAI OCR」を提供しています。データ入力に割いていた業務時間の短縮化や、書類削減による省スペース化など、業務全体の効率化に貢献するサービスです。

 AIを用いることで、今までのOCRでは難しかった手書きのクセ字も対応が可能となり、訂正印のある紙資料のような複雑なものでも、きちんと判別ができるように改良されています。

 既存のOCRで満足がいかない方は、ぜひ一度おまかせAI OCRをお試しください。

※「おまかせAI OCR」は、AI inside 株式会社の「DX Suite」を活用しています
※「DX Suite」はAI inside株式会社の登録商標です

※掲載している情報は、記事執筆時点のものです

執筆=太田 勇輔

ネットワークスペシャリスト、情報セキュリティスペシャリスト保有。インフラエンジニアとして、官公庁や銀行などのシステム更改をメインに10年従事した後、IT関連ライターとして活動中。プログラミング、ネットワーク、セキュリティなどの解説記事を中心に執筆している。

【M】

あわせて読みたい記事

連載バックナンバー