話題のサービス使ってみた(第2回) おまかせAI OCR、文字認識を検証してみた

自動化・AI デジタル化

公開日:2020.06.03

 OCR(光学的文字認識)は「手書き文字だと間違いだらけになってしまって使えない」というイメージを持つ方が多い。実際、印刷された活字ならば正しく認識できても、手書き文字となると途端に爆笑の認識結果を吐き出したりする。

 ところがAIの“目”を組み合わせて文字認識するAI OCRが登場。手書き文字も高い精度で読み取れるようになった…と、説明されることが多いわけだが、実際はどうなのか。そこでBiz Clip編集部では、NTT西日本が提供するAI OCRサービスの「おまかせAI OCR with DX Suite」を使って、AIを活用したOCRの使い勝手や読み取り具合の体験レポートをお送りすることにした。前編では使い勝手を実体験。今回は、読み取りがどのぐらい正確にできるのかをチェックしてみる。

 おまかせAI OCRは、クラウド型で提供するAI OCRサービス。帳票や書類をスキャンして画像データ化するスキャナーなどと、ブラウザーからクラウド型のサービスにアクセスするパソコンとインターネット接続環境があれば利用できる(※)。
※利用には「フレッツ 光ネクスト」等やプロバイダーの契約・料金が別途必要

 それでは、実際におまかせAI OCRの手書き文字の読み取りがどのようなものか、検証しよう。

人間が読める文字ならばほぼ間違わない

 おまかせAI OCRを使って複数の人の手書き文字を読み取ってみたのが、下の図だ。サンプルとして読み取った文字が上段に、認識したテキストが下段に表示される。クセ字でも大丈夫そうだ。手書き文字の読み取りが苦手なOCRのイメージとは異なり、正しく読み取りができている。

何人かの文字で住所の入力欄を読み取り。クセ字であってもうまく読み取っている

 

 もちろん、百発百中というわけにはいかなかった。今回のテストの中では、「1泊」の文字を「(三白」と読み取ったところがあった。私たち人間は文脈から「1泊」と読めるが、自然言語解析と組み合わせたAIでも、ちょっと丸い文字は難易度が高かったようだ。

二重線の訂正は反映されているが、「1泊」の文字を「(三白」と認識してしまった

 

 名前や住所、電話番号、数字など、項目ごとに記載される内容を指定できるので、そうした項目ではより正しく認識ができるようだ。下の例のように、住所の指定の欄で実在しない「吉祥寺西町」といった手書き文字を読み取らせると、実在する「吉祥寺本町」という答えを返してくる。書いてある文字そのものを認識するだけでなく、指定した内容に沿った形で正しい答えを探しているのだ。

実在しない住所(吉祥寺西町)が、実在する住所(吉祥寺本町)として認識された

 

複数の行に分かれても、訂正線があってもOK

 帳票や書類では、記入欄の枠が指定されているが、実際に人間が手書きで文字を書いていくと、幅が足りなくなって2行に書き込むケースも少なくない。また、帳票や書類に書かなければならないと思うと、なぜか書きなれた自分の住所でさえ間違えてしまって、慌てて黒く塗りつぶしたり、二重線で消したりする失態を犯しがちだ。

 おまかせAI OCRでは、こうした「手書きのバリエーション」に対し、どのような読み取り結果を示してくれるのか。結論からいうと、テストした限りでは、「書き手の意図をしっかりくんで認識してくれる」だった。

 前ページのサンプルからも分かるように、住所などで改行されていても読み取りに問題はない。二重線による訂正も、読み取り結果に反映された。自由記入欄でも普通に改行されている書き込みは、文章としてきちんとテキストになった。

複数行の自由記入欄でも問題なく認識できている。訂正印にも対応

 

 今回のテストでは、訂正印が押してあるケースでも、問題なくその部分を飛ばして読み取っている。一方で塗りつぶして訂正するケースでは、塗りつぶしが完全ではなく元の文字や数字の形が残って見えてしまうと、文字として認識することもあった。きちんと塗りつぶすか、二重線などで訂正しているのが明らかな方が、より間違いなく認識する。とはいえ、顧客に文字の訂正の仕方までお願いするのは現実的ではないから、うまく訂正できていない読み取り結果があった場合は、手動で修正しても大きな負担ではないと感じた。そもそも、修正する頻度そのものが高くなかった。

書類あるある、FAXで潰れた文字は?

 帳票や書類の内容を情報システムに取り込むときに、いまだにある課題の1つがFAXだ。FAXを繰り返して送られてきた文字は、独特のザラッとした粗さがある。伝送するときに入ったノイズとおぼしき線が入ることもある。これは人間の目で見ても読み取るのに少し苦労する。そんなFAX独特のかすれた文字に対して、おまかせAI OCRはどのぐらい健闘するだろうか。

 下の図を見てほしい。かなり読みにくくなっている文字からの認識だが、おまかせAI OCRはよく認識していると感じないだろうか。住所では、町名までは住所の辞書とマッチングさせて結果を認識したと想像されるだけあって、潰れている文字でも間違いなく読み取っている。同じような潰れ方の文字列でも、建物名など条件による絞り込みがない場合は間違いやすいようだ。

 名前や郵便番号も、判読ギリギリの文字から正しく認識できている。人間がはじめから判読して入力するよりも、一定の誤認識はあってもおまかせAI OCRの結果を修正していく方が作業としては正確で楽だと感じられた。

FAXで3回やり取りして文字が潰れた書類でも、よく読み取っている。この例では「備後町タワー」の文字が「猪後町タワー」と読み取られ、部屋番号でもミスがある。とはいえ、部屋番号は人間の目でも判別しにくいので、おまかせAI OCRを責めるのは酷だろう

 

同じく3回のFAXのやり取りを経た原稿。自由記入欄で少し外してしまった読み取り結果がある

 

 こうして見てくると、おまかせAI OCRの手書き文字の読み取りは、なかなか優秀だといえそうだ。少なくとも、OCRに対して間違いだらけのイメージを持っている方々には、AI OCRは別物ともいえる正確な読み取り性能を持っているのを感じてもらえたのではないだろうか。実際、テストを進めてもなかなか間違った読み取り結果が出てこなくて、全問正解してしまうのではと、逆の心配をしたほどだ。

 おまかせAI OCRを使って手書き文字のある帳票や書類をテキストデータに変換してしまえば、その後の業務処理もソフトウエアロボットのRPAなどにスムーズに渡して効率化できる。貴社の業務にも、確かな目を持ったAI OCRを採用してみてはいかがだろうか。

※掲載している情報は、記事執筆時点のものです

執筆=岩元 直久

【M】

あわせて読みたい記事

連載バックナンバー