ビジネスWi-Fiで会社改造(第44回)
ビジネスWi-Fiで"学び"が進化する
手書きの書類や帳票、無くしたくてもなかなか無くならないのが企業や組織の実情だ。手書きの文字を読み取って、Excelのシートや業務システムのフォームに入力する作業は、1つひとつに神経を使う上に、繰り返しの作業で疲労も重なる。
そこでBiz Clip編集部では、NTT西日本が提供するAI OCRサービスの「おまかせAI OCR with DX Suite(以下、おまかせAI OCR)」を例に、その使い勝手と読み取り能力を実体験してレポートしたい。おまかせAI OCRは、AI OCRの代表的なサービスであるAI insideの「DX Suite」をベースに、NTT西日本が提供する、中小企業での利用も想定した導入しやすく使いやすいサービスだ。「AIなんて難しそう」と感じる中小企業の経営者や担当者の方にも、実際に導入したときのイメージをつかんでいただけると思う。
今回は、おまかせAI OCRの使い勝手をチェックする。おまかせAI OCRは、クラウド型のサービスとして提供され、ユーザー側に特別な設備や機器は必要ない。手元の複合機で書類をPDFファイルなどの画像データにでき、クラウド型のサービスにアクセスできるパソコンとインターネット接続環境があれば大丈夫(※)。画像データをクラウドに送ると、文字を認識してテキストデータとして戻してくれる。
※利用には「フレッツ 光ネクスト」等やプロバイダーの契約・料金が別途必要
おまかせAI OCRは、ブラウザーベースの操作画面を使って、簡単なマウス操作を中心にして手軽に使えるサービス。実際の操作の流れは5つのステップに分かれる。その5つとは、「アップロード」「読み取りモデル設定」「テキスト読み取り」「変換チェック」「ダウンロード」。難しいAIの用語は出てこない。
おまかせAI OCRの読み取り操作における5つのステップ
業務でさまざまな帳票や書類を読み取るには、事前に「アップロード」と「読み取りモデル設定」のステップで、帳票や書類を登録する。帳票や書類の「どの部分を、どのように読み取るのか」をあらかじめ設定。そのために、登録したい帳票や書類をスキャナーで読み取って画像データにしてアップロードし、おまかせAI OCRの操作画面上で帳票や書類の中から文字認識する枠や文字種別を定める読み取りモデル設定をする。
読み取りモデル設定が終わったら、実際に帳票や書類の手書き文字を読み取る作業に移る。ここでも、読み取る帳票や書類の画像データをアップロードするステップは欠かせない。次の「テキストの読み取り」のステップで、AIが手書き文字を読み取る。そして、読み取った結果が間違っていないかを確認する「変換チェック」のステップを経て、最終的な読み取り結果をテキストデータとして「ダウンロード」する手順だ。
それでは、実際の操作を画面のデータを見ながら確認していこう。
おまかせAI OCRを使うときの最初のステップが、アップロード。これはあらかじめ行う読み取りモデル設定でも、本番のテキストの読み取りでも、同じく必要なステップだ。
まず、ユーザー側で準備するスキャナー機能を持つ装置で、帳票や書類を画像データのファイルにして保存。その後、おまかせAI OCRのサービスにログインして、「Intelligent OCR」のメニューを開く。
ここで読み取りモデル設定用アップロードのため、左右3分割された画面中央のフィールドの「+」マークをクリックして開く画面から、指示に従って画像データのファイルを選び実行する。
まず読み取りモデル設定するためベースとなる帳票や書類をアップロード
アップロードが終わると、帳票や書類のイメージが画面に表示される。この中から、おまかせAI OCRで文字を読み取りたい部分を指定する作業が読み取りモデル設定だ。操作は、マウスで読み取りたい部分に枠を指定して、右側のフィールドで最終的にダウンロードするときのCSV形式のファイルの「CSVヘッダー名」(項目の名称)の指定や、住所や電話番号、日付、または指定なし(すべての文字)で認識する「読取条件の指定」を行う。複数の読み取り枠があったら、この作業を繰り返していけばOKだ。
読み込んだ帳票や書類にマウスで読み取り枠を設定。読み取り条件の指定や読み取りテストの実行も可能
読み取りモデル設定のためにアップロードした帳票や書類に手書き文字があれば、実際に読み取れるかどうかを「読取テスト」のボタンで確認できる。サンプルで記入した手書き文字は、読取テストの段階で間違いなく認識され、直感的には認識精度がかなり高いと感じた。
枠の指定が終わったら「保存」のボタンをクリックして、読み取りモデルの設定が完了する。
複数の読み取り枠を指定して、読み取りモデルの設定を完了
次に、本番の帳票や書類の読み取りに挑戦する。おまかせAI OCRでは、クラウド側に文字認識エンジンが用意され、ユーザー側でAIに文字の学習をさせる必要はない。帳票や書類の読み取り枠の設定さえ済んでしまえば、すぐに本番の読み取りが可能なのだ。このように迅速に利用を始められるところも、クラウド型のサービスを使うメリットだ。
本番で読み取らせる帳票や書類も、設定時と同様にスキャナー機能で画像データのファイルにしておく。
今度は、画面右側のフィールドで「+」を選び、「ドキュメントを読み取る」の画面でファイルを指定。指示に従って「読取開始」のボタンを押せば、あとは自動的にクラウド上のエンジンが文字を認識していく。読み取りの進捗が画面上に示され、「読取完了」と表示されれば、テキスト読み取りのステップが終了となる。
読み取りのステップが完了したことを示す画面。次に「エントリー」のボタンをクリックする
次に操作画面の「エントリー」ボタンを押して、変換が正しく行われたかを確認する「変換チェック」のステップに進む。画面には、CSVヘッダー名として指定した項目ごとに、アップロードした画像データの手書き文字と、読み取り結果が上下に並べて示される。比較して間違いがなければOKだし、もしも読み取りに間違いがあったら下段のテキストデータを修正。画面上で手書き文字と読み取り結果が対応して表示されるので、読み取りのチェックは簡単だ。
帳票や書類上の手書きの文字と、おまかせAI OCRの読み取り結果が並んで表示されるエントリー画面。読み取りに間違いがあれば簡単に修正できる
すべて完了したら、「次へ」のボタンをクリックし、ホーム画面に戻る。ここで、「CSVダウンロード」を選ぶと、最後のステップの「ダウンロード」が実行される。ダウンロードしたファイルをExcelで開いてみると、読み取った文字が項目名ごとに並んでいるのが分かる。
CSV形式のファイルでデータをダウンロード。Excelで開くと、このように読み取り結果のデータが並ぶ
設定から読み取りまで、おまかせAI OCRの操作には高度なITの知識を必要としないのがお分かりいただけただろうか。パソコンでブラウザーを使ってフォームに文字入力できるぐらいのスキルがあれば、誰でもAIを使ったOCRで手書き文字を苦労せずに読み取ってテキストデータにできる。引き続き次回は、手書きの文字をどの程度認識してくれるのか、AI OCRの文字読み取りの体験をレポートする。
※掲載している情報は、記事執筆時点のものです
執筆=岩元 直久
【M】