AI-OCRの精度は実際に使えるレベル?試しに手書き書類を読み取ってみました

2020年3月に開催したAI-OCRセミナーが予想以上に好評

 

2020年3月5日(金)、17日(水)と、弊社(NOC)とNTT東日本、芙蓉総合リースの3社で共同開催したセミナー『テレワーク実現に向け、乗り越えるべき障壁「紙の処理」をどう解決するか。その方法とは?─AI-OCR×RPAとBPOの有効活用─』は、AI-OCRとRPA、さらにはアウトソーシングを組み合わせ、どのようにテレワーク、ペーパーレス化を実現するのか、を提案したセミナーでした。

結果としては非常に好評で、参加者も多く、かつセミナー内でも数多くの質問を受け、本テーマの関心の高さをうかがうことができました。

コロナ禍で電子契約や請求書の電子化などデータでのやり取りが増え、以前に比べればテレワーク、ペーパーレス化は進んでいるものの、どうしても紙文書の処理のため出社しなければならない。企業にとっては解決したくてもなかなかできない課題です。

そういった中で本セミナーを介して紙文書のデータ化が注目されていることがわかりました。

 

AI-OCRとは

そもそもAI-OCRとはどんな技術でしょうか。

旧来からあるOCR(Optical Character Recognition)は、紙文書をスキャンし、文字データに変換する技術で、さらにAI(artificial intelligence:人工知能)技術を組み込み、学習効果により、OCR精度を飛躍的に高めた技術になります。

OCR技術は、一定の条件下でないと正確に読み取れない、読み取れても精度が低いということで一般的な事務業務に活用される技術ではありませんした。
(例えば、名刺のような印刷されているものでも、英語のIを1と読む、住所のハイフンを漢数字の一と読む、文字がつぶれていると読取りすらできない場合がありました)

しかし、AIによりOCRも進化し実用に耐えるほどになり、現在ではAI-OCRの読取り精度は96%以上と言われています。

とはいえ、本当に正確に読み取れるのか、疑問に思っている人はまだまだ多いのではないでしょうか。

 

AI-OCRの実力は

弊社もセミナーを主催し、「NOC AI-OCR with AI Inside」というサービス提供している手前、本当に高い精度で読み取れるのかテストをしてみました。

まず、以下のような住所変更届のフォーマットを用意しました。

yomitori

試しに以下のように手書きをしてみました。
※筆者のほか、5名ほど同じものを試してもらいました。
※5人は個人情報がそのまま記載されているため手書きの画像は控えさせてもらます。

yomitorigo※住所や電話番号は適当です。

 

わざと文字に印鑑をかぶせたり、間違いを修正したりしています。

これを複合機でスキャンしPDF化します。

次にAI-OCRで読み取ります。(諸事情で操作画面はお見せできません)

結果、出力されたCSVデータを確認しますと、100%の読取り率でした。同様に弊社社員に協力してもらい10枚程度実施しましたが95%から100%の精度で読取りすることが可能でした。(読取りミスがあったほうが、よりリアルでしたね)

test1

tes2

 

個人的な感想ですが、想像以上の精度でした。

ちなみにほかの5人の結果、お客様の事例で、読み取れなかったものの代表例としては、

・住所欄で英語の1を7と誤認
・漢字で人の目でも判断するのが難しいほどの字体
・欄からはみ出た文字

でした。

事前の読取り設定で解決できるものもあります。しかし、人の目でも判断しづらいものはAI-OCRでも難しいようです。(学習させていけば読み取れるようになります)

 

まとめ

弊社はサービス提供する側とはいえ、デメリット的なことは伝えづらいところではありますが、過去のOCR技術の精度を知っている手前、個人的にAI-OCRの精度にも正直なところ疑問を持っていました。

今回のテストやお客様の紙文書の読取り精度を確認しますと、想像以上の精度があり、通常の事務業務で普通に使える技術だと確信することができました。

とはいえ、世間一般的にはまだまだ半信半疑の人は多く、AI-OCRの導入について様子見している人は多いのではないでしょうか。

紙文書の仕様が多種多様で読取りのルール化が難しい、読み取る箇所が沢山ある、指定された欄に手書きされていないなど、まだまだAI-OCRで高い精度で読み取るには難しい紙文書があるのも確かです。

ただ、AI-OCRの強みは学習効果です。読み取らせば読み取らすほど学習し、精度が上がっていきます。同じツールを使用している全国のユーザーの読取り結果が反映されていくのです。

それでも100%の読取り率は難しく最終的に人の目でチェックはまだまだ必要ですが、現時点でも皆さんが考えている以上の精度であることは間違いありません。

全ての紙を記載されている情報をチェックし、それをエクセルやシステムに手作業で入力するよりは各段に楽で効率的です。さらにデータ化された情報を、RPAを活用してシステムに自動入力するような設計を行えばさらに効率的になります。

もう一段階進めると、そもそもの紙文書のスキャンからAI-OCRにかける作業をアウトソーシングすれば、従業員が社内で作業する必要もなくなり、テレワーク化、ペーパーレス化がより現実的になります。

興味のある方は、是非このタイミングでAI-OCRを試してみてください。

 

2021年6月30日まで無料の読取りキャンペーンを行っています。

https://www.noc-net.co.jp/release/campaign_aiocr_2104

 

 

ライタープロフィール

津久井 基喜

津久井 基喜

営業推進部副部長。NOCのマーケティング責任者および問合せ全件を管理する。アウトソーシングだけではなく、企業の事業を推進するうえで基盤となる管理部門の方々の価値を高めるための情報発信、提案を行いたいと日々考えている。

関連シリーズを見る

関連記事