MENU

2021.04.29 掲載 2024.04.02 更新

AI-OCRの精度は実際に使えるレベル?試しに手書き書類を読み取ってみました

AI-OCRで手書き文字や印刷文字をデータ化

AI-OCRとRPAシステムサービス

2020年3月に開催したAI-OCRセミナーが予想以上に好評

2020年3月5日(金)、17日(水)と、弊社(FOC)とNTT東日本、芙蓉総合リースの3社で共同開催したセミナー『テレワーク実現に向け、乗り越えるべき障壁「紙の処理」をどう解決するか。その方法とは?─AI-OCR×RPAとBPOの有効活用─』は、AI-OCRとRPA、さらにはアウトソーシングを組み合わせ、どのようにテレワーク、ペーパーレス化を実現するのか、を提案したセミナーでした。
結果としては非常に好評で、参加者も多く、かつセミナー内でも数多くの質問を受け、本テーマの関心の高さをうかがうことができました。
コロナ禍で電子契約や請求書の電子化などデータでのやり取りが増え、以前に比べればテレワーク、ペーパーレス化は進んでいるものの、どうしても紙文書の処理のため出社しなければならない。企業にとっては解決したくてもなかなかできない課題です。
そういった中で本セミナーを介して紙文書のデータ化が注目されていることがわかりました。

AI-OCRとは


そもそもAI-OCRとはどんな技術でしょうか。
旧来からあるOCR(Optical Character Recognition)は、紙文書をスキャンし、文字データに変換する技術で、さらにAI(artificial intelligence:人工知能)技術を組み込み、学習効果により、OCR精度を飛躍的に高めた技術になります。
OCR技術は、一定の条件下でないと正確に読み取れない、読み取れても精度が低いということで一般的な事務業務に活用される技術ではありませんした。
(例えば、名刺のような印刷されているものでも、英語のIを1と読む、住所のハイフンを漢数字の一と読む、文字がつぶれていると読取りすらできない場合がありました)
しかし、AIによりOCRも進化し実用に耐えるほどになり、現在ではAI-OCRの読取り精度は96%以上と言われています。
とはいえ、本当に正確に読み取れるのか、疑問に思っている人はまだまだ多いのではないでしょうか。

AI-OCRの実力は

弊社もセミナーを主催し、「NOC AI-OCR with AI Inside」というサービス提供している手前、本当に高い精度で読み取れるのかテストをしてみました。
まず、以下のような住所変更届のフォーマットを用意しました。
yomitori
試しに以下のように手書きをしてみました。
※筆者のほか、5名ほど同じものを試してもらいました。
※5人は個人情報がそのまま記載されているため手書きの画像は控えさせてもらます。
yomitorigo※住所や電話番号は適当です。

わざと文字に印鑑をかぶせたり、間違いを修正したりしています。
これを複合機でスキャンしPDF化します。
次にAI-OCRで読み取ります。(諸事情で操作画面はお見せできません)
結果、出力されたCSVデータを確認しますと、100%の読取り率でした。同様に弊社社員に協力してもらい10枚程度実施しましたが95%から100%の精度で読取りすることが可能でした。(読取りミスがあったほうが、よりリアルでしたね)
test1
tes2

個人的な感想ですが、想像以上の精度でした。
ちなみにほかの5人の結果、お客様の事例で、読み取れなかったものの代表例としては、
・住所欄で英語の1を7と誤認
・漢字で人の目でも判断するのが難しいほどの字体
・欄からはみ出た文字
でした。
事前の読取り設定で解決できるものもあります。しかし、人の目でも判断しづらいものはAI-OCRでも難しいようです。(学習させていけば読み取れるようになります)

まとめ

弊社はサービス提供する側とはいえ、デメリット的なことは伝えづらいところではありますが、過去のOCR技術の精度を知っている手前、個人的にAI-OCRの精度にも正直なところ疑問を持っていました。
今回のテストやお客様の紙文書の読取り精度を確認しますと、想像以上の精度があり、通常の事務業務で普通に使える技術だと確信することができました。
とはいえ、世間一般的にはまだまだ半信半疑の人は多く、AI-OCRの導入について様子見している人は多いのではないでしょうか。
紙文書の仕様が多種多様で読取りのルール化が難しい、読み取る箇所が沢山ある、指定された欄に手書きされていないなど、まだまだAI-OCRで高い精度で読み取るには難しい紙文書があるのも確かです。
ただ、AI-OCRの強みは学習効果です。読み取らせば読み取らすほど学習し、精度が上がっていきます。同じツールを使用している全国のユーザーの読取り結果が反映されていくのです。
それでも100%の読取り率は難しく最終的に人の目でチェックはまだまだ必要ですが、現時点でも皆さんが考えている以上の精度であることは間違いありません。
全ての紙を記載されている情報をチェックし、それをエクセルやシステムに手作業で入力するよりは各段に楽で効率的です。さらにデータ化された情報を、RPAを活用してシステムに自動入力するような設計を行えばさらに効率的になります。
もう一段階進めると、そもそもの紙文書のスキャンからAI-OCRにかける作業をアウトソーシングすれば、従業員が社内で作業する必要もなくなり、テレワーク化、ペーパーレス化がより現実的になります。
興味のある方は、是非このタイミングでAI-OCRを試してみてください。

2021年6月30日まで無料の読取りキャンペーンを行っています。
https://www.noc-net.co.jp/release/campaign_aiocr_2104

AI-OCRで手書き文字や印刷文字をデータ化

FOCのAI-OCRとRPAを合わせたサービスです。紙からデータ、さらにはシステムへの入力作業をAI-OCRとRPAを活用することで人の手を介在しない自動化を実現します。NOC AI-OCRとNOC RPAを同時にご利用いただくだけでなく個別でのご利用も可能です。

サービスの特徴

  • 社内に存在する「紙書類」のデータ化を実現
  • 手書き書類95%以上の識字率※
  • 初めて使う人でも簡単操作
  • クラウドシステムのため簡単導入に可能

※NTT東日本が2018年8月~9月に3社で行ったAI-OCRサービスのトライアルにおける、申込書・現金通帳(手書き文字を含む20,275文字)の読取精度(正解数/全文字数)の平均です。
※ AI inside 株式会社の文字認識AIを活用

FOCは、30年/1,000社以上のノウハウを活かし、御社のコア業務の生産性向上、バックオフィス部門のコスト削減に貢献します。

AI-OCRとRPAシステムサービスに関する

ご相談・お問い合わせはこちら

03-5275-7137(平日9:00〜17:30)

ライタープロフィール

津久井 基喜

元FOC社員。主にマーケティング担当と営業推進を担当。企業の事業を推進するうえで基盤となる管理部門の方々の価値を高めるための情報発信、提案を行いたいと日々考えている。

津久井 基喜

人事・総務・経理部門の
根本的な解決課題なら

芙蓉アウトソーシング&
コンサルティングへ

03-5275-7137(平日9:00〜17:30)

MAIL MAGAZINE

メールマガジンで
役立つ情報をお届けしています

人事・総務・経理の課題解決メールマガジンを定期的に配信しています。
お気軽にご登録ください。

SERVICE

私たちは、お客様の
問題・課題を解決するための
アウトソーシングサービスを
提供しています

30年にわたり1,000社の人事・総務・経理など管理部門に対してコスト削減、業務効率化の支援をしてきたFOCだからこそできる、ソリューションをご提供します。
アウトソーシング・BPOの枠を超え、クライアントの本質的な課題解決のために、最適なサービスを提供します。