2024年6月、RPAテクノロジーズ株式会社は、会社統合の上、オープン株式会社へ社名を変更予定です。
 
 
 

BizRobo! ブログRPA関連のお役立ち情報をお届けします

「AI-OCR」とは?活用事例やツール選定のコツ、活用のポイントを解説!

いいね いいね 0
読み込み中...

多くの企業でDX(デジタルトランスフォーメーション)が進められていますが、日々の仕事において書類のデータ化や読み取りの精度に悩まれている方は決して少なくないのではないでしょうか。人の手で直接システムに入力したり、読み取っても結局後から修正したり、負担のかかる業務となっているケースもあるかと思います。

そのような悩みを抱えている方におすすめしたいのが「AI-OCR」です。その名の通り、OCRにAI技術を加えたもので、従来のOCRと比較して文字の認識精度を向上させたものです。今回は、ツール選定のコツや活用のポイントをわかりやすく解説していきます。

ライター紹介

長澤 史佳(ながさわ ふみか)
大学在学中に「ハフポスト日本版」と「Forbes JAPAN」にて記事執筆・編集・翻訳などを経験後、新卒で株式会社PR TIMESに入社し、PRプランナーとして化粧品メーカーや食品メーカーを担当。2022年よりRPAテクノロジーズ株式会社に入社し、コンテンツ企画や広報を手掛ける。

OCRとAI-OCRの違い

OCRとは「Optical Character Recognition / Reader」の略で、日本語に訳すと「光学的文字認識」という意味になります。画像データなどをスキャナやデジタルカメラで読み取り、コンピュータが利用できる文字データに変換する技術のことを指します。

書類をスキャンしてコンピュータ上にPDFとして保存することもできますが、PDFは書類がそのままデータ化されるだけのため、書かれている文字の検索まではできません。OCRを使用すると、スキャンで読み取った画像が文字データに変換されるため、文字を認識・解析するところまで可能となります。

OCR(光学的文字認識)

そして、AI-OCRとは、AI(人工知能)とOCRの読み取り技術を融合させた技術です。AIの特徴であるディープラーニング(※1)により文字の補正結果を学習するため、従来のOCRと比べて文字の認識精度が高くなるのが大きなメリットです。活字だけでなく、手書き文字や罫線被りの文字なども読み取ることが可能です。

また、OCRと比較すると多様なフォーマットの帳票に対応できることもAI-OCRを利用する大きなメリットです。書類の中で読み込む位置や項目をAIが自動抽出できるため、スキャンするだけで文字認識が実現します。さらに、会計システムやRPA(※2)など他ツールとの連携が可能なので、組み合わせて使用することで紙帳票のデータ化からデータ入力集計・出力といった一連の業務のさらなる効率化も期待できます。

AI-OCRについて、詳しくは「OCRとは?OCRの歴史からAI-OCR導入のメリットとデメリットまで徹底解説!」というブログをご用意しておりますので、そちらをご覧ください。

  • ※1 深層学習。データの背景にあるルールやパターンをコンピュータに学ばせる技術のことで、例えばカタカナの「ソ」と「ン」の見分け方などを学習させて認識精度を高めることが可能
  • ※2 ロボティックプロセスオートメーションの略。パソコン上で行う業務をロボットで自動化すること

 

 

「OCRとは?」徹底解説ブログを読む

 

 

3種類のAI-OCRを解説

帳票には、あらかじめレイアウト・フォーマットが決まっている「定型帳票」と、自由で形式が異なる「非定型帳票」があります。定型帳票の例としては自社内で運用しているアンケートや申込書で、非定型帳票の例としては名刺や領収書などレイアウトがそれぞれバラバラなものです。2種類の帳票に伴い、AI-OCRは3種類に分類されるため、順番にご紹介していきます。

3種類のAI-OCRを解説

① 汎用×定型フォーマット型

読み取る帳票の種別は「汎用(書類の種類を限定していない)」ですが、帳票は「定型フォーマット」となるタイプです。あらかじめフォーマットが決まっている定型帳票が対象なため、文字の抽出精度は高くなります。一方で、帳票内の「どこに何か書かれているのか」「該当の文字列が何を表しているのか」などを事前に指定する必要があり、準備に時間がかかる場合があります

さらに、定義されたフォーマットの帳票しか読み取ることができないため、新しい帳票を読み取りたい場合は改めて定義する作業が必要となります。例えば、請求書のフォーマットを定義したら同じ請求書は問題なく読み取れますが、違った帳票を読み取りたい場合は別途フォーマット定義をしなければいけません。

★汎用×定型フォーマット型がおすすめの帳票
フォーマットが統一されている請求書や手書きのアンケートなど、どこに何が書かれているか決まっている帳票

② 汎用×非定型フォーマット型

読み取る帳票の種別は「汎用(書類の種類を限定していない)」で、帳票も「非定型フォーマット」となるタイプです。AIに帳票のフォーマットを学習させることで、人間がいちいち定義せずとも「どこに何が書かれているのか」を抽出できるのがメリットです。

一方で、AIにフォーマットを学習させる必要があるため、帳票をしっかりと読み取れるレベルに至るまでの学習やデータ収集には多くの時間がかかる場合があります。また、新規フォーマットの帳票を読み取りたい場合、AIの学習が十分ではないため読み取りができなかったり、精度が低くなったりすることがあります。

★汎用×非定型フォーマット型がおすすめの帳票
複数の取引先から送られてくる納品書や見積書、名刺など、フォーマットがバラバラだがある程度どこに何が書いてあるのかがわかりやすい帳票

③ 業務特化×非定型フォーマット型

読み取る帳票の種別は「特定種別(請求書や納品書など、特定の帳票に対応する)」で、帳票は「非定型フォーマット」となるタイプです。あらかじめAIにフォーマットを学習させておくことで、人間が学習させなくても多様なフォーマットの帳票を読み取ることができます。また、特定の帳票に対応する業務特化である特性を利用し、AIで仕訳データの抽出から作成までを自動化できるため、会計システムなどとの連携も可能です。

特定の帳票に限定されるというデメリットはあるものの、請求書や納品書などで大量の作業が発生している企業の場合、業務効率化と大きな負担軽減が期待できます。

★業務特化×非定型フォーマット型がおすすめの帳票
自社で発行している納品書や申込書など、フォーマットが定まっている特定の帳票
3種類のAI-OCRを解説

AI-OCR製品 選定のポイント

AI-OCRと一言に言っても、現在は多くの製品が存在しています。自社に合った製品を選ぶには、あらかじめ要件をしっかりと整理しておくことが大切です。下記にポイントをまとめているので、どのような帳票を読み取りたいか一緒に確認していきましょう。

どのような帳票を読み取りたいのか

まずは、どのような帳票を読み取りたいのかをチェックしましょう。基本的に同じレイアウトで作成されている定型帳票なのか、それともバラバラのレイアウトで自由形式の非定型帳票なのかを確認します。その上で、その帳票上の文字列は活字なのか、手書き文字なのかも大切なポイントです。活字の場合は多くの製品にて対応可能ですが、手書き文字の場合は認識精度が低くなってしまうこともあります。

また、主に日本国内でのやり取りのみであれば特に気にする必要はありませんが、海外拠点とのコミュニケーションがあったり、多言語でやり取りしたりするケースがある企業であれば、多言語対応の製品を選びましょう。

どのような帳票を読み取りたいのか事前に整理しないままに製品を選んでしまうと、後から帳票のフォーマット定義に時間がかかってしまったり、認識精度が低く読み取り切れなかったりすることがあります。製品を選んだ後の負担を小さくするためにも、しっかりと確認した上でサービス選定をするのがポイントです。

帳票の仕分け機能は備わっているか

AI-OCRは「この帳票はどんな帳票か(例:請求書なのか、領収書なのか)」を選んでから、読み込ませるのが一般的です。読み込みたい帳票がすでに決まっており、それが1種類の場合であれば特に問題はありません。しかし、帳票の種類が多い場合は事前に人間の手で仕分けなければならず、結局作業が発生してしまうことになります。

そのため、帳票を読み込んだ際、帳票内に含まれているキーワードから自動で仕分けてくれる帳票自動仕分け機能があるととても便利です。読み取りたい帳票の種類が数種類以上ある場合は、仕分け機能が備わっている製品を選ぶのがおすすめです。

確認・修正作業が必要か

AI-OCRの自動読み取り精度は高いものの、どの製品を選んだとしても完璧に正確になることはありません。例えば、請求書で金額の桁が増えてしまっていたり、申込書の連絡先が間違ってしまったりするまま読み込んでしまったら、後々大きな問題になってしまう可能性もあります。重大なリスクを事前に防ぐためにも、読み取った後のデータを確認・修正するという作業は必ず行う必要があります。

しかし、現状は社内でデータの確認・修正をするリソースがない企業もいらっしゃるかと思います。その場合は、読み取り後のデータを確認・修正まで請け負ってくれる製品を選びましょう

想定枚数に対し、コストパフォーマンスは適切か

AI-OCR製品は、枚数で料金が決まるもの、帳票内の項目数で料金が決まるもの、月額での定額料金など、それぞれ課金体系が異なります。そのため、どのくらいの帳票を読み取るのかを事前にシミュレーションした上で、最適な課金体系の製品を選択しましょう

想定枚数を事前に把握せずに導入してしまった場合、使用頻度に見合わない金額になってしまう可能性もあるので要注意です。

基幹システムやRPAと連携が必要か

AI-OCR製品の中には、基幹システムやRPAに組み込むことができるものも存在します。例えば、写真で撮影した領収書データをAI-OCRと連携した経費精算システムにアップロードすると但し書きや金額を自動で取得することができます。読み取ったデータをシステムと連携させたいと検討している場合は、連携できるかどうかもしっかりと確認することが大切です。

AI-OCRで帳票の読み取りを業務効率化してもその後のシステムへの出力などを手動で行っていたとしたら、作業工程は少なくなったとしても負担は残ったままになってしまいます。システム連携までできるかを確認し、業務効率化をより実現しやすくできる条件を揃えましょう

AI-OCRの活用事例

ここまでAI-OCRについて解説してきましたが、実際にどのような現場で使われているのでしょうか。今回は、紙のデータ化が大きな負担となっていた物流会社の活用事例をご紹介します。

鴻池運輸株式会社での活用事例

鴻池運輸株式会社(大阪市中央区)は、140年余の歴史を持つ老舗の物流会社。物流業界ではかねてより人手不足が深刻化しており、鴻池運輸株式会社でも同様の課題を抱えていました。働き手の高齢化や離職率の高さなどから今後さらなる人手不足が見込まれる中で、単純作業を減らして新人の学習環境を整え、習熟を早めることが生産性を維持・向上していくポイントになると考えていたとのことです。

さらに、従来の鴻池運輸株式会社では約3000種類、年300万枚の紙伝票を処理しており、現場の大きな負担となっていました。紙伝票に手書きでの修正が発生することもあり、さらに、システムへの手入力時のミス、目視による照合作業時の間違いや精神的負担など、現場にとって大きな負担となっていました。

そこで、鴻池運輸株式会社のIT部門は、紙ベースの情報を速くかつ正確にデータ化するオンラインサービス「デジパス詳細は下記にて紹介)」を開発。DX支援を目的に新設したシャイン株式会社を通じ、自社内外に提供することを決めました。

実際にデジパスを使いはじめると、従来は営業所で1日約100枚行っていた納品書のデータ入力と確認作業は不要となり、1日あたり最大2時間の余力が創出されました。実際に現場で作業を担ってきた社員は「手書き修正があってもなくても納品書をスキャンするだけ。あとは検品データと一致しない旨のメール通知が来たときに該当箇所を確かめれば済むようになりました」と説明しています。さらに、目を酷使する照合作業が必要なくなるメリット、メンタル面でも負担が軽減されたメリットも強く実感しているとのことです。

鴻池運輸株式会社での活用事例

 

 

鴻池運輸株式会社の事例を詳しく読む

 

 

AI-OCRの導入は、まるごとおまかせできる「デジパス」がおすすめ

デジパス」は、スキャンするだけで書類のデータ化をまるごとおまかせできるサービス。紙帳票をスキャンして送るだけ、最短2時間でデジタル化されたデータをお手元にお戻しします。先述の通り、紙文化でデジタル化が推し進められない、人手不足の中で紙伝票の処理が大きな負担になっている、という悩みを抱えている現場の声から誕生しました。

デジパスの強み

1. スキャンするだけ、最短2時間でお戻し
お客さま側で必要な作業は、対象となる紙帳票をスキャン・アップロードするだけ。スキャンしてデジパス側に送ると、最短2時間でデータ化されたデータが戻ってきます。
2. 手書き文字でも読み取り可能
デジパスは活字だけではなく、手書き文字でも読み取り可能です。さらに、AI-OCRだけだと難しい判断でもデジパスの場合は熟練オペレーターの校正を挟むので、不安定な手書き文字でも安心して任せられます。
3. オペレーターによる校正で安心
前述の通り、デジパスではAI-OCRの読み取り後にそのデータが正しいか、熟練オペレーターが文字校正をし、仮に読み取れていなかった部分がある場合にはその時点で修正します。人と技術のハイブリッドだからこそ、速くて正確なサービスが実現しています。
4. 帳票の仕分けや帳票設計が不要
読み取り対象の帳票仕分けや帳票設計は不要なので、事前準備の手間がかかりません。帳票をスキャンし、アップロードするだけでデータ化されます。
5. 初期費用0円でお手軽に始められる
初期費用がかからないため、安心してスタートできます。月額料金6万円(税抜き)の中で、従量課金5万円分までを無料でご使用いただけます。5万円分を超えた分からは、従量課金として加算されていきます。
AI-OCRの導入は、まるごとおまかせできる「デジパス」がおすすめ
6. 安心のセキュリティ対策
完全国内型のシステム環境やオペレーション体制を取っているため、お客様の大切なデータを安心してお預けいただけるようなセキュリティ対策を整えています。また、オペレーターからお客様の帳票全体が見えないように、帳票は分割してランダムに配信されます。
7. 専用センターへの作業集約で低価格が実現
サービス作業の集約で技術とノウハウを構築することで、大量に利用しても安心な低価格を実現しました。
AI-OCRの導入は、まるごとおまかせできる「デジパス」がおすすめ

 

 

「デジパス」についてもっと詳しく知る

 

 

この記事のまとめ

  • AI-OCRは、AIとOCRの読み取り技術を融合させた技術。AIの特徴であるディープラーニング(深層学習)により文字の補正結果を学習するため、従来のOCRと比較して文字の認識精度が高い。また、手書きの文字列や非定型フォーマット文書の文字認識も可能
  • ニーズによって選ぶべき製品が変わってくるので、あらかじめ要件や文書について整理しておく

デジパス」についてさらに知りたいという方、お問い合わせしてみたいという方はぜひ下記からお気軽にご連絡ください。

デジパス資料請求:https://rpa-technologies.com/inquiry/catalog/?p=digipath
お問い合わせ:https://rpa-technologies.com/inquiry/contact/