AI-OCRとは
AI-OCRとは、AIを活用して文字認識精度を向上させた光学的文字認識技術のことです。従来のOCR技術にAI(人工知能)を組み合わせることで、これまで機械での読み取りが難しかった手書き文字や不具合のある文字を高精度で認識できるようになりました。
AI-OCRとOCRの違い
従来のOCRは、画像処理技術とパターンマッチングに依存し、特定のルールベースで文字を認識していました。そのため、手書きや非定型フォーマットの文字認識に弱く、ノイズや汚れの影響を受けやすいという課題がありました。
この課題を克服したのがAI-OCRです。スキャナーやカメラで取得した画像からノイズやゆがみを除去し、画像内の文字を特定し、ディープラーニングを活用したAIモデルで文字データに変換します。
AIを活用することで、従来のルールベースの方法と比較して、認識精度が飛躍的に向上しました。
AI-OCRの導入メリット
従来型のOCRではなく、AI-OCRを導入することのメリットは、主に次の3つが挙げられます。
1.高い文字の認識精度
AI-OCRは、AIのディープラーニングを活用して膨大な文字データを学習しています。手書き文字や異なるフォントタイプの文字など、多様な文字データを学習することで、従来のパターンマッチングを用いたOCRと比較して、認識精度が大幅に向上しています。
2.多種多様なフォーマットの帳票に対応
AI-OCRは、膨大な文字データとさまざまな帳票フォーマットを学習しています。これにより、定型フォーマットでない帳票でも、特定の項目名やレベルを自動認識し、それに基づいて関連する値を抽出することが可能です。
3.RPAなどの業務システムとの連携でさらに業務効率が上がる
高い文字認識精度と非定型フォーマットへの対応力を活用し、RPAなどの業務システムと連携することで、業務プロセス全体の自動化が可能になります。RPAとAI-OCRを組み合わせることで、紙帳票からデータを抽出し、データ入力、集計・加工、出力といった一連の業務プロセスを自動化します。人間の作業はプロセスの要所でのチェックや、読み取りエラーの修正に限られるため、業務効率が大幅に向上します。また、RPAで何ができるか詳しく知りたい方は以下をご覧ください。
AI-OCRの種類
AI-OCRの種類には以下が挙げられます。
1.汎用×定型フォーマット型
汎用×定型フォーマット型は、「汎用」タイプでフォーマットが「定型」となる帳票を指します。定型フォーマットを使用することで、文字の抽出や認識の精度が向上しますが、フォーマットの定義は人間が行う必要があります。
2.汎用×非定型フォーマット型
汎用×非定型フォーマット型は、「汎用」タイプでフォーマットが「非定型」となる帳票を指します。非定型フォーマットの場合、AIがフォーマットを学習することが前提となり、人間がフォーマットを定義する必要がありません。しかし、機械学習に時間がかかることや、読み取り精度が低くなる可能性がある点がデメリットです。
3.業務特化×非定型フォーマット型
業務特化×非定型フォーマット型は、「業務特化」タイプでフォーマットが「非定型」となる帳票を指します。請求書や納品書といった特定の帳票に限定されますが、AIがすでに学習済みであるため、フォーマットを教える手間が軽減されます。
AI-OCRの選定ポイント
現在、さまざまなAI-OCR製品がありますが、その中から最適な製品を選ぶための選定ポイントとして、以下の3つを挙げることができます。
1.読み取り精度の高さ
AI-OCRは従来のOCRと比べて、読み取り精度が非常に高いことが特徴です。しかし、製品によって精度に違いがあるため、より高精度な読み取りが可能な製品を選ぶことが重要です。
たとえば、住所部分では、2行にわたる折り返しでも高精度で読み取れることや、文字が枠を超えて一部欠けていても自動補完できる機能を持つAI-OCRは、業務効率を大幅に向上させます。また、訂正印を正しく認識して読み飛ばすことができることも重要です。さらに、チェックボックスや縦書きに対応しているかどうかも、AI-OCRを選定する際の重要なポイントです。
2.ユーザーが使いやすいか
見やすいUIで直感的に操作できるかどうかは、AI-OCR選定の重要なポイントです。フォーマットの設定や読み取りたい項目の設定は、AI-OCRを活用するための基本的な準備であり、どれだけ使いやすいユーザビリティを備えているかは、選定時の重要な基準となります。
3.費用対効果が見込めるか
どんなに読み取り精度が高く、ユーザビリティが優れていても、導入・運用に大きなコストがかかり、それに見合う効果が得られないのであれば意味がありません。そのため、AI-OCRを導入する際には、費用対効果を正確に評価することが重要です。
AI-OCRを導入して業務効率化させた成功例
AI-OCRを導入し、業務効率化に成功した事例を紹介します。
1.ミルシートの自動集計(建設業)
建設現場では、使用する鋼材の寸法や本数、重量などを記載したミルシート(鋼材検査証明書)を受領し、エクセルで集計する必要があります。しかし、納入業者ごとにミルシートのフォーマットが異なるため、集計作業は非常に複雑でした。
AI-OCRを活用し、文書仕分けソフトやRPAを併用することで、ミルシートの集計作業にかかる手間を80%削減することに成功しました。
受領したミルシートをスキャンしてPDF化し、仕分けソフトで帳票タイプごとに分類し、AI-OCRでテキストデータ化します。その結果をRPAでCSVデータとして自動ダウンロードし、指定のエクセルフォーマットで集計するまでを自動化しました。
これにより、人が関与するのは最初のスキャニング作業と、AI-OCRでテキスト化したデータの確認作業だけとなりました。
2.原材料の検査成績書システム登録自動化(製造業)
ある製造業の本社では、自社工場や委託工場から送られてくる検査成績表をシステムに登録する業務を行っていました。この会社では、検査成績表以外にも多種多様な帳票を扱い、1日あたり10社から約300件の帳票を受け取っていました。これらの帳票は、事務担当者がスキャンしてPDF化し、データ入力、確認、基幹システムへの登録をすべて手作業で行っていました。
そこで、AI-OCRや帳票仕分けソフト、RPAを活用することで、これらの業務を大幅に効率化することに成功しました。
各工場から送られてくる原材料の検査成績書などの帳票をスキャンしてPDF化します。次に、これらのPDFデータを帳票仕分けソフトで分類し、AI-OCRでデータを読み込み、CSVデータに変換して集計します。さらに、集計結果を基幹システムに取り込むまでの一連のプロセスをRPAで自動化しました。
この事例では、結果として年間で1,560時間もの作業時間を短縮することができました。
3.500種類の納品書登録(卸売業)
ある卸売業者では、多様な取引先から500種類の納品書をシステムに登録する業務を行っていました。これらの納品書をフォーマットタイプごとに仕分けし、手動でデータ化して基幹システムに取り込む作業は非常に手間がかかっていました。
このプロセスをAI-OCR、帳票仕分けソフト、RPAを活用して自動化することで、業務効率化に成功しました。
取引先から届く納品書を帳票仕分けソフトで分類し、AI-OCRでデータを読み込み、CSVデータに変換した後、RPAで基幹システムに取り込む一連のプロセスを自動化しました。
圧倒的な認識精度を誇るAI-OCR「DX Suite」
丸紅情報システムズでは、30年以上のOCRソリューション提供の実績を持ち、高精度の「DX Suite」を中心に、お客様の特定のニーズに応じた最適なOCRソリューションを提案しています。DX Suiteは、2行折り返し住所や、欄外にはみ出した文字の自動補完、チェックボックスや縦書きの文字認識において、業界最高水準の精度を誇ります。
また、ユーザビリティの高さも特徴で、簡単な操作で読み取り設定が可能です。さらに、非定型帳票への対応力があり、APIやRPAとのスムーズな連携が可能です。これにより、業務自動化への柔軟な対応が可能となります。
丸紅情報システムズは、ペーパーレスソリューション「MAI-Preparator」とDX Suiteを組み合わせることで、迅速な帳票仕分けとデータ変換を実現し、業務の効率化を図ります。さらに、RPAツール「WinActor」を活用することで、業務プロセスの大部分を自動化し、企業の生産性向上を加速します。
AI-OCRソリューションを基盤に、関連ソリューションを柔軟に組み合わせることで、企業の業務自動化を推進し、効率的な業務運営を実現します。
DX Suite お役立ち資料
本記事に関連する資料をダウンロードいただけます。