トップページ > サービス > スマートOCR

AI-OCRサービス提供形態

OCRエンジン

OCRエンジン

オンプレミス

オンプレミス

クラウド

クラウド

smartocr

ディープラーニング(人工知能)OCRエンジンにより、
非定型の文書(請求書、健診書等)の
データ化(RPA)を実現する



スマートOCR(ディープラーニングOCRエンジン)の特徴

スマートOCRとはAI(人工知能)ディープラーニング技術を用いて、非定型レイアウトの文書(決算書、請求書など)のデータを
汎用的にデータ化(RPA)するOCRエンジンです。 おもに4つの技術から成り立っています。

インフォディオ独自のAI-OCR文字認識エンジン

インフォディオ独自の
AI-OCR 文字認識エンジン

学習用文字画像作成システム、文字切出しシステム(ディープラーニング: GAN) と文字認識システム (ディープラーニング: CNN) を用いた 文字認識エンジンを独自開発(特許出願済)
文字フォント、画質に応じた文字画像学習を行い、文字認識の精度が向上します。
ディープラーニングGANとCNNを用いた文字認識エンジン

インフォディオ独自のAI-ノイズ処理エンジン

インフォディオ独自の
AI-ノイズ処理エンジン

独自開発の敵対的生成ネットワーク(ディープラーニング: GAN)を用いたノイズ除去エンジンを 独自開発(特許出願済)
文書画像の影・歪みのノイズ処理、網掛け文字処理、反転文字処理、塗りつぶし文字処理、罫線処理が可能となりました。 従来のOCRでは不可能であった高度なノイズ処理を実現致しました。
ディープラーニングGANを用いたAIノイズ除去エンジン

非定型レイアウトの処理に対応した自然言語解析・構造化エンジン

非定型レイアウトの処理に対応した
自然言語解析・構造化エンジン

自然言語解析・構造化エンジンの搭載により、認識した文字列に形態素解析、誤認識修正、構造化処理を行います。
構造化処理により作成された構造化ドキュメントをマッピング処理することにより、取得したい文字列をデータ化(RPA)することが可能となります。
非定型帳票のデータ化システム

継続的な機械学習により認識精度向上

継続的な機械学習により
認識精度向上

スマートOCR WEB管理画面にて、OCR変換後のテキストを確認・修正することが可能です。
変換ミスを修正することにより、OCRエンジンを学習させるこにが可能で、OCR認識精度が向上します。
再学習による文字認識率向上

スマートOCRと従来のOCRの比較

スマートOCR 従来の製品
導入容易性
取り込んだ画像を読み取るとすぐに結果が表示
帳票定義(座標)設定が必要
非定型レイアウト対応
非定型文書でもOCR変換可能
非定型文書には対応できない
文字認識
Deep Learning : CNN による文字認識エンジン
従来のベクトル・確率分布等を用いた文字認識エンジン。
再学習
OCR変換後の文字画像を学習させることにより認識率向上
×
精度向上はOCRエンジンのバージョンアップが必要。
ノイズ処理
AI(人工知能)-ノイズ処理エンジンにより学習させることで高度なノイズ除去処理が可能 (スキャニング時の影、網掛け・べた塗り・白抜き文字など)
×
非AI(人工知能)によるノイズ処理
誤認識修正
自然言語解析(形態素解析、N-GRAM) 、辞書登録等による修正
×
辞書登録による修正

特許出願済

ディープラーニングGANとCNNを用いたAI-OCR文字認識エンジン
ディープラーニングGANを用いたノイズ除去エンジン
非定型帳票のデータ化システム

スマートOCRエンジンの内部フロー




①AI(GAN)等を用いた画像前処理

GANの画像復元学習技術を使用して、ノイズ除去、網掛け文字処理、反転文字処理、塗りつぶし文字処理、罫線・点線処といったOCR変換の前処理行います。

AI(GAN)等を用いた画像前処理

②文字切出し・文字認識処理

AI(GAN)等を用いたエリア認識・文字切出し処理、CNN等を用いたAI-OCR認識を行います。

文字切出し・文字認識処理

③自然言語解析による誤認識修正

OCR変換後、文字列を自然言語解析処理(N-GRAM、形態素解析、辞書等)により誤認識修正を行います。

自然言語解析による誤認識修正

④構造化処理

OCRにより文字列に変換されただけでは、データ化(RPA)することが容易ではありません。
枠線、表組み等の位置特性と品詞等の言語特性により、変換した文字列を構造化します。
OCR変換文字列を構造化することにより、データ化(RPA)が容易になります。

構造化処理

構造化ドキュメントとは

ドキュメントは単にOCR変換されてもデータ化(RPA)することはできません。
ドキュメントに階層化特性、品詞・形態素(数値、金額、日付、住所、氏名、会社名、商品名)、位置、類義語などの特性をもたせることにより、必要な項目のデータを抽出することが可能となります。
例えば、”請求金額 (ご請求金額、ご請求額) に論理的に一番近い金額を取り出す”と設定することにより、文書フォーマットが異なった請求書においても、請求金額を抽出するこが可能となります。

構造化ドキュメントとは
smartocr

お客様のご要望に応じたAI-OCRシステムの構築・導入を行います

画面構成

画面構成

テキスト選択



ドキュメント画像の「矩形」を選択すると、スプレッドシートの対応したセルがアクティブ(選択状態)になります。

テキスト選択

OCR認識率表示

OCRの認識率が色分けして表示します。
認識率の低い文字列を確認して、OCR変換ミスを容易に見つけることが可能です。

OCR認識率表示

学習機能

変換ミスがあった場合には、該当箇所のセルをクリックすると「カーソル」が表示され修正可能となります。

学習機能




継続的な機械学習により認識精度向上

スマートOCRシステム等を用いてOCR変換後の誤認識テキストを修正し、 それらを再学習( 文字画像、単語辞書登録)することにより、OCR認識精度が向上していきます。

継続的な機械学習により認識精度向上

Key &Value設定画面

構造化されたデータをクリックして「Key]と「Value」を選択し、関連付けを定義します。

Key &Value設定画面




Key &Value設定画面

取込確認画面

「Key」と「Value」が整ったデータ(cvs)ファイルがスプレッドシート画面に出力されます。

取込確認画面




取込確認画面

データベース連携

「構造化データマッピング画面」にて関連付けを定義したデータが出力され、既存システムへ連携可能となります。





データベース連携

スマートOCRの主な流れ

ご利用の流れ

AI-OCR事例 1

保険証券データ化(RPA) 【開発済】

保険証券カメラはスマートフォンで撮影した保険証券画像をAI(人工知能)ディープラーニング技術を用いたスマートOCRエンジンによりデータ化(RPA)します。
保険証券分析システムとAPI 連携して、保険証券分析を瞬時に行うことが可能となりました。



AI-OCR事例 2

健康保険証データ化(RPA) 【開発済】

保険証スキャンアプリで撮影した健康保険証画像をAI(人工知能)ディープラーニング技術を用いたスマートOCRエンジンによりデータ化(RPA)します。
今まで手入力していた健康保険証データをレセプトシステム等にデータ化(RPA)して登録することができます。



AI-OCR事例 3

開発予定:健診書データ化:カスタマイズ + ライセンス提供

健康診断書を撮影またはスキャニングして、AI(人工知能)ディープラーニング技術を用いたスマートOCRエンジンによりデータ化(RPA)します。
今まで手入力していた健康診断書データをデータベースやエクセルにデータ化(RPA)して登録することができます。



AI-OCR事例 4

開発予定: 請求書等データ化:カスタマイズ+ライセンス提供

請求書を撮影またはスキャニングして、AI(人工知能)ディープラーニング技術を用いたスマートOCRエンジンによりデータ化(RPA)します。
今まで手入力していた請求書データをデータベースやエクセルにデータ化(RPA)して登録することができます。



スマートOCR 導入のフロー

Flow

スマートOCR導入までの最適なプランを提案します

Step1

サンプル帳票検証

お客様からご提供頂いたサンプル帳票で検証を実施し、
OCR変換の検証結果を報告します。
正しく文字認識できない箇所は、原因と対策方法を合わせてご報告します。

Step2

AI-OCRシステム提案(概算見積提示)

お客様の運用要件とサンプル帳票検証結果から最適な
提案(概算見積提示)を行います。

Step3

実証実験(有償)・コンサルティング

お客様と実証実験方法を協議して、実証実験を実施させて頂きます。
実証実験結果からAI-OCRシステムの導入判断をして頂き、
導入AI-OCRシステムの要件(見積提示)を 確定します。

Step4

AI-OCRシステム構築

お客様の導入システム要件に従い、お客様向けのディープラーニングおよび
カスタマイズ開発を行いAI-OCRシステム構築を行います。

Step5

AI-OCRシステム運用・保守

製品紹介パンフレットダウンロード

Down Load

A3見開き(9.29MB)

ダウンロード

A3見開き圧縮(1.70MB )

ダウンロード

A3中綴じ冊子(9.82 MB)

印刷設定は下記設定を参考にしてください。
※プリンターにより設定項目が異なる場合がございます。
■原稿(用紙)サイズ:A3
■印刷の向き:横
■出力用紙サイズ:原稿サイズと同じ
■片面/両面:両面印刷
■とじ方向:短辺とじ(左)

ダウンロード




smartocr pamphlet
※PDFファイルを閲覧・プリント アウトするためには、  Adobe(R) Reader(無料)が必要です。
     

お問合せ

Contact Us

会社名company Name
会社名ふりがなcompany Name Reading
部署名Department Name
名前Your Name
ふりがなName Reading
メールアドレスMail Address
メールアドレス(確認)Mail Address Confirm
郵便番号Postal
郵便番号検索
住所Address
電話番号Phone Number
お問い合わせの種類Inquiry Kind
お問い合わせの内容Mail Contents
個人情報保護方針を確認・同意のうえ、送信してください。

PAGE TOP