ネットスマイル、生成AI-OCRの特許取得
生成AIを駆使したDX事業を展開するネットスマイル株式会社(本社:東京都文京区)は、2025年9月5日に生成AIによる文書画像処理システムに関する特許を取得しました。この特許技術は、同社の提供する生成AI-OCR「なんでも読めるくん®」に搭載され、従来のOCRでは解決が難しかった様々な帳票を高精度でデータ化することを可能にします。
特許の概要
取得された特許(特許第7738872号)の名称は「文書画像処理システム」であり、この技術によって生成AI-OCRの機能が大幅に進化しました。特に、近年の生成AI技術の進展により、さまざまな文書画像を正確に読み取る精度の向上が期待されています。
背景と課題解決
AI-OCR技術において生成AIの利用が進む中で、一つの大きな課題として「ハルシネーション」、つまり誤った情報生成が問題視されていました。特に、請求書や見積書など、書式の固定されていない文書に対しては、抽出精度が不十分な場合が多く見受けられました。今回の特許技術は、そのような課題を根本的に解決し、信頼性のある文字認識を実現します。
発明の特徴
1. 二重のOCR処理と検証
この技術では、文書画像を読み取る際にローカルOCRと生成AI-OCRの2つの方法を用い、両者の結果を比較・検証することで高精度な文字認識を行います。ローカルOCRが読み取ったデータと生成AIからの結果が一致するか確認し、正当性が認められた場合にのみ生成AIの結果を採用します。
2. 精度向上のフィードバック機能
誤りが判定された場合は、ローカルOCRの結果を用いて追加のプロンプトを生成AIに送付し、さらに精度を向上させるためのフィードバックを行います。これにより、生成AIがより多くの情報を得て、精度を高めることができます。
3. 位置情報の特定
ローカルOCRはテキストの座標情報を特定し、生成AIの結果を文書上の正しい位置と関連付けます。これが、高い精度の文書データ化を支える要素となります。
4. 複数の生成AIモデルの活用
複数の生成AIモデルを並行して利用し、得られた結果を統合することで、単一モデルの欠点を補い、高い信頼性のある結果を獲得することが可能です。
期待される導入効果
この特許技術により、ネットスマイルの「なんでも読めるくん®」は多様な業務シーンでの活用が期待されます。特に請求書処理や契約書の管理、各種申込書のデータ化においては、処理工数の削減や人手による確認作業の軽減が見込まれています。これにより企業の業務の自動化が進み、効率化が実現されるでしょう。
生成AI-OCR「なんでも読めるくん®」の特長
この次世代OCRサービスは、2025年4月にスタートしました。特長として、テンプレート不要で自動的に情報を抽出できること、かすれた手書きや複雑なレイアウトにも対応できること、そして文脈理解に基づいた要約や情報生成が可能な点が挙げられます。
ネットスマイル株式会社について
ネットスマイル株式会社は、2013年に設立され、東京都文京区に本社を構えています。代表取締役は齊藤福光氏であり、生成AI-OCRやDXソリューションを中心に業務を展開しています。企業や業界のニーズに応じたカスタマイズが可能であり、より良い文書処理ソリューションの提供が期待されています。ネットスマイルの最新技術により、企業のデジタルトランスフォーメーションが加速していくことが予想されます。