JAPAN AIが実現したマルチモーダルRAGの可能性と製造業への影響
JAPAN AI株式会社が新たに実装した「マルチモーダルRAG」は、多様な情報形式を統合的に扱える革新的な技術です。この技術の導入により、特に製造業界における情報管理や技能継承の課題解決に大きな影響を与えることが期待されています。
技術革新の背景
製造業では、熟練技術者が持つノウハウや経験が重要ですが、技術者の退職や異動に伴い、社内に蓄積された貴重な技術資料が効果的に活用されないケースが増えています。長年の経験から生まれた設計図面や作業手順書、品質管理データなどの情報は、時として分散した形で保存され、必要な時に必要な情報にアクセスすることが困難に。
これに対し、JAPAN AIはこれまでもテキスト情報の検索精度を高めてきましたが、視覚的情報に基づくデータの取得に難しさを感じていました。このことから、画像とテキストを融合的に理解するカスタムRAG、いわゆる「マルチモーダルRAG」の開発が進められました。
マルチモーダルRAGの仕組み
「マルチモーダルRAG」では、複数のデータ形式(画像・文書・音声など)を同時に検索し、生成AIがその結果をもとに回答を生成します。従来のテキストだけのRAG対して、今回は画像処理やOCR技術が追加されたことにより、PDF文書内のビジュアルコンテンツからも重要な情報を取得し、洗練された回答を提供することが可能になりました。
例えば、図面やグラフの情報を解析し、それに基づいた精度の高い数値データを自動的に抽出することができるようになりました。
具体的な使用例
図面検索機能
ユーザーがPDFファイルをアップロードすると、システムはまずその内容を解析します。たとえば、「全長50メートル級の船舶の設計図面を探して、その詳細な仕様を教えて」といった具体的なリクエストに応じて、該当する設計図面を迅速に特定し、関連情報を引き出すことが可能です。この技術により、設計者は過去の事例を遡る手間を省き、新たな設計業務の参考資料をスムーズに入手できます。
グラフ理解の具体例
また、グラフの解析機能においても、「2023年第3四半期の売上推移をグラフから知りたい」というリクエストに応えられるレベルまで進化しています。線の動きや軸の数値を解析し、的確に「前年同期比15%増の1,200万円」といった詳細な数値を素早く算出し、簡潔な分析をも提供できます。
今後の展望
今後、JAPAN AIでは過去の設計事例を最大限に活用し、業務改善提案や新製品の見積機能を持つAIエージェントの開発を予定しています。このような進化は、ますます多様化する製造業のニーズに応える力を持ち、業務効率や技術革新を促進する重要な要素となるでしょう。単なる情報検索を超えた知識活用支援システムとして、BUILDTHE FUTUREを掲げる製造業界への貢献を果たしていくことを目指します。
まとめ
JAPAN AIの新しいマルチモーダルRAGは、製造業の技術的課題解決へ向けた重要な一歩です。今後もこの技術の進化に期待し、ジェネレーティブAI活用の可能性を広げていきます。