NABLAS株式会社が「NABLA-VL」を発表
AI技術の先端を行くNABLAS株式会社が、150億パラメーターを誇る新しい大規模視覚言語モデル「NABLA-VL」を一般公開した。これは経済産業省とNEDOが推進する「GENIAC(Generative AI Accelerator Challenge)」プロジェクトの一環として開発された渾身の作品である。
このモデルは、日本語と英語の両方に対応できる高精度なバイリンガル機能を持ち、テキスト・画像・動画などの多様な情報を理解する能力を有している。特に、研究や産業用途での利用に最適化されており、様々な場面での利用が期待されている。
良好な性能を発揮
「NABLA-VL」は、視覚トークンを87.5%圧縮するトークン削減手法を導入することで、学習時間を約50%、推論時間を約23%短縮し、コストや開発時間を大幅に削減することに成功した。この技術革新により、基盤となるモデルの信頼性が一層高まっている。
公開にあたって、国内の主要なベンチマークにおいて、他の国産モデルを上回る優れた性能を達成していることも強調されている。特に英語の分野では、数々の評価項目で国内トップのスコアを記録した。
オープンソースの利便性
NABLA-VLはオープンソースとしてリリースされており、研究者や開発者が容易に利用できるように設計されている。このモデルのソースコードはHugging Faceで確認可能で、技術的な詳細は同社の技術ブログにも掲載されている。これにより、さまざまな開発者や研究者がこの技術を手軽に試し、応用できる環境が整っている。
モデルの詳細と今後の展望
モデルの性能は、複数のベンチマークを通じて評価されており、例えば、JDocQAやMulIm-VQAといったテストでも優れた結果を出している。特にJMMMUでは優れたスコアを記録し、その実力を証明している。また、OpenAIのgpt-4o-2024-11-20と比較すると、いくつかのベンチマークにおいてこれを上回る結果が出ているのも注目すべき点である。
NABLAS株式会社は、これからも基盤モデルの研究開発を進め、視覚と言語の融合に向けた新しい技術の実装を目指すとともに、軽量化やリアルタイム推論の実現に積極的に取り組む意向を示している。
NABLAS株式会社の概要
NABLASは、東京大学発のベンチャー企業であり、AIによる人材教育やコンサルティングサービスを提供している。最新のAI技術、特にディープラーニングに基づいたソリューションを展開し、次世代の技術を創造することを目指している。企業の成長に必要な技術やサービスを提供し、「Discover the gradients, Towards the future」という理念の下、未来社会を支える役割を果たしていく。
NABLASについての詳細情報は、公式ウェブサイト(
NABLAS株式会社)で確認することができる。さらに、NABLA-VLに関するお問い合わせも、会社の公式フォームを通じて受け付けている。