日本語のビジネス・自己啓発分野専用音声データセットが登場

Qlean Datasetの新しい音声データセットがリリース

Visual Bank株式会社（東京都港区）は、傘下の株式会社アマナイメージズを通じて、AI開発用の新しいデータソリューション「Qlean Dataset」を提供することを発表しました。このデータセットは、日本語のビジネスや自己啓発、趣味実用テーマに関連する朗読音声とそのトランスクリプト（文字起こし）から構成されており、AI技術のさまざまな活用シーンで役立つことが期待されています。

データセットの内容

Qlean Datasetでは、日本人の話者が一人で朗読した音声が収録されています。特にビジネス書や自己啓発書、実用書の内容に基づく話題が取り上げられており、それにより業務の解説や考え方の整理、手順の説明などが含まれています。このように、知識や概念を言葉で表現するための豊かな文脈が提供されている点が大きな特徴です。

公開されている音声データは長さが30秒から最大160分までで、音声の質も高く、44.1kHzまたは48kHzのサンプリングレートで録音されています。また、音声データはmp3形式で提供され、対応するトランスクリプトはtxt、json、csv形式で用意されているため、さまざまなニーズに応じた利用が可能です。

研究用途の多様性

本データセットの特性は、AI研究や開発においてさまざまに活用できます。たとえば、音声入力を基にした日本語の言語理解モデルの精度を検証するために使用できます。特にビジネスや実用分野の文書を使って内容を理解する精度や、その推論の動きを検証するためのリソースとして役立つでしょう。

また、音声とテキストの対応関係に基づく多様な研究も可能です。例えば、音声表現と文章構造の関連を分析したり、音声情報が言語理解に及ぼす影響を探究したりすることが期待されています。これにより、マルチモーダル研究が進展することが予想されます。

産業用途にも広がる可能性

Qlean Datasetは、業務支援AIの基盤モデル検証にも利用されます。音声入力によって業務知識や手順を理解するAI製品に対して、ビジネス分野の日本語音声を用いて認識と理解の性能を評価できる資源を提供します。さらに、音声から得られた日本語テキストデータを基にしたLLM（大規模言語モデル）のファインチューニングにも利用され、要約や回答生成の質を評価するためのデータとして価値があります。

Qlean Datasetの特長

Qlean Datasetは、商用利用が可能なAI学習用データソリューションとして、音声、テキストなど多種多様なデータを提供しています。視覚的なデータを扱う私たちは、業界特化で最新トレンドを意識したデータラインナップ「AIデータレシピ」を通じて、研究だけでなく商用開発にも対応しています。

データの提供方針として、すべての被写体からの同意を取得し、既存データは最短1日で納品可能です。さらに、特定のニーズに応じたカスタムデータの撮影や収録も行っており、企業が求めるデータ環境を整備しています。

Qlean Datasetは、AI開発現場におけるデータ収集や整備の負担を軽減し、リスクのない法令遵守に基づいたAI開発環境を確立するために貢献しています。これは、AIが社会にさまざまな形で実装される過程において、大きな促進役となることでしょう。

詳しい情報やデータセットの購入については、Qlean Datasetの公式サイトをご覧ください。さらに、AIデータレシピに関する詳細はこちらから確認できます。