2024.5.20
人名等の誤り率を30%改善、新音声認識エンジンを自社開発
日本語特有の課題に挑戦、AIボイスボット「commubo」に6月末搭載予定
株式会社ソフトフロントホールディングス(本社:東京都千代田区、代表取締役社長:二通宏久)は、この度新しい音声認識エンジンを自社開発し、子会社である株式会社ソフトフロントジャパン(本社:東京都千代田区、代表取締役社長:髙須英司、以下 ソフトフロントジャパン)が提供する、自然会話 AI ボイスボット「commubo(コミュボ)」に6月末より搭載することを発表します。
End-to-End方式という新しい技術を採用しつつ、リアルタイム性を維持した新エンジンでは、従来のエンジンと比較し、人名・住所・短文の平均誤り率が30%以上改善されました(当社比)。これにより、今までボイスボットでは対応が難しいとされていた業務への拡大が期待されます。
■開発の背景
ボイスボットで最も重要となる「お客様が発話する内容の正確な認識」のため、commubo では、お客様自身で編集可能な「音声認識辞書機能」や、会話の場面に応じて動的に認識辞書を切り替える「シーンセレクタ機能」を提供し、優れた会話業務を実現してきました。
しかしながら、2018年10月のcommubo 販売開始以降、ボイスボットがさまざまな業界、業種、業務で導入され始め、応対するお客様の層が増えるに従って、改めて音声認識精度の限界がボイスボットの応対クオリティを左右する課題として浮かび上がっています。
ソフトフロントは、音声のリアルタイム処理技術という自社の強みを活かし、「自然に会話でき、業務利用に耐えうるボイスボット」というcommuboの思想に沿って、この課題を解決すべく、新音声認識エンジンの開発に取り組んできました。
■新技術の「End-to-End 方式」を採用しつつ、日本語特有の“読み”の課題に対応
これまでの commubo では、実績の優れた DNN-HMM方式 (ディープニューラルネットワーク・隠れマルコフモデル) による音声認識技術を用い、高速な日本語音声認識処理を行ってきました。
一方で、ここ数年において、世の中に新たな音声認識技術として「End-to-End方式」が登場し、更にLLM (大規模言語モデル) と組み合わせることによって、優れた音声認識精度が実現できるようになりました。
このEnd-to-End方式は、音声とテキストを直接学習させたAI処理を行うことが特徴ですが、一方で「表音文字」 (ひらがなやカタカナ、アルファベットなど) と「表意文字」 (漢字) が組み合わされる日本語特有の言語処理に対応できないことが課題でした。
ソフトフロントホールディングスでは、日本語LLMによるEnd-to-End方式の音声認識エンジンの研究に取り組み、この度、この日本語特有の課題である、言語処理に対応した音声認識エンジンの開発に成功しました。
■従来の音声認識エンジンと比較し、人名・住所・短文において誤り率が30%以上改善
従来のエンジンと新エンジンを比較した自社性能評価の結果、新エンジンでは平均誤り率が大幅に改善されました。特に「人名」「住所」「短文」の3シーンで、30%以上の誤り率改善※を確認できています。
※当社比、自社性能評価結果より
■ボイスボットへの搭載にあたり、自社の技術力を活かし、自然な会話を実現
さらに、新エンジンをボイスボットに搭載するにあたり、電話応対業務にスムーズに対応すべく、下記の自社技術を活かした自然な会話を実現しています。
- ●日本語特有の「よみ」を同時出力する技術
音声認識の「東」という出力とともに、実際の発話が「あずま」か「ひがし」を出力し、ボイスボットが正しくお客様に復唱。 - ●膨大な演算量を軽量化し、リアルタイム性を実現する技術
日本語言語処理を組み合わせたLLM/End-to-End音声認識によって膨大となった演算量を、軽量化し、ボイスボットがスムーズに会話するリアルタイム性を実現。 - ●呼量に応じて、サーバー装置を動的にスケーラブルする技術
高価な演算装置 (GPU) を必要とする新エンジンのサーバーを、呼量に応じて動的に増減させ、低価格で提供。
従来のエンジンと新エンジンの比較はこちらの動画もご覧ください。
また、近日中に体験デモを公開予定です。
■ボイスボットのより幅広い業務への展開や、生成AIと連動した高度な業務支援を促進
誤り率が改善し会話データのテキスト化精度が上がると、ボイスボットが聴取した音声を人が確認して補正するような手間が大幅に少なくなり、「住所」や「状況説明」などの聴収業務の生産性が大きく向上します。また、ボイスボットで聴収できるデータの種類が増えることで、「介護」や「教育」といった業務への対応や、会話データの二次活用など、ボイスボットが適用できる業務の幅が広がります。
さらに、昨今関心が高まっている、会話内容の要約・分析などの生成AIの活用においては、正しい発話内容の認識が前提となっているため、今回の音声認識精度の向上によって、より高度な業務支援にもつながります。
ソフトフロントジャパンは、今後も自然な対話ができるボイスボットを極めていき、電話応対業務の効率化や、電話を通じた顧客体験向上に貢献して参ります。
新エンジンは2024年6月末にcommuboに搭載予定。新エンジンの新たな情報は今後もプレスリリース等で案内を予定しております。本リリースに関する取材等はお気軽にお問合せください。
■自然会話AIボイスボット「commubo(コミュボ)」について
「commubo」は「継続的で」「複雑な」音声の会話に対応する自然会話AIボイスボットです。
自然な会話の高速AI、Webからの簡単操作、システム連携など、自動化や効率化のための機能性だけでなく、導入企業ごとに異なる業務体制や業務フローに最適にフィットする柔軟性を兼ね備えています。
これまでコンタクトセンター業務を中心に、あふれ呼対策や注文受付、予約受付、督促業務など、受電業務・架電業務を問わず、様々な業界において電話業務の効率化や生産性向上を支援しています。
https://commubo.com
■株式会社ソフトフロントジャパン
ソフトフロントジャパンは、ソフトフロントホールディングスの子会社として2016年8月の発足以来、表現力豊かにつながる・伝わるコミュニケーションプラットフォームとして、通話・ビデオチャット・メッセージによるリアルタイム・コミュニケーションを中心とした各種製品やサービスを提供しています。最近は永年培ってきた音声伝送技術を元に、AIや自動化技術も取り入れ、電話業務を自動化するクラウドテレフォニーサービスプラットフォーム「telmee」や、自然会話AIボイスボット「commubo」を展開し、様々な事業領域で新しいコミュニケーションビジネスを創出しています。
https://softfront-japan.co.jp/
■お問い合わせ先
【「commubo」に関するお問合せ先】
株式会社ソフトフロントジャパン
電話 :03-6550-9930
E-mail:sales@softfront-japan.co.jp
【リリースに関するお問合せ先】
株式会社ソフトフロントホールディングス
担当 :広報窓口
電話 :03-6550-9270
E-mail:press@softfront.co.jp
*本書面に記載されている会社名、製品およびサービス名は、各社の登録商標または商標です。