音声感情認識AI

The Voice Emotion Recognition AI

パナソニックの特許技術を活用した「音声感情認識AI」が会話から「怒り」「喜び」「平静」をリアルタイムに分析します

POINT

01

実用化を目指して 「誤検出率 5.91%!」*1

実用化に向けて、音声感情認識エンジンの誤検出率を極力下げることに成功しました。

POINT

02

教師データ不要!言語依存も少ない汎用エンジン

音響解析型のため準備が大変な教師データが不要!かつ言語に極力依存せず汎用性の高いエンジン仕様です。

POINT

03

発話区間を自動で解析! 音量の自動増幅にも対応

秒毎ではない発話区間による解析&音量を適切なレベルで自動増幅。自然な会話に近い状態で感情判定します。

*1・・・精度評価方法については「精度評価の実施方法について」をご参照ください

実用化が進む「感情認識技術」

人の感情には目に見えないー。そんな概念を覆すのが「感情認識技術」です。 顔の表情や、テキスト、会話や音声等から人の感情を読み取ります。 近年は音声認識技術と併用して、感情認識技術がロボットへ搭載されるなど、音声による感情認識技術は実用化が進みはじめています。

音声感情認識とは

当社の感情認識技術は、「音声・会話」などの音声データを元に感情を判定します。
音声感情認識技術は、「言語解析型」と「音響解析型」とに大別されます。 言葉を音声認識させることで感情を分析する「言語解析型」では、複数の感情を表す言葉や、固有名詞を多く含む場合などは感情の判定が困難でしたが、 当社の技術ではそれらの問題に左右されず、音声自体の持つ特徴量をベースとした「音響解析型」で感情を判定しています。そのため、「言語解析型」では判別しにくかった言葉や、音声認識しにくい怒声なども検知することが可能です。

〜言語解析と音響解析の違い〜

言語解析
音響解析

「音声感情認識AI」の8つの特徴

「音声感情認識AI」は、ヒトの会話などの「音声データ」から、「怒り」「喜び」「平静」の3つの感情を解析できます。

音声単体の特徴量からシンプルに解析を行うため、軽量で、1発話区間につき1秒以内という「高速な感情解析」が可能です。
既存の音声データはもちろんのこと、「リアルタイム解析」も対応しています。

anger/happy/normal

精度が100%に到達することのない新しいテクノロジー分野においては、「誤検出率を極力下げる」ことが実用化に向けて重要な要素となります。
本エンジンは、パナソニックの特許技術を元に「独自のアルゴリズム」を編み出し、徹底的に精度にこだわり調整開発を重ねた自信のエンジンです。
本エンジンでは、ノイズ検知時などの「音源が解析に十分でない場合は解析しない」という処理を追加することで、「誤検出率を10%程度」まで抑え、実用化レベルに最適化しています。(個別で、ご利用環境に応じた検出率向上チューニングも可能)

発話区間を「動的に解析」するオリジナルの技術「ダイナミック判定」を採用しています。従来のような、設定した秒数毎に機械的に感情結果を取得するよりも、「より自然の会話に近い感情結果」を取得でき、空白を含む音源でも精度は左右されません。

業界初の「ダイナミック判定」を採用

音声感情認識AIに用いているアルゴリズムは、教師データが不要な「独自のアルゴリズム」であるため、従来多くの時間や労力を割いていた「サンプルデータの準備・収集が不要」です。
手元に音源データのない企業さまでも「導入直後から最高のパフォーマンスを発揮」します。

外国語対応

理論的に言語依存しないエンジン

ノイズ除去機能

ノイズは自動で非解析に

クリッピング(音割れ)判定

会話中の音割れ箇所を判定

音量の自動増幅

音量不足時は適正レベルに自動増幅

わずか1秒未満でリアルタイム判定

省メモリで軽量に動作するエンジン仕様のため、会話をほぼリアルタイムに分析。音声を入力後、瞬時に感情を判定できます。(ご利用環境によって異なる場合があります)
例えばコールセンターに導入し、SV(指導者・管理者)によるフォローが必要なクレーム(怒り・ストレス)が発生した場合でも、 タイミングを逃すことなく適切かつスムーズに対処することが可能です。

〜導入事例1.コールセンター(カスタマーサービス)〜

コールセンター(カスタマーサービス)

既存データを分析してフィードバックに活用

リアルタイムに感情を判定する以外にも、音声や会話をバッチ処理して後で分析することももちろん可能です。例えば社内面談に導入し、 面談が適切に行われたか人事でフィードバックしてパワハラを防止したり、顧客との通話を感情認識と合わせて分析することにより、解約率の低下や、顧客満足度の向上を図ることができます。

〜導入事例2.人事での活用(パワハラ防止)〜

人事での活用(パワハラ防止)

〜導入事例3.潜在ニーズの発掘〜

潜在ニーズの発掘

「音声感情認識AI」の活用シーン

当社の感情認識技術は、感情をその場で見える化する「リアルタイム判定」と、後でデータ分析する「バッチ処理判定」の2種類があります。それぞれに最適な活用シーン(導入事例)をご紹介いたします。

■リアルタイム判定の導入事例

コールセンターに

コールセンターに

クレームの見える化により解約率の低下に

コールセンター

カスタマーサービスに

隠れたストレスをフォローして顧客満足度向上

スマホ・スマートスピーカーに

スマホ・スマートスピーカーに

感情に配慮した受け答えやサービスが可能に

■バッチ処理判定の導入事例

面談や社内ミーティングに

面談や社内ミーティングに

自覚が難しいパワハラ抑制にも役立ちます

人事考課や査定に

人事考課や査定に

感情をデータ材料としてご活用できます

マーケティングに

マーケティングに

感情分析による潜在ニーズ発見につながります

活用している特許技術

特許登録番号 特許権者 タイトル
1 JP特許第4085130号 松下電器産業株式会社 感情認識装置
2 JP特許第4914295号 パナソニック株式会社 力み音声検出装置

他社の「音声を用いた感情認識」製品との比較

当社の「音声感情認識AI」は、”認識の速さ”と、”導入の手軽さ””カスタマイズの柔軟さ”が特徴です。
「声帯の力み具合」と「声質」を特徴量として感情判定をするアルゴリズムのため、男女や年齢などによる個人差が生まれにくく、言語や方言なども問わず認識精度を担保することができます。

音声を用いた感情認識システム 他社比較表
当社 A社 E社 L社
認識できる感情種別 怒り/喜び/平静 怒り/喜び/平静/
悲しみ/興奮
喜怒哀楽
気分の浮き沈み
怒り/悲しみ
興奮/幸福度など
Web API提供 × ×
API入力仕様 サンプリング
レート
8kHz/16kHz
44.1kHz/48kHz
- 11025Hz -
ビット深度 8bit/16bit - 16bit -
サイズ上限 200MB - 1.9MB -
SDK提供 Linux/Mac/Windows
iOS/Android
Linux/Windows Linux/Mac/Windows/iOS/Android -
WEBからお試し × ×
その他特徴 パナソニック社の
特許を活用した独自の高精度アルゴリズム
膨大な研究成果と
Pepperへの導入実績
気分の判定が可能 思考も数値化
海外での導入実績

※2019年08月時点の当社独自の調査結果です 現在と相違している可能性がありますのであらかじめご了承ください

提供形態

Webサービスやアプリ開発に適した「API」と、組込み開発に適した「SDK」の2種類を提供中です。

音声認識エンジンと併せてご利用いただいたり、顔・表情による感情認識技術と併用してご利用いただくことが可能です。他の先端技術と組み合わせることで、より高度で確からしい結果を得られるため「AIソリューション」としてもご利用いただけます。

また、「コールセンターさま向け 実証実験パッケージ」もございます。実際に小規模試用していただくことで、SDKの精度や使用感をご体感いただけます。お気軽にお問合せくださいませ。

無料トライアル

API 14日間トライアル」と、手軽に精度検証ができる「WEBアプリ」の2種類を提供中です。
お申し込みの前に、ぜひトライアルして「音声感情認識AI」の精度をお試しください。

対応環境/動作環境

音声感情認識API/SDKの対応環境や動作環境などは、以下のとおりです。

▼ 音声感情認識API

Githubに「インターフェース仕様書」を公開中です。下記リンクよりご確認ください。

音声感情認識SDK

音声感情認識SDK 対応環境
項目 要件
インターフェース C++言語 (C++11以降)
対応OS WindowsOS / Linux OS(Debian系/Red Hat系/Raspbian OSも可) / macOS / iOS
CPUアーキテクチャ x86系64bit、 Armv7系、Armv8系、Arm64系
エンディアン方式 リトルエンディアン方式を推奨

※DSPなど、その他の環境でのご利用を希望される場合は、お問い合わせください

音声感情認識SDK 動作環境
プラットフォーム種別 要件
Linux kernel 4.9以降, glibc 2.12以降 SDKを利用するアプリケーションの開発にはgccの利用を推奨します
macOS 10.11以降
Windows 7以降 Visual Studio 2017 用 Microsoft Visual C++ 再頒布可能パッケージのインストールが必要です
iOS 10以降 Xcode 10での開発およびビルドを推奨します。

入力音源の推奨スペック

音声感情認識API/SDKへの入力音源は、以下のスペックを推奨しています。

音声感情認識API

音声感情認識API 推奨音源スペック
項目 要件
サンプリングレート 8kHz / 16kHz / 44.1kHz / 48kHz
※その他についても解析自体は可能です
量子化ビット深度 8bit / 16bit
※24bitや32bitをご希望の方は別途お申し付けください
入力音声データフォーマット wav, mp3, aiff, wmaデータ形式

音声感情認識SDK

音声感情認識SDK 推奨音源スペック
項目 要件
サンプリングレート 8kHz / 16kHz / 44.1kHz / 48kHz
※その他についても解析自体は可能です
量子化ビット深度 8bit / 16bit
※24bitや32bitをご希望の方は別途お申し付けください
チャンネル モノラルのみ対応
※ステレオ音源の場合は、あらかじめLRのいずれかをモノラルチャンネルとして変換してください
入力音声データフォーマット rawデータ形式

※wav、wma、mp3音源などは、「SoX (http://sox.sourceforge.net/sox.html)」や、「FFmpeg (https://ffmpeg.org/)」などを使用して、rawデータ形式に変換してから入力を行なってください

導入フロー

音声感情認識API

「音声感情認識API」の導入フロー例です。
まずは「無料トライアル」を行なっていただき、引き続きご利用いただける場合は、任意のプランをお求めいただく流れです。

  • トライアル申込みトライアル申込み
  • 無料トライアル無料トライアル
  • 有料プランお見積り有料プランお見積り
  • お支払いお支払い
  • 運用開始運用開始

音声感情認識SDK

「音声感情認識SDK」の導入フロー例です。
まずは「開発版SDKライセンス」をご購入いただき、PoCののち、商用版をお求めいただく流れです。

  • お問合せお問合せ
  • お見積もりお見積もり
  • お申込み お支払いお申込み
    お支払い
  • 開発版SDK 納品開発版SDK
    納品
  • PoCPoC
  • 商用版条件交渉 ライセンス契約商用版条件交渉
    ライセンス契約
  • 運用開始

価格・料金

音声感情認識AIの価格や、サポート料金、初期費用などは以下の通りです。

API利用料金

音声感情認識APIは、「コール数ごとの料金プラン」となります。
約2ヶ月分の料金がお得になる「年割料金」もご用意しておりますので、長期ご利用の場合はぜひご検討ください。

プラン 月額料金(税抜) 年割料金(税抜) 備考
14日間無料トライアル 0円 トライアルする
1,000コール プラン 5,000円/月 60,000円 ➡︎
50,000円
超過分1コールにつき5円(税抜)
2,500コール プラン 10,000円/月 120,000円 ➡︎
100,000円
超過分1コールにつき4円(税抜)
15,000コール プラン 30,000円/月 360,000円 ➡︎
300,000円
超過分1コールにつき2円(税抜)
50,000コール プラン 50,000円/月 600,000円 ➡︎
500,000円
超過分1コールにつき1円(税抜)

お申し込みの際は、利用規約へのご同意が必要です。また、機能は、全てのプランで同一です。
お支払い方法は、請求書払いとさせていただきます。APIご利用につきましては、サポート対応は原則行っておりませんので、あらかじめご了承ください。

SDK開発版ライセンス料金

ビジネスユース
プラン 料金(税抜) 備考
3ヶ月ライセンス 250,000円 5ライセンス付き
6ヶ月ライセンス 400,000円 5ライセンス付き
年間ライセンス 600,000円 5ライセンス付き
アカデミックユース
プラン 料金(税抜) 備考
年間ライセンス 300,000円 5ライセンス付き、証明書類の提出が必要です

SDK商用版ライセンス料金

プラン 基本料金(税抜) 備考
コールセンター<ブース課金> 360,000円/年間 20ブースまで
1ブース追加につき+18,000円/年間
コールセンター<サーバ課金> 3,000,000円/年間 5ライセンス付き(1OSに対して1ライセンス)
1OS(1ライセンス)追加につき+ 60万円/年間
スマホアプリ利用 360,000円/年間 1アプリ1OS(1ライセンス)
※オンラインアクティベーション料金は別途見積もり
端末組み込み利用 別途お見積もり ご用途:DSP、マイコン、IoT機器など
その他 別途お見積もり お気軽にお問合せください

オフラインアクティベーション料金

プラン 料金(税抜) 備考
USBドングル方式 10,000円/本 オフライン利用の場合(オンラインは無料です)

各種SDKサポート料金

初期費用
プラン 料金(税抜) 備考
初期費用 100,000円/初回のみ SDKご利用時は必須です
導入サポート
プラン 料金(税抜) 備考
導入サポート 別途お見積もり ビルド・インストール代行、音源解析代行・調査、インテグレート代行など
無償サポート
プラン 料金(税抜) 備考
無償サポート 無料 バグなどの不具合の対処
有償サポート
プラン 料金(税抜) 備考
メールサポート<単発> 40,000円/回
メールサポート<月間> 150,000円/月 5チケット付き、1チケット追加につき+3万円
メールサポート<年間> 1500,000円/年 60チケット付き、1チケット追加につき+3万円

音声感情認識SDKの有償サポートは、「チケット制」でのメール対応となります。
インストールやアクティベーション、ライセンスの移行・構成などのトラブルシューティングに関する質問1つにつき、1チケットを消費します。必要に応じてお求めください。

精度評価の実施方法について

本エンジンは、声優音源コーパスの”900音源”をもとに”2130区間”を検証データとし、「anger音源をhappyと検出してしまった」および「happy音源をangerと検出してしまった」という区間を「誤検出」とし、「誤検出率を10%程度」まで抑えた実用化レベルに最適化しています。
稀に、特徴の強い音源は上記の精度が出ない場合がございます。その際は、音源に合わせたチューニングを個別に実施することも可能(※有償ケースあり)ですので、一度お問合せくださいませ。

メディア掲載実績

メディア掲載実績は以下の通りです。取材のご依頼は「お問合せフォーム」よりどうぞ。

生まれ変わった「音声感情認識AI」をぜひお試しください

2017年11月より実施しておりました「音声による感情認識技術」の無料トライアルは、2018年8月21日をもって終了とさせていただきました。
期間中は、多くのご利用ならびにご感想やご意見などをお寄せいただきまして、誠にありがとうございました。

トライアルしていただいた「100ユーザー」の皆さまからの生の声を元に、「ユーザビリティの向上と実用的な精度の担保」に重点をおき、約1年に渡る改善開発を重ね、この度の新バージョンをリリースすることができました。

「API14日間トライアル」または「デモ体験WEBアプリ」より、まったく新しいアルゴリズムに生まれ変わった「音声感情認識AI」をどうぞお試しください。

Top