音声認識ソリューション

音声認識エンジンを載せるサーバーなどのソリューション。 音声認識エンジンを動かすためにはサーバーが必要ですが、そのためには  ・高負荷に耐えられること  ・それ自体が音声認識が可能なこと(サーバーによる) 等が挙げられます。 ですが、基本的には一般的なサーバーとあまり変わらないことが多いです。

vGate ASR音声認識システム

vGate ASRは、フュートレックという会社から出ているIoTやAI、ロボット、自動運転など次世代技術に対応した音声認識ソリューションです。
サーバー型音声認識システム
オンプレミス型音声認識システム
ASPサービス
ローカル型音声認識システム
ローカル型大語彙連続音声認識システム
など、様々なシステムを提供しています。

また、音声認識エンジンはフュートレック独自のものを採用しています。

vGate ASR音声認識システム製品紹介ページはこちら→製品紹介
企業サイトへのリンクはこちら→企業サイト

vGateASRの特徴

ここからはvGateASRの特徴を紹介します。
※「可能」ではありますが、どんな状況でも100%音声認識が可能というわけではありません※

  1. オンプレミス型音声認識システムでお客様のサーバー環境構築支援をしている
    お客様がサーバーを自社で管理・運用したい場合、「オンプレミス型音声認識システム」という音声環境のバックエンドサーバーを構築しているシステムを提供しています。

    また、お客様自身で言語モデルや固有名詞などのメンテができるサービス「言語モデル更新サービス」や
    「単語登録サービス」も提供しています。

  2. ローカル型大語彙連続音声認識(L-LVCSR)システムで通信を行わずに音声認識が可能
    サーバーとの通信を行わないオフライン音声認識ですが、連続した文章の認識が可能です。
    ただし、機器内に掲載された言語モデルだけで音声認識を行なうため、認識できる語彙数と認識率はオンライン時より減ります。
    その代わりネットワークの状態に左右されないためレスポンスは早いです。

  3. ハイブリッド型音声認識の提供も可能
    「サーバー型」と「ローカル型」を切り替えて利用できる「ハイブリッド型」での提供も可能です。

予算(プラン)

 

vGateASRの予算(プラン)はHPから要お問い合わせ→お問い合わせ先

SpeechRec音声認識サーバー

SpeechRecは、NTTテクノクロスから出ている音声認識ソリューションです。
また、音声認識エンジンはNTT研究所開発の「VoiceRex」を採用しています。

SpeechRecの説明ページはこちら→説明ページ
企業サイトへのリンクはこちら→企業サイト

SpeechRecの特徴

ここからはSpeechRecの特徴を紹介します。
※「可能」ではありますが、どんな状況でも100%音声認識が可能というわけではありません※

  1.  最新のNTT研究所独自の音声認識を提供
    NTT研究所の最新メディア処理技術「MediaGnosis」を搭載しています。

    また、End-to-Endによる音声認識にも対応しています。→End-to-End音声認識の説明ページ
    このEnd-to-Endは、音響モデル・認識辞書・言語モデルに左右されることなく音声からテキストへの変換を1つの
    モデルで表現しているため、精度を限りなく高めることができています。

  2. オンプレミス環境とプライベート環境を提供している
    発話内容の秘匿性を守るために、オンプレミス環境とプライベート環境を構築して秘匿性を高めています。

  3. 雑音をなるべくカットした音声認識を提供
    通常、音声認識というのは、雑音があると精度が下がりやすいです。
    しかし、SpeechRecではNTT研究所の音響信号処理技術を活用して雑音をなるべく抑え音声認識の精度を上げるよう
    工夫しています。

  4. 利用用途に合わせてチューニングし、専門用語などでも精度の高い音声認識を提供
    その業界にしかない専門用語や社内用語など、一般的な辞書では判読ができない場合でも、辞書や言語モデルを
    チューニングすることによって専門用語や社内用語などの音声認識精度を高めています。

予算(プラン)

 

SpeechRecの予算(プラン)は要お問い合わせ。→お問い合わせ先