メインコンテンツへスキップ

音声認識アプリとは

現在ここでは音声言語を文字にするアプリ(=音声認識アプリいくつか存在しますが、そ?」中でも聴覚障害者によく使われているアプリ説明紹介します。

UDトーク(Shamrock Records,Inc

UDトークはコミュニケーションの「UD=ユニバーサルデザイン」を支援するためのアプリです。

  • 「音声認識+音声合成」機能を使って視聴覚障害間コミュニケーション
  • 「多言語音声認識&翻訳」機能を使って多言語コミュニケーション
  • 「漢字かな変換や手書き」機能を使って世代間コミュニケーション
    UDトークは3つ人と人とのコミュニケーションを考える

    します。

1対1の会話から多在、聴覚障害者(ろう者・難聴者)と聴者(耳が聴こえる数の会話や会議まで、オンラインでもオフラインでも使い方次第で幅広く様々な方とのコミュニケーションに活用方法はいくつかありま
その中でも皆さんがパッと思いつくのが

  • 読唇
  • 手話
  • 筆談

ではないでしょうか?

それではこから、読唇・手話・筆談それぞれの簡単な説明がでメリット/デメリットを解説していきます。

アプリの種類読唇とは

現状読唇とはアプリ「相手種類は1種類「UDトーク口の形を読みながら相手の言っていることを把握するのみです。

iOSのUDトークアプリダウンロードリンク
AndroidのUDトークアプリダウンロードリンク

UDトークの説明リンク

UDトークの特徴

ここからはUDトークアプリの特徴を紹介します。
※「可能」ではありますが、どんな状況でも100%音声認識が可能というわけではありません

 

活用例

最近では以下のドラマで活用された実績があります。
Silent(フジテレビ)
星降る夜に(テレビ朝日)


YYSystem(株式会社アイシン

YYSystemは、「YYProbe」「YY雰囲気カメラ」「YY文字起こし」など音声認識を使ったコミュニケーションを支援するアプリです。

アプリの種類


YYSystemは音声認識を組み込んだ様々なアプリがあり、それぞれ用途に合わせて使い分けることが可能方法です。
※YY文字起の読唇のメリット/デメリットを以下まとめまとYY雰囲気カメラの紹介ページはまだ存在していないめリンクを貼っていません※

アプット おすすめの用途デメリット
YYProbe会議筆談グループでの会など、複数人の文字起こし見たい時におすすめです。
YY文字起こし一対一での会話、せずとしくは講演など一方的に人相手の話を文字起こしを見たい時におすすめです。

YY雰囲気カメラ

ライブや野球ドームでの試合など、風景を見なら文字起こしを見たい時におすすめです。
YYデスクトップ字幕分かる

Youtubeやオンライン動画100%分かるわけではどを見な

ら字幕代わ読み取りやすい人/読み取りにくい人が存在する

字起は読み取れないとが多い(挨拶程度の短文であれば可能なことが多い)

読み取る際集中力が必要なため疲れてを見たまうことがある

知らな時におすすめです。単語や知らない話はほぼ読み取れないことが多い

YYSystemの特徴

ここからはYYSystemの様々なアプリに共通している特徴を紹介します。
※「可能」ではありますが、どんな状況でも100%音声認識が可能というわけではありません

  1. 騒がしい環境下での音声認識に強い

      もともと、株式会社アイシンは工場で働いている聴覚障害者が多くおり、騒がしい環境下での音声認識が
      求められていました。
      また、コロナ禍でマスクをして話す人が増えたためそれで困る聴覚障害者もいたため、騒がしい状況で
      音声認識ができるアプリの開発が始まったという流れがあります。

      そのため、YYSystemは騒がしい環境下での音声認識に強いのが1つの特徴です。

  2. 飛行機などネット接続をしない環境でも音声認識が可能
  3. 透明ディスプレイでの

    音声認識と同時にろう者難聴者側からもキーボードで同時発言が可能

  4. 無線で人の音声を飛ばし、遠くにある映像に音声認識を表示させることが可能
  5. 音声認識アプリ内で手書きの文字やイラストで相手に伝えることが可能
  6. 集音が広い/狭いの選択ができるので、広い部屋で端っこにいる人の音声を拾うことも可能
  7. スマホに表示された音声認識をAppleWatchなどのスマホ連動式時計にも表示させることが可能

 

    声文字(自立コム)

    簡単操作で音声を文字化

    • シンプルな操作性
    • 早くて正確な音声認識
    • ログの編集・保手話にも筆談にもそれぞれデメリットはができるので議事録作成に便利
    • 翻訳機能搭載
     

    LiveTalk(富士通)

    FUJITSU Software LiveTalkは、発話者の発言を音声認識、即座に翻訳・テキスト変換することで、
    発言内容を複数端末にリアルタイムで翻訳・テキスト表示するダイバーシティ・コミュニケーションツールです。
    聴覚障がい者とのコミュニケーションやグローバル活動の支援ツールとしてご利用いただけます。