導入・活用事例
音声認識ツールをどのように導入できたのか、どのように活用しているのか、様々な事例を紹介します。各チャプターで、上司など職場に理解を求めた事例、既存の周辺機器との接続事例などを紹介しています。 カバー画像: https://pixabay.com/photos/startup-meeting-brainstorming-594090/
上司など職場に導入を認めてもらった事例
セキュリティ面で理解してもらえた事例
巷にある音声認識アプリは基本的に、音声認識データはクラウドサーバーに置かれることが多いです。
これは音声認識の精度を高めるためであるが、しかし、これに対し難色を示す企業はとても多いです。
例えば「企業の機密データが漏れるのではないか」等の理由で難色を示すことが多いです。
そこで、このページではセキュリティ面で理解してもらえた事例を書いていきます。
※ここではUDトークまたはYYProbe・YY文字起こしを例にします。(今はこの3つが主流となっているため)
【UDトーク】
A社の事例
UDトークの導入にあたって、セキュリティ面に関して、以下のように企業機密が漏洩されない仕様であることを理解してもらえたことで導入が実現できた。
①セキュリティ通信を行っていること
②UDトークが採用している高精度日本語音声認識エンジン「AmiVoice(アミボイス)」は株式会社アドバンスト・メディアが管理していること
③同社アドバンスト・メディアはコールセンターや銀行などとの取引実績を持っており、プライバシーポリシーがしっかりしているといえること
④UDトークの認識結果(ログ)の共有はQRコードなど限られた者しか見ることができない仕様になっていること
⑤有料プランでは音声データを保存しないこと。
B社の事例
セキュリティといえばTeamsなど会社で使うアプリも結局はサーバーに音声情報を送っていることから、何もセキュリティに不安を感じるのはUDトークだけではないということを理解してもらえた。
【YYProbe、YY文字起こし、YYデスクトップ字幕】
A社の例
まずお試しとしてアプリごとにどんなことができるのかの説明を自分の部署向け、また、人事部や総務部向けに行なった。
その後、上司から株式会社アイシンにお問い合わせしていただき、セキュリティについて納得してもらった上でトライアル登録をしてもらった。
B社の例
普段から上司や周囲の方々と話すときに積極的にYY文字起こしやYYProbeを使うようにした。
その結果、上司や周囲の方々も自分のスマホにYYアプリを入れてくださるなど慣れてきて業務でも使うようになった。
その後、上司から「業務でも使うようになっているから登録したいね」と言って下さり、上に掛け合ってくれた。
その際セキュリティが不安だというお話を受けたが、TeamsやUDトークなどほかの音声認識アプリも同じだというお話をすると納得いただけた。
まとめ
全般的にどんな音声認識アプリでも、「実際に使ってその目で見てもらう」ことが大事だと考えています。
口だけで「使いたいから許可お願いします」と言っただけでは、却下されることも多い(会社も当然自社からお金を出すことになるのと、また、仕事上機密情報が洩れたら会社としての信用を失うため)ので、お願いする立場としては
- 使いたいアプリの規約をしっかり確認し、把握する
- アプリを実際に使ってもらう機会を作る
- 同じチームの人や上司など身近なところから働きかけ、皆にも使ってもらいその良さを実感してもらえるようにする
といったことを基本として動いていくと良いでしょう。
予算面で理解してもらえた事例
【UDトーク】
A社の事例
UDトークの導入にあたって、プラン価格が高く、聴覚障害当事者とのリアルタイムでのコミュニケーションに使うだけでは使用頻度が少ないので、費用対効果が得られにくいと消極的な反応があった。
これに対し、UDトークは、
- 本社の各種ミーティングや会議の文字起こしによる議事録作成
- 講演会や研修会の講師談話の文字起こしによる報告書作成
- プレゼンテーションのリハーサルの音声の文字起こしによる口頭原稿の作成
- 消費者や関係企業へのインタビュー調査の記録作成
・・などで作業の労力や時間が大幅に改善されるので、本社で使う標準アプリの1つとして使いたいとアピールした。
その結果、認められ、各部署でUDトークが使われるようになり、その結果として聴覚障害当事者とのコミュニケーションでも、「ああ、UDトークだね」とスムーズに使ってもらいやすくなった。
【YYアプリ】
B社の事例
YYアプリは複数種類があり、B社では
・YY文字起こし・・・各々のスマホに入れてあり、雑談などの会話で使われている
・YYProbe・・・主にAndroidユーザーのスマホに入っており、雑談などの会話で使われている
といったように、各々のスマホの種類によって使い分けられています。
しかし、雑談などの軽い会話にも仕事に関係することが入ることもあり、それで「やはり社内で許可を取ってから使いたいね」ということになり、社内でアプリ使用許可届を出した。
しかし、YYの場合はクラウドにデータが転送されることからセキュリティ面に対して懸念があるとされ、なかなか認めてもらえなかった。
だが、そもそもYYの音声認識エンジンはMicrosoftのエンジンを使っていること(2023年当時)、また、Teamsなど数多くの企業で使われているアプリでもMicrosoftエンジンが使われておりそのセキュリティ性は高いこと、
かつ、YYはトヨタの安全基準をクリアしているということからようやくセキュリティ面でも認められ、クリアできた。
きちんと音声入力するように対応してもらえた事例
【UDトーク】
A社の事例
小人数で行うミーティング場面で、UDトーク端末のマイクモードを「ワイドスペクトル」に設定して1台の端末に音声入力する方法で行った。
しかし複数名の聴者がUDトーク端末があることをうっかり忘れて同時に発言して誤認識が多発してしまうことが多発してしまった。
そのためコミュニケーション・ツールとしてだけでなく議事録作成ツールとして併用することを提案し、大型のiPadを皆で見ながら、認識しやすい音声で発言するようにしてもらうようにお願いした。
大型iPadであれば過去の発言も同画面内で確認できるため、他の聴者にとってもこれまでの発言内容を確認しながら議論でき、記憶補助ツールとしても副次的効果が得られた。
【YYアプリ】
B社の事例
そもそもYYアプリ系は騒がしい場所でも音声認識ができるように作られたものであり非常に音声認識精度が高いが、それでもうまく表示できないなど精度が悪いことがたまにある。
そういう時はまずアプリの設定を環境に合わせて変えたり、スマホの調子を確かめたりすることが大事である。
それでも不調が見つからない場合は次に環境や話し手の話し方などを疑ってかかったほうが良い。
そして色々と試してみて、結果、話し手による話し方に原因があると分かった場合は話し手に以下のことをお願いする。
- まず第一に音声認識の結果を意識しながらゆっくり、はっきりと話してほしいこと
- 専門用語や社内用語は正しく変換されないことが多いため、常に変換されている字幕を見ながらもし間違っていたら訂正してほしいこと
- 社内では他の社員も字幕を確認し、もし間違いがあったらチャットでも良いので間違っている部分と正しい変換を教えてほしいこと
この3点を中心にお願いしたところ、最初は皆さんもなかなか身につかなかったが、お互いの声かけによって徐々に身につくようになり、少しずつ良くなっていった。
誤認識発生への対応をしてもらえた事例
【UDトーク】【YYアプリ】
UDトークもYYアプリも、どちらも環境や話し手の話し方など様々な要因で誤認識が起こり得る。
そういう時の対応方法はUDトークもYYアプリも共通しているのでここでは1つにまとめている。
まず誤認識発生の原因を把握することが大事である。
【誤認識が発生する原因と解決策】
1:話し手による話し方の問題と解決策
- ぼそぼそした話し方は音声認識には向かない。
- マスクをしている場合はやむを得ないが、マスクをしていてもしていなくても関係なく、口を大きく、はっきりした声で話すようにする⇒UDトークの場合はNHKアナウンサーが話すような感じで話すと認識率が上がると言われているが、そもそもNHKアナウンサーも何年も話し方の訓練をしてきているので、そういう人の話し方を一般人が真似することは難しい。しかし、とにかく意識して丁寧に、はっきりと話すことを心がければそれだけでも精度は上がる。
2:環境の問題と解決策
- セミナールーム、会議室など、閉じられた部屋では音が壁に反射しやすい⇒なるべく狭い部屋は避ける
- セミナールームや会議室などでテーブルの上に1つマイクを置いて皆がそのマイクに向かって話すようにした場合、
人の声を正しく拾いにくくなり認識精度が下がる⇒一人一人がヘッドフォンをしたほうが精度が上がりやすい
3:ネット接続環境の問題と解決策
- ネット接続が弱いなど、ネット接続に問題がある場合は音声認識にもそれが反映され精度が悪くなる⇒ネット接続が良いところで音声認識を使うようにする
4:スマホの性能の問題と解決策
- 1,2,3の問題をクリアしてもそれでも音声認識の精度が悪い場合、スマホの性能自体が悪いことが多い。
その場合はスマホを変えたほうがスムーズになることがあるので検討する。
A社の事例
ミーティングで誤認識が出ても聴者社員が発言を続ける状況が見られるようになったため、事前に単語登録の方法と誤認識修正の方法をまとめたマニュアルを作成して職場内で配布した。
その結果、職場内の複数名の同僚が自発的に誤認識を修正してくれるようになり、その様子を見た他の同僚はなるべく誤認識を発生させないように明瞭に発言する行動をとるようになった。
既存の周辺機器との接続で活用しやすくした事例
研修会でマイクではなく音響機器と接続させた事例
【UDトーク】
A社の事例
50人規模の会議で、会場の各所で多く発言が出されるため、ワイヤレスマイクが各所に設置されている。
UDトーク端末とマイクを各所に設置することは予算的にも台数的にも難しいことから、会場に設置されている音響機器の音声出力端子にUDトーク端末をケーブルで接続させ、認識結果は、聴覚障害当事者の座席に設置したタブレットで見ることができるようにした。
なお、音声出力端子にUDトーク端末とつなげてもスピーカーから音声が出てくるかどうかも念のため確認しておく必要があった。
オンライン会議でパソコンからの出力音声を入力端末と接続させた事例
【UDトーク】
A社の事例
Googleミートというオンライン会議システムを導入することになった。
UDトークで専用の新しいトークを追加し、そのトークのQRコードを参加者全員に配布することで、各自のスマートフォンでUDトークを起動させて音声入力してもらう方法を考えた。
しかし、一部の参加者から、スマートフォンで会議関係の情報を確認しながら発言するため難しいと言われた。そこで、モバイル・オーディオ・インターフェイスを使って聴覚障害当事者が用いるPCの音声出力端子とUDトーク端末をつなげる方法で、参加者の発言内容を把握することができた。