高度な検索
検索結果
57件見つかりました
音声認識ツール
音声認識ツールを導入したり活用したりするのに参考になる情報 カバー写真: https://unsplash.com/ja/%E5%86%99%E7%9C%9F/AGRtDoZlpYw
YYSystemの紹介(双)
YYSystem(株式会社アイシン) YYSystemは、「YYProbe」「YY雰囲気カメラ」「YY文字起こし」など音声認識を使ったコミュニケーションを支援するアプリです。 製品の説明ページはこちら→製品の説明企業HPへのリンクはこちら→企業HP アプリの種類 YYSystemは音声認識を組み込んだ様々なアプリがあり、それぞれ用途に合わせて使い分けることが可能です。※YY文字起こしとYY雰囲気カメラの紹介ページはまだ存在していないためリンクを貼っていません※ アプリ名 おすすめの用途 YYProbe...
きちんと音声入力するように対応してもらえた事例
【UDトーク】 A社の事例 小人数で行うミーティング場面で、UDトーク端末のマイクモードを「ワイドスペクトル」に設定して1台の端末に音声入力する方法で行った。しかし複数名の聴者がUDトーク端末があることをうっかり忘れて同時に発言して誤認識が多発してしまうことが多発してしまった。そのためコミュニケーション・ツールとしてだけでなく議事録作成ツールとして併用することを提案し、大型のiPadを皆で見ながら、認識しやすい音声で発言するようにしてもらうようにお願いした。大型iPadであれば過去の発言も同画面内で確認できるた...
誤認識発生への対応をしてもらえた事例
【UDトーク】【YYアプリ】 UDトークもYYアプリも、どちらも環境や話し手の話し方など様々な要因で誤認識が起こり得る。そういう時の対応方法はUDトークもYYアプリも共通しているのでここでは1つにまとめている。 まず誤認識発生の原因を把握することが大事である。 【誤認識が発生する原因と解決策】 1:話し手による話し方の問題と解決策 ぼそぼそした話し方は音声認識には向かない。 マスクをしている場合はやむを得ないが、マスクをしていてもしていなくても関係なく、口を大きく、はっきりした声で話すようにする⇒U...
研修会でマイクではなく音響機器と接続させた事例
【UDトーク】 A社の事例 50人規模の会議で、会場の各所で多く発言が出されるため、ワイヤレスマイクが各所に設置されている。UDトーク端末とマイクを各所に設置することは予算的にも台数的にも難しいことから、会場に設置されている音響機器の音声出力端子にUDトーク端末をケーブルで接続させ、認識結果は、聴覚障害当事者の座席に設置したタブレットで見ることができるようにした。なお、音声出力端子にUDトーク端末とつなげてもスピーカーから音声が出てくるかどうかも念のため確認しておく必要があった。
オンライン会議でパソコンからの出力音声を入力端末と接続させた事例
【UDトーク】 A社の事例 Googleミートというオンライン会議システムを導入することになった。UDトークで専用の新しいトークを追加し、そのトークのQRコードを参加者全員に配布することで、各自のスマートフォンでUDトークを起動させて音声入力してもらう方法を考えた。しかし、一部の参加者から、スマートフォンで会議関係の情報を確認しながら発言するため難しいと言われた。そこで、モバイル・オーディオ・インターフェイスを使って聴覚障害当事者が用いるPCの音声出力端子とUDトーク端末をつなげる方法で、参加者の発言内容を把握...
モバイルWi-Fi
UDトーク、YY Probeなどのスマートフォンで使用する音声認識アプリは、通常のモバイル回線で十分に活用できます。 一方で、Wi-Fiが設置されていない場所で、Zoomなどのオンライン会議システムを使用したり、パソコンを使用して複数人での編集作業を行ったりする場合には、モバイルWi-Fiが必要になることもあります。★YYProbeはオフライン認識モードが備わっており、Wi-fiが設置されていない場所でも音声認識が可能です。 また、海外で使用するときには、現地の通信事業者の回線を使用する「データローミング」機能...
セキュリティ全般におけるポイント
会社の業務で音声認識アプリを使うときには、顧客の個人情報などの機密情報が外部に漏れないように気をつける必要があります。特に、「音声データ」や「会話ログ」については、送信したデータがサーバー上に保存されることがあり、この点が会社のセキュリティルール違反になることがあります。 そのため、自分で勝手にインストールしたりせず、直属の上司や情報システム部門に相談して許可を得て使用する必要があります。このページでは会社に相談する際に必要なヒントを紹介します。 オンラインでの音声データや認識結果の処理について まずはじめに...
音声認識アプリとは
ここでは、「音声認識アプリとは?」の説明をします。 人と人とのコミュニケーションを考える 現在、聴覚障害者(ろう者・難聴者)と聴者(耳が聴こえる人)とのコミュニケーション方法はいくつかあります。その中でも皆さんがパッと思いつくのが 読唇 手話 筆談 だと思われます。それではここから、読唇・手話・筆談それぞれの簡単な説明とメリット/デメリットを解説していきます。 読唇とは 読唇とは、「相手の口の形を読みながら相手の言っていることを把握する」という方法です。この読唇のメリット/デメリットを以下まとめまし...
声文字の紹介(単)
声文字(自立コム) 声文字は、自立コムという福祉支援機器制作会社から出ているコミュニケーション用アプリです。1対1の会話から多人数の会話や会議まで、オンラインでもオフラインでも使い方次第で幅広く様々な方とのコミュニケーションに活用することができます。 製品の説明ページはこちら→製品の説明企業HPへのリンクはこちら→企業HP アプリの種類 現状、アプリの種類は1種類「声文字」のみで、iOSとAndroid両方があります。また、会社のサイトから申し込みして買い切りするタイプとなっています。 iOS声文字のダウ...
セキュリティ面で理解してもらえた事例
巷にある音声認識アプリは基本的に、音声認識データはクラウドサーバーに置かれることが多いです。これは音声認識の精度を高めるためであるが、しかし、これに対し難色を示す企業はとても多いです。例えば「企業の機密データが漏れるのではないか」等の理由で難色を示すことが多いです。そこで、このページではセキュリティ面で理解してもらえた事例を書いていきます。※ここではUDトークまたはYYProbe・YY文字起こしを例にします。(今はこの3つが主流となっているため) 【UDトーク】 A社の事例 UDトークの導入にあたって、セキュ...
LiveTalkの紹介
FUJITSU Software LiveTalkは、発話者の発言を音声認識し、即座に翻訳・テキスト変換することで、発言内容を複数端末にリアルタイムで翻訳・テキスト表示するダイバーシティ・コミュニケーションツールです。聴覚障がい者とのコミュニケーションやグローバル活動の支援ツールとしてご利用いただけます。そして、LiveTalk機能の1つとして「字幕表示」があります。ビデオチャット中、CC字幕をONにすれば、マイクを通して相手の声が自動で音声認識され、文字で表示されます。企業サイトへのリンクはこちら→企業サイト ...
Vosualの紹介(単)
Vosual Vosualは、「聴覚障害者用音声認識アプリ」として名付けられており、音声をシンプルにテキストに変換するためのアプリです。1対1の会話から多人数の会話や会議まで、オンラインでもオフラインでも使い方次第で幅広く様々な方とのコミュニケーションに活用することができます。 アプリの種類 現状、アプリの種類は1種類(iOS無料版)のみです。 iOS版Vosualアプリのダウンロードリンク Vosualの特徴 ここからはVosualの特徴を紹介します。※「可能」ではありますが、どんな状況でも100%音...
Google音声文字変換(Live Transcribe)の紹介(単)
Google音声文字変換(Live Transcribe) Androidには、Google音声文字変換(Live Transcribe)という機能が備わっています。これは一方的になりますが、人の声を音声認識し、文字化するというものです。1対1の会話から多人数の会話や会議まで、オンラインでもオフラインでも使い方次第で幅広く様々な方とのコミュニケーションに活用することができます。 製品の説明ページはこちら→製品の説明企業HPはこちら→企業HP アプリの種類 現状、アプリの種類は1種類(Android無料版)の...
入力や誤認識修正に使用する端末(スマートフォン、タブレット、パソコン)
端末の種類について 音声認識アプリへの入力や誤認識修正に使用する端末は、大きく分けてスマートフォン、タブレット、パソコンの3つの選択肢があります。それぞれメリットとデメリットがあるため、目的にあわせて使い分けましょう。 端末 メリット デメリット スマートフォン(iPhone, Android) コンパクトで持ち運びが容易 画面が小さいため、文字が読みづらい タブレット(iPad, Android) 文字が大きく複数人で画面を見ながら使いやすい スマートフォンより大きいので持ち運びが不便 デス...
クラウドサービスのセキュリティについて
このページでは、音声をテキストに変換する、クラウド上のSpeech-To-Textサービスのセキュリティ情報をまとめています。 以下は、2023年4月時点での情報です。最新の情報は各サービスのウェブサイトなどで確認してください。 Amazon AWS Transcribe ドキュメントのAmazon Transcribe でのセキュリティ項目において、セキュリティやデータ保護についての技術的な情報が記載されている。 サービス改善のためのデータの使用をオプトアウトする項目には、下記記載あり。 デフォ...
音声認識アプリ(音声認識サーバー)のセキュリティについて
このページでは、音声認識アプリと、アプリから接続する音声認識サーバーのセキュリティについてまとめています。 以下は、2023年4月時点での情報です。最新の情報は各サービスのウェブサイトなどで確認してください。 UDトーク よくあるご質問 ページにまとめられており、システムの全体構成図も掲載されています。 UDトーク®利用規約(一般)第4条に下記記載あり。 4. 本アプリに入力されるお客様の音声については、音声認識精度向上のために収集、分析、再利用します。この際、音声は、その内容を一般に公開すること...
GooglePixelレコーダー(文字起こし)(単)
GooglePixelレコーダー(文字起こし) Androidには、Google音声文字変換(Live Transcribe)という機能が備わっています。それとは別に、GooglePixel6からはレコーダーに文字起こし機能が加わりました。これは一方的になりますが、人の声を音声認識し、文字化するというものです。1対1の会話から多人数の会話や会議まで、オンラインでもオフラインでも使い方次第で幅広く様々な方とのコミュニケーションに活用することができます。 製品の説明ページはこちら→製品の説明企業HPはこちら→企業H...
予算面で理解してもらえた事例
【UDトーク】 A社の事例 UDトークの導入にあたって、プラン価格が高く、聴覚障害当事者とのリアルタイムでのコミュニケーションに使うだけでは使用頻度が少ないので、費用対効果が得られにくいと消極的な反応があった。 これに対し、UDトークは、 本社の各種ミーティングや会議の文字起こしによる議事録作成 講演会や研修会の講師談話の文字起こしによる報告書作成 プレゼンテーションのリハーサルの音声の文字起こしによる口頭原稿の作成 消費者や関係企業へのインタビュー調査の記録作成 ・・などで作業の労力や時間が大幅に...
マイク
音声認識アプリはスマートフォン一台あれば使い始めることができます。「とりあえず使いたい」ときには特に新しくマイクを購入する必要はありませんが、よりよい認識精度を得たいのであれば外付けのマイクを使用することをおすすめします。 スマートフォンのマイクを使うコツ スマートフォンの内蔵マイクを使うときは、マイクの位置に注意するとよいでしょう。iPhoneの場合、マイクが3つ内蔵されており、背面上部(カメラ付近)、前面上部(インカメラ付近)、そして底面(充電端子の両脇)にあります。主に底面にあるマイクが使われているようで...
チャットツール
SlackやMicrosoft Teams、LINE Worksなど、グループでの会話をテキストで行うためのアプリの使い方に関する情報 カバー画像: https://unsplash.com/ja/%E5%86%99%E7%9C%9F/aE0iX-bLCJc
音声認識ソリューション
音声認識エンジンを載せるサーバーなどのソリューション。 音声認識エンジンを動かすためにはサーバーが必要ですが、そのためには ・高負荷に耐えられること ・それ自体が音声認識が可能なこと(サーバーによる) 等が挙げられます。 ですが、基本的には一般的なサーバーとあまり変わらないことが多いです。
オンライン会議システム
ZoomやMicrosoft Teams、WebExなどオンライン会議システムの効果的な使い方について カバー画像 https://unsplash.com/ja/%E5%86%99%E7%9C%9F/qnWPjzewewA
このプロジェクトについて
デバイス
カバー画像の出典 https://unsplash.com/photos/iphone-x-beside-macbook-OwvRB-M3GwE https://unsplash.com/photos/gg3HJf0Dn6A https://unsplash.com/photos/5_h5cX1e11I
音声認識アプリ(スマホ)
スマートフォンやパソコンの各種OSごとに使える音声認識ツールの紹介です。 音声認識アプリには「単一方向」と「双方向」があります。 単一方向・・・人の音声を文字に変換 双方向・・・人の音声を文字に変換して表示+ろう者難聴者側からはキーボードやイラストなどで相手に伝えることが可能 そして、ここでは、単一方向の場合は「単一」双方向の場合は「双」とアプリ名の最後に書きます。 カバー画像: https://unsplash.com/ja/%E5%86%99%E7%9C%9F/9e9PD9blAto
デバイス
音声認識ツールを使うために必要な各種デバイスの紹介 カバー画像: https://unsplash.com/ja/%E5%86%99%E7%9C%9F/DsmDqiYduaU
セキュリティ
各種音声認識ツールにおけるセキュリティに関する情報 カバー画像: https://pixabay.com/photos/computer-security-padlock-hacker-1591018/
導入・活用事例
音声認識ツールをどのように導入できたのか、どのように活用しているのか、様々な事例を紹介します。各チャプターで、上司など職場に理解を求めた事例、既存の周辺機器との接続事例などを紹介しています。 カバー画像: https://pixabay.com/photos/startup-meeting-brainstorming-594090/
音声認識アプリ(PC)
こちらでは、アプリに付属している音声認識システムを紹介します。 例えばTeams、Zoom、GoogleMeetがあります。
クレジット
松﨑丈(宮城教育大学) 井上正之 (筑波技術大学) 金沢佑治 (静岡県立総合病院) 清野絵(国立障害者リハビリテー ションセンター ) 幕内充(国立障害者リハビリテー ションセンター ) 佐藤真美(デフエンジニアの会) 鈴木彩紗子(デフエンジニアの会) 吉村優一(デフエンジニアの会) 伊藤浩平 (サイト制作)
このサイトについて
イベントのお知らせ
Zoom
Zoomについての説明です。 カバー画像 https://unsplash.com/photos/black-and-white-pug-and-brown-and-white-long-coated-small-dog-sW_BS0OVgv0
Slack
カバー画像 https://unsplash.com/photos/person-using-phone-and-laptop-gUIJ0YszPig
Teams
サムネイル画像の出典 https://unsplash.com/photos/Fx7Ybi2w3cA
Teams(チャット)
上司など職場に導入を認めてもらった事例
既存の周辺機器との接続で活用しやすくした事例
vGate ASR音声認識システム
vGate ASRは、フュートレックという会社から出ているIoTやAI、ロボット、自動運転など次世代技術に対応した音声認識ソリューションです。サーバー型音声認識システムオンプレミス型音声認識システムASPサービスローカル型音声認識システムローカル型大語彙連続音声認識システムなど、様々なシステムを提供しています。また、音声認識エンジンはフュートレック独自のものを採用しています。vGate ASR音声認識システム製品紹介ページはこちら→製品紹介企業サイトへのリンクはこちら→企業サイト vGateASRの特徴 ここか...