セキュリティ

各種音声認識ツールにおけるセキュリティに関する情報 カバー画像: https://pixabay.com/photos/computer-security-padlock-hacker-1591018/

セキュリティ全般におけるポイント

会社の業務で音声認識アプリを使うときには、顧客の個人情報などの機密情報が外部に漏れないように気をつける必要があります。特に、「音声データ」や「会話ログ」については、送信したデータがサーバー上に保存されることがあり、この点が会社のセキュリティルール違反になることがあります。

そのため、自分で勝手にインストールしたりせず、直属の上司や情報システム部門に相談して許可を得て使用する必要があります。このページでは会社に相談する際に必要なヒントを紹介します。

オンラインでの音声データや認識結果の処理について

まずはじめに、データがどのように処理されるか、大まかな流れをおさえておきましょう。

音声認識アプリをオンラインで使用するときには、ユーザーが使用するアプリから音声データを音声認識サーバーに送り、さらに、音声認識サーバーからラウドサービス上で音声を文字に変換し、変換された結果(テキスト)が、音声認識サーバーを通ってアプリに送られ、画面に表示される仕組みになっています。

アプリによっては、翻訳機能やChatGPTによる要約機能を備えている場合もあり、これらの機能を使用する場合には、異なるクラウドサービスにデータを送信する場合があります。

Wi-Fiに接続せず、オフライン状態で使用できるアプリもあります。その場合は、外部のネットワークを介さないため、データが送信されることはありません。iOSやAndroid OSの標準機能でもオフラインでの音声認識が可能です。

(ただし、UDトークの開発元のサイトによると、Androidのデバイス組み込みの音声認識に関しては場合によってはデータの再利用をされている可能性があります。との記載があります。Android端末を利用する場合にはより詳細な確認を求められるかもしれません。)

会社に相談する前にチェックしておきたいこと

1. 音声データがサーバー上で再利用されないかどうか

音声認識アプリには、ユーザーが発話した音声データを収集する機能が含まれます。さらに、発話した音声をクラウドサーバーに送信し、ミーティングの議事録を保存する機能がある場合もあります。そのため、アプリがどのようにデータを利用するか、くわしく確認する必要があります。

2. セキュリティが担保されているかどうか

ZoomやTeamsなどのオンライン会議システムと同様に、複数の端末で同じミーティングに入る機能がある場合、関係のない第三者が入室できてしまうことがあるため、パスワードで保護する機能が利用できるとより安全です。また、サーバーとアプリとの間の通信がSSLで暗号化されているかどうかについても確認が必要です。

アプリによっては、Wi-Fiに接続せずにオフライン状態で音声認識を使う機能を実装している場合もあります。

3. 定期的なアップデートが行われているかどうか

新たな脅威やセキュリティ上の問題に対応するためには、定期的なアップデートが行われていることが必要です。長い期間アップデートされていないアプリは、何らかの脆弱性(セキュリティホール)をかかえている可能性があります。

上記であげた3つのポイントのほかに、他社や自治体などで導入実績があるかどうかも調べておくと良いでしょう。金融機関や大手IT企業などセキュリティルールが厳しい組織での実績を示すことができるとより効果的です。

また、サポート体制(他社に委託している場合もある)や自社のセキュリティチェックシートへの記入に対応しているかどうかについても確認しておくと良いかもしれません。

詳細については音声認識アプリを提供している会社に個別に問い合わせると良いでしょう。

クラウドサービスのセキュリティについて


このページでは、音声をテキストに変換する、クラウド上のSpeech-To-Textサービスのセキュリティ情報をまとめています。

以下は、2023年4月時点での情報です。最新の情報は各サービスのウェブサイトなどで確認してください。

Amazon AWS Transcribe

ドキュメントのAmazon Transcribe でのセキュリティ項目において、セキュリティやデータ保護についての技術的な情報が記載されている。

サービス改善のためのデータの使用をオプトアウトする項目には、下記記載あり。

デフォルトでは、Amazon Transcribe処理した音声入力を保存および使用して、サービスを開発し、お客様のエクスペリエンスを継続的に改善します。Amazon TranscribeAWS Organizationsオプトアウトポリシーを使用することで、お客様のコンテンツが開発および改善のために使用されることを拒否することができます。オプトアウトの方法の詳細については、「AI サービスのオプトアウトポリシー」を参照してください。

Amivoice API

SLA (サービス品質に関する合意)の項目2.11 「音声データ及び認識結果ログの取扱い」に記載。

  1. 契約者がログ保存なしのプランを利用している場合、サーバーに音声データ及び認識結果ログは保存されません。
  2. 契約者がログ保存ありのプランを利用している場合、サーバーに一時的に音声データ及び認識結果ログが保存され、その後当社管理下のストレージに回収されます。回収された音声データ及び認識結果ログを、当社は、当社製品及びサービスの研究開発、品質向上のために利用することができるものとします。

なお、API(共用サーバー利用型)のほかに、専用サーバー利用型、端末組み込み型という別のサービス形態があります。それらについてはAmiVoice Cloud Platform(アミボイス)のサイト内に別途記載されています。

Google Cloud Speech-to-Text

ドキュメントのデータロギング項目に記載。

デフォルトでは、Speech-to-Text はお客様の音声データや音声文字変換を記録しません。データロギング プログラムを有効にすると、ニーズに合わせて Speech-to-Text を利用できます。データロギング プログラムを有効にしてお客様のデータを使用することで、音声認識サービスを改善し、Speech-to-Text の品質を向上させることができます。このプログラムを有効にすると割引料金が適用されます。

Microsoft Azure 音声テキスト変換

Speech to Text - オーディオからテキストへの翻訳ページにセキュリティについての記載あり。

音声認識アプリ(音声認識サーバー)のセキュリティについて


このページでは、音声認識アプリと、アプリから接続する音声認識サーバーのセキュリティについてまとめています。

以下は、2023年4月時点での情報です。最新の情報は各サービスのウェブサイトなどで確認してください。

UDトーク

よくあるご質問 ページにまとめられており、システムの全体構成図も掲載されています。

UDトーク®利用規約(一般)第4条に下記記載あり。

4. 本アプリに入力されるお客様の音声については、音声認識精度向上のために収集、分析、再利用します。この際、音声は、その内容を一般に公開することはなく、厳重に管理し、音声認識精度向上のための統計量を抽出することのみに利用します。また、個人が特定できる形態での使用は一切いたしません。※なお、UDトーク®法人向けプランでは、音声の収集、分析、再利用はしていません。
5. 本アプリがバックグラウンドに回ったときは通信や録音などの処理は行いません。

UD トーク®利用規約 (法人向け・スタンダードプラン及びプレミアムプラン)第4条に下記記載あり。

5. 当社及び株式会社アドバンスト・メディアは、本サービスにより付与されたアカウントにてログインした端末を用いて本アプリに入力されるユーザーの音声については、収集、分析、再利用はしない。ただし、ユーザーが、 本ソフトウェアの拡張機能(別途課金の場合もある)により、株式会社アドバンスト・メディアではない事業者 が提供する音声認識サーバーを利用する場合、当該事業者が、入力された音声の収集、分析、再利用をする場合 がある。

株式会社アドバンスト・メディアAmivoice Cloud Platformというクラウドサービスを提供している企業です。)

YY System (YY Probe)

無料版については、サービスの品質向上のみを目的としてデータの再利用を行い、法人版、聴覚障がいプレミアムプラン等の有償版については、データ再利用を一切せず、顧客の要望に応じてセキュリティ審査への対応や各種カスタマイズが可能。(開発チームが運営しているLINEオープンチャットのノート内FAQに記載あり。)

利用規約はアプリ内から閲覧できる。その他、ご利用ガイドサーバー上にデータは残りますか?項目ページにも下記記載あり。

発言データは過去の会議履歴の確認や検索ができるように、サーバー上のデータベースに保存しています。
データの共有範囲は次の通り、アプリによって異なります。

音声などのデータはどこに保存されますか?暗号化などされていますか?項目ページに下記記載あり。

YY systemのサービスは多数の実績と高い信頼性をもつAWS(Amazon Web Services)を利用しています。また、音声認識された発言データは暗号化して保存しています。