デバイス

音声認識ツールを使うために必要な各種デバイスの紹介 カバー画像: https://unsplash.com/ja/%E5%86%99%E7%9C%9F/DsmDqiYduaU

マイク

音声認識アプリはスマートフォン一台あれば使い始めることができます。「とりあえず使いたい」ときには特に新しくマイクを購入する必要はありませんが、よりよい認識精度を得たいのであれば外付けのマイクを使用することをおすすめします。

スマートフォンのマイクを使うコツ

スマートフォンの内蔵マイクを使うときは、マイクの位置に注意するとよいでしょう。iPhoneの場合、マイクが3つ内蔵されており、背面上部(カメラ付近)、前面上部(インカメラ付近)、そして底面(充電端子の両脇)にあります。主に底面にあるマイクが使われているようです。

そのため、話し手がマイクから離れていたり、向きを逆にするだけで認識精度が変わります。うまく認識されていないなと思ったらマイクの位置を変えてみるとよいでしょう。

マイク自体の本体のバージョンに依存します。たとえばiPhone8よりも新しいiPhone14のほうがマイクの性能がよく、認識精度も上がります。

ヘッドセッドマイク、スタンドマイク

パソコンやスマートフォンに内蔵されているマイクは、一般的には、「無指向性」タイプといわれる広い範囲の音を集音するマイクが使われており、離れた場所の音声を集音しやすい反面、雑音が入りやすいという特徴があります。音声認識の精度をより高めたいときには、「単一指向性」タイプのヘッドセットマイク(ヘッドフォンマイク)やスタンドマイクなど、口とマイクの距離が近く、一定に保てるものをおすすめします。

製品は、エレコム、オーディオテクニカ、サンワサプライ、ロジクールなどのメーカーからさまざまな製品が出ており、価格は2,000円前後のものから2万円前後のものまで様々あります。

購入するときには、マイクをPCやスマートフォンに接続する方式を確認しておきましょう。大きく分けてBluetoothを使うワイヤレス方式と、従来の有線方式の2種類があります。最近ではワイヤレス方式が主流ですが、通信が不安定になったり音ズレが起きることもあるため、精度重視であれば有線方式のほうがおすすめです。

有線マイクで使っているパソコンやスマートフォンとマイクの端子の規格が異なる場合には、変換コネクタも必要です。USB-AからUSB-C、3.5mmステレオミニプラグからUSB-Aなど、端子の形が異なる組み合わせでも使うことができます。

音声認識に特化したマイク

アドバンスト・メディア社から音声認識に特化したマイクが発売されており、Amazonでも購入可能です。有線接続、Bluetooth接続の両方に対応しており、ネックストラップで首にかけたり、クリップで襟に止めたりすることができます。

AmiVoice® Front WT01

モバイルWi-Fi

UDトーク、YY Probeなどのスマートフォンで使用する音声認識アプリは、通常のモバイル回線で十分に活用できます。

一方で、Wi-Fiが設置されていない場所で、Zoomなどのオンライン会議システムを使用したり、パソコンを使用して複数人での編集作業を行ったりする場合には、モバイルWi-Fiが必要になることもあります。
★YYProbeはオフライン認識モードが備わっており、Wi-fiが設置されていない場所でも音声認識が可能です。

また、海外で使用するときには、現地の通信事業者の回線を使用する「データローミング」機能がありますが、通信料が比較的高額のため、この場合にもモバイルWi-Fiをおすすめします。

テザリング機能との違い

モバイルWi-Fiと似た機能で、スマートフォンのモバイル回線(4G, 5Gなど)を使用して接続する「テザリング」があります。この機能は、モバイル回線の契約オプション項目に含まれていることが多く、機器を追加する必要もないので手軽ですが、データ容量は少なく、通信速度も遅い傾向にあります。

モバイルWi-Fiは、テザリングと比較するとデータ容量が大きく通信速度も高速です。長時間のイベントで使用する場合には、モバイルWi-Fiのほうがよいでしょう。

モバイルWi-Fiを利用するには

モバイルWi-Fiサービスはau, docomo, SoftBank, UQ WiMax、Y!mobileなどの通信事業者が提供しています。

通信に使用するルーターは持ち運びに便利な小型タイプなどいくつかの種類があり、購入するかレンタルすることができます。

会社によっては、使用する業者やプランなどが決まっていることがあるので、購買部門やIT部門などに確認しましょう。

契約のポイント

モバイルWi-Fiを利用する際の注意点

機器の使い方は簡単で、スイッチを入れるだけですぐに使えるものが多いです。

SSIDとパスワードはモバイルWi-Fi端末側で設定するため、複数人で使用する際には、パスワードの管理、共有方法には気をつけましょう。端末に付箋でパスワードをメモするのは避けてください。

入力や誤認識修正に使用する端末(スマートフォン、タブレット、パソコン)

端末の種類について

音声認識アプリへの入力や誤認識修正に使用する端末は、大きく分けてスマートフォン、タブレット、パソコンの3つの選択肢があります。それぞれメリットとデメリットがあるため、目的にあわせて使い分けましょう。

端末 メリット デメリット
スマートフォン (iPhone, Android) コンパクトで持ち運びが容易 画面が小さいため、文字が読みづらい
タブレット (iPad, Android) 文字が大きく複数人で画面を見ながら使いやすい スマートフォンより大きいので持ち運びが不便
デスクトップPC (Windows, Mac) Zoomなどのオンライン会議システムと併用しやすい 持ち運びが不便で使用できる場所が限られる

複数の種類を組み合わせる使い方もできます。
例えば、スマートフォンをマイクにして、タブレットをディスプレイにして参加者全員で画面を共有するといった使い方も
できます。タブレットやパソコンの画面を液晶ディスプレイに出力すれば、PC要約筆記と同様に、スライドや登壇者の横にディスプレイで字幕を表示させることができ、視線移動の負担を減らすことができます。

また、バータイプの液晶モニターを使うと、テレビや映画の字幕のように画面の下にキャプションを表示させる、といった使い方もできます。(製品の例:12.6型バータイプ液晶モニター Screen Plus, ITPROTECH)

選ぶときの注意点

各種音声認識アプリの中にはリアルタイム誤認識修正ツールが使用できるものがあり、音声認識アプリ本体の内部で実装しているものもあれば、誤認識修正のみに特化したアプリを別途提供しているものもあります。

使用したいアプリによって対応している端末やOSにより使用できる機能が異なることがあるので注意しましょう。

以下に例を示します(2023年4月現在の情報)。

アプリ名 スマートフォン(iOS, Android) タブレット(iPad, Android) パソコン(Windows) パソコン(Mac)
UDトーク(本体) 対応 対応 非対応 非対応
(※M1 Macは対応)
UDトーク(認識結果編集アプリ) 非対応 非対応 対応 対応
YYProbe 対応 (※古いiPhoneでは高精度オフライン版が動作しません)
対応 非対応 非対応
(※M1 Macは対応)
YYデスクトップ字幕 非対応 非対応 対応 非対応