みなさん、こんにちは。
埼玉県ふじみ野市でITサポートを行っているSORAの関口です。
メールや企画書や報告書など、文章作成することが多い仕事では、いかに効率的に文章を作成するかが業務の効率化につながります。
「音声入力だけで文章が作成できたら・・・」と考えている方「音声入力は誤認識が多くて結局は使えない」と思っている方、ぜひ音声入力にチャレンジしてみてください。
最近の音声入力は、音声認識精度が向上した結果、マイクがあれば「誰でもかんたんに直ぐに音声入力する」ことができます。
でも、「どんな音声入力アプリがあるの?」「どの音声入力アプリが一番いいの?」と疑問に感じますよね。
今回は音声入力の代表的なアプリ『スピーチノート』・『Windows10音声入力』・『ドラゴンスピーチ』の3製品の比較評価を行い、オススメの音声入力アプリをご紹介していきます。
音声入力アプリの比較評価
今回は以下の音声入力アプリを使い比較評価を行いました。
- スピーチノート(google 音声入力)
- windows 10音声入力
- ドラゴンスピーチ
比較評価の結果は下記のとおりです。
【評価環境】
OS:Windows10(surface pro3)
マイク:ロジクールG430ヘッドセット利用
音声入力アプリの製品紹介
スピーチノート(google音声入力)
スピーチノートは google 音声入力を利用した、無料のクラウド型Webアプリケーションです。
インターネット上にあるgoogle の音声認識機能を使用するため、パソコンはインターネットに接続されている必要があります。
他の音声アプリとは違い、声をパソコンに覚えさせる”初期トレーニング”が不要のため、スピーチノートはマイクを購入すればすぐに使うことができます。
しかも、音声認識率が高く変換速度がとても速いので、文章を作成するときなどは、スピーチノートがオススメです。
また、スピーチノートはスマートフォンでも使用することができます。
ブラウザ版のスピーチノートは下記URL で利用することができます。
■こちらの記事もご参考ください。
windows 10音声認識
Windows 10音声認識は、windows 10に標準インストールされている無料の音声入力機能です。
OSにインストールされているため、パソコンがインターネットに接続されていなくとも音声入力ができます。
Windows10の音声認識は、音声認識精度を向上させるため初期トレーニングが必要です。
トレーニング後は「テキストエディタ」や「ワード」など主にマイクロソフト製品で音声入力できますが、マイクロソフト製品以外のアプリでは安定した音声入力ができません。
OS標準の機能であるためwindows 10のOSコントールも音声入力で行うことができます。
Windows10音声認識は『Windows簡単操作』→『Windows音声認識』から起動することができます。
ドラゴンスピーチ
ドラゴンスピーチは昔からある音声入力の有料アプリです。
現在のバージョンは「ドラゴンスピーチ11」です。
ドラゴンスピーチは、windowsパソコンにインストールして使用します。
windows 10音声認識と同様にインターネットに接続されていなくても音声入力ができます。
ドラゴンスピーチも音声認識率を向上させるために初期トレーニングが必要です。
トレーニング後は様々なアプリケーションで音声入力が使えるようになります。
また、ICレコーダーやスマートフォンを利用した音声入力など様々な機能がドラゴンスピーチには備わっています。
■こちらの記事もご参考ください。
音声入力アプリの機能評価
4-1.音声認識率
3つの音声入力を使い宮澤賢治の『雨にも負けず』を音声入力しました。
入力結果は以下のとおりです。
■スピーチノート
■Windows10音声認識
■ドラゴンスピーチ
音声入力の認識率はスピーチノート(google音声入力)の認識率が一番高いです。
google 音声認識は、誤って認識した文字も前後の文章から自動的に修正されているようで、かなり精度の高い文章が作成されます。
ドラゴンスピーチも認識率は普通に使えるレベルです。
ただ、私の発音の問題かもしれませんが、濁点や「きゃきゅきょの拗音(ようおん)・小さな「っ」の促音(そくおん)が含まれる文章の場合、認識率が悪いと感じます。
『雨にも負けず』の音声入力では「行って」の文章が全て「、」で認識されています。
Windows10の音声認識率が1番低かったです。
事前に音声登録トレーニングを行っていますが認識率は改善されませんでした。
音声認識速度
音声の認識速度もスピーチノートが一番高速でした。話したと同時にすぐに文章化されていきます。
ドラゴンスピーチはアプリ自体の処理が重たいため音声入力した後の文字変換に若干のタイムラグが発生します。
しかし、ドラゴンスピーチは不要な機能を停止し、音声入力専用モード(ディクテーションモード)に切り替えることで、音声入力の速度は向上します。
Windows10の音声入力もドラゴンスピーチとほぼ同じです。
文章修正機能
音声入力では、必ず文字の誤認識が発生します。
修正機能とは音声入力時に誤認識した文字を、「xxを修正」と音声コマンドのみで文字修正する機能です。
クラウドタイプのスピーチノートには、文章修正機能はありません。
誤認識をした場合は、音声入力後手作業で修正を行う必要があります。
ただ、スピーチノートは認識率が高いため、あまり修正する必要がありません。
windows 10音声入力とドラゴンスピーチに文章修正機能が備わっています。 ドラゴンスピーチの場合「xxxxを修正」と話すことで、 修正候補がリストアップされ音声操作だけで文章を修正することが可能です。
騒音対応
スピーカーで音楽を聴きながら音声入力できるかの評価を行ないました。
その結果スピーチノートが1番でした。スピーチノートは周りに雑音があっても綺麗に音声だけを認識してくれます。
windows 10音声認識とドラゴンスピーチは、周りに雑音があると認識率がかなり低下します。
どちらの製品もマイクから入ってきた音を全て音声変換するからです。
ちなみに、ドラゴンスピーチとキーボードを併用して使用すると、キーボードの「カタカタ」音をドラゴンスピーチが拾い「カタカタ」と音声入力されることがあります。
拡張性
拡張性とは、様々なアプリケーションで音声入力が使えるかどうかの評価項目です。
拡張性ではドラゴンスピーチが一番になります。
スピーチノートはクラウドタイプの音声入力のため、基本ブラウザ上でのみ利用できます。
ブラウザ上で音声入力を行い、入力した文章をコピーして各アプリケーションに貼り付けする使い方になります。
Windows 10音声認識は、『ワードパッド』『ワード』や『エクセル』などのマイクロソフト製品で使用することができました。
また、ジャストシステム社の『一太郎』でも音声入力することができました。
しかし、それ以外のアプリでは安定した音声入力ができませんでした。
ドラゴンスピーチは、様々なアプリケーションで音声入力が可能です。
私が一番利用しているのが、マインドマップソフト「iMindmap」での音声入力です。
マインドマップを作成時に音声入力でキーワードをインプットできるので、かなりスピーディーにマインドマップを作成することが可能です。
辞書登録機能
音声入力で問題になるのが固有名詞の漢字です。
例えば、私の名前は関口剛史(せきぐち・たけし)ですが、「せきぐちたけし」と音声入力をしても、アプリは「関口剛史」か「関口健」それとも「関口武」なのかを判断することができません。
固有名詞を常に同じ漢字で変換させる為には辞書登録機能が必要になります。
スピーチノートには辞書登録機能がないため、固有名詞はその都度手動で修正する必用があります。
Windows 10音声認識とドラゴンスピーチには辞書機能があるため、固有名詞の音声と文字を辞書登録することで、正確な音声入力ができます。
OSコントロール機能
OSコントロールとは、Windowsの「 画面スクロール」操作や「アプリケーションの切り替え」などのWindows操作を音声コマンドで行う機能です。
当然、クラウドタイプのスピーチノートには、この機能はありません。
Windows10音声認識とドラゴンスピーチ共に音声コマンドでOSをコントロールすることが可能です。
ただし、この機能が有効だと音声認識速度が遅くなることがあります。アプリに音声がインプットされたとき、それが文字変換する「音声入力」なのか、それともOSを操作する「音声コマンド」なのかを判断する時間が発生するからです。
私がドラゴンスピーチを使用する場合、この機能を無効にして音声入力専用モード(ディクテーションモード)にしています。
オススメの音声入力アプリは?
以上3つの音声入力アプリを比較評価してきましたが、 私の主観で順位をつけると下記のとおりになります。
1位 スピーチノート
2位 ドラゴンスピーチ
3位 windows 10音声認識
スピーチノートは、高い音声認識率、早い音声変換速度、周りの騒音対応など、他の2つのアプリよりも頭ひとつ抜け出た状態です。
しかし、クラウドタイプの音声入力のため、ネット環境が必須のうえブラウザ上でしか使えないのと辞書登録ができないのが弱点です。
スピーチノートの弱点を補うために、私はドラゴンスピーチを併用して使用しています。
私の音声入力アプリの利用方法としては、まず、ドラゴンスピーチとiMindmapの組み合わせで企画案を作成。
次に企画案を見ながらスピーチノートで下書き文章を音声入力で作成します。
最後にスピーチノートで作成した下書き文章を『一太郎』にコピーし、一太郎のアウトライン機能で文章を組み立て校正をしています。
キーボードで文章を作成するよりも、まず音声入力で下書き文章を作成し、下書き文章を組み立て・校正をしていく方が文章作成時間は短くなります。
■こちらの記事もご参考ください。
まとめ
今回の音声入力の比較評価はいかがでしたでしょうか?
音声入力は、コンピュータが聞き取りやすい話し方をすることがポイントです。聞き取りやすい話し方に慣れるまで少し時間がかかりますが、慣れてしまえばスムーズに音声入力ができるようになります。
特に今回ご紹介したスピーチノートは、マイクがあれば無料で使えますので、音声入力に興味がある方は、ぜひ一度試してみてください。
きっと、音声入力の認識率の高さに驚かれると思います。
最後に独り言ですが・・・
一人一人にパソコンが導入された結果、私たちのコミュニケーションの多くはメールやSNSを利用して文章で交わされるようになりました。
そして、多くの文章を作成する必用があるため、今度はコンピューターに話しかけて(音声入力で)文章を作成するようになっていきます。
しかし、人と人とのコミュニケーションは会話がいちばんだと、私は思います。
音声入力で作成した文章を相手に送信するのもいいですが、たまには、人間どおし膝を突き合わせながら会話を交わすことも大事だと思います。
ここまで長文をお読みいただきありがとうございました。
7.今回のオススメアイテム
■音楽を聞きながら音声入力をするときは、ヘッドセットがオススメです。
■外出先で音声入力をするときは、小型マイクがオススメです。
コメント