ぺんちゃん日記

日常のネット活動について、広く浅くいろいろと。

音声入力近況

これまでの流れはこんな感じでした。

  1. ドラゴンスピーチを使い始めてその精度の高さに驚愕する
  2. Windows 10にアップデートしたら動かなくなって驚愕する
  3. Windows 10の音声認識は相変わらずの残念感で諦める
  4. Google の音声入力を試したが思ったような制度に至らず諦める
  5. コルタナを試したら想定したよりはましな認識精度とあったので使い始める
  6. コルタナは連続入力している間にフリーズしてしまう問題に直面する

ということで数ヶ月間アウトプットがめっきり減ってしまっていました。

が、1年ぶりぐらいに試してみた Google の音声入力が躍的に精度向上しておりまして、これは使えるぞと至った次第にございます。使い方は簡単です。

  1. ChromeGoogle 検索のトップページを開く
  2. 検索ボックスの右にあるマイクボタンをクリックしてからマイクに向かって話しかける
  3. 検索結果が表示される
  4. 認識されたテキストが検索ワードとして入力ボックスに入っているのでコピペして使う

この使い方は手っ取り早いですが、1行ごとしか入力できないし、入力ごとに検索結果が出るのであまり効率はよろしくありません 。より本格的に使いたいなら Google ドライブGoogle ドキュメントが良いです 。
メニューのツールから音声入力を選ぶとマイクのダイアログが表示されます。
f:id:yasushiito:20180310151554p:plain
このマイクアイコンをするとマイクが聞き取りモードになって音声入力が可能になります。
f:id:yasushiito:20180310152112p:plain
もう一度マイクアイコンをクリックすると聞き取りを中止します。
Google 検索とは違い、ユーザがマイクをオフにするまで音声入力が有効なので、長文を連続入力できます。マイクを永続的にオンにしてしまうのは便利かもしれませんが、常に Google のサーバと通信することは意識しておいた方が良いかもしれません。
有償ソフトのドラゴンスピーチに匹敵するくらいの精度だと思うので、これが無料なのは反則だなあと思います 。

もちろんドラゴンスピーチが勝る点もあります。

  • 誤変換を修正して学習させることはできません
  • 句読点や改行を挿入することはできません
  • 文章の区切りっぽいところに半角スペースが挿入されます
  • オフラインで作業できません
  • コマンドで操作できません
  • もちろんエディタから直接 Twitter に投稿できません
  • 他にも細々とした機能が及んでいません

期待した結果が得られない場合、精度向上があるまでキーボードで入力することになります。英語版ではすでにピリオドと改行は挿入できるようなので日本語もまもなく対応するかもしれませんね。