ぺんちゃん日記

食と歴史と IT と。 Web の旅人ぺんじろうが好奇心赴くままに彷徨います 。

ドラゴンスピーチはどこに行った

久しぶりの更新となりました。洒落にならない病気で入院してヘロヘロでしたが、何とか体調も落ち着いてきたのでこの一年半の間にあった音声認識入力周りのことをお知らせして行きたいと思います。

ドラゴンスピーチが起動しなくなりました

Windows10へのアップグレードが行われ、ドラゴンスピーチが起動しなくなりました。ネット検索したところ動作不良の報告が多数。メーカーサイトからは無慈悲のサポート対象外アナウンス。音声入力できなくなって困り果てました。

デスクトップPCの症状

プロファイルが壊れました。新規に作成したプロファイルなら起動したので、そこに既存のファイルを無理やり上書きしたら無事復元できました。ただし上級者限定の荒業です。

ノートPCの症状

起動を試みるとOSごとフリーズしました。再インストールすらできない状況。慌ててwindows7に巻き戻したけど、既にそちらでも動かなかった。ハードディスクの損傷を疑ってディスクを検査したら同じようにフリーズしたのでドラゴンスピーチは悪くないかもしれないです。

どうするの?

ハードディスクやpcを交換したところで動く保証はないので降参です。いろんなマシンに突っ込んでポジティブな結果が得られたならPc買い替えも検討するのですが…。英語版はバージョンアップしているのに日本語版が放置されている所を見るとメーカーの対応も期待できません。日本語に力を入れても儲からないから見捨てられたのかな。なんとかならないかなぁ。

ほかのソフトはどうなの?

AmiVoiceはWindows10のサポート対応してます。今更同価格帯のソフトを買うのもあれですが。他に信頼できそうな有償ソフトは見当たりません。

Appleのsiriを始めgoogleマイクロソフトなど、各社音声認識サービスを開発していて追加コストなしに利用することができます。ちなみにこの文章はwindowsのコルタナさんに聞き取って貰っています。コルタナさんに話かけるとEdgeが起動してbingで検索してくれますので、検索ボックスからいちいちコピペしています。はっきりいってめちゃくちゃ面倒ですがないよりましです。chromegoogle検索でも同じようなことができます。各サービス認識精度はまあまあですが、いずれも検索に特化しているので長文を作成には向いていません。解釈も検索用途に偏っています。学習もしてくれないので時々絶望しますがそれでもないよりましです。当面の間、音声認識こちら(スマホ需要)を中心に回っていくと思われます。人材も英語中国語に偏って流れていくと予想されます。日本語版は日本人が頑張ってもらわないとターンが回って来ないかも。

結論

自己責任でwindows10にインストールするか、中古のwindows7マシンを手に入れてインターネットに繋がらない環境で利用するか、AmiVoiceに逃げるか。いずれにせよただでは済まなそうです。

この一年の間に

pcがずいぶん難しいものになったと思う今日この頃。

コンピュータが自分の意思に反して動くとか、初めての経験ですよ‼

うっかりプログラミングミスして暴走させた経験はたくさんありますけど、スキル不足は自分の責任。それは仕方ありません。

しかし、なすすべもなく強制再起動ってあまりにもひどいじゃないですか。しかも、アップデートによって小1時間操作不能になったり、デバイスが動かなくなっていたり。

ちょっと席を外したすきにこれですよ。出社してPCに電源を入れてトイレに行っている間にアップデート再起動操作不能なんて事例も少なくないのでは?

毎日欠かさず使っている人ですかこれですから、週一程度しか利用しない方だと、各種ソフトウェアのアップデートだけで1時間、やりたい作業にたどり着くまでに力つきてしまうような?

もう初心者にpcを勧められる時代ではなくなったのだなと思いました。

どうやってパソコンの使い方覚えたの?

実務には耐えられない体となってしまったので、 ossの開発で余生を送っています。

障害者施設で過ごす時間が多いので、開発時間の半分以上は施設で行っています。

まぁ、そんな状態ですので、施設の隅っこでコソコソとプログラミングする毎日です。平穏にプログラミングできる日常を過ごせれば良いのですが、案外そうもいきません。障害者施設は来客が頻繁にあるのです。役所方面とか実習の学生とか。その他にも、職員の入れ替わりが激しい業界ですので、新しく入ってきた人とか。

で、そういった(障害者と楽しく会話して仲良くなることを目論む)人たちが施設にやって参りまして、 PCに向かう私の姿を見るわけです。となれば、画面を覗き込んで何をやっているのか尋ねたくなるのが人情ってものです。芸能人のブログがー!新作のゲームがー!と期待できますしね。

しかし、そこにはなんと!

期待を裏切る黒字ベースのエディタ!立ち並ぶコマンドプロンプト! そして、ブラウザにはリファレンス。

なんだこれは!

そりゃまぁ、自分の知っているWindowsの画面とは全然違うわけですから、そうなりますわな… 。

それで「これは何? 」と聞かれるわけだけど、開発中のアプリが即座に見られる形になっているわけでなし、かといって、口頭では何をするためのソフトだと上手に説明できず。心ならずも適当にお茶を濁す羽目になるのであります。

意地悪で教えないわけじゃないんですよ。専門用語をふんだんに盛り込んだ熱いトークを展開した後、コンソールに出力される実行結果を見せてゲヘゲヘと笑ってもキモがられるだけじゃないですかー。ヤダー。

そこで本題なのですが、彼らは当然の疑問として「こんなにたくさんのアプリケーションの使い方をどうやって覚えたのだろう? 」となるわけですよ。それでタイトルの質問をされちゃうわけなんですね。

この質問をされるたびに困っちゃって… 。コンピュータ関係の学校に通ったわけでなし、仕事をきっかけに覚えたわけでなし。興味本位に弄りまわしているうちに使えるようになったわけですから。当然正直に、そうやって答えるんですね。

まぁ昔のパソコンなんて、電源を入れるとBASICが立ち上がるのが普通だったわけで、今のようにリッチなソフトが即座に使える環境ではなかったのだから、それ以外になかったわけですけど… 。

いずれにせよ、この質問については、もっと真剣に答えを用意しておいた方が良いのではないかなぁと近頃思うのです。いちど基礎が身についてしまえば、後は適当でなんとかなるにしても、最初のとっかかりだけは何らかのトレーニングがあったはずです。でなければ、アプリケーションはともかく、プログラミングはできない。その段階を理解できない限りは、コンピューターに興味を持つ中学生に質問された時(学校行事で中学生が来ることがあります) 、適切に回答できずに興味を掘り下げる機会を逸してしまうのではないでしょうか?

そこで、もう一度考え直してみたわけです。結果、出てきたのが

パソコンを買ったときに付属してきたBASICのリファレンスマニュアルに掲載されていた小さいプログラムを頑張って入力した経験

です。退屈でやることのないときに十行程度の小さいプログラムを入力すると、不思議なことが起こるわけです。図形が描画されたり、音が鳴ったり… 。ひとしきり遊んだ後は改造したり。お小遣いが底をついた時の娯楽としては悪くなかったように思います。それを面白いと思えるかどうか、そこが分かれ目になるんじゃないかなと思います。

もう一つ外せない話として、ベーマガがあります。影響力としてなら、ベーマガの方が格段に上なんですけど、あれはあの時代特有の環境だったから昔話だけに限定されちゃいますね。あのような現象がもう一度起きればいいんですけど。

超長いストローで快適に水分補給する。

卓上のコップに刺したストローで水分補給したいわけですが、どうしても首が曲がりません。前のめりになれば届くわけですが、割とバランスギリギリで油断すると転倒の恐れあり。単純に私の胴が長いだけかもしれませんが、卓上のコップから水分補給するのって難しいですよね。台の上にコップを載せるなどして対処してきましたが、さすがにそれも長くは続かないだろうと、新たな解決策を求めていました。

冷静に考えて、もっと長いストローを使えば届くわけですが、通常のストローは長くても二十数センチ。一般に流通しているものの中で一番長いものを頼んでも、最低十センチは足りません。そんな時はおとなしくネットで探します。

Amazonで見つかったのはこれ。五十センチとか長すぎだろうと思わないでもないですが、パーティーグッズらしく、イベントのゲームに使うことを想定しているようです。 長い分にはハサミで切断すれば良いだけなので好きな長さに調節すればよろしいかと。東急ハンズが取り扱っているようなので、店頭に行けば入手できるかもしれませんが、手っ取り早さを考えれば、通販の方が手堅いですね。規格外の長さのため送料が高くつくので、その辺苦しいところですが、ここは思い切って二つ購入して、一本あたりの送料を抑える方針にしました。

使ってみれば、これまでの問題はおおむね解決しました。そのうえで、残る少々の問題点を挙げておきます。

  • 首が曲がらない

曲がるストローならもっと飲みやすいんですけど。長いときは曲がらない側を切ればよいので、曲がってくれてもバチは当たらないと思うのですが。

  • ちょっと太い

もう少し細い方が飲みやすいですね。折れにくくするために、太い目に付くってあるんでしょうか。

  • ちょっと硬い

材質のせいでしょうか、曲がりにくく固いため口当たりもよくありません。こうやって比べてみると、普段何気なく使っているストローが案外細やかな気配りがあることに気付かされます。

まとめてみますと、使い方さえ工夫すれば、遊び目的だけでなく、実用としても使えるかと思います。二リットルペットボトル向けの長さのストローとかあったら面白いかもしれません。

ちょっと放置した

ドラゴンスピーチで音声入力ボックスを表示して、さまざまなアプリケーションに音声入力をするやり方について書きたいなと思っているが、時間が取れない。Firefoxには直接入力できないので、この機能を使うことになるんだけど。需要があるなら書くのだけど。

ベッドサイドテーブルをパソコンラックとして利用する

今回はPC周りの環境を整備しなおしたので、特徴を紹介しますね。

テーブル

ノートPCをご覧のようなベットサイドテーブルに載せて利用しています。

このタイプのテーブルは高さを自由に調節できるので、車いすでの利用に便利です。自分にあった高さでキーボードタイプできます。

キーボード

やはりノートPCのキーボードでは思ったような入力ができません。まぁ元々思ったような入力ができるわけではありませんが、昔はそれなりにできたし、今でも多少ならできるんです(力説)!もちろん、入力しやすいように配慮されたクールなキーボードを別途購入して利用となるのですが。そうなるとキーボードを二枚使うことになるので、すごく邪魔です。というか、サイズ的にテーブルに収まらない。もう一つテーブルを用意して、ノートPCを奥のテーブルにおけば解決…すれば良いのですが、これだとモニターが遠すぎて、細かい文字が読めません。

万能台

そこで、次のような台を用意して、テーブルを二段にします。

不二貿易 玄関台 幅60cm 天然木製 段差ステップ 88989

不二貿易 玄関台 幅60cm 天然木製 段差ステップ 88989

台の上にノートPCを (音声入力用のマウスも含めて)配置して、テーブル面にキーボードおよびマウスをおきます。これで下駄の下の空間で操作をします。もちろん、ある程度のスペースがないと、手が入らない(動かせない)ことになります。ついでに言うと、手をすべり込ませるための導入スペースも必要です。

今回これを購入したのですが、これを探すのに随分苦労しました。まず商品名がわからない(苦笑) 。ジャンル的には「すのこ」とか「収納台」に当りますが、統一的な名前は無いようです。いろんなキーワードで検索して関連商品の名前から見つけていくしかありません。結局私は 「万能台」というキーワードから、この商品にたどり着きましたが、商品名は「玄関台」 。主な利用方法はお年寄りが玄関の段差を楽に登れるようにするためのものです。開発者もまさかこんな形で利用されるとは想定してないでしょうね。

まぁとにかく、テーブルに乗るサイズで程よい高さの製品を探すのに苦労します。ハンドメイドであればサイズの微調整も含めて探す手間も省けるのですが、自分で作れるようなら、苦労しませんよね。

この辺なら、重量も軽いし、アルミ製なので放熱にも最適なのですが、何分、奥行きが足りなくて、安定性に不安があります。もう一回り広くて高さを抑えてあれば購入なんだけどなぁ。

ドラゴンスピーチは思ったように音声入力できない

ドラゴンスピーチの小さな不満シリーズ。

ジャストシステム ドラゴンスピーチ11J 通常版 ヘッドセットマイク付

ドラゴンスピーチの特性として、短い文章は誤変換しやすいです。それと、最初の音を取りこぼしやすいです。発音のうち、ドラゴンはいくつかの音を苦手にしているようです。このような理由から、ドラゴンが文脈では判断しづらいような、短くて苦手な文章を入力するとき、苦戦することが多々あります。

小さいことにこだわらないなら、音を拾いやすい別の単語に変えたり、わざと文章を長くしたり、文章の構成を変えたりなど、様々な方法で問題を回避できます。ここら辺でこだわりを発揮すると、苦しい思いをします。小さな違いが文学的に大きな違いとなる場合などです。

例えば「量と質」と入力したいのに、 「ようと質」と認識されてしまったらどうしましょう? 「よう」の部分を選択して修正することになるでしょう。しかし、 「量」は音が短すぎて文脈で判断が難しいので、ドラゴンも簡単には認識してくれません。実はこの場合も「質と量」と順序を変えればいとも簡単に認識してくれるのですが、 「量」を前に持ってきて強調したいとすると困ります。もちろん根気よく修正することで、なじんでくるでしょうが、その努力よりも自分のドラゴンに合わせた方が簡単なのですよね。地道な修正は時間と体力を必要としますから。

このような感じにドラゴンと喧嘩しないで上手に付き合えばわりと便利に使えるのですが、それと引き換えに、自分らしさを損なうことを突きつけられます。自分らしい文章ではなく、ドラゴンらしいリズムのテキストを書いていくことになるでしょう。自分なりの文章術を磨きあげた人にとっては受け入れがたい部分かもしれません。

競合製品のアミボイスには、これまでに自分が書き連ねてきたテキストを読み込んで、その人なりの文章の癖を覚えこませる機能がありましたね。あの機能があれば、地道な作業しなくても、これまでの蓄積を残さずに活用できます。ドラゴンスピーチにも取り入れられないかなぁ。

エムシーツー 音声認識ソフト AmiVoice SP2 USBマイク付

エムシーツー 音声認識ソフト AmiVoice SP2 USBマイク付

少し話はそれますが、話し始めの「あー」 「えー」を除去する機能が強すぎて余計な苦労をすることが多いです。 「絵を描く」や「ヘッダ」などはなかなか認識してくれません。この機能、ほとんど意味がないじゃないかな?少なくとも私は、話し始めのときに、そのような前置きを入れることはありません。もちろん人によって違うので、どの程度の強さで除去するかをオプションで設定できるといいんですけどね。「絵」については、今でも地獄じゃ。マンガ作成ツールを開発しているので、ドキュメントにはその辺のワードがぎっしり使われますから。