スポンサーリンク

ブログ記事を書くのに音声入力を始めてみた

最近、音声入力をするとか、インタビューの文字起こしを音声入力に突っ込んでいくとか、音声入力の話題を聞くようになってきた。

音声入力

実は、ちょっと前よりお客様の声は紙に書いてもらうのではなくて、雑談形式で話をしながら後で文字起こしをするという形に変え始めている。文字起こし用のツールを使ってゴリゴリ文字起こしをしていたが、どうにも効率が悪いので音声入力に挑戦してみた。

音声入力に録音を突っ込んでみると、文字起こしとしてはそこそこいい結果だった。だが、実のところ自分で聞きながら打ち込んでいくのに比べ効率はあまり良くならずにほぼ放置状態になっていた。

音声入力リベンジ…

最近、自分の周りでうまくいっているという話が広まりだしている。そこで、再チャレンジしてみた。ツール的には、Googleドキュメントだ。周りを見聞きしても、これが無料だし精度が高いということだ。

音声入力に復帰しはじめてわかってきたことがある。

音声入力をするパソコンの性能が高いに越したことはないのだが、今までは何の性能が影響するのかがよくわからなかった。結論からいえば、うちの場合にはCPU性能よりもストレージ性能の影響が大きい感じ。

普段2台のPCを使っていて、

  • i5+8GB RAM+2TB HDD デスクトップPC
  • i5+8GB RAM+256GB SSD ノートPC

だ。CPU性能は倍とかの違いはないと思うけどデスクトップの方が世代が新しいし、デスクトップ用なのでたぶん高性能。でも、音声入力をしてみるとスムースさがまったくなくて、すぐに止まる感じになる。

一方ノートPCはCPUが遅い感じはあるけど、音声入力に関してはスムースに入る。なので、ストレージへの書き込み性能が音声入力の肝になるような気がする。

ネット回線の速度がボトルネックになる可能性はなくて、というのもデスクトップは有線LAN接続されていて、ノートPCは無線LAN接続だ。

Googleドライブのくせ(?)

あと、音声入力時に少し癖がある。Googleドライブしか使ったことがないから、ほかのアプリでも出るかどうかはわからない。で、どんなことかというと、音声の入力空白時間ができると、変換しないというか反応してくれないときがある。

ちょっと変な感じだが、隙間を空けずにどんどん入力していくと変換は止まらない。なのに、いったん少し隙間を入れてしまうと、入力待ち状態になるんだか、しばらく反応しないような感じになって、何度か話しかけるような感じになる。プログラムの仕様だとは思うけど、ブログ記事を書くときに、考えながらというのがあまりできなくて、とにかく長い文章単位で一気に話さないといけない感じだ。

まぁ、うちのPCはあまり性能が高くないので、高性能マシンを使っている方には全然関係ないもしくは感じ取ることができないトラブルかもしれない。

音声認識的としては、マイク入力レベルを上げておいたほうが認識率は上がるような気がする。もちろん、一番いい状態の入力レベルというのはあるだろう。で、マイク入力がちゃんとできている場合には、認識率は結構高い。とりあえず、音声でバーッと書いて、あとから校正・推敲をしていく感じだろう。考えている間はない。どんどん入れていく。

この記事もまずは音声入力で書いてみた。

これから

まだまだ頭が付いてこないようで、推敲時間がだいぶかかり、かつ修正点も多かった。この音声入力に慣れてくると、頭もだいぶ良くなっていくような気がする。

とにかくスピード重視の文章作成には慣れは必要だけど音声入力に軍配があがりそうだ。段々と慣れていきたい。