Googleドキュメントでどこまで音声起こしを自動化できるのか、実際に音声起こしの仕事に使ってみた

  • 投稿日:
  • by
  • カテゴリ:

音声起こしの仕事が年に数回入りますが、これがもらえる金額の割に手間が掛かる。
面倒くさいけど、他にやってくれる人がいないようなので、この仕事は続けてます。
でも、正直もうちょっと何とかならないかな~と思う。

そこで、ダンナが画期的なシステムを教えてくれた。
それは、Googleの音声入力を使って、自動で文字起こしをするというもの。

必要なものはブラウザがGoogle Chromeであること。
Googleのアカウントがあって、Googleドキュメントが使えること。
あとはPCのステレオミキサーが有効であること。
詳しくは「Googleドキュメントで音声起こしを自動化する」でググってください。
細かいセッティングなどは、いくらでも出てきます。

ここでは、実際の仕事に使えるかどうかだけを書く!

話者の滑舌が良く、音声もクリアで雑音がなければ、ほぼ自動で入る。
ただ、実際にはそんな恵まれた環境のデータはもらえない。
会話形式で、どちらかが声が大きくて、もうひとりが声が小さいと、もう全然入らない。

あと、長い時間続けて音声を拾うのもできないらしい。
これは会話の切れ目などで、こまめにスタートし直すことでなんとかなる。

声が大きい人の部分からスタートすると、声が小さい人は雑音扱いされて拾ってもらえない。
この場合、無音のところからスタートすると、そこの音量レベルに合わせて音を拾ってもらえるので、小さい声でも結構入る。こっちが聞き取れない音声も拾ったことがあったので、神かと思ったことがある。

誤変換は仕方がない。結構あります。
これは地道に見直していくしかない。
でも、真っ白いページを1から埋めていくのではなく、終わりまでの分量が可視化できるので、モチベーションは保ちやすいです。

今回やったカンジだと、いつもの半分とはいかないけれど、3/4の労力で済みました。
音声の状態が良ければ、半分以下の時間で終わると思います。

これで音声起こしの仕事もラクにはなるかもしれないけど、そのうち完全に自動化されて仕事自体がなくなるかもしれない。
校正の仕事は、まだしばらくは残ると思うけどね。

最終更新日: