Web版のWordで使える音声ファイルの文字起こし機能「トランスクリプト」を試してみた

ライターの仕事をしていると、取材のときに録音した音声ファイルを文字起こしするという作業をすることがあります。

文字起こし作業は時間の長い音声ファイルほど手間がかかってしまうもの。かなり地道な作業になるので、正直あまり楽しくはありません。できることなら誰かにお願いしてしまいたいです。

これを請け負ってくれる業者はたくさんありますし、ランサーズやクラウドワークスなどのクラウドソーシングサービスで依頼できる人を探すこともできます。しかし、もちろん依頼するには相応の対価が必要です。

「たとえ精度が低くても、音声ファイルを無料で文字起こしする方法はないものかな……」と調べてみると、なんと以前にウェプレスでも紹介したWeb版のWordでできることがわかりました。

■Microsoft Officeには無料のWeb版がある! インストール版との違いや注意点は?
https://wepress.web-magazine.jp/2021/12/10/20211210/

Web版のWordは有料版Officeのライセンスを持っていれば商用利用することも可能。早速以下のURLからWeb版Wordを開いて機能を試してみました。
https://www.office.com/

使い方自体は何も難しいことはなかったです。


メニューから「ディクトーション」→「トランスクリプト」と選択します。


すると画面の右側にトランスクリプトのメニューが表示されるので、こちらから音声ファイルをアップロードします。

アップロードできる音声は月間300分までという制限があるので長いファイルを読み込ませる場合は注意。取材時の録音データは公開できるものがないですが、以前に占いっぽいことをしてもらったときの音声データが残っていたので、今回はそちらをアップロードしてみました。

すると一瞬にして文字起こしが完了。通信環境などにも左右されるかと思いますが、3分程度の音声だと1分もかからずにデータ化されました。しかも音声の質から話者の判別もしてくれていますね。

文字起こしが完了したデータは細かく区切られているので、ひとつひとつ選んでドキュメントに追加することもできますし、下部の「ドキュメントを追加」ボタンから形式を選んで追加することもできます。

肝心の精度は正直なところ65点くらい……でしょうか。公開された当初は英語専用機能だったということもあってか、漢字や固有名詞などの変換はちょっと弱いように感じました。あと話者の判別は話をする人の声質にもよるかと思いますが、そこまで期待しないほうがよさそうです。

ただ、Word上で音声データを再生することができ、文字起こしデータが区切られている箇所に合わせて頭出しすることができるので、変換が怪しい箇所はすぐに確認して手直しできます。音声が近い言葉には変換されているので、テキストを見ながら聞き直せばだいたい問題なく修正できました。

マイクを使って吹き込んだ音声をリアルタイムで文字入力する機能はGoogleドキュメントやダウンロード版のWord、さらにはiPhoneなどのスマホ端末などにも普及しましたが、音声ファイルを読み込んで文字起こしできるサービスはほぼなかったので、ライターの私にとってはかなり重宝しそうです。

普段のビジネスシーンでも会議の議事録などをつけるときにはかなり役立つのではないでしょうか。

【PR】


さいたまのホームページ制作運用定額プラン2x2(ツーバイツー)のご案内


長尺動画制作パッケージのご案内│新浦和映像