以前にウェプレスで【iOS 18以降のボイスメモに搭載された「文字起こし機能」が便利!】という記事を書きました。AI技術の進歩により、文字起こしや音声認識の技術も向上。すべての端末では対応していませんが、標準搭載の「ボイスメモ」アプリでも自動で文字起こしされるようになったのは本当にすごいことだと思います。
iOS 18以降のボイスメモに搭載された「文字起こし機能」が便利!
https://wepress.web-magazine.jp/2025/08/12/20250812/
「ボイスメモ」の文字起こしはまだ精度が低め
ですが、記事中で紹介したとおり、「ボイスメモ」の文字起こし機能の精度自体はまだそんなに高くありません。会話の大まかな内容は把握できますが、そのまま記事や議事録などにするのは難しいのが現状です。
オンライン文字起こしサービス「TurboScribe」を使ってみた
そこで、ご紹介したいのが「TurboScribe」というオンライン文字起こしサービス。
こちらはChatGPTで知られるOpenAI社が開発した音声認識AI「Whisper」を活用。高精度なだけでなく、98以上の言語対応、話者の判別機能、動画からの文字起こし対応、フォーマット多彩な出力形式など、さまざまな機能が搭載されています。
しかも30分未満のファイルであれば1日3ファイルまで無料!

月額20ドルの有料プランに加入すると回数が無制限になり、他言語への翻訳も可能に。さらに10時間までのファイルも文字起こしが可能となります。
先日、約3時間の音声ファイルの文字起こしをしたかったため一時的に有料プランに加入して機能を試してみましたが、その精度の高さに驚かされました。
「ボイスメモ」と「TurboScribe」の文字起こし精度を比較
どのくらい精度がすごいのか、iOSの「ボイスメモ」と「TurboScribe」で同じ音声ファイルを文字起こしさせてみました。
・「ボイスメモ」の文字起こし
まずは「ボイスメモ」の文字起こしデータをご覧ください。

わかりにくい文面になっていますが、「コンビニ」「セブンイレブン」「グルメ」といった単語が出てくるので、コンビニグルメについて話している会話ということはわかるのではないでしょうか。
・「TurboScribe」の文字起こし
続いて、以下が「TurboScribe」で同じ音声ファイルを文字起こししたデータになります。

一目で精度の違いに気づけますね。音声データから自動的に話者1と話者2に分けられて文字起こしされ、インタビュー形式になっているため、読みやすさが段違い。大半をそのまま違和感なく読むことができます。
このクオリティなら少し整えるだけで記事や議事録にも使えるレベルですし、タイムスタンプが表示されるところも便利ですね。
Googleのアカウントがあればすぐに使い始めることができ、クレジットカードの登録なども不要です。機会があればぜひ試してみてください。