5年間使っていたHuawei Mate 30スマホが楽天モバイルSIMを受け付けなくなったので、しぶしぶPixel9aに乗り換えました。移行した全てのアプリが使えるようになるまで1ヶ月かかり、かつカメラの自動補正はHuawei Mate 30の方が優れていて不満が残るものの、「これは優秀!」と感心したのが音声認識です。
以前はGoogleの音声認識がひどすぎたので、Edivoiceというアプリで認識させてから、Gmailにペーストしていました。今はGmailに直接、散歩しながら浮かんだ発表原稿内容を文字起こしさせて送信、自宅に帰ってからワードなどにコピペしてそのまま原稿になります。一手間も二手間も減りました。同音異義語も、使うほどに私がよく当てる漢字を選ぶよう学習しています(たとえば「キスイ」は「既遂」ではなく「汽水」)。
「AIって、日々進化してるなぁ。」と実感したので、一昨日に行った講演は全て録音して、参加者が復習できるように文字起こししてみました。
90分の講演を無料で文字起こししてくれるサイトは無かったので(「できる」と宣伝されていても、実際はスタックしたりなど)、Audio Cutterを使って30分づつに分割しました。Audio Cutterはブラウザ内で使えるので、アプリをインストールしたりなどの手間がいりません(リンクは下記です)。
ちょっとした会話程度ならNottaで文字起こしさせてコピペしてましたが、今回は長時間なので、無料では文字起こしファイルをダウンロードできないNottaは使えません。フリーサイトをいくつか試したところ、Turboscribeが速く、1日3ファイルまで無料だったので、これを使いました。
90分話し続けた内容が、音声ファイルの切り出しから1時間以内で文字起こしできました。同音異義語や専門用語は不適切な漢字を当てていたりするので、よく使っているAIに添削してもらうなどの一手間は必要そうです(今回はTurboscribeが文字起こししたのを主催者に丸投げしました)。
数年前までは文字起こし業者に数万円払って1週間くらいを要した作業が、無料で即時できるようになったわけです。「これ、無料AIでできるかな?」とちょっと探る習慣があるか無いかで、出費がかなり変わりそうです。