- 投稿日:2024/11/19
- 更新日:2024/12/04

whisperとはOPENAIが開発した音声認識モデル
whisperは、ChatGPTのOPENAIが開発した汎用の音声認識モデルです。書き起こしや翻訳ができるとても便利なソフトです。使う方法には、有料のAPI版(重量課金)と無料のGitHub版があります。今回は無料版を紹介します。
プログラムを使いますが、コピーアンドペーストができれば問題ありません。
whisperを使うと30分程度の音声書き起こしが10分弱で終了しました。レビューで書いてもらいましたが、出力された文章をAIを使ってまとめを頼むと、さらに楽できます。
自分で細かい修正を対応してもトータルで1時間まではかかりません。多少誤字脱字はありますが、再生しながら聞いて直せるくらいです。
注意点としてAIは便利ですが、使う際には間違いがあることは忘れずに使用してください。ものによりますが、内容を確認せずに使用すると自分の信頼を下げかねません。

続きは、リベシティにログインしてからお読みください