• 投稿日:2024/11/24
  • 更新日:2024/12/04
書き起こしができるAIは実用的?OpenAIのwhisperを検証!

書き起こしができるAIは実用的?OpenAIのwhisperを検証!

  • 2
  • -
会員ID:I2FH4Fgo

会員ID:I2FH4Fgo

この記事は約19分で読めます
要約
OpenAIのwhisperについて書き起こしの精度を詳しく検証しています。日本語でも実用レベルで書き起こしができるので優秀でした。興味を持ってくれた方は他の記事で使い方も紹介しているので、参考にしてください。

whisperの検証

この記事では、OpenAIが出している動画ファイルや音声ファイルから書き起こしができるAIの検証をしています。使い方や詳細は、こちらの記事で詳しく解説しています。

whisperは多言語の書き起こしに対応しており、日本語でもかなり高い精度でした。モデルは「turbo」や「medium」で簡単に実用レベルの書き起こしが可能です。

モデルごとの出力結果と時間、オプション設定を入れたときの結果を載せました。使用するときの参考にしてください。

12/4 出力された文章をAIに修正させる応用編を追加しました。

モデルごとの違い

モデルは以下の6種類です。モデルの後ろの時間は1分の音声の処理にかかった時間を表します。


・tiny
・base
・small
・medium
・turbo
・large

動画は、リベ大ショート動画のパープレキシティAIをもとに出したものです。約1分で420文字程度の内容となります。誤字を黒太字にしました。読みやすくするために改行していますが、実際の文章は改行なしです。

続きは、リベシティにログインしてからお読みください

ノウハウ図書館でできること
  • すべての記事の閲覧

  • ブックマーク

  • いいね・レビュー

  • 記事の投稿※応援会員(有料)のみ

  • ポイントの獲得※応援会員(有料)のみ

※会員登録には、新入生会員(初月30日無料)と応援会員(有料)があります

応援会員制度とは?
さらに!
  • リベシティの他の機能やサービスもご利用いただけます詳しく見る

ブックマークに追加した記事は、ブックマーク一覧ページで確認することができます。
あとから読み返したい時に便利です。

会員ID:I2FH4Fgo

投稿者情報

会員ID:I2FH4Fgo

トラ会員

この記事に、いいねを送ろう! 参考になった記事に、
気軽にいいねを送れるようになりました!
この記事のレビュー(0

まだレビューはありません