- 投稿日:2024/12/26

1. はじめに
皆さんこんにちは!こんばんは!
「犬が吠えている動画から、本当に犬の鳴き声を自動で作ってくれたら便利だなあ」「テキストで“波の音”って入力するだけで、リアルな波の音を手に入れられたら面白そう!」――こんなふうに思ったことはありませんか?
そんな夢のようなことを実現してくれるのが、今回ご紹介するMMAudioというAIモデルです。MMAudioは、映像ファイルやテキストを入力すると、それに対応した音声を生成してくれるすごい仕組みを持っています。たとえば、動画の中に「犬が吠えるシーン」があれば、AIが犬の鳴き声を作り出し、テキストで「波の音」と書くだけで波の音が生成されるのです。
そして嬉しいことに、MMAudioは誰でもアクセスしやすいHugging FaceのSpacesというプラットフォーム上で公開されています。この記事では、そんなMMAudioの特徴や使い方、さらには音声生成の動きを細かくコントロールするためのパラメータについてわかりやすく解説していきます。

続きは、リベシティにログインしてからお読みください