- 投稿日:2026/01/11
- 更新日:2026/01/11
はじめに
こんにちは✨️趣味はカラオケ🎤歌うことでストレス発散をしているステラです。「歌ってみた」の投稿をしていて、動画編集やサムネイル作成のときにAIの画像生成をよく使っています。
ただ、画像生成ってこんな壁にぶつかりませんか?
🌀思ったイメージと違う。修正しているのにAIが汲み取ってくれない
🌀壁打ちを続けるうちに、最終的にテーマと関係ない画像になっていく
この記事では、こうした悩みを減らすためのコツと、具体的な画像生成の手順を7ステップに分けてご紹介します。
コツは「いきなり画像生成しない」こと
結論から言うと、画像生成のコツは 最初から画像を作りにいかないこと です。AIは「いい感じに」「可愛く」などの曖昧な表現が苦手です。ですので、まずはプロンプト(指示文)を次のように分解して、具体的に書ける状態を作ります。
✅️背景
✅️登場人物(または被写体)
✅️場面(状況・動作)
✅️スタイル(画風・雰囲気)
✅️画像比率(例:1:1、16:9、9:16 など)
この準備ができるだけで、狙いに近い画像が出やすくなります。
使用する2つのAIと役割
今回は2つのAIを使用します。
ChatGPT:プロンプト作成・修正・翻訳
・画像生成プロンプトを作る
・納得いかない部分を壁打ちして修正する
・日本語→英語に翻訳する
Gemini(Nano Banana):画像生成
・英語プロンプトをコピペして画像生成する
・ツール(モデル) Nano Banana を選んで生成する
ステップ1:近いイメージの画像を3〜4枚用意する
まず、作りたいテーマに近い画像を 3〜4枚 集めます。「理想の雰囲気」「構図」「色味」が伝わる画像があるほど、プロンプトが作りやすくなります☺️✨️
ステップ2:プロンプトの下書きを作る
画像をChatGPTに3〜4枚アップロードして、次のように入力します。
入力例「AIで画像生成を行います。背景、登場人物、場面、スタイルに分けてプロンプトを考えてください。テーマは〇〇。画像比率は〇〇です。」
これで、プロンプトの土台ができます。
ステップ3:プロンプトを修正する(ここが勝負)
次に、できたプロンプトをChatGPTと壁打ちしながら整えます。
私がよく修正するポイントはこのあたりです。
登場人物:髪の長さ、目の色、服装、年齢感
場面:手の動き、姿勢、視線、表情など「具体的な動作」
ここで時間がかかってしまう人は、ある程度で次に進んでOK です。一度画像を生成してみてイメージと違ったら、あとからステップ3に戻りましょう☺️
ステップ4:英語に翻訳する
日本語プロンプトを英語に翻訳します。英語のほうが学習データが多く、結果が安定しやすい傾向があります。
やり方は簡単で、同じチャット内で「英語に翻訳」と入力するだけです。
ステップ5:Nano Bananaで画像生成する
完成した英語プロンプトをコピーして、Geminiに貼り付けます。このとき、入力欄の左下(ツール選択)から Nano Banana を選びます。
Nano Bananaは、画像生成向けのモデルとして使われることが多いです。(※利用回数や仕様は変更される可能性があるので、画面表示の案内を優先してください)
ステップ6:同じプロンプトで10回ほど試す
同じプロンプトでも、毎回まったく同じ画像にはなりません。まずは 10回くらい を目安に試し、自分のイメージに近い画像が出るまで繰り返しましょう。
ステップ7:ダメなら「文章そのもの」を変える
繰り返しても納得できない場合、生成回数を増やすより、プロンプトの文章を変えたほうが早い です。
① いまのプロンプトで曖昧な箇所はどこか
② 欲しい要素が抜けていないか
③ 逆に不要な要素が混ざっていないか
この3点を確認して、ステップ3〜6をもう一度繰り返します。
成功例と失敗例
これまで解説してきた7ステップを基に画像生成を行いました。ご参考になれば嬉しいです✨️
〈成功例〉
プロンプトの下書き
修正プロンプト
統合プロンプト
英語に翻訳
最終的にできた画像
〈失敗例〉
いきなり画像生成を行った失敗例も載せておきます😂GeminiのNano Bananaに「星空の下楽しそうに歌っている女性と優しく見守る星」とプロンプトした結果…。怖い😂😂
まとめ:コツはプロンプトの「具体化」
思い描く画像に近づける一番のポイントは、AIが理解できる形までプロンプトを具体化すること です。AIは曖昧な表現が苦手です。いきなり画像生成するのではなく、まずはプロンプト作りから始めてみてください。
あなたのAIライフが、もっと楽しくなりますように☺️