DALL-3の簡単な使い方

ども、おはようございます。教室長です。

Microsoftが提供する画像生成AI「ImageCreater」ですが、最近DALL-E3が実装されました。

関連記事

Bing、無料で最新の画像生成AI「DALL·E 3」試せるように。日本語もOK(アスキー) - Yahoo!ニュース

実際に利用すると、長文やプロンプトの内容を以前のバージョンより理解しているように思えます。すごい!

でも、ちょっと意識しないとなかなか分かってくれないこともあるのでChatGPTと相談しながら手順を考えてみました。

以下の文章がその答えです。

もう少し練りこまないといけない部分もあるけど、現時点ではよいのではないでしょうか?

今後の自分用備忘録もかねて記録です。

ではではスタート!


画像生成AIの使用手順を段階的に詳しく説明します。これにより、プロンプトを段階的に詳細化し、AIに反映される確率を高めることができます。

1. 赤いスポーツカー:
最初のプロンプトでは、単純な記述を提供します。ここでの目標は、AIに対象物を知らせることです。例えば、"赤いスポーツカーの画像を生成してください。"といった基本的な指示です。

2. 朝日を背景に走る赤いスポーツカー:
次に、背景に関する情報を追加します。この段階では、"朝日の光を背景に走る赤いスポーツカーの画像を生成してください。"といった指示を与えます。これにより、AIは背景に関する情報を理解し、反映できる可能性が高まります。

3. 朝日を背景に時速300Kで走る赤いスポーツカー:
次のステップでは、スポーツカーの動きに関する詳細を提供します。AIにとって、"時速300Kで走る"という速度情報を提供することは重要です。したがって、"朝日の光を背景に、時速300Kで走る赤いスポーツカーの画像を生成してください。"という指示を与えます。

4. 朝日を背景に時速300Kで走る赤いスポーツカーを正面のカメラから撮影している写真:
最後に、望むアングルや視点に関する情報を提供します。これにより、AIは特定のカメラアングルからの画像を生成するのに役立ちます。例えば、"朝日の光を背景に、時速300Kで走る赤いスポーツカーを正面から撮影している写真を生成してください。"という指示を追加します。

これらの段階的なプロンプトを使用することで、AIに対する詳細な情報を提供し、望んだ画像を生成する確率を高めることができます。画像生成AIはプロンプトの情報に基づいて作業するため、情報が具体的で正確であるほど、望ましい結果を得やすくなります。


となりました。

より詳しく書き込むと反映されるのですが、慣れないうちは一気に書くよりも、徐々にやってもらいことを増やしていくのがわかりやすくてよいのでは?と思います。

では、よいイメージ作成ライフを!