ChatGPTに搭載された画像生成AI『DALL-E3』はもう体験されましたか?
【前回の記事】
ChatGPTの『DALL-E3』の使い方や、どんな画像が生成できるのか実践レビューを紹介しました。
AIによる画像生成の技術の高さに驚きだったね!
実際使ってみたけれど、どんなスタイルがあるか分からないから、単調なデザインになってしまうのが悩み。
もっと画像の幅を広げたいな。
今回は、『初心者が画像生成AIを使いこなすコツ』を、ChatGPTに直接質問しながら記事にまとめました。
画像生成AIを絶賛勉強中のマネ夫婦です。
ChatGPT先生、よろしくお願いします!
色々教えてください!
画像生成に関する初心者の悩みにお答えしますよ。
一緒にAIによる画像生成の世界を楽しみましょう!
基本的な画像生成のやり方
まずは基本的な画像生成のやり方を確認しておきたいな。
了解しました。
基本的な画像生成のやり方についてシンプルに説明します。
どんな絵を描きたいかイメージして言葉に変換する
「こんな絵を描いて!」と伝えるための言葉を「プロンプト」と言います。
具体的で詳細なプロンプトを提供することで、より希望に近い画像を得ることができます。
例えば、『夕焼けの山の風景』を指示するよりも、『夕暮れ時の紫とオレンジの空の下、雪を頂いた山の風景』と詳しく指定する方が、具体的な画像を生成しやすくなります。
『具体的で詳細なプロンプト』ってのを考えるのが難しいんだよね。
言葉が出てこない…。
プロンプトが苦手な方は、ChatGPTにサポートしてもらうのがおすすめです。
ChatGPTに、「画像生成するための具体的なプロンプトをいくつか考えて」と聞いてみると、イメージを描き出すための具体的なプロンプトを提案してくれました。
- Q『夕焼けに染まった山』を画像生成するための具体的なプロンプトをいくつか考えて。
- ChatGPT
夕焼けに染まった山の美しい風景を生成するためのプロンプトを作成する際には、視覚的な要素や感情的なニュアンスを細かく描写することが重要です。
以下に、そのようなシーンを描き出すためのいくつかのプロンプトを提案します。1.”穏やかな夕暮れ時、空はオレンジとマゼンタのグラデーションで染まり、その光が山々を温かな赤金色に照らしています。山頂はまるで炎のように輝き、周囲の雲は柔らかなピンク色に包まれている。”
2.”日が沈むと、空に広がる紫とピンクの色彩が山をゆっくりと染め上げていく。山脈のシルエットはドラマチックに切り取られ、遠くの山々は夕日の光によってぼんやりとしたオレンジ色に見える。”
3.”夕焼けが山々にキスするように広がり、空は赤、オレンジ、紫のパレットで描かれている。山の輪郭ははっきりとしており、一部は太陽の残照で明るく照らされ、他の部分はすでに影に隠れている。”
4.”夕日が山の頂上をかすめるように沈んでいき、その光が山を柔らかな黄金色に変える。周囲の空は深い青から紫へと変わり、最後の光が山の斜面をなで下ろしているかのようだ。”
5.”静寂の中、夕焼けが山肌を撫で下ろし、燃えるような赤とオレンジの色合いが周囲を包み込む。遠くの山々は影に落ち始め、最後の日の光が山の稜線を照らし出している。”
これらのプロンプトは、色彩、光と影、感情的な描写を用いて、視覚的に魅力的な夕焼けの山の風景を生成するために使用できます。独自のニュアンスや詳細を追加することで、よりパーソナライズされた画像を生成することができます。
詩、もしくは小説に出てきそうな文章が出来上がりました。
同じ夕日でも、高い位置から真っ赤に染めているのか、沈む前の残光なのか、描写の違いが伝わります。
始めのうちは、ChatGPTにプロンプトを考えてもらい、イメージの参考にしたり、そのまま使ってみたりするのもいいかもしれませんね。
描かれた絵をチェックする
一回のプロンプトで、イメージ通りの画像を作ってもらうのは難しいです。
生成された画像を確認し、「イメージと違うな」と感じたら、プロンプトの内容を調整してみてください。
色や形、全体の感じなど、ちょっとした部分を直したい場合は、トライ&エラーを何度か繰り返すことで、イメージに近づけることができます。
プロンプトのコツ・注意点とは
初心者が画像生成AIを使う時の注意点を教えて!
了解しました。
DALL-E3を利用して画像を生成する際、初心者が注意すべき内容を紹介しましょう。
・あいまいな表現は避ける
・具体的な形容詞で指示する
・一度に複数の要素を詰め込みすぎない
・矛盾した意味を持つ言葉の組み合わせは避ける
・「DALL-E3」で制限されているポリシーを確認する
ひとつずつ確認していきましょう!
あいまいな表現は避ける
例えば、『犬』といっても、色々な種類の犬が存在しますよね。
『犬の画像』と伝えると、DALL-E3は、何種類もの犬の画像を生成する可能性があるので、調整のやり取りが増えてしまいます。
『雪の中で遊ぶ黒いラブラドール犬』
といった具合に、具体的な特徴やシーンを加えてプロンプトを作成すると、調整のやり取りを減らすことができます。
具体的な形容詞で指示する
画像生成上で大切なのが、形容詞を用いてAIに具体的なイメージを伝えることです。
「大きな赤いリンゴ」のように、形容詞は絵のイメージを具体化するのに役立ちます。
【プロンプトを詳細化するための形容詞の例】
サイズや量:小さな、巨大な、薄い、太い
色:透明な、明るい青、くすんだ緑、濃い紫
感じや質感:ふわふわの、つるつるの、ざらざらの、もこもこの
形や状態:曲がった、まっすぐな、壊れた、新しい
気持ちや雰囲気:幸せそうな、悲しむ、興奮した、リラックスした
特徴を表す:きらきら輝く、古風な、未来的な、手作りの
例えば、『透明な翼を持つ幸せそうな小さな妖精』のように、形容詞を組み合わせることで、より具体的なイメージをAIに伝えることができます。
一度に複数の要素を詰め込みすぎない
あれこれ伝えなきゃとプロンプトに詰め込みたくなりますが、返って逆効果になることも。
例えば、『夏の森の中で、ピクニックをしている家族と飛んでいる蝶々と夕日』を描きたいとします。
このように、『家族』『蝶々』『夕日』と一度に多くの要素を詰め込むと、DALL-E3は、どの要素に重点を置くべきか判断できず、期待通りの画像が生成されないことがあります。
『夏の森でピクニックをする家族』
といった具合に、まずはプロンプトをシンプルに保ち、主要な要素に焦点を絞ります。
土台ができたら、蝶々、夕日と足していくと、ひとつずつに細かい設定を入れていくことができます。
矛盾した意味を持つ言葉の組み合わせは避ける
矛盾する意味を持つ言葉の組み合わせは、DALL-E3が画像を生成する際に混乱を引き起こす可能性があります。
プロンプトを作成する際は、矛盾しない記述を心掛けることが、スムーズな画像生成に繋がります。
例)
太陽の下の星空、乾いた水たまり、冷たい火 など
ファンタジー小説に出てきそうな言葉。
DALL-E3のような画像生成モデルは、学習データに基づいて動作しているから、矛盾する情報をどのように解釈すればいいか判断ができず、混乱が生じるっていうことみたいです。
DALL-E3で制限されている画像を理解する
DALL-Eを使用して画像を生成する際の主な制約・ポリシーをChatGPTに聞いてみました。
- 生成される画像の数:一度のリクエストにつき、最大4枚の画像を生成することができます。
- 公共の人物:政治家や他の公共の人物の画像を生成することはできません。
- 名前やヒントの変更:具体的な有名人やセレブリティへの言及がある場合、それを一般的な記述に置き換えます。
- 人物の描写:物を含むすべての画像の描写を多様化する必要があります。具体的には、各人物の性別や人種を明示的に指定します。
- オフェンシブな内容:オフェンシブな内容や不適切な画像の生成は避けられます。
- 詳細な記述:画像の詳細な記述をDALL-Eに提供する必要があります。この詳細な記述に基づいて画像が生成されます。
確かに、大統領の画像が簡単に生成できちゃうと、それがフェイクニュースの生成や誤情報の拡散、または個人のプライバシーや名誉の侵害に利用されるリスクが高まりますからね。
AI技術、特に画像生成やテキスト生成のような強力なツールは、正しい目的で使われれば多くの価値をもたらすことができますが、同時に誤用のリスクも伴います。そのため、利用の際には適切なガイドラインやポリシーが必要となり、利用する側にも理解が求められますね。
様々なスタイルで画像を生成するには
DALL-E3は、非常に多様なスタイルの画像を生成する能力を持っています。
童話『赤ずきんちゃん』を使って、どんなスタイルがあるのか一例を紹介します。
一部実際に画像生成してみたので、参考にしてみてください。
1.アートスタイル
・油絵:厚みのあるペイントを使い、リッチな色合いと深みを持った絵。
・水彩画:透明感のある水をベースにしたペイントで、柔らかく繊細な絵。
・ペンスケッチ:ペンを使って線で描かれたシンプルなスケッチや図。
・木版画:木の板にデザインを彫り、それを使って印刷されたアート。
・アール・ヌーボー:19〜20世紀初頭の芸術運動で、曲線や自然のモチーフが特徴。
- Q有名なアーティストのスタイルを基にした画像は作れますか?
- ChatGPT
有名なアーティストのスタイルを参考にした画像の生成は、一部の制約があります。
100年以内のアーティスト:
100年以内に活動していたアーティスト(例:ピカソ、フリーダ・カーロ)のスタイルを直接参照しての画像生成は行うことができません。100年以上前のアーティスト:
100年以上前に活動していたアーティスト(例:ゴッホ、クリムト)は参照して、そのスタイルに似た画像を生成することが可能です。もし特定のアーティストのスタイルを基にした画像を希望される場合、そのアーティストの名前や特徴的なスタイルの要素をお知らせいただければ、可能な範囲でそのスタイルを模倣した画像を生成する試みを行います。
2.現代的なデザイン
・フラットデザイン:シンプルでフラットな色と形を使用したモダンなデザイン。
・グラデーションデザイン:色が徐々に変わる、滑らかな色の遷移を持ったデザイン。
・ミニマリスト:シンプルで余計なものを排除したデザインスタイル。
・抽象アート:具体的な形を持たない、色や形の組み合わせに焦点を当てたアート。
・デジタルアート:コンピュータやデジタル技術を用いて制作されるアート。
3.イラスト風
・日本のアニメ風:日本のアニメーションやマンガ特有のスタイル。
・アメリカのカートゥーン風:アメリカのアニメーション特有のオーバーアクションなスタイル。
・西洋のクラシックアニメ:ディズニーやワーナーブラザーズに代表される、20世紀中頃のアニメーションスタイル。
・CGIアニメーション:コンピュータグラフィックスを使用して制作されたアニメーション。リアルなテクスチャーや3Dの動きが特徴。
・クレイアニメーション:粘土を用いてキャラクターや背景を作成し、フレームごとに動かして撮影されるアニメーション。
4.写真風
・リアルな写真風:現実の風景や人物をそのままキャッチしたようなリアルな画像
・ヴィンテージ写真風:古い時代の写真のような色調や質感を持ったスタイル
・セピア調:茶色っぽいモノクロの色調を持った写真風
5.変わり種
・サイバーパンク:未来的でハイテク、都市的な景色を持つスタイル。
・フェアリーテール風:妖精や魔法の世界をテーマにした、夢見るようなスタイル。
・レトロ:過去の時代、特に20世紀中頃のスタイルやデザイン。
・ファンタジー:現実世界には存在しない、夢や魔法の世界を表現するスタイル。
・シュール:非現実的で奇妙な、夢のような風景や情景を描写するスタイル。
・ふわふわ&もこもこ:キャラクターや背景がふわふわとした質感や、もこもことしたファーを持つスタイル。
たくさんの例を挙げましたが、これでもほんの一部です。
「○○なイラストを描きたい、どんなスタイルがありますか?」
とChatGPTに聞けば、それに見合ったスタイルを教えてくれるので、ぜひ試してみてください。
最後に:DALL-E3の楽しみ方は無限大
いかがでしたか?
DALL-E3を用いた画像生成の基本的なステップやコツ、さまざまなスタイルの選び方について紹介しました。
・最初から要素を散らばらせず、描きたいオブジェクトのプロンプトを明確に伝える。
・形容詞を使用して、オブジェクトの特徴を具体化させる。
・スタイルを選択すれば、イラストのバリエーションが豊かになる。
DALL-E3は、言葉だけでさまざまなイメージを実現できるツールです。
初心者でも、自分だけのオリジナルな画像を生成する楽しさを体験することができます。
今回は以上です。
自分なりの素敵な作品を生み出してみてください。
DALL-E3で作る作品は、あなたの想像力次第です!
Udemy(ユーデミー)で学ぶChatGPTおすすめ講座
いつでも、どこでも学べるオンライン動画コース
>はじめて使うChatGPT講座【ChatGPTの使い方セミナー】【初心者向け】【事例で学ぶ】2,400円
>【ChatGPT】初心者向け講座 ビジネスで活用できる程に返答の精度や品質を上げるコツを徹底解説【非エンジニア向け】3,000円
コメント