画像サイズは実は結構重要なポイントだったりします。
ここで使っているSDXLの生成AIのモデルは、1024×1024の絵をベースに学習されています。
ですので、1024×1024を大きく変更したりすると、なんだこりゃといった画像が出力されてしまいます。
そのためアップスケーラーというものを組み込んだりしてとかあるのですが。。。
と、ここではベースのワークフローで変更していきましょう。
1.サイズ変更
特に難しいことはなく、以下の赤枠のところを変えるだけです。
現在は「width」(幅)512ピクセル 「height」(縦)512ピクセル
で出力するようになっています。
今回「SDXL1.0」というモデルを使用しているので、1024×1024以上にしましょう。
直接「width」、「height」をクリックすると、数値が入力できます。
2.バッチサイズ
下の赤枠のところですね。
「batch_size」とは効率よく処理をいくつ同時に行うかを設定するところです。
例えば”5”だと5つ同時に処理をしてくれるので、出力は5枚になります。
ですが、今はあまり気にせず”1”のままにしましょう。
3.画像出力
サイズをかえたので、先ほど使ったプロンプトを使用して、同じように出力してみたいと思います。
ぱっと見あまり変わっていないですが、マウスのホイールをくるくるまわして拡大すると、
精密さが違うことがわかります。
また、「Save Image」の右下あたりをドラッグすると、拡大できるので、これでも違いがわかりますね。
右下の矢印を引っ張ると。。。
プレビュー画面が広がります!
下は 1024×1024
こちらが512×512
実際、「Output」に出力された画像を見比べればよくわかるのですが、
これでも、岩肌や猫のモフモフ感が「1024×1024」のほうが出てますよね!
4.極端に画像サイズを変えてみる
たとえば、出力する画像サイズを2倍にしてみます。
2048×2048に設定しました。
先ほどと同じプロンプト
「A cool cat climbing a mountain」(山登りをする、かっこいい猫)で出力してみます。
すると。。。
こんな感じで画像が破綻してしまいます。
(正直もっと見せられないような画像も出てきました。。。)
これは1024×1024で学習しているのに、それ以上の2048×2048などにしてしまうと、
1024×1024以外の部分を何を書けばいいのか、AIがわからなくなってしまう為ともいわれています。
ですので、適切なサイズを選びましょう。
SDXLでは以下のサイズが推奨とされているみたいですので参考にどうぞ。
・1024×1024
・1152×896
・896×1152
・1216×832
・832×1216
・1344×768
・768×1344
・1536×640
・640×1536
どうやら、1024×1024=1,048,576 の値に近い比率がお勧めになっているみたいですね。
次は、実際に画像を生成する「サンプラー」を紹介します。
ここの設定で出力される画像が大幅に変わってきますので見てみましょう。