より良いLoRA制作の為の3つのポイント

目次

LoRAとは

StableDiffusionなどのAI生成環境が整ってきたことにより、AIによる画像生成が盛んに行われるようになりました。StableDiffusionによる画像生成に関しては過去の記事でもご紹介しましたが、生成される画像は「学習モデル」と呼ばれる学習の蓄積データから生み出されます。しかしながら「学習モデル」は制作に膨大なデータを必要とします。そこで特定の被写体を描画するためにその被写体となるオブジェクトの追加学習を行うという手法が用いられます。この「追加学習モデル」をLoRAと呼びます。LoRAは学習モデルに比べ手軽に準備できますので、生成する画像の種類・用途を増やすために利用されています。

LoRAの制作方法については、ツールごとに様々な方が手法を公開して頂けていますので、ここでの説明は省略しますが、学習元となる画像についての説明は比較的少ないように感じられました。
そこで、ここではより良い画像を得るために必要となる画像に関するポイントをご紹介したいと思います。

より良いLoRA制作の為の画像に関するポイント

良い画像を選ぶ

良い画像生成のためには、学習元となる画像はしっかり選びましょう。
まずは、下記のものが学習対象の画像に含まれないようにします。

 ピンボケ
 被写体ブレ
 ゆがんだ画像 (広角レンズなどの撮影により歪みのあるもの)
 白黒画像
 明るさが適正でないもの (白とび、黒つぶれ)
 低解像度を極端に拡大したもの

また、著作権・肖像権を有する画像を権利者に無断で学習データに使用するのはNGですので、注意してください。

サイズ、解像度を整える

望ましい解像度は、下記のようになります。

SD : 512✕512、768✕768
SDXL: 1024✕1024

学習データの画像を大きくすることで、LoRA作成時に多量のGPUメモリが必要になってしまいます。
SDXL1.0では、1024程度あれば充分な画像生成が可能です。

また、アスペクト比は 1:1 でなくてもLoRA制作は可能ですが、1:1に統一しておくほうが品質が安定している印象があります。

被写体をどう表現したいのかを整理しておく

用意する学習元データの画像をAIが学習していきますので、その画像に表現したくないものが含まれないようにします。
例えば、自動車であれば、ボディー傷や汚れ、製品として求めていないデザインや意匠を画像に含まないようにします。人物の場合は、極端なメイクやなどは避けたほうが良いと思います。
表現したくないイメージは学習元データに含めないようにするのが、原則的な考え方になりますので、事前にどのような表現を行う為のLoRAであるのかを整理しておくと、画像選別やタグ付けの際にも迷ううことが少なくなるのではないかと思います。

さいごに

AIによる画像生成は、これまでにない画期的なものですが、使い方次第では著作権や肖像権の侵害につながる可能性の高いものです。これまで著作権や肖像権などに注意を払いながら制作活動を行ってきたクリエイターであれば、それに関する配慮を蔑ろにすることはないと私は信じています。
どんな優れた技術、どんな便利な道具であっても、使う側のモラルがあってこそのものだと思います。
AIは優れた技術ですし、うまく活用することでクリエイティブの分野でも大きく効率化が可能だと思っています。
今後も大きいに楽しみな分野です。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次