はじめに
前編では、すでに撮影された料理写真を対象に、生成AIによる「編集」でシズル感を補う考え方を整理しました。

一方、生成AIにはもう一つの使い方があります。
それが、シズル感そのものを設計し、料理写真を生成するという使い方です。
この場合、重要になるのは、どのような状態の料理を、どのように美味しそうに見せたいのかという考え方になります。この考え方は写真を撮影する際にも重要で、撮影する料理シーンでシズル感をどのように表現するのかを事前に決めておくと準備や進行がスムーズになりますし、撮影された画像の良し悪しを現場で決める判断基準にもなります。
本記事では、どのようにシズル感を表現するのか、それをどのように生成AIで画像化するのか、について順に説明していきます。食品業界・広告業界の皆様の参考になりましたら幸いです。
「編集」と「生成」は別のアプローチ
生成AIを食品写真に使う場合、「編集」と「生成」は似ているようで、目的が異なります。
【編集】撮影された写真を尊重し、写りきらなかった情報を補う
【生成】最初から「どう見せるか」を設計し、理想の状態を作る
編集は後処理であり、料理・シーンが存在しますので、どのように表現していくか、どの要素を補強するのか、といった考え方になります。
対する生成は、0からシズル感を設計していきます。食材、シーン、明るさ、雰囲気、などそれら全てをコーディネート出来ることになります。そのため、考えるべきポイントも変わってきます。編集に比べ、自由度も高く、考えておくべくポイントも多くなります。
生成でシズルを作るときに最初に考えること
まず整理しておきたいのは次の点です。
・料理の状態 調理中、提供直前、食事中(今まさに食べようとしている)
・伝えたい要素 温度、水分、ジューシーさ、柔らかさ、照りツヤ、香ばしさ
・写真の用途 広告メインビジュアル用、イメージ共有、メニュー、カタログ
これらが曖昧なままだと、シズル要素が過剰になったり、広告臭が強くなったりする可能性もあり、そうなると結果として使いづらい画像になることもあります。
シズル感を「設計する」
画像生成する場合、湯気や艶、油膜は「とりあえず足す」では充分ではありません。
- 湯気はどこから、どの程度立つのか
- 艶は全体なのか、局所なのか
- 反射はどの角度で見えるのか
これらは、光や視点、料理の状態と密接に関係しています。
生成AIでは、
- 盛りすぎた湯気
- 不自然に均一な艶
- 現実にはあり得ない反射
といった失敗も起きやすくなります。これは使用するモデルがどんなことを学習しているかにも大きく影響しますが、正しく設計され、整理された指示を出すことで、モデルに寄るばらつきを抑えることが可能です。
AIは万能ではありませんので、「いい感じに~」では、どんでもない画像になってしまうことも大いにあります。
※もちろん想像以上に良い結果になることもあります(笑)
ツール・モデルについて
生成AIのモデルは、実に多くの種類がリリースされています。そのそれぞれで、表現できるものやテイスト、得意分野が異なります。目的に応じてモデルやサービスの選定を行うことも重要になります。
以下に、本日(2025/12/18)時点で使用できるサービス(モデル)での比較を行ってみました。
Prompts:
Steak being grilled on a hot plate, steam rising from it






Prompts:
おいしそうな天ぷらの盛り合わせ






画像を見てわかる通り、それぞれのモデルで表現が異なります。簡単なプロンプトで生成しましたので、モデルの特性が出ているように思います。※アニメ系のモデルは今回の記事の目的と異なりますので、評価に含めておりません。
料理の分野によっては、表現がかなり異なることもありますので、本格的に制作に入る前にモデル選定はおこなった方が良い結果になりそうです。
追加学習という方法
生成AIは学習したものから画像を生成します。もし画像を生成したいものが一般的なものとはいないもの、例えば極一部の地方でのみ食べられている食品や、料理方法等の場合、上記のモデルでは生成が難しくなる可能性があります。
そのような場合、「追加学習」と呼ばれる方法を用いて独自の料理等について学ばせることが出来ます。生成AIではその追加学習したものをLoRAと呼びます。
このLoRAを作成して、画像生成の仕組み利用することで、より正確で、より目的に応じた画像生成が可能になります。
特に、写真や映像の資産を多く保有されているメーカー様においては、これまでの資産を活用して、新しい画像資産を生成することが可能になります。
そう聞くと万能に思えるLoRAですが、制作においては、少々手間がかかります。AIの進化によりこれも改善されていくと思いますが、現時点ではローカルでのモデルを活用して学習を進めていきます。ローカルのモデルでの生成についうては先程のモデルよりも劣る部分もあります、LoRAを含めた環境構築から行うことが重要になってきます。
弊社では、そのようなローカル環境の構築もお手伝い出来ますので、興味のある方は、ご連絡頂けましたら幸いです。
料理別に見る「生成」の考え方
ステーキ

A steak just before completion on a hot pan.
The surface is actively sizzling with realistic meat juices and localized glossy highlights.
Thin translucent steam and subtle heat shimmer rise from the pan.
Butter and juices coat the steak naturally; sear marks are well-developed.
Close-up cooking scene, dynamic lighting, shallow depth of field, photorealistic.

A freshly grilled steak as a hero visual for food advertising.
Appetizing, realistic meat-juice gloss with crisp specular highlights; caramelized sear marks visible.
Thin, clean, translucent steam rising naturally.
Moist and tender cut surface.
Directional studio lighting with subtle rim light, shallow depth of field, photorealistic, high detail, clean background.
焼き鳥

Ramen being finished just before serving.
Noodles are lifted from the boiling broth, glistening with moisture.
Abundant but clean steam rises from the pot.
The soup surface shows subtle oil sheen and movement.
Dynamic cooking scene, close-up, backlit steam, photorealistic.

A bowl of ramen as a food advertising hero visual.
Thin, delicate steam clearly visible with gentle backlight.
Subtle realistic oil sheen on the soup surface.
Noodles look freshly served and moist.
Shallow depth of field, photorealistic, high detail, clean background.
ラーメン
※ラーメンの調理シーンでは、麺の形状や湯切り道具を明示しないと、生成AIはパスタとして解釈しやすい。

Ramen being finished just before serving in a professional kitchen.
Fresh ramen noodles (wavy, yellowish, medium thickness) are lifted from a pot of boiling plain water using a round wire ramen strainer (tebo).
The noodles are clearly ramen noodles, not pasta.
Clean, translucent steam rises vigorously from the boiling water.
In the background, a separate bowl of prepared ramen soup is ready.
Japanese kitchen setting, close-up cooking scene, dynamic backlit steam, photorealistic.

A bowl of ramen as a food advertising hero visual.
Thin, delicate steam clearly visible with gentle backlight.
Subtle realistic oil sheen on the soup surface.
Noodles look freshly served and moist.
Shallow depth of field, photorealistic, high detail, clean background.
すき焼き(鍋)

Sukiyaki cooking on a portable gas stove, just before completion.
A pair of wooden chopsticks is stirring and turning the beef and vegetables inside the pot (cooking action, not serving).
Warishita sauce is simmering with subtle bubbling; clean translucent steam rises continuously.
The scene is clearly in the cooking phase: no bowls, no chopsticks for eating, no plated servings, no raw egg dipping bowl, no dining table setting.
Close-up cooking scene, warm directional lighting, shallow depth of field, photorealistic.

Sukiyaki hot pot as a food advertising hero image.
Clean translucent steam rising naturally, subtle heat shimmer.
Realistic glossy highlights on warishita-coated meat.
Warm directional lighting with gentle rim light, shallow depth of field, photorealistic.
いずれも、何をシズルとして見せたいかを先に決めることが重要です。
※作例はいずれも、Nano banana proにて生成しています
まとめ
食品の写真を生成する場合、まず下記をしっかりまとめておくことが、より良い画像への近道です。
- 何を伝えたいのか(どの食品を主役にするのか)
- どの状態を見せたいのか(どんなシーンにするのか)
- どの表現を重視するか(優先順位)
シズル感は偶然ではなく、設計によって作ることができます。前編で紹介した「編集による補完」と、
本記事で整理した「設計による生成」。
この二つを使い分けることで、食品シズル表現の幅と活用の可能性は大きく広がります。
あとは、使用するモデルやツールの特性を知れば、記事中のようなシズル感のある画像を作ることが可能になります。
まずは、試してみてください。

石水修司 株式会社フィジカルアイ代表/Adobe Community Expert
ベーマガに熱中した少年時代から、ベーカム時代の映像制作を経て、現在は3DCG・VFX・生成AIを融合した映像表現を手がける。Lancer of the Year 2016、CGWORLD「CGごはん」選外優秀賞。今治市在住。