人物写真から「内部構造」を描く nano banana pro vs Flux2.pro:AIはどこまで人体を理解しているか?

目次

人物写真から「内部構造」を描くという新しい表現

生成AIの性能が向上し、写真のような人物表現はもはや珍しいものではなくなりました。
しかし、“人体の内部構造まで自然に見せる”という表現は、これまでの手法では非常に難しく、医療系CGや教育コンテンツで専門の制作体制が必要でした。

今回は 実写人物写真に「内部構造(骨格・臓器・筋肉)」を自然に重ねる というテーマで、
最新の画像生成モデル Flux2-pro と Nano-banana-proを比較してみました。
その結果、
Nano-banana-pro が圧倒的に自然で、人体理解の精度が高いように見える出力を生成しました。

この記事では、

  • なぜ“内部構造が見える人物表現”が今求められているのか
  • 従来の制作では何が難しかったのか
  • Flux2 と Nano-banana-pro がどのような差を生んだのか
  • どんな用途でこの技術が活きるのか

をまとめます。

なぜ「人体内部構造が見える」シーンが必要なのか

従来、人体内部が透けて見える表現は医療・教育・産業安全・スポーツ科学 といった専門分野で求めらることがありました。
特にこうした用途では、

  • 体の動きと、内部の臓器・骨格がどう関係しているか
  • 姿勢変化に伴う骨格の回旋
  • 呼吸・動作と筋肉の動き
  • 衣服越しに臓器の位置を直感的に理解したい

といったポイントを可視化して、見る側の理解度を上げることを目的としています。
従来、これらのシーンは実写とCGの合成という手法で映像が制作されていました。

しかし従来のCGでは、実際の撮影のポーズに合わせてCGのモデルを調整し、動きをトラッキングする等の手間が必要になります。
実際のモデルの姿勢、内部の骨格の位置・角度を調整するのがなかなか難易度が高く、1カットの制作に何日も費やすのも珍しくはありません。

そして、先日、新しくリリースされたFlux2-proの特徴に「人体の構造を正しく理解している」と記載されているのをみて、では実際の人物画像から内部構造がどのくらい正確に描画できるのか? について検証してみたくなりました。

検証:元写真→人体内部構造

まずは、人体構造についての描画です。シンプルなもので確認します。

テスト1:人体構造描画の確認

こちらのシンプルな人体画像から試していきます。
もちろん、CG画像です。

SC20251127111211

使用するプロンプトはこちらです

人体の骨格、内蔵の配置について、正確な画像を生成

nano banana pro

SC20251127111821

Flux2 Pro

SC20251127111851

テスト2:自然なポーズの画像

元画像はこちらを使用します。
この画像も生成AIの画像です。Grokで生成しました。

SC20251127104548

この画像を元に、筋肉、骨格、血管、内蔵の描画を重ねるように指示します。プロンプトは以下のものを使用します。

構図、ポーズはそのままで、骨と内蔵と血管だけの状態にして、リアルな感じで

以下が生成結果です。(4つの生成結果を一つの画像にまとめています)

nano banana pro

combined 1504x560 20251127 105320

Flux2 pro

combined 1504x560 20251127 105753

検証結果

Nano-banana-pro は驚くほど自然で、姿勢・骨格の回旋に内部構造を合わせるという高度な整合性が見られました。
姿勢を理解し、それに応じ内部構造がどのように見えるか、を正確に推論できているような結果になりました。
この点で、Flux2と大きな差が出たように思います。

まとめ

人体の内部構造が透けて見える表現は、これまで主に医療や教育の専門領域で扱われてきました。しかし、従来のCG制作では「外側の姿勢」と「内側の骨格・臓器」を合わせ込む作業に大きな手間と専門スキルが必要で、コスト面・時間面のハードルが高いのが現実でした。

今回、実写人物写真をもとに、内部構造が透けて見えるイメージを Flux2.pro と Nano banana proで生成・比較した結果、Nano banana pro のほうが明らかに優れていることがわかりました。
この結果は、「AIがどこまで人体を“理解しているように見えるか”」という問いに対して、少なくとも今回の条件下では Nano banana pro が一歩先を行っていることを示しています。同時に、専門的な3DCGをゼロから組むことなく、写真ベースで内部構造を可視化できる可能性が現実味を帯びてきたとも言えます。

今後は、医療説明・教育コンテンツ・スポーツ指導・産業安全といった分野で、こうした「内部構造が見える人物表現」を、より手軽に・短期間で制作できるワークフローが求められていくはずです。そのとき、どのAIモデルをどの用途に使い分けるかは、単なる“画の綺麗さ”ではなく、「人体構造をどこまで破綻なく扱えるか」という観点で評価していく必要があると感じています。


SC2025102318247

石水修司 株式会社フィジカルアイ代表/Adobe Community Expert
ベーマガに熱中した少年時代から、ベーカム時代の映像制作を経て、現在は3DCG・VFX・生成AIを融合した映像表現を手がける。Lancer of the Year 2016、CGWORLD「CGごはん」選外優秀賞。今治市在住。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次