GPT Image 1.5 登場！最新の画像生成を徹底解説

2025年12月23日

こんにちは。テックキャンプの石田です。

私は高校を卒業してすぐに働き始め、馬車馬というかサンドバックになって社会を駆け回りました。

資本主義サバンナ、ラットレースを駆け抜けてきた中で、広告運用をやったりウェブデザイン(サイト制作)をやったりすることもあり、デザインバナー(画像)を作ることもしばしばありました。

ただメイン業務として画像加工をしたわけではなく、デザイナーに作ってほしいデザインイメージを渡すためのデザイン草案を作成したり、デザイナーに渡すまでもない範囲でのものを自分で作成していました。

私は多機能神アプリケーションであるCanvaを使っていましたが、Photoshopと比較すると便利なものの、やはり素人からするとめんどくさいです。

「パクって使ってください！！」という理由で用意されているテンプレートをそのまま使うとクライアントに怒られるし、なんて理不尽な世の中なのでしょうか。

ですが2022年末からChatGPTやGeminiなどの、生成AIなんていう世界を超越したアプリケーションが生まれました。

そしてその神童アプリケーションには「画像生成」なんていう私にとってはバグのような機能も搭載されています。

さらに2025年12月16日、私がクリぼっちの危機を感じている間に、家族よりも接しているChatGPTがImage1.5という新しい画像生成モデルを発表しました。

今回は、その「ChatGPT Image 1.5」を解説＆触ってみます。

そもそも画像生成AIとは何か

本題に入る前に、「そもそも画像生成AIとは何か？」というところに少し触れておこうと思います。

めちゃくちゃ丸く言うと「言葉を入れるだけで、AIが画像を生成してくれる」という機能です。
仕組みを言うと、「大量の画像データと説明文をセットで学習したAIが、プロンプト（指示）を元にゼロから絵を構築する」というものです。

この「ゼロから絵を構築する」というのがポイントです。

修正等は基本的にはできません。

パソコンの見た目上(人間の目)は「画像の一部を修正している」ように見えても、AI側からすると「その部分だけ0から再生成している」という形になります。

2025年12月16日にChatGPTに新しい画像モデルが登場した

Image1.5という、ChatGPTに新しい画像モデルが登場しました。

※モデルなので、機能ではありません。なので今回は「画像生成能力が進化した」ということです。

公式サイトはこちら

結論としては「やはり日本語やデザインはGeminiだが、人物差し替えなどのちょっとした画像修正ならGPT」という感じです。

GPT Image 1.5は画像加工（特に人物）が自然で、少し雑な指示でもそれなりの完成度の画像を出してくれます。

先に言ってしまうと、Gemini 3 (Nano Banana Pro)のほうが日本語文字入れやデザインセンスは良いです。

ですので、元画像の加工や手軽な生成はGPT、サムネイル作成などデザイン・文字重視ならGeminiという使い分けがいいかと思います。

具体的にどう違ったのか、以下のような項目内容を検証してみました。

では、上から順に見ていきましょう。

テキストから作る画像の完成度はどうか

ChatGPTに以下のプロンプトを出して画像を生成してもらいました。

======
ChatGPTに新たに統合された画像生成機能について解説します。今回のアップデートにより、ユーザーはテキストによる指示だけで、高品質かつ実用性の高い画像をChatGPT上で直接生成できるようになりました。従来の「文章は得意だが、画像は別ツール」という分業構造が解消され、会話の流れの中でそのままビジュアル制作まで完結できる点が大きな特徴です。

まず強調されているのは、生成される画像のクオリティと制御性の向上です。単なるイメージイラストにとどまらず、プレゼン資料、UIモック、マーケティング用ビジュアル、図解など、ビジネス用途でそのまま使える水準を目指して設計されています。特に、構図やレイアウト、色味、スタイルといった要素を自然言語で細かく指定できるため、デザイナーと会話している感覚に近い形で調整を進められます。

また、テキストと画像の整合性が大幅に改善された点も重要なポイントです。画像内に含まれる文字が崩れにくくなり、意味の通る文章として描画されやすくなっています。これにより、スライドの見出し、図表のラベル、簡単な説明文などを含む画像生成が現実的な選択肢になりました。ビジネス資料や教育コンテンツにおいて、「あとで手直しが必要」という前提が減る設計になっています。

さらに、反復的なブラッシュアップがしやすい点も、ChatGPT統合ならではの価値として紹介されています。生成された画像に対して、「この部分の色を変えたい」「人物の表情を少し柔らかくしたい」「16:9のスライド比率にしてほしい」といった修正指示を、そのまま会話として重ねていくことが可能です。これにより、試行錯誤のコストが大きく下がり、非デザイナーでも一定水準のビジュアル制作が行えるようになります。

記事では、具体的な活用シーンとして以下のような例が示されています。

・プレゼンテーションや企画書向けのスライド用画像
・プロダクトやアプリのUIコンセプト図、ワイヤーフレーム
・マーケティングやSNS向けのキービジュアル
・教育用途の図解やインフォグラフィック

これらはいずれも、従来は専門ツールや外注を前提としていた領域ですが、ChatGPT内で完結できる可能性が高まったことを意味します。

一方で、安全性と責任ある利用についても言及されています。実在の人物や著作権に配慮した設計がなされており、不適切なコンテンツ生成を防ぐためのガードレールが組み込まれています。特に、誤解を招く表現や悪用リスクが高いケースについては、生成制限や調整が行われる仕組みになっています。

総じてこの記事は、「画像生成機能が単体で進化した」という話ではなく、「対話型AIの中核機能として、画像が自然に溶け込んだ」ことを強調しています。文章で考え、会話で詰め、必要なビジュアルを即座に生成するという一連の流れが、ChatGPT上でシームレスに成立する。これは、企画・設計・説明といった知的作業のスピードと表現力を一段引き上げるアップデートだと位置付けられています。
======
上記文面をもとに解説ペライチ画像を作って。

結果は以下です。

デザインがいいかは個々人のセンスによるので言及しませんが、明らかに日本語が崩れています。

この点はGeminiのほうが日本語の表示が上手い(正しく表示してくれる)ので、Geminiの方が良いですね。

URLを渡すだけで画像は作ってくれるのか

次は、ChatGPTにそれぞれ以下のように、「このURLの記事を画像化して」と言ってURL→画像化を試してみました。

プロンプトは以下です。

https://openai.com/index/new-chatgpt-images-is-here/
この記事の内容を画像化して。ビジュアルで内容を理解したい。

結果は以下です。

あれ、画像を生成してくれなかったですね。

試しにGeminiにも指示してみましょう。

Geminiは生成してくれましたね。

結果としては以下のように分かれました。

ChatGPT → 画像を生成してくれなかった
Gemini → 画像を生成してくれた

Geminiが生成した画像も若干意図は違いますが、そこはおそらくプロンプトで調整できるでしょう。
「そもそも画像を生成するのかどうか」という論点でChatGPTは生成してくれなかったので、URLを与えて画像を作らせたいなら、Geminiしか手段がありませんね。
ChatGPTでやる場合は、一旦URLを渡して文字起こしをさせてから、画像を生成するとよさそうですね。

画像内人物の差し替えはどれくらいナチュラルか

検証会話はこちら / こちらも検証会話

今回は、以下の画像を合成してみました。

具体的には一枚目画像の人物を二枚目の人物へ差し替えを依頼してみました。

元画像は以下です。

右に人物を、男性の画像と女性の画像を用意して差し替えてみます。

結果はこちらです。

男性の方はいいと思います。

女性の方も、まあ悪くないのではないでしょうか。

私はナチュラルに生成してくれたと思います。

服や姿勢(体の向き)が変わってますが、それほど違和感を感じません。

女性版の画像について、右下の「AIカレッジ」が移動しちゃっているのでそれだけ修正を試みてみましょう。

結果は以下です。

修正されてないだと…

おまけにGemini3でも試してみました。

Gemini3作の画像はこちら！

あれ！！！Geminiのほうがいいかも？！

でもこれだけで「じゃあ画像生成はGeminiだな」と思いたいところですが、Geminiも画像生成が事故ることは普通に発生するので、人物の差し替えに関してはなんとも言えないですね。

特殊なプロンプト形式にすると良い結果になるのか

構造化データ（YAML形式など）を用いたプロンプト指示が、どの程度正確に反映されるかをテストします。

今回は以下の画像をGPT Image1.5が作れるか試してみます。

AI活用ナビのサムネイルです。

AI活用ナビでは、

ChatGPT→緑カラー

Gemini→紫カラー

という風にパターン分けしています。

今回はGeminiのパターンを試してみました。

プロンプトは以下です。

{
  "task": "generate_slide_image",
  "engine_hint": "Nano Banana Pro",
  "output": {
    "aspect_ratio": "16:9",
    "size_px": [1920, 1080],
    "format": "png",
    "background_transparent": false
  },
  "style": {
    "overall": "PowerPoint slide look, clean flat design, crisp edges, soft shadows, high legibility",
    "typography": {
      "font_family_preference": ["Noto Sans JP", "Hiragino Sans", "Yu Gothic", "Meiryo"],
      "title_weight": "extra_bold",
      "body_weight": "bold",
      "text_color_main": "#4A4A4A",
      "text_color_inverse": "#FFFFFF"
    },
    "constraints": [
      "render all Japanese text exactly as provided",
      "do not add extra text",
      "no watermark",
      "no random icons or decorations beyond specified background pattern",
      "no distorted or garbled letters",
      "keep margins and alignment clean"
    ]
  },
  "brand": {
    "logo_text": "AI活用ナビ  by TECH CAMP",
    "logo_style": {
      "plate": "white rounded rectangle",
      "shadow": "soft",
      "primary_color": "#2A55FF",
      "accent_color": "#A25BFF",
      "sub_color": "#111111"
    }
  },
  "template": {
    "type": "{{TYPE}}",
    "type_candidates": ["eyecatch", "heading"],
    "backgrounds": {
      "eyecatch_by_category": {
        "AIツール": "teal/cyan gradient tech background with polygon mesh and thin network lines",
        "Gemini": "purple-to-blue gradient abstract background with large soft circular shapes",
        "ChatGPT": "mint/green gradient background with soft waves and subtle dotted pattern",
        "業務効率化": "monochrome gray geometric blocks background, minimal",
        "コラム": "warm yellow gradient background with large overlapping soft circles"
      },
      "heading_common": "very light lavender background with subtle wave-line pattern, minimal",
      "heading_top_strip": {
        "enabled": true,
        "height_ratio": 0.035,
        "gradient_left_to_right": ["#284BFF", "#A25BFF"]
      }
    },
    "components": {
      "eyecatch_center_card": {
        "shape": "rounded rectangle",
        "fill": "white, slightly translucent",
        "corner_radius_ratio": 0.06,
        "shadow": "soft",
        "size_ratio": [0.80, 0.58],
        "position": "center"
      },
      "eyecatch_bottom_bar": {
        "enabled": true,
        "height_ratio": 0.12,
        "fill": "#F2F2F2",
        "logo_align": "center"
      },
      "heading_title_pill": {
        "shape": "rounded pill rectangle",
        "gradient_left_to_right": ["#1F49FF", "#A25BFF"],
        "size_ratio": [0.92, 0.18],
        "position": "top",
        "margin_top_ratio": 0.08,
        "text_align": "left",
        "padding_left_ratio": 0.05
      },
      "heading_item_card": {
        "shape": "rounded rectangle",
        "fill": "#FFFFFF",
        "corner_radius_ratio": 0.06,
        "shadow": "soft",
        "text_align": "center"
      },
      "heading_number_badge": {
        "enabled_when_mode": "numbered",
        "shape": "small rounded square outline",
        "outline_gradient_left_to_right": ["#2A55FF", "#A25BFF"],
        "number_color": "#2A55FF",
        "position": "left_inside_each_card"
      },
      "heading_logo_position": {
        "position": "bottom_right",
        "with_plate": true
      }
    },
    "layout_rules": {
      "heading_variants": {
        "plain": {
          "6": "grid_2col_3row",
          "5": "grid_2col_2row_plus_1left",
          "4": "grid_2col_2row",
          "3": "stack_3",
          "2": "stack_2"
        },
        "numbered": {
          "6": "grid_2col_3row_with_badges",
          "5": "grid_2col_2row_plus_1left_with_badges",
          "4": "grid_2col_2row_with_badges",
          "3": "stack_3_with_badges",
          "2": "stack_2_with_badges"
        }
      },
      "text_limits": {
        "eyecatch_title_max_lines": 4,
        "eyecatch_recommended_chars_per_line": [10, 16],
        "heading_h2_max_chars": 22,
        "heading_item_max_items": 6,
        "heading_item_max_chars": 18,
        "numbered_mode_rule": "do not include numbers in item text; numbers come from badges"
      }
    }
  },
  "content": {
    "keyword": "{{KEYWORD}}",

    "eyecatch": {
      "category": "{{CATEGORY}}",
      "title_lines": ["{{TITLE_LINE_1}}", "{{TITLE_LINE_2}}", "{{TITLE_LINE_3}}", "{{TITLE_LINE_4}}"]
    },

    "heading": {
      "mode": "{{MODE}}",
      "h2_title": "{{H2_TITLE}}",
      "items": ["{{ITEM_1}}", "{{ITEM_2}}", "{{ITEM_3}}", "{{ITEM_4}}", "{{ITEM_5}}", "{{ITEM_6}}"]
    }
  }
}

プロンプトの内容としては、

まず「Geminiの内容」ということを明記しました。

よって背景はちゃんと紫になるのか、という点を確認しました。

あとはフッター(画像下)部分の「AI活用ナビ by TECH CAMP」がちゃんと表示されるか、という点も確認しました。

こちらのプロンプトを試した結果は以下です。

まあいいのではないでしょうか。

「AI活用ナビ」にプロンプトには指示していない装飾がかかっているので、この点だけガチャだなと思いましたが、逆に言うと明示的に指示すればここも上手くやってくれそうですね。

試しに「単色にして」と指示してみましょう。

できたのはこちら。

ロゴがなくなりましたね。

「AI活用ナビを単色にして」と言ったほうが良かったですね。

ん〜。難しいですね。

おそらくカラーコードをちゃんと言ってあげれば期待通りのものが出てくると思います。

ですがこのセクションの検証に時間をかけ過ぎてしまったので、ひとまずこの検証はここで終了とします。

わかったのはプログラムのようなプロンプトはかなり細かなところまでイメージ通りのものを作ってくれますが、だったら一枚だけ見本となるバナー画像をPowerPointやCanvaで作成して、それをアップロードして編集させるような感じで指示をすれば、より事故らない画像を生成してくれるかと思います。

特定スタイルをマネすることはできるのか

今回はビジネス系メディア「PIVOT」風のサムネイル作成をやってみようと思います。

指示は以下のような感じです。まずは対象のサムネイルを分析させて、その後作成指示を出します。

このようにまずはPIVOTサムネイルを分析させました。

分析が済んだので、作成指示を出してみます。

すると以下のような結果になりました。

雰囲気は出てますね。ただ独学でウェブデザインを学んで1週間経った人のようなクオリティです。

ちなみにGeminiに全く同じプロンプトで分析→作成と指示してみました。

結果はこちらです。

PIVOTが絶対使わない背景になりましたね。

画像サイズ変更はちょうど良くしてくれるのか

次にアスペクト比や解像度の変更を指示した際、構図が崩れずに維持されるかを確認します。

ChatGPT（GPT image 1.5）とGemini(Nano Banana Pro)で試しました。

双方には以下のようなプロンプトを指示して作成してもらいました。

この画像を、縦長のバナーとして画像生成して下さい。
各要素や情報は一貫性を保ちつつ正方形のバナーとして最適な構図にして下さい。

結果は以下です。

ChatGPT（GPT image 1.5）

Gemini(Nano Banana Pro)

どちらも悪くない。ChatGPTはちょっとロゴが崩れてるかな。

そのほか何か違いはあるか

GPTの画像はウォーターマークはない

ウォーターマークとは、画像の右下に表示されるアイコン、マークのことです。

結論としてはGemini3（Nano Banana）の場合はありますが、ChatGPT Image 1.5の場合はありませんでした。

GPT

Gemini

生成スピードはGemini思考モード(Gemini3)のほうが速い

「時は金なり」ということで、生成完了までの時間をタイマーで測ってみました。
結果は以下です。

モデル	生成スピード
ChatGPT Image 1.5	1分7秒
Gemini思考モード(Gemini3)	35秒

それぞれ作った画像は以下です。

ChatGPT

Gemini

これを見るとGeminiのほうが速いのに加えてクオリティも高いですね。

(ChatGPT Image 1.5のほうは画面左右の文字が切れている)

ですが人物の差し替えに関してはどちらもGoodですね。

ChatGPTの画面左右の文字が切れているのは、以下のように「文字が切れているから修正して」と言って修正を試みれば良いです。

若干上下に余白ができたものの、修正はしてくれてますね。

「そもそも生成AIに一発で完成を求めてはいけない」という初心を忘れずに接してあげましょう。

まとめ

使いやすさだけで言うとGPT。デザインセンスで言うとGeminiの方が良いかな。というところです。

今回の検証のように元画像がある場合はGPTで良いかと思います。
ただ、例えば被写体画像に文字を入れてYouTubeのサムネイルを作成する場合などは、Geminiの方が良いかなと思います。

GPT(image 1.5)のほうはどんなプロンプト(指示)でもそれなりのものを作ってくれる印象ですが、やはり日本語やデザイン能力はGemini(Nano Banana Pro)のほうが高い印象です。

ただGeminiは細かく指示を出さないといけないので、その点においては疲れますね。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

GPT-5.2はExcel/PowerPoint生成にどれくらい強いのか

この記事を書いた人

AI活用ナビ編集部

「AI活用ナビ」は、プログラミングスクール「テックキャンプ」が運営するAI情報メディアです。生成AIをあなたの強力なパートナーにするための最新情報や、すぐに試せる実践的な活用法を発信しています。

GPT Image 1.5 登場！最新の画像生成を徹底解説

そもそも画像生成AIとは何か

2025年12月16日にChatGPTに新しい画像モデルが登場した

テキストから作る画像の完成度はどうか

URLを渡すだけで画像は作ってくれるのか

画像内人物の差し替えはどれくらいナチュラルか

特殊なプロンプト形式にすると良い結果になるのか

特定スタイルをマネすることはできるのか

画像サイズ変更はちょうど良くしてくれるのか

そのほか何か違いはあるか

GPTの画像はウォーターマークはない

生成スピードはGemini思考モード(Gemini3)のほうが速い

まとめ

この記事を書いた人

関連記事