GEMINI LABEN
FLASH — Gemini 3.5 Flashが一般提供(GA)に。エージェントやコーディングで持続的なフロンティア性能をうたいますAGENTS — Gemini APIにManaged Agentsがパブリックプレビュー。Googleホストの隔離Linuxサンドボックスで自律エージェントを実行できますWEBHOOK — イベント駆動のWebhooksが追加され、Batch APIや長時間処理のポーリングを置き換えられますSEARCH — File Searchがマルチモーダル対応に。gemini-embedding-2で画像も埋め込んで検索できますSUNSET — gemini-3.1-flash-image-preview・3-pro-image-previewは6/25に停止予定ですANTIGRAVITY — Antigravity Agentのマネージドエージェント(antigravity-preview-05-2026)がプレビュー提供されていますFLASH — Gemini 3.5 Flashが一般提供(GA)に。エージェントやコーディングで持続的なフロンティア性能をうたいますAGENTS — Gemini APIにManaged Agentsがパブリックプレビュー。Googleホストの隔離Linuxサンドボックスで自律エージェントを実行できますWEBHOOK — イベント駆動のWebhooksが追加され、Batch APIや長時間処理のポーリングを置き換えられますSEARCH — File Searchがマルチモーダル対応に。gemini-embedding-2で画像も埋め込んで検索できますSUNSET — gemini-3.1-flash-image-preview・3-pro-image-previewは6/25に停止予定ですANTIGRAVITY — Antigravity Agentのマネージドエージェント(antigravity-preview-05-2026)がプレビュー提供されています
記事一覧/高度な活用
高度な活用/2026-06-14上級

画像生成モデルを乗り換えると品質は静かに落ちる — 人手レビューなしで検知する自動ゲートの設計

preview から GA への画像モデル移行で、出力品質が落ちていないかを目視に頼らず検証する3層ゲートの実装です。決定的プロパティ検査・マルチモーダル埋め込み類似度・Gemini によるブリーフ遵守スコアを Python のコードでつなぎ、しきい値とカットオーバー手順まで整理しました。

gemini86image-generation5model-migration5embedding8llm-as-judge5Python36

プレミアム記事

画像生成モデルを preview 系から GA 版へ切り替えたとき、API は何ごともなく 200 を返し続けます。例外も出ません。けれども数日後にアプリの新着壁紙を眺めると、なんとなく彩度が浅い、構図の余白の取り方が変わった、という違和感に気づきます。テキスト生成のように「壊れたら例外で止まる」わけではないので、品質の劣化は静かに進行します。

私は個人開発で壁紙アプリを運営していて、生成パイプラインは毎日まとまった枚数を吐き出します。6月25日に gemini-3.1-flash-image-previewgemini-3-pro-image-preview が停止する以上、GA 版への移行は避けられません。問題は「切り替えた後、品質が落ちていないことをどうやって確かめるか」でした。1枚ずつ目で見るのは枚数的に無理がありますし、私自身の主観に頼ると日によってぶれます。そこで、出力品質を機械で見張るゲートを移行前に組みました。本稿はその設計と、実際に動かしているコードの記録です。

移行作業そのもの(モデルID の確認やコード差分)は6月25日停止する画像 preview モデルの GA 移行手順に整理しています。本稿はその次の工程、つまり「移行が品質を壊していないかを検証する」部分に絞ります。

なぜ生成画像では画素比較(SSIM)が破綻するのか

最初に試して失敗したのが、移行前後で同じプロンプトを投げ、出力画像を SSIM や画素差分で比べる方法でした。テキストやスクリーンショットの回帰テストでは定番の手段です。

ところが生成画像では、同じプロンプト・同じシードでもモデルが変われば構図そのものが変わります。GA 版は preview 版と重みが違うので、SSIM はほぼゼロに張り付きます。「全部が変わっている」としか言えず、肝心の「品質が下がったのか、ただ違う絵になっただけなのか」を区別できません。

つまり生成画像の品質ゲートに必要なのは「ピクセルがどれだけ一致するか」ではなく、次の3つの問いに別々に答える仕組みです。

  • その画像は仕様(解像度・アスペクト比・ファイル健全性・安全性)を満たしているか
  • 出力は「依頼したブリーフ」からどれだけ逸脱したか(内容の意味的な距離)
  • 人が見たときの完成度・ブリーフ遵守度はどれくらいか

この3問にそれぞれ別の層で答えるのが、本稿の3層ゲートです。

3層ゲートの全体像

層を分けるのは、安いチェックで早く弾き、高いチェックを最後に回すためです。

  • 層1: 決定的プロパティ検査 — API 呼び出しゼロ。解像度・アスペクト比・デコード可否・極端な単色画像を検出します。ここで落ちるものは下流に流しません。
  • 層2: マルチモーダル埋め込み類似度gemini-embedding-2 でブリーフ文と生成画像をそれぞれ埋め込み、コサイン類似度で「依頼からの逸脱度」を数値化します。preview 時代の baseline 分布と比べて外れ値を検出します。
  • 層3: Gemini によるブリーフ遵守スコア — 構造化出力で 0〜100 のスコアと理由を返させます。最も高コストなので、層1・層2 を通った画像にだけ適用します。

最終判定は3層のスコアを合成し、baseline から決めたしきい値で pass / fail を出します。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
画像モデルの切り替えで品質が落ちていないか不安だった人が、目視レビューを増やさずに劣化を機械で検知する仕組みを今日組める
生成画像には使えない画素比較の代わりに、マルチモーダル埋め込み類似度と Gemini 判定を組み合わせた3層ゲートのコードを入手できる
baseline の取り方としきい値の決め方が分かり、preview 停止前に安全なカットオーバー判断を自分で下せるようになる
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Gemini Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

高度な活用2026-06-13
Gemini の GA 画像モデルは端末解像度ちょうどに出力できない — 縦横比とセーフエリアを揃える壁紙パイプライン
GA 版の画像モデルに切り替えたら壁紙が端末画面に収まらない。1枚のマスターから全デバイス分を正確に切り出し、生成回数を台数分の1に抑える壁紙パイプラインの実装を、Pillow のコードとともにまとめます。
高度な活用2026-04-24
Gemini API のシャドウトラフィックで新モデル移行を安全に進める — 出力差分を本番で測る実装パターン
Gemini のモデル移行を「デプロイしてみないと分からない」から卒業するためのシャドウトラフィック設計。本番入力をコピーして新モデルに流し、出力差分を定量評価してから段階的にカットオーバーする実装パターンを、Python と Cloud Tasks のコード付きで解説します。
高度な活用2026-03-28
TurboQuantをRAG・ベクトル検索に応用する — KVキャッシュ圧縮技術の新しい活用法
Google TurboQuantの圧縮技術はLLM推論だけでなく、RAGパイプラインのベクトルデータベースにも応用可能です。埋め込みベクトルの圧縮によるメモリ効率化、検索速度向上、大規模RAGシステムへの実装アプローチを解説します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →