GEMINI LABEN
CLI — 本日6/18、Gemini CLIとGemini Code Assist IDE拡張がAI Pro/Ultra・無料個人利用向けにリクエスト提供を終了。後継はAntigravity CLIですFLASH — Gemini 3.5シリーズが始動し3.5 Flashが提供開始。エージェントとコーディング向けにフロンティア級、長時間タスクに強いと説明されていますDEEPTHINK — Gemini 3 Deep ThinkがGoogle AI Ultra向けに展開中。数学・科学・論理・多段推論の最上位モードですAPP — GeminiアプリにDaily Brief、再設計UI、AI動画モデルGemini Omni、個人AIエージェントGemini Sparkが加わりましたDESIGN — 新デザイン言語Neural Expressiveで、よりリッチな視覚出力とモダリティ間の素早い切替に向けて再構築されていますULTRA — Google AI Ultraはモデル最上位アクセス・Deep Research・Veo 3動画生成・100万トークンコンテキストを束ねるプレミアム枠ですCLI — 本日6/18、Gemini CLIとGemini Code Assist IDE拡張がAI Pro/Ultra・無料個人利用向けにリクエスト提供を終了。後継はAntigravity CLIですFLASH — Gemini 3.5シリーズが始動し3.5 Flashが提供開始。エージェントとコーディング向けにフロンティア級、長時間タスクに強いと説明されていますDEEPTHINK — Gemini 3 Deep ThinkがGoogle AI Ultra向けに展開中。数学・科学・論理・多段推論の最上位モードですAPP — GeminiアプリにDaily Brief、再設計UI、AI動画モデルGemini Omni、個人AIエージェントGemini Sparkが加わりましたDESIGN — 新デザイン言語Neural Expressiveで、よりリッチな視覚出力とモダリティ間の素早い切替に向けて再構築されていますULTRA — Google AI Ultraはモデル最上位アクセス・Deep Research・Veo 3動画生成・100万トークンコンテキストを束ねるプレミアム枠です
記事一覧/API / SDK
API / SDK/2026-06-16上級

既定モデルが上がっても折れない — Gemini 呼び出しに起動時の能力検出レイヤーを挟む設計

モデル名のピン留めも既定への依存も、どちらも静かに折れます。いま実際に届いているモデルが何をできるのかを起動時に確かめ、その結果でリクエストを組み立て直す能力検出レイヤーの設計と、コピペで動く Python を残します。

gemini83gemini-api241production87architecture8model-migration5

プレミアム記事

朝、いつものように夜間ジョブのログを開いたら、前夜まで通っていた構造化出力の呼び出しが finish_reason だけ返して本文を空にしていました。コードは一行も変えていません。変わっていたのは、こちら側ではなく、API の向こうで既定として割り当てられるモデルのほうでした。

2026 年 6 月、Gemini 3.5 Flash が一般提供になり、一部の提供形態では機能管理のトグルそのものが外されました。「このモデルを使う」と指定したつもりでも、運用面では既定が上がっていく前提に変わりつつあります。モデル名を固定すれば廃止のタイミングで落ち、固定せず既定に委ねれば、ある朝こちらの知らないうちに振る舞いが変わります。

どちらも折れる。それなら、起動時に一度だけ「いま実際に届いているモデルが、何を受け付けて何を返すのか」をこちらから確かめてしまえばよい、というのが今日の話です。私自身が個人開発の自動化で何度かこの朝を経験して、最終的に落ち着いた設計を残します。

ピン留めと既定依存が、別々の理由で折れる

まず、よくある二つの構えがなぜ両方とも折れるのかを整理しておきます。ここを曖昧にしたまま対策を足すと、対症療法が積み重なるだけになります。

モデル名のピン留めは、再現性のためには正しい判断です。gemini-2.5-flash のように固定すれば、昨日と今日で同じ重みが応答します。ただしこの安定は、そのモデルが提供され続けている間だけの安定です。廃止予告が出れば、固定したコードはその日付を境に 404NOT_FOUND で止まります。安定の代償として、寿命を自分で管理する義務を負います。

既定への依存は逆です。gemini-flash-latest のような別名や、明示しない既定に委ねると、廃止では落ちません。代わりに、こちらが何も知らないうちに別の重みへ差し替わります。プロンプトは同じでも、出力の長さの癖、thinking の既定挙動、構造化出力のスキーマ遵守の厳しさが、静かにずれます。落ちないぶん、気づくのが翌朝のログになります。

つまり問題は「どちらが正しいか」ではありません。固定は時間軸で折れ、委譲は振る舞いの軸で折れる。片方を選ぶ限り、どちらかの軸が無防備に残ります。

起動時に一度だけ、届いているモデルに尋ねる

無防備な軸を塞ぐ最小の方法は、アプリの起動時に小さな試し打ちを送り、返ってきた事実だけで判断することです。ドキュメントに「対応」と書いてあるかではなく、いま自分の API キーで、いま割り当てられるモデルで、実際に受理されるかを見ます。

from google import genai
from google.genai import types
import time, logging
 
log = logging.getLogger("capability")
 
class Capabilities:
    def __init__(self, model: str):
        self.model = model
        self.thinking = False          # thinking 指定を受け付けるか
        self.thinking_param = None     # "level" か "budget" か
        self.structured = False        # response_schema を遵守するか
        self.multimodal = False        # 画像入力を受理するか
        self.probed_at = 0.0
 
def _try(call):
    """例外を握りつぶし、成功なら戻り値、失敗なら None を返す小さなヘルパー。"""
    try:
        return call()
    except Exception as e:                       # SDK 版差・API 版差を吸収する
        log.info("probe miss: %s", type(e).__name__)
        return None

ここでの設計判断は二つあります。ひとつは、検出を例外ベースにすること。フィールド名が SDK のバージョンで変わっても、受理されなければ例外になるという事実は変わりません。hasattr でフィールドの有無を見るより、実際に送って受理されるかを見るほうが、こちらの想定に依存しません。

もうひとつは、検出を機能単位に割ること。「このモデルは新しい」といった粗い判定ではなく、thinking が通るか、構造化出力がスキーマを守るか、画像が受理されるかを、それぞれ独立した小さな呼び出しで確かめます。モデルは機能ごとに段階的にロールアウトされるので、束ねて判定すると必ずどこかで外れます。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
モデル名のピン留め(廃止で落ちる)と既定への依存(黙って差し替わる)の両方を避け、起動時に「いま届いているモデルが実際に何を受け付けるか」を確かめてから本番リクエストを組む構成を手に入れられます
thinking 指定・構造化出力・マルチモーダルを 1 機能ずつ小さな試し打ちで判定し、結果をTTL付きでキャッシュする能力プロファイル実装を、そのまま動く Python として持ち帰れます
検出が外れた瞬間に例外を投げず静かに縮退させるフォールバック連鎖と、検出オーバーヘッドを 1 日あたり数円に抑えるコスト設計の実測値を確認できます
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Gemini Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

API / SDK2026-06-13
Gemini 3.5 Flash GA をどこから差し替えるか — ワークロード別の置き換え判定とモデルルーターによる段階導入の記録
Gemini 3.5 Flash GA への移行をモデル名の書き換え1行で済ませず、評価ハーネスでワークロード別に実測してから段階導入した記録です。判定基準・比較コード・環境変数ルーター・ロールバック設計をまとめます。
API / SDK2026-06-17
Flash と Pro のルーティングしきい値を、シャドウ再評価で較正し続ける
Flash で生成し、自信のないものだけ Pro に回すルーターは、しきい値を手で決めた瞬間から少しずつ古くなります。サンプリングしたシャドウ再評価で不一致率を測り、しきい値を品質予算から逆算して較正し続ける仕組みを、動くコードで組み立てます。
API / SDK2026-06-15
既定モデルが勝手に上がる時代に、プロンプト変更の劣化を数値で捕まえる — バリアント管理とカナリア評価の実装メモ
Gemini 3.5 Flash が既定に上がり、無効化もできなくなりました。プロンプトを触っていないのに応答が変わる前提で、バリアントを束ねて管理し、カナリアと LLM-as-judge で劣化を数値として捕まえる仕組みを、動くコードで組み立てます。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →