GEMINI LABEN
CLI — 本日6/18、Gemini CLIとGemini Code Assist IDE拡張がAI Pro/Ultra・無料個人利用向けにリクエスト提供を終了。後継はAntigravity CLIですFLASH — Gemini 3.5シリーズが始動し3.5 Flashが提供開始。エージェントとコーディング向けにフロンティア級、長時間タスクに強いと説明されていますDEEPTHINK — Gemini 3 Deep ThinkがGoogle AI Ultra向けに展開中。数学・科学・論理・多段推論の最上位モードですAPP — GeminiアプリにDaily Brief、再設計UI、AI動画モデルGemini Omni、個人AIエージェントGemini Sparkが加わりましたDESIGN — 新デザイン言語Neural Expressiveで、よりリッチな視覚出力とモダリティ間の素早い切替に向けて再構築されていますULTRA — Google AI Ultraはモデル最上位アクセス・Deep Research・Veo 3動画生成・100万トークンコンテキストを束ねるプレミアム枠ですCLI — 本日6/18、Gemini CLIとGemini Code Assist IDE拡張がAI Pro/Ultra・無料個人利用向けにリクエスト提供を終了。後継はAntigravity CLIですFLASH — Gemini 3.5シリーズが始動し3.5 Flashが提供開始。エージェントとコーディング向けにフロンティア級、長時間タスクに強いと説明されていますDEEPTHINK — Gemini 3 Deep ThinkがGoogle AI Ultra向けに展開中。数学・科学・論理・多段推論の最上位モードですAPP — GeminiアプリにDaily Brief、再設計UI、AI動画モデルGemini Omni、個人AIエージェントGemini Sparkが加わりましたDESIGN — 新デザイン言語Neural Expressiveで、よりリッチな視覚出力とモダリティ間の素早い切替に向けて再構築されていますULTRA — Google AI Ultraはモデル最上位アクセス・Deep Research・Veo 3動画生成・100万トークンコンテキストを束ねるプレミアム枠です
記事一覧/API / SDK
API / SDK/2026-06-16上級

Managed Agents が作った成果物を本番に入れる前に — 受け入れゲートを自前で設計する

公開プレビューの Managed Agents にファイル生成まで任せると、品質がぶれたまま本番へ流れ込みます。サンドボックスの成果物を受け入れる前に通す検証ゲートを、そのまま動く Python コードと却下フィードバックの設計まで含めて組み立てます。

gemini-api241managed-agents2production87automation27quality-gateagent-design

プレミアム記事

Managed Agents の公開プレビューを自分の自動運用に差し込んでみて、最初に肝を冷やしたのは「エージェントが自信満々で壊れた成果物を返してくる」場面でした。Google ホストの隔離 Linux サンドボックス内で計画・推論・コード実行・ファイル操作までを完結させてくれるのは確かに楽なのですが、その出力をそのまま本番ディレクトリに置いた瞬間、品質の番人が一人もいなくなります。

私は4サイトのコンテンツを自動で更新する仕組みを個人開発で回しているので、この「番人不在」は致命的でした。生成物が一度でも薄いまま外に出ると、サイト全体の評価がじわじわ下がることを過去に身をもって学んでいます。だからこそ、エージェントを賢くする話よりも先に、エージェントの出力を信用しないための層を一枚かませる設計をお伝えしたいと思います。

なぜ「賢いエージェント」だけでは本番に出せないのか

公開プレビューの Managed Agents は、ステートフルに動いてファイルまで書き換えてくれます。ここで見落としがちなのは、エージェントが返す成功ステータスは「タスクを完了したと自己申告した」という意味でしかない、という点です。コンテナの中でファイルは確かに生成されました。ただ、それが要件を満たしているかどうかは別問題です。

私が実際に遭遇したのは、こんな失敗でした。

  • 生成した記事ファイルの frontmatter から必須フィールドが1つ欠けていた(エージェントは「書いた」と申告)
  • 別タスクで作った段落を、今回の成果物にそっくり再利用していた(逐語重複)
  • 出力 JSON のキー名が前回と微妙に違っていて、後段のビルドが無言で空配列を返した

どれもエージェント側のエラーにはなりません。だから、受け入れ側に決定的(deterministic)な検証コードを置くしかないのです。エージェントの自己申告とは独立した、人間が書いた判定ロジックが要ります。

受け入れゲートの全体像

設計の骨子はシンプルです。エージェントは「生産者」、ゲートは「検品」と割り切ります。

  1. Managed Agent をサンドボックス内で走らせ、成果物を生成させる
  2. サンドボックスから成果物ファイルを取り出す(accepted ではなく一旦 quarantine/ へ)
  3. 受け入れゲートに通す(スキーマ・重複・必須シグナルを機械判定)
  4. 合格なら accepted/ へ移動。不合格なら却下理由を構造化して残す
  5. 却下理由をエージェントに返し、同じタスクを書き直させる(feedback loop)

ポイントは、3 の判定を別の LLM に任せないことです。LLM-as-judge は補助層としては有効ですが、一次ゲートに置くと「賢いが気まぐれな検品員」をもう一人増やすだけになります。一次ゲートは必ず deterministic なコードにします。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
Managed Agents に成果物の生成を任せたいけれど品質がぶれて本番に出せない、という方が、エージェント出力を機械的に検証してから受け入れる仕組みを今日から組めるようになります
サンドボックスから成果物を取り出し、スキーマ検証・段落の逐語重複検出・必須シグナル判定を通すまでの、そのまま動く Python の受け入れゲートを手に入れられます
却下理由をエージェントに返して書き直させる feedback loop と、quarantine/accepted の二段ディレクトリ運用で、自動化が静かに劣化するのを止める設計判断が分かります
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Gemini Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

API / SDK2026-06-13
Gemini の生成は通ったのに公開が落ちた朝 — 高価な出力を取りこぼさない『生成アウトボックス』の設計
生成は成功したのに、公開処理の直前でプロセスが落ちる。すると高価な出力が消え、もう一度同じ生成に課金することになります。生成結果を先に永続化し、公開を冪等な後続処理に分離する『生成アウトボックス』の実装と、6月の障害下での運用記録をまとめました。
API / SDK2026-06-13
Gemini API の Managed Agents に自前のエージェントループを移すべきか — 移す処理と残す処理を分ける3つの質問
Gemini API の Managed Agents が公開プレビューになり、自前のエージェントループとの使い分けが現実の検討事項になりました。実行環境・状態の所有・失敗時の回収という3つの質問で、移す処理と残す処理を分ける考え方を整理します。
API / SDK2026-03-25
Gemini API プロンプト評価・最適化パイプライン構築ガイド — LLM-as-Judge で品質を自動計測する
Gemini API を使ったプロンプト評価パイプラインの構築方法を解説。LLM-as-Judge パターン、A/Bテスト、自動スコアリング、コスト対品質の最適化まで、本番運用に必要な実装を網羅します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →