GEMINI LABEN
SEARCH — File Searchの根拠情報が強化。視覚引用のmedia_idとページ番号が加わり、どの画像・どのページが根拠か辿れますAPI — Webhooksのイベント駆動でBatch APIや長時間処理のポーリングを置き換えられますDEPRECATION — 画像プレビューモデル2種(gemini-3.1-flash-image-preview等)が6/25に停止。利用中の自動化は即日移行が必要ですMODEL — Gemini 3.5 Flashは一般提供済み。3.1 Proをほぼ全ベンチで上回りつつ4倍高速に動作しますAGENTS — Managed AgentsがGemini APIでパブリックプレビュー。隔離Linuxサンドボックスで自律エージェントを動かせますSTUDIO — Google AI Studioが自然言語からAndroidアプリを生成できるようになりましたSEARCH — File Searchの根拠情報が強化。視覚引用のmedia_idとページ番号が加わり、どの画像・どのページが根拠か辿れますAPI — Webhooksのイベント駆動でBatch APIや長時間処理のポーリングを置き換えられますDEPRECATION — 画像プレビューモデル2種(gemini-3.1-flash-image-preview等)が6/25に停止。利用中の自動化は即日移行が必要ですMODEL — Gemini 3.5 Flashは一般提供済み。3.1 Proをほぼ全ベンチで上回りつつ4倍高速に動作しますAGENTS — Managed AgentsがGemini APIでパブリックプレビュー。隔離Linuxサンドボックスで自律エージェントを動かせますSTUDIO — Google AI Studioが自然言語からAndroidアプリを生成できるようになりました
記事一覧/API / SDK
API / SDK/2026-06-24上級

Gemini API を Edge に載せると subrequest 上限で静かに落ちる — 残量を計装して守る運用メモ

Gemini API を Cloudflare Workers で運用していると、平常時は問題ないのに負荷やツール連鎖が深まった瞬間だけ subrequest 上限で落ちます。残量をリクエスト単位で計測し、予算として守るための計装パターンと実装を、個人開発で運用しているサイト群の知見からまとめます。

gemini-api248cloudflare-workers7edge-runtimesubrequestobservability6

プレミアム記事

本番に出してしばらく安定していた Gemini API のエンドポイントが、ある日のアクセス増加の時間帯だけ「Too many subrequests」を返し始める。ログを見ても Gemini への呼び出しは普段どおり1回。けれど Workers のサブリクエスト計上は 50 を超えている——個人開発で運用しているサイト群を Cloudflare Workers に寄せたあと、私はこの「平常時は見えない上限」に二度刺されました。一度目は原因に半日、二度目は計装が効いて 5 分でした。差を分けたのは、subrequest を「エラーが出たら直すもの」ではなく「リクエストごとに残量を持つ予算」として扱えていたかどうかです。

この記事は、その予算という見方を実装に落とすための運用メモです。閾値の数字を覚えるより、自分のアプリが1リクエストで実際に何件消費しているかを測れる状態を先に作るほうが、長く効きます。

なぜローカルでは絶対に出ないのか

Cloudflare Workers は、1つのリクエスト処理の中で外部へ発行できる接続(fetch、Cache API、KV、D1、R2、Durable Objects への到達など)の総数に上限を持ちます。執筆時点で Free は 50、Workers Standard は 1,000 です。Gemini API への呼び出しも、当然このうちの1件として数えられます。

つまずきやすいのは、自分が明示的に書いた fetch 以外も計上される点です。Next.js を Workers 上で動かしていれば、キャッシュミス時の ASSETS 取得がサブリクエストになります。ミドルウェアでアクセスログを外部に飛ばしていれば、それも毎回1件です。Gemini を1回叩いているつもりでも、フレームワークと周辺処理が裏で 20〜30 件を黙って積み上げていることは珍しくありません。

ローカルの開発サーバーはこの上限を持たないため、wrangler dev でも再現しません。本番相当で観測するには wrangler dev --remote、稼働中の実トラフィックを見るには wrangler tail が要ります。診断はここを整えるところから始めます。

推測でモデルを変える前に、残量を数える

エラーを見ると、まずモデルを軽いものに替えたくなります。けれど subrequest 上限はモデルの重さとは無関係です。最初にやるべきは、1リクエストが実際に何件消費しているかを数値で掴むこと。wrangler tail を開いて実トラフィックを流し、1操作あたりの外向き接続数を観察します。「自分のコードは1回しか fetch していないはずなのに 25 件出ている」というギャップに、ここで初めて気づけます。

数えるべき発生源は、私の経験では次の3つに集約されます。

ひとつ目は Function Calling の連鎖深度です。モデルがツールを呼び、その結果を受けてまた別のツールを呼ぶたびに、新しい往復が1件ずつ積まれます。深さ5の連鎖なら、ツール実行の外部 API も合わせて二桁に届きます。ふたつ目は SDK の自動リトライ。@google/genai は 429 や 503 を受けると静かに再試行するので、ユーザーから見える1リクエストの内側で3回ぶんが計上されることがあります。みっつ目は、ログ・メトリクス・設定取得のような「小さくて気づきにくい」毎リクエストの送信です。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
1リクエストが消費する subrequest を実測し、予算として可視化する BudgetedFetch ラッパーの実装
Function Calling の連鎖・SDK 自動リトライ・ログ送信が水面下で消費する分を切り分ける診断手順
上限に当たる前に劣化させる(degrade gracefully)ための予算配分と waitUntil バッチ化の設計
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Gemini Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

API / SDK2026-06-22
Gemini API のアプリで、無料ユーザーのコストが粗利を食う前に — ティア設計とコスト上限の実装メモ
Gemini API を組み込んだアプリの粗利を守るには、回数制限ではなく『1ユーザーあたりの月次コスト天井』で設計します。ティア別モデルルーティング、KVでの実コスト計測、トークン膨張の潰し方を実装例で示します。
API / SDK2026-05-28
Gemini API の SLO と Error Budget を個人開発で運用する設計 — 4 サイトの可用性を Burn Rate 監視で守る
Gemini API を 4 サイトの本番運用に組み込んできた立場から、個人開発でも実装できる SLO と Error Budget の運用設計をまとめました。Cloudflare Workers と KV を使った Burn Rate 計算、Multi-Window アラート、エラー予算消費時の機能凍結ルールを動くコード付きで共有します。
API / SDK2026-05-23
Gemini API × Sentry でLLMエラー追跡とプロンプト失敗を観測する本番運用パイプライン
Sentry のエラートラッキングと Gemini API 固有の失敗パターンを組み合わせ、プロンプト崩壊・安全フィルタ発火・トークン超過まで本番で観測する実装パイプラインを設計します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →