GEMINI LABEN
API — Gemini 3.5 Flashが一般提供。gemini-flash-latestの実体となり、エージェント・コーディングで持続的に高性能を出しますAGENT — Managed Agentsが公開プレビュー。Googleホストの隔離Linuxサンドボックスでステートフルな自律エージェントを構築できますSEARCH — File Searchがマルチモーダル対応。gemini-embedding-2で画像をそのまま埋め込み・検索できますRESEARCH — Deep Researchの新版が協調プランニング・可視化・MCPサーバー連携・File Searchに対応しましたSHEETS — Gemini in Sheetsが周辺データ構造を解析し、数式エラーを1クリックで診断・修正しますROADMAP — Gemini 3.5 Proは品質調整のため7月へ延期。最新の主力はFlash系ですAPI — Gemini 3.5 Flashが一般提供。gemini-flash-latestの実体となり、エージェント・コーディングで持続的に高性能を出しますAGENT — Managed Agentsが公開プレビュー。Googleホストの隔離Linuxサンドボックスでステートフルな自律エージェントを構築できますSEARCH — File Searchがマルチモーダル対応。gemini-embedding-2で画像をそのまま埋め込み・検索できますRESEARCH — Deep Researchの新版が協調プランニング・可視化・MCPサーバー連携・File Searchに対応しましたSHEETS — Gemini in Sheetsが周辺データ構造を解析し、数式エラーを1クリックで診断・修正しますROADMAP — Gemini 3.5 Proは品質調整のため7月へ延期。最新の主力はFlash系です
記事一覧/API / SDK
API / SDK/2026-06-27上級

Project Spend Caps とアプリ側ソフト上限で、無人パイプラインの費用事故を二重に止める

Gemini API の Project Spend Caps(月額ドル上限)と、ハード上限の手前で止まるアプリ側ソフトサーキットブレーカーを二段構えにする設計。Python と sqlite による日次コスト台帳の実装コードつき。

Gemini API148コスト管理10Spend Caps2自動化23運用設計4

プレミアム記事

ある朝、コーヒーを淹れる前に Gemini API のダッシュボードを開いて、手が一瞬止まりました。前夜から無人で回している自動投稿パイプラインが、想定の数倍のリクエストを叩いていたのです。原因は単純で、ある外部 API が断続的に 5xx を返し、私が書いたリトライが素直に何度も叩き直していただけでした。料金としては大事には至りませんでしたが、「無人で回す」とは「気づかないうちに費用が積み上がる経路を常に開けておく」ことでもあると、静かに胸に刻みました。

2026年6月26日に一般提供へ進んだ Project Spend Caps は、まさにこの不安に効く更新です。プロジェクト単位で Gemini API の月間ドル上限を設定でき、変更か無効化をするまで効き続けます。ただ、ハード上限だけでは足りないというのが、個人開発で複数のアプリやブログを並行して無人運用してきた私自身の実感でした。そこで取り入れたのが、Project Spend Caps を土台に置きつつ、その手前で静かに止まるアプリ側のソフト上限を重ねる、二段構えの設計です。実装コードとあわせて残しておきます。

無人運用で費用が跳ねる瞬間はどこか

費用が跳ねるのは、たいてい人が見ていない時間帯です。そして原因は数えるほどしかありません。

第一に、リトライの暴走です。一時的な 429 や 5xx に対して指数バックオフを入れていないと、失敗のたびに即座に叩き直し、短時間で呼び出し回数が膨らみます。私のヒヤリも、まさにこれでした。

第二に、モデルの取り違えです。下調べやタグ付けのような軽い前処理にまで重いモデルを当ててしまうと、1リクエストあたりの単価がそのまま何倍にもなります。出力トークンの単価は入力よりも高いため、長い応答を無造作に返させる設計も地味に効いてきます。

第三に、ループの取りこぼしです。エージェント的に「足りなければもう一度」を繰り返す処理で停止条件が甘いと、無限に近い往復が生まれます。Managed Agents のような自律実行を無人で走らせる場合、ここが一番こわい落とし穴になります。

これらはどれも、平常時のテストでは表に出ません。本番運用に乗せて、人が寝ている数時間のあいだに初めて牙をむきます。だからこそ、コードの正しさとは別のレイヤーで、費用そのものに天井を用意しておく必要があります。

Project Spend Caps はどこを守り、どこを守らないか

Project Spend Caps の役割は明快です。プロジェクトに紐づく Gemini API の月間支出が設定したドル額に達したら、それ以上の課金対象リクエストを止めます。クレジットカードの利用枠のように、最後の砦として効きます。

一方で、ハード上限には性質上の限界もあります。上限に達した瞬間、進行中の処理は一律に弾かれます。途中まで組み立てた記事の生成も、半分まで進んだバッチも、区別なく止まります。アプリから見れば、ある時刻を境に呼び出しが急にエラーを返し始める挙動になります。

つまりハード上限は「破滅を防ぐ」ためのもので、「優雅に減速する」ためのものではありません。月末に近づいて上限が迫っているとき、重要なジョブだけ通して些末なジョブを後回しにする、といった判断はハード上限にはできません。そこを埋めるのが、次に作るソフト上限です。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
Project Spend Caps で各プロジェクトに月額ドル上限を割り当て、暴走時の被害を構造で止める考え方
Python と sqlite で書く日次コスト台帳と、ハード上限の手前で作動するソフトサーキットブレーカーの実装
gemini-flash-latest への自動ダウングレードと thinking budget 制御で土台コストを下げる手順
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Gemini Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

API / SDK2026-06-26
Gemini API の月額上限に当てた瞬間、有料ユーザーまで止まる — Project Spend Caps の影響範囲をプロジェクト分割で閉じ込める
Project Spend Caps はプロジェクト全体を一度に止めます。無料ユーザーの暴走が有料ユーザーを巻き込まないよう、上限の影響範囲をティア別プロジェクトで分離し、約10分の遅延を埋めるソフト予算ゲートを実装する設計メモです。
API / SDK2026-04-23
Gemini API を組み込んだ個人プロダクトのコスト暴走を防ぐ — 請求書を見てから慌てないためのガードレール設計
Gemini API を組み込んだ個人プロダクトで月末に「請求額を見て青ざめる」のは、ほぼ全員が一度は通る道です。私が壁紙アプリの AI 機能と、受託案件での Gemini 導入支援で繰り返し組み込んでいる、コスト暴走を未然に防ぐためのガードレール設計を実装込みで整理しました。
API / SDK2026-06-18
countTokens でバッチ投入前にコスト超過を止める — 既定モデルが変わっても崩れない予算ゲートの設計
夜間バッチが想定外に高くつく原因は、投入後にしかコストが分からないことです。countTokens を起点に、思考トークンまで織り込んだ予算ゲートを設計し、既定モデルが入れ替わっても見積もりが崩れない運用に立て直します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →