●API — The Gemini API now processes over 16 billion tokens per minute, roughly on par with OpenAI●ENTERPRISE — Gemini Enterprise passes 8 million paid seats across more than 2,800 companies●AGENT — Claude Opus 4.8 arrives on Gemini Enterprise Agent Platform, expanding multi-vendor choices●SPEECH — gemini-3.1-flash-tts-preview adds streaming speech generation via streamGenerateContent●DATA — Crossbeam data stores can now connect to Gemini Enterprise in public preview●MODEL — Gemini 3.5 Flash GA and Gemma 4 round out options for agentic and lightweight workloads●API — The Gemini API now processes over 16 billion tokens per minute, roughly on par with OpenAI●ENTERPRISE — Gemini Enterprise passes 8 million paid seats across more than 2,800 companies●AGENT — Claude Opus 4.8 arrives on Gemini Enterprise Agent Platform, expanding multi-vendor choices●SPEECH — gemini-3.1-flash-tts-preview adds streaming speech generation via streamGenerateContent●DATA — Crossbeam data stores can now connect to Gemini Enterprise in public preview●MODEL — Gemini 3.5 Flash GA and Gemma 4 round out options for agentic and lightweight workloads

TAG

token bucket

1 articles

← Back to all tags

Gemini API¹ rate limits¹ architecture¹ operations¹ production¹

⬡ Gemini Advanced/2026-07-03Advanced

Your Night Batch Is Causing the Morning 429s — Priority Admission Control for a Shared Gemini Quota

When bulk jobs and interactive features share one project's RPM/TPM, the bulk lane wins by default. A priority token bucket design with measurements: 429 rate 3.2% down to 0.03%.