◈ Gemini API/2026-06-23上級
Gemini API の平均レイテンシは速いのに、たまに固まる — p95/p99 を守る運用メモ
平均TTFTは速いのに、一定割合のユーザーだけ応答が固まる — これはテールレイテンシ(p95/p99)の問題です。計測の取り方からモデルルーティング・ストリーミング予算・キャッシュ会計・リトライ設計まで、本番で効いた防衛策をコード付きで共有します。
◈ Gemini API/2026-05-28上級
Gemini API の SLO と Error Budget を個人開発で運用する設計 — 4 サイトの可用性を Burn Rate 監視で守る
Gemini API を 4 サイトの本番運用に組み込んできた立場から、個人開発でも実装できる SLO と Error Budget の運用設計をまとめました。Cloudflare Workers と KV を使った Burn Rate 計算、Multi-Window アラート、エラー予算消費時の機能凍結ルールを動くコード付きで共有します。