TAG

Observability

7 記事

Gemini API のセーフティフィルタが正当な応答を黙って落とすとき — 全切りせず誤検知だけを救う運用メモ

本番のGemini APIで正当なプロンプトがSAFETYでブロックされる誤検知を、全カテゴリ無効化に逃げずに扱う運用メモ。入力ブロックと出力ブロックの切り分け、誤検知率の計装、カテゴリ別の段階的リカバリまでを実装で整理します。

◈ Gemini API/2026-06-24上級

Gemini API を Edge に載せると subrequest 上限で静かに落ちる — 残量を計装して守る運用メモ

Gemini API を Cloudflare Workers で運用していると、平常時は問題ないのに負荷やツール連鎖が深まった瞬間だけ subrequest 上限で落ちます。残量をリクエスト単位で計測し、予算として守るための計装パターンと実装を、個人開発で運用しているサイト群の知見からまとめます。

◈ Gemini API/2026-05-23上級

Gemini API × Sentry でLLMエラー追跡とプロンプト失敗を観測する本番運用パイプライン

Sentry のエラートラッキングと Gemini API 固有の失敗パターンを組み合わせ、プロンプト崩壊・安全フィルタ発火・トークン超過まで本番で観測する実装パイプラインを設計します。

◈ Gemini API/2026-04-25上級

Gemini API を OpenTelemetry でトレースする本番運用ガイド — 1リクエストの内側を全部見せる

Gemini API を本番投入したあと、ログだけでは追えなくなったコスト・レイテンシ・失敗の連鎖を OpenTelemetry の分散トレーシングで丸ごと可視化する方法を、Python・Node.js の実装からセマンティック規約、Grafana/Datadog 連携まで具体的に解説します。

◈ Gemini API/2026-04-23上級

Gemini API × Langfuse — LLM オブザーバビリティの本番実装ガイド

Gemini API を本番運用するチーム向けに、Langfuse を使った LLM オブザーバビリティの実装を体系的に解説します。トレース設計、コスト可視化、プロダクショントレースでの LLM-as-Judge 評価、PII マスキング、サンプリングまで動作コード付きで網羅します。

⬡ Gemini 応用/2026-04-20上級

Gemini API 本番アーキテクチャ設計2026 — スケーラブルで安定した AI システムを構築する設計パターン集

Gemini APIを本番運用するための設計パターンを徹底解説。レジリエントなAPIクライアント、多層キャッシング、マルチテナント設計、観測可能性、コスト制御まで実装コード付きで解説します。

◈ Gemini API/2026-03-30上級

Gemini API 本番環境のオブザーバビリティ — ログ・監視・コスト追跡の実践パターン

Gemini APIを本番運用する際に不可欠なオブザーバビリティ基盤を構築する方法を解説。構造化ログ、トークン使用量の追跡、レイテンシ監視、コスト最適化ダッシュボードまで、実装コード付きで網羅します。