Gemini 3.5 Flash 移行で組み直した RAG の3層キャッシュ — レスポンス・検索・埋め込みを段階的に節約する
Gemini 2.0 Flash の廃止を機に、RAG のキャッシュ設計を 3.5 Flash 前提で組み直しました。レスポンス・セマンティック・埋め込みの3層それぞれの実装コードと実測ヒット率、API 側 Context Caching との役割分担までを整理します。
Gemini 3.5 Flash GA をどこから差し替えるか — ワークロード別の置き換え判定とモデルルーターによる段階導入の記録
Gemini 3.5 Flash GA への移行をモデル名の書き換え1行で済ませず、評価ハーネスでワークロード別に実測してから段階導入した記録です。判定基準・比較コード・環境変数ルーター・ロールバック設計をまとめます。
Gemini in Chrome が Android に来る前に、ブログ側で整えておきたいこと
Gemini in Chrome の Android 展開が6月下旬に始まります。auto browse を載せたモバイルのエージェントブラウジングを見据え、個人ブログ側で先に整えておきたい設計のポイントを実作業ベースでまとめました。
Gemini in Chrome の auto browse に備える — エージェントが操作できるWebアプリの構造設計メモ
Android 版 Chrome に Gemini の auto browse が届く前に、自分のWebアプリをエージェントが確実に操作できる形へ整える設計メモです。操作の的の固定・アクセシビリティツリー・JSON-LD・破壊的操作の保護を実装コードで整理します。
Gemini の生成は通ったのに公開が落ちた朝 — 高価な出力を取りこぼさない『生成アウトボックス』の設計
生成は成功したのに、公開処理の直前でプロセスが落ちる。すると高価な出力が消え、もう一度同じ生成に課金することになります。生成結果を先に永続化し、公開を冪等な後続処理に分離する『生成アウトボックス』の実装と、6月の障害下での運用記録をまとめました。
Deep Think・Deep Research・Live・Omni をどう使い分けるか — 増えた Gemini のモードに1週間の作業を割り当て直した記録
Deep Think・Deep Research・Live・Omni と増えた Gemini のモードを、個人開発の1週間の作業にどう割り当てるか。3つの判断軸と、運用して見直した箇所をまとめました。
Gemini で自律エージェントを動かす最小構成 — ツールループ設計で学んだこと
google-genai SDK の自動 Function Calling で自律エージェントを最小構成から作る手順。ステップ上限・ツール許可リスト・再試行の設計判断を、ブログ運用の自動化で得た実体験とともにまとめます。
Gemini API の Managed Agents に自前のエージェントループを移すべきか — 移す処理と残す処理を分ける3つの質問
Gemini API の Managed Agents が公開プレビューになり、自前のエージェントループとの使い分けが現実の検討事項になりました。実行環境・状態の所有・失敗時の回収という3つの質問で、移す処理と残す処理を分ける考え方を整理します。
夜間ログを毎朝3分で読み切る — Gemini API で Daily Brief 風の運用ダイジェストを自作した記録
Daily Brief に着想を得て、夜間の運用ログを毎朝1通のダイジェストに変えるパイプラインを自作しました。収集・構造化・要約・配信の4段構成と実測トークン数、障害の朝でも配信を止めないフォールバック設計までの実装記録です。
壁紙アセットの画像探しを File Search のマルチモーダル検索に任せてみた記録
数千枚の壁紙アセットから目当ての一枚を探す作業を、File Search のマルチモーダル検索(gemini-embedding-2)に置き換えられるか300枚で検証しました。カテゴリタグ運用との比較、つまずいた点、使い分けの結論を実装コードとともに残します。
すべての記事を見る (581) →