GEMINI LABEN
MODEL — Gemini 3.5 FlashがGA(正式版)となり、gemini-flash-latestの実体になりましたAGENT — Managed AgentsがGemini APIで公開プレビュー入り。分離されたGoogleホストのLinuxサンドボックスで自律エージェントを動かせますSEARCH — File Searchがマルチモーダル検索に対応し、gemini-embedding-2で画像も直接埋め込み・検索できますWEBHOOK — Batch APIや長時間処理向けにイベント駆動のWebhookが追加され、ポーリングを置き換えられますEMBED — gemini-embedding-2がGAとなり、埋め込みの本番利用が安定しましたDEPRECATION — 一部の画像生成モデルが8月17日に提供終了となるため、移行の準備が必要ですMODEL — Gemini 3.5 FlashがGA(正式版)となり、gemini-flash-latestの実体になりましたAGENT — Managed AgentsがGemini APIで公開プレビュー入り。分離されたGoogleホストのLinuxサンドボックスで自律エージェントを動かせますSEARCH — File Searchがマルチモーダル検索に対応し、gemini-embedding-2で画像も直接埋め込み・検索できますWEBHOOK — Batch APIや長時間処理向けにイベント駆動のWebhookが追加され、ポーリングを置き換えられますEMBED — gemini-embedding-2がGAとなり、埋め込みの本番利用が安定しましたDEPRECATION — 一部の画像生成モデルが8月17日に提供終了となるため、移行の準備が必要です
記事一覧/API / SDK
API / SDK/2026-07-04上級

一晩のバッチで静かに落ちた数十件をどう拾うか — Gemini Batch API の行単位リトライ台帳

Batch API の「完了」は「全件成功」ではありません。個人開発で夜間バッチを回し続けるなかで見えた、行単位の結果台帳・一時失敗と恒久失敗の切り分け・選択的リトライ・恒久失敗の無限リトライ防止を、SQLite で組んだ状態機械の動くコードとともに残します。

gemini-api265batch-api3リトライ設計2冪等性3個人開発73運用設計9

プレミアム記事

朝、バッチジョブのステータスが SUCCEEDED になっていました。安心して結果を書き戻し、その日は別の作業に移りました。

数日後、分類結果を眺めていて気づきます。ある一群のレビューだけ、カテゴリが空のまま Firestore に入っていました。件数にして数十件。ジョブ全体は「成功」でも、その中の一部の行は静かに落ちていたのです。

個人開発で複数のアプリと4つのサイトを回していると、夜間バッチは「動かしてから寝る」道具になります。App Store Connect と Google Play Console に溜まったレビューを分類する私自身の運用でも、翌朝に全件が揃っている前提で次の処理を積み上げていました。だからこそ、この「一部だけ落ちる」取りこぼしは、後工程まで汚染してしまいます。

この記事は、Batch API の完了を「全件成功」と読んでしまう油断をやめ、行単位で結果を台帳に記録し、落ちた行だけを拾い直す設計をまとめたものです。夜間処理の初回実装ではなく、その後に必ず訪れる「失敗した数十件をどう回収するか」に焦点を当てています。

「完了」と「全件成功」は違う

Batch API のジョブ状態と、ジョブに含まれる個々のリクエストの成否は、別の層の話です。ジョブは無事に終わっても、出力JSONL の各行には成功したレスポンスと失敗したエラーが混在します。

出力の1行は、おおよそ次のどちらかの形をしています。SDK のバージョンによってキー名は前後します。この場合は、実際の出力を一度 head で覗いてから実装に落とすことを推奨します。

{"key": "review-000512", "response": {"candidates": [ ... ]}}
{"key": "review-000513", "error": {"code": 400, "message": "..."}}

つまり、ジョブが SUCCEEDED でも、error を持つ行は普通に混ざります。私が取りこぼしたのは、safety フィルタに引っかかった攻撃的なレビュー本文と、絵文字だけで構成された本文でスキーマ抽出に失敗した行でした。

私自身の実測では、8,000件規模のバッチで error を持つ行はおおむね全体の1〜2%、件数にして数十件から百数十件でした。通常APIの約50%というコストで回せる代わりに、この数%を静かに取りこぼすと、後工程がじわじわ狂います。

ここで大切な考え方を1つ。ジョブの成否と、行の成否を、別々に記録すること。この2層を混ぜて「ジョブが成功したから全部入れる」とすると、必ず穴が空きます。

行単位の台帳を持つ

そこで、投入するリクエスト1件ごとに状態を持つ台帳を用意します。キーは custom_id(ここでは key)です。状態は次の4つに絞りました。

状態意味次にすること
pendingまだ結果を受け取っていない次のバッチに含める
succeeded正常な構造化出力が得られた何もしない(確定)
retryable一時的な失敗(429 / 503 等)回数上限まで再投入する
permanent入力起因・safety 等で再試行しても直らない再投入せず、別扱いで人間が見る

SQLite にしたのは、個人開発の夜間バッチで「1ファイルで持ち運べて、途中で落ちても残る」ことが何より効くからです。台帳のスキーマと初期化はこれだけです。

import sqlite3
import time
 
def open_ledger(path: str = "batch_ledger.db") -> sqlite3.Connection:
    conn = sqlite3.connect(path)
    conn.execute(
        """
        CREATE TABLE IF NOT EXISTS rows (
            key           TEXT PRIMARY KEY,
            payload       TEXT NOT NULL,   -- 入力リクエスト(JSON文字列)
            status        TEXT NOT NULL DEFAULT 'pending',
            attempts      INTEGER NOT NULL DEFAULT 0,
            last_error    TEXT,
            result        TEXT,            -- 成功時の抽出結果(JSON文字列)
            updated_at    REAL NOT NULL DEFAULT 0
        )
        """
    )
    conn.commit()
    return conn
 
 
def enroll(conn: sqlite3.Connection, key: str, payload: str) -> None:
    """初回投入時に pending として登録する。再投入では触らない。"""
    conn.execute(
        "INSERT OR IGNORE INTO rows(key, payload, updated_at) VALUES (?, ?, ?)",
        (key, payload, time.time()),
    )
    conn.commit()

INSERT OR IGNORE にしているのが要点です。2晩目に同じ key で再投入しても、succeeded 行を pending に巻き戻さない。台帳は「一度確定した成功を守る」ためにあります。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
Batch の出力JSONLを custom_id で照合し pending / succeeded / retryable / permanent の4状態を持つ SQLite 台帳を組む実装を、コピペで動く形で手に入れる
429 や 503 のような一時失敗と、safety ブロックや不正入力のような恒久失敗を分類し、恒久失敗を無限にリトライしない停止条件の作り方がわかる
2晩目・3晩目に「失敗した行だけ」を再投入する選択的リトライと、試行をまたいだコスト計上のズレを台帳で吸収する運用手順を学べる
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Gemini Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

API / SDK2026-06-21
Gemini Batch API でアプリレビュー8,000件を一晩で分類し、ポーリングを Webhooks に寄せるまで
個人開発の6アプリで溜まった約8,000件のレビューを Gemini Batch API で一晩のうちに分類した実装メモに、2026年6月のイベント駆動 Webhooks で翌朝のポーリングを置き換える設計を加えました。コスト・所要時間の実数値、複合キー設計、ハングジョブの見切り、期限つき非推奨の管理まで、動くコード付きで残します。
API / SDK2026-06-30
長尺の音源を Gemini に「聴かせて」章立てを作る — タイムスタンプ付き構造化抽出の実装
1時間を超えるヒーリング音源を手作業で章立てしていた作業を、Gemini の音声理解でタイムスタンプ付きの構造化データに置き換えた実装記録です。Files API での長尺アップロード、response_schema での JSON 固定、そして実際にハマったタイムスタンプのずれ・幻の無音区間を検証で潰すところまで、動くコードで残します。
API / SDK2026-06-26
Gemini 3.5 Flash は本当に安いのか — リトライ増幅を実測して Flash と Pro の損益分岐を出す
3.5 Flash が一般提供になった今、全部を Flash に寄せたくなります。でも単価ではなく成功1件あたりの実効コストで見ると判断が変わります。リトライ増幅を実測する最小ハーネスと損益分岐の出し方を共有します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →