GEMINI LABEN
SIRI — WWDC 2026で刷新版SiriがGoogle Geminiモデルで動くと確定。ただしEUではDMAによりiOS 27時点で提供されませんFLASH3.5 — Gemini 3.5 FlashがGA。エージェント・コーディングで持続的なフロンティア性能を発揮する最上位FlashモデルですIMAGE-GA — Gemini 3.1 Flash Image / 3.1 Pro Imageがネイティブ視覚モデルとしてGA。preview版は6/25に終了予定MANAGED-AGENTS — Gemini APIでManaged Agentsが公開プレビュー。Googleホストの隔離Linuxサンドボックスで自律エージェントを構築できますFILE-SEARCH — File Searchがマルチモーダル対応。gemini-embedding-2で画像のネイティブ埋め込み・検索が可能になりましたDEPRECATION — gemini-3.1-flash-image-preview / gemini-3-pro-image-previewは6/25に停止。GA版への移行をお早めにSIRI — WWDC 2026で刷新版SiriがGoogle Geminiモデルで動くと確定。ただしEUではDMAによりiOS 27時点で提供されませんFLASH3.5 — Gemini 3.5 FlashがGA。エージェント・コーディングで持続的なフロンティア性能を発揮する最上位FlashモデルですIMAGE-GA — Gemini 3.1 Flash Image / 3.1 Pro Imageがネイティブ視覚モデルとしてGA。preview版は6/25に終了予定MANAGED-AGENTS — Gemini APIでManaged Agentsが公開プレビュー。Googleホストの隔離Linuxサンドボックスで自律エージェントを構築できますFILE-SEARCH — File Searchがマルチモーダル対応。gemini-embedding-2で画像のネイティブ埋め込み・検索が可能になりましたDEPRECATION — gemini-3.1-flash-image-preview / gemini-3-pro-image-previewは6/25に停止。GA版への移行をお早めに
記事一覧/高度な活用
高度な活用/2026-04-16上級

Gemini 2.5 Pro の思考を制御する — Thinking Budget と推論プロセスを活用した高精度プロンプト設計

Gemini 2.5 Pro の Thinking 機能(内部推論プロセス)を深掘り解説。Thinking Budget の設定・調整から、思考プロセスを活用した高精度回答の引き出し方まで、API レベルの実装パターンを紹介します。

Gemini 2.5 Pro24Thinking Budget2reasoning5プロンプト設計9Gemini API179高精度AI

プレミアム記事

「賢さ」を設定できるモデルが登場した

Gemini 2.5 Pro が他のモデルと決定的に異なる点は、モデルが回答を返す前にどれだけ深く考えるかを設定できることです。

これが thinking_budget パラメータです。0に設定すれば即座に回答(Thinking OFF)、24576トークンまで上げれば問題をじっくり内部で検討してから回答します。同じプロンプトでも、この設定次第で回答品質が大きく変わることを、実際に検証してみました。

Thinking Budget とは何か

thinking_budget は Gemini 2.5 Pro の独自パラメータで、モデルの内部推論に使えるトークン数の上限を設定します。

注意すべきは「使えるトークン数の上限」であって「必ず使うトークン数」ではないことです。簡単な質問には少ない推論で答え、難しい問題には上限まで使います。つまり、高い値を設定することは「必要なら時間をかけていい」という許可を与えることになります。

コストについても正直に書くと:Thinking トークンは通常のトークンと同じ料金で課金されます。thinking_budget を24576に設定して難しい問題を解かせると、その分コストが増えます。コストを抑えたい簡単なタスクには低い値を使いましょう。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
Budget 値別のレイテンシ・コスト・品質スコアの実測値(5回平均)
本番運用で実際にハマった3つのトラブルと安全側に倒した対処コード
5,000万DLアプリ開発者の私が普段使っている Budget 配分ルールと早見表
Stripe による安全な決済 · いつでもキャンセル可能
シェア

お読みいただきありがとうございます

Gemini Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

高度な活用2026-04-06
Gemini 2.5 Proビジネス上級活用マスタークラス:思考力と統合力を極める
Gemini 2.5 Proの推論能力(Thinking)、100万トークンコンテキスト、マルチモーダル理解を最大限に活かすビジネス活用法を徹底解説。意思決定支援・文書分析・データ解析・戦略立案まで、上級者向けのプロンプト設計と実践ワークフローをまとめました。
高度な活用2026-06-01
Gemini Embedding の次元を 3072 から 768 へ切り詰める — ベクトルDBのコストとレイテンシを下げる Matryoshka 設計
gemini-embedding-001 は 3072 次元の埋め込みを返しますが、Matryoshka 表現のおかげで前方だけを切り出しても精度がほとんど落ちません。次元を 768 へ削ってベクトルDBのストレージとレイテンシを下げる設計を、再正規化の落とし穴と粗密二段検索のコード付きで組み立てます。
高度な活用2026-05-31
Gemini Embedding モデルを切り替える日:無停止リインデックスの設計
埋め込みモデルを新しくすると、過去に作った全ベクトルが使えなくなります。サービスを止めずに数十万件のベクトルを作り直す二重インデックス方式を、再開可能な再生成ジョブとクエリ側の抽象化層のコード付きで設計します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →