GEMINI LABEN
SEARCH — File Searchの根拠情報が強化。視覚引用のmedia_idとページ番号が加わり、どの画像・どのページが根拠か辿れますAPI — Webhooksのイベント駆動でBatch APIや長時間処理のポーリングを置き換えられますDEPRECATION — 画像プレビューモデル2種(gemini-3.1-flash-image-preview等)が6/25に停止。利用中の自動化は即日移行が必要ですMODEL — Gemini 3.5 Flashは一般提供済み。3.1 Proをほぼ全ベンチで上回りつつ4倍高速に動作しますAGENTS — Managed AgentsがGemini APIでパブリックプレビュー。隔離Linuxサンドボックスで自律エージェントを動かせますSTUDIO — Google AI Studioが自然言語からAndroidアプリを生成できるようになりましたSEARCH — File Searchの根拠情報が強化。視覚引用のmedia_idとページ番号が加わり、どの画像・どのページが根拠か辿れますAPI — Webhooksのイベント駆動でBatch APIや長時間処理のポーリングを置き換えられますDEPRECATION — 画像プレビューモデル2種(gemini-3.1-flash-image-preview等)が6/25に停止。利用中の自動化は即日移行が必要ですMODEL — Gemini 3.5 Flashは一般提供済み。3.1 Proをほぼ全ベンチで上回りつつ4倍高速に動作しますAGENTS — Managed AgentsがGemini APIでパブリックプレビュー。隔離Linuxサンドボックスで自律エージェントを動かせますSTUDIO — Google AI Studioが自然言語からAndroidアプリを生成できるようになりました
記事一覧/開発ツール
開発ツール/2026-06-24初級

WindowsでGemma 4をローカル実行する — Ollamaでコマンド2つから始める手元のLLM

Googleの軽量オープンモデル Gemma 4 を、Windows のノートPCでローカル実行する手順をまとめます。Ollama を使えば実質コマンド2つでインストールから起動まで完結します。クラウドのGemini APIと手元のGemmaをどう使い分けるかの観点まで。

Gemma2Gemma 412Ollama8ローカルLLM10WindowsGemini69

クラウドのAPIは便利ですが、ちょっと試したいだけのときに、鍵を発行して課金枠を気にして、という前段が地味に重く感じることがあります。手元のPCだけで完結する小さなモデルが一つあると、その心理的なハードルがすっと下がります。

私自身、個人開発でアプリやブログを回しながら、下調べや文章の下書きにLLMを使う場面が増えました。常時クラウドに投げるほどでもない軽い用途では、手元で動くモデルが想像以上に役に立ちます。ここでは、Googleの軽量オープンモデル Gemma 4 を、Windows のノートPCで動かす最短手順をまとめます。

なぜ「手元で動くLLM」を一つ持っておくと良いか

クラウドのGemini APIが要らなくなるわけではありません。むしろ住み分けの話です。手元で動くモデルには、クラウドにはない利点がいくつかあります。

  • 鍵も課金枠も気にしなくてよい — 思いついたときにすぐ試せる
  • 入力が外に出ない — 下書きやメモなど、外に投げたくない文章を安心して渡せる
  • オフラインでも動く — ネットが不安定な場所でも止まらない

逆に、最新の大規模モデルの推論力や、長大なコンテキストが要る作業はクラウドの方が向いています。「軽い用途は手元、重い用途はクラウド」という二段構えにしておくと、両方の良さを取れます。私はこの切り替えを意識してから、無駄なAPI呼び出しが減りました。

動かす環境の目安

Gemma 4 には軽量な小型版が用意されていて、一般的なノートPCでも動かせます。参考までに、私が見た構成では Intel Core i7 世代・メモリ32GBの Windows 11 ノートで、小型版が問題なく対話できていました。

メモリは多いほど余裕があります。小型版なら16GBでも動く可能性はありますが、快適さを求めるなら32GBあると安心です。GPUがなくてもCPUで動きますが、応答速度は搭載ハードに依存します。まずは手持ちのPCで小型版から試し、物足りなければ上位サイズへ、という順序がお勧めです。

Ollama を使えばコマンド2つで起動できる

セットアップの主役は Ollama です。モデルのダウンロードと起動を肩代わりしてくれるので、難しい設定なしに対話を始められます。PowerShell を開いて、次の3行を順に実行します。

irm https://ollama.com/install.ps1 | iex
ollama --version
ollama run gemma4:e2b

1行目が Ollama 本体のインストール、2行目がインストール成功の確認、3行目が小型版 Gemma 4 のダウンロードと起動です。実質的にやることは「入れる」と「動かす」の2手だけで、最後の ollama run を打つとモデルが取得され、そのまま対話が始まります。

起動後にやり取りを確かめる

起動が終わると、メッセージの入力待ちになります。試しに挨拶を送ると応答が返り、日本語でもそのまま会話できます。終了したいときは /bye と打てば対話モードを抜けられます。

対話モードに入らず、その場で一回だけ質問する使い方もできます。

ollama run gemma4:e2b "元素周期表で2番目の元素はなんですか?"

このようにプロンプトを引数で渡すと、回答だけを受け取ってすぐコマンドラインに戻れます。短い確認や、スクリプトから呼び出す用途ではこちらが便利でした。

入っているモデルを確認する

ダウンロードしたモデルの一覧は、次のコマンドで確認できます。

ollama list

モデル名・ID・サイズ・更新日時が並ぶので、複数のモデルを入れているときの整理に役立ちます。小型版は数GB程度なので、ストレージへの負担も限定的です。容量が気になってきたら、使わないモデルを削除しながら回すとよいでしょう。

サイズ選びと、つまずきやすい点

小型版で物足りなくなったら、上位サイズへ切り替える前に、自分の用途が「速さ重視か、賢さ重視か」を一度はっきりさせると選びやすくなります。短い下書きや確認の往復が中心なら、応答が速い小型版のままで十分なことが多いです。一方で、長めの文章をまとめさせたり、込み入った指示を一度で通したい場合は、上位サイズに上げると安定します。サイズを上げるほどメモリと待ち時間が増えるので、手元のPCと相談しながら一段ずつ試すのがお勧めです。

つまずきやすいのは、初回のダウンロードに時間がかかって「固まった」と勘違いしてしまう点です。モデルの取得は回線次第で数分かかることがあり、進捗バーが伸びている間は正常に動いています。途中で打ち切らず、success の表示まで待つのが確実です。もう一つ、複数のモデルを入れすぎてストレージを圧迫しがちなので、ollama list でときどき棚卸しして、使わないものを整理しながら回すと快適に保てます。

どう使い分けるか

手元の Gemma 4 は、思いつきの下書きや短い確認、外に出したくないメモの相談といった軽い用途に向いています。一方で、込み入った設計の相談や最新情報を踏まえた長文の生成は、クラウドのGemini APIに任せた方が結果が安定します。

私の場合は、まず手元で雑に投げてみて、物足りなければクラウドに上げ直す、という流れに落ち着きました。この二段構えは、個人開発でAPIコストを抑えつつ作業の手数を増やすうえで、地味に効いています。具体的には、アプリのストア説明文の言い回しを何パターンか手元で出してから、最終的な仕上げだけクラウドに上げる、といった使い方をしています。下書きの試行回数を増やしても費用が膨らまないので、気兼ねなく案を量産できるのが手元モデルの良いところです。後編では、ローカルのGemma 4を実際の作業にどう組み込むか、応答速度の体感を上げる工夫や、簡単なパイプラインへの組み込みまでを掘り下げます。まずは手持ちのPCでコマンドを3行打って、手元にモデルが立ち上がる感覚を味わってみてください。

シェア

お読みいただきありがとうございます

Gemini Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

もしこの記事がお役に立ちましたら、チップ(¥150)で応援いただけると大変励みになります。広告なしでの運営を続けるため、皆さまのご支援が大きな力になっています。

関連記事

開発ツール2026-06-24
ローカルGemma 4を日々の作業に組み込む — Ollama APIと応答速度の実践メモ
対話で動かせるようになったローカルGemma 4を、実際の作業に組み込むところまで。OllamaのローカルAPIをスクリプトから叩く方法、応答速度を体感で上げる工夫、クラウドのGemini APIへ自動でフォールバックする二段構えの実装まで、コード込みで解説します。
開発ツール2026-05-06
Android StudioのローカルLLM機能でGemma 4を動かす — Ollamaとの連携設定から実際の開発体験まで
Android StudioのローカルLLM機能とOllamaを使ってGemma 4を開発環境に組み込む方法を解説。MacOS環境での設定手順、26Bモデルの実用性、実際の開発体験を詳しく紹介します。
開発ツール2026-05-04
Gemma 4 26B A4B × OpenCode で『無料Claude Code』環境を作る — Mac/Linux 実機セットアップ
Apache 2.0で公開された Gemma 4 26B A4B と OpenCode を組み合わせて、ローカルで動く無料コーディング環境を構築する手順をまとめます。Ollama / LM Studio / vLLM の選び分けと、実用的なエージェント設定例も解説します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →