GEMINI LABEN
SIRI — WWDC 2026で刷新版SiriがGoogle Geminiモデルで動くと確定。ただしEUではDMAによりiOS 27時点で提供されませんFLASH3.5 — Gemini 3.5 FlashがGA。エージェント・コーディングで持続的なフロンティア性能を発揮する最上位FlashモデルですIMAGE-GA — Gemini 3.1 Flash Image / 3.1 Pro Imageがネイティブ視覚モデルとしてGA。preview版は6/25に終了予定MANAGED-AGENTS — Gemini APIでManaged Agentsが公開プレビュー。Googleホストの隔離Linuxサンドボックスで自律エージェントを構築できますFILE-SEARCH — File Searchがマルチモーダル対応。gemini-embedding-2で画像のネイティブ埋め込み・検索が可能になりましたDEPRECATION — gemini-3.1-flash-image-preview / gemini-3-pro-image-previewは6/25に停止。GA版への移行をお早めにSIRI — WWDC 2026で刷新版SiriがGoogle Geminiモデルで動くと確定。ただしEUではDMAによりiOS 27時点で提供されませんFLASH3.5 — Gemini 3.5 FlashがGA。エージェント・コーディングで持続的なフロンティア性能を発揮する最上位FlashモデルですIMAGE-GA — Gemini 3.1 Flash Image / 3.1 Pro Imageがネイティブ視覚モデルとしてGA。preview版は6/25に終了予定MANAGED-AGENTS — Gemini APIでManaged Agentsが公開プレビュー。Googleホストの隔離Linuxサンドボックスで自律エージェントを構築できますFILE-SEARCH — File Searchがマルチモーダル対応。gemini-embedding-2で画像のネイティブ埋め込み・検索が可能になりましたDEPRECATION — gemini-3.1-flash-image-preview / gemini-3-pro-image-previewは6/25に停止。GA版への移行をお早めに
記事一覧/開発ツール
開発ツール/2026-05-06中級

Android StudioのローカルLLM機能でGemma 4を動かす — Ollamaとの連携設定から実際の開発体験まで

Android StudioのローカルLLM機能とOllamaを使ってGemma 4を開発環境に組み込む方法を解説。MacOS環境での設定手順、26Bモデルの実用性、実際の開発体験を詳しく紹介します。

Android Studio2Gemma 416Ollama9ローカルLLM11Android開発2オフラインAIGemini Code Assist7

「クラウドのAI APIを使いたいけど、コードが社外に出るのが気になる」という状況は、特に業務アプリの開発で珍しくありません。私もその悩みを抱えていたのですが、Android StudioがローカルLLM機能を搭載してから、状況が変わりました。

OllamaでGemma 4を手元で動かし、それをAndroid Studioに繋げると、コードは自分のマシンの外に出ることなく、AIアシスタントの補完や提案が使えます。ここではMacOS環境でのセットアップ手順と、実際に使ってみてわかったことをお伝えします。

必要なもの

  • MacOS(Apple Silicon推奨。MシリーズはGPU加速のメリットが大きい)
  • Android Studio Narwhal以降
  • Ollama(ollama.com からダウンロード)
  • 空きRAM:Gemma 26Bを動かす場合は少なくとも32GB推奨

Intel MacやWindowsでも動作しますが、Gemma 26Bはモデルサイズが大きいため、スペックに余裕があるほど快適です。より軽量な gemma4:9bgemma4:4b でも試せます。

Step 1: OllamaでGemma 4を起動する

まず、OllamaをインストールしてGemma 4モデルをダウンロードします。

# Gemma 4 26Bモデルのダウンロード(約17GB)
ollama pull gemma4:26b
 
# ダウンロード後、サーバーを起動
ollama serve
 
# 別ターミナルで動作確認
ollama run gemma4:26b "Hello, how are you?"

ollama serve を実行すると、デフォルトで http://localhost:11434 でAPIが提供されます。Android Studioはこのエンドポイントにアクセスしてモデルを呼び出します。

軽量モデルで試したい場合:

# 軽量版(4Bパラメータ、約3GB)
ollama pull gemma4:4b
 
# または中間サイズ(9Bパラメータ、約6GB)
ollama pull gemma4:9b

Step 2: Android StudioのローカルLLM設定

Android Studioを開き、設定を行います。

設定の場所: Preferences(またはSettings)> Tools > Gemini Code Assist > AI Provider

ここで「Local LLM」を選択し、エンドポイントURLを入力します:

http://localhost:11434

モデル名フィールドに gemma4:26b(またはダウンロードしたモデル名)を入力します。

接続テストボタンがあれば押してみましょう。Ollamaが起動していれば、接続成功のメッセージが出るはずです。

設定が完了すると、コードエディタ上でAIアシストが有効になります。通常のGemini APIの代わりに、ローカルのGemma 4が使われます。

実際にどのような場面で役立つか

設定後、いくつかのAndroidプロジェクトで試してみた感触をお伝えします。

良かった点

コードの補完品質は、26Bモデルを使う限り実用的なレベルです。Kotlinの基本的な構文や、AndroidのViewModelやRepositoryパターンはきちんと認識されます。

// こういった定型パターンはスムーズに補完される
class UserRepository @Inject constructor(
    private val userDao: UserDao,
    private val apiService: ApiService
) {
    // AIがコンテキストを理解してメソッドを提案してくれる
    suspend fun getUser(id: String): Result<User> {
        return try {
            val localUser = userDao.findById(id)
            if (localUser != null) {
                Result.success(localUser)
            } else {
                val remoteUser = apiService.fetchUser(id)
                userDao.insert(remoteUser)
                Result.success(remoteUser)
            }
        } catch (e: Exception) {
            Result.failure(e)
        }
    }
}

制約と感じた点

レスポンス速度はクラウドAPIより遅めです。Gemma 26BをM3 Max(96GB RAM)で動かした場合、補完のレスポンスに2〜4秒かかることがあります。軽量モデル(4B、9B)は速いですが、複雑なコードの理解度は下がります。

Jetpack Compose関連の補完は、クラウドのGeminiに比べると精度が落ちる印象がありました。新しいAPIへの追従はクラウドモデルの方が早いのは当然ですね。

OllamaをAndroid Studioと並行して常時起動する

毎回手動でOllamaを起動するのは面倒なので、Mac起動時に自動起動する設定をしておくと便利です。

# LaunchAgentとして登録(MacOS)
mkdir -p ~/Library/LaunchAgents
cat > ~/Library/LaunchAgents/com.ollama.serve.plist << 'EOF'
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN"
  "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
<plist version="1.0">
<dict>
    <key>Label</key>
    <string>com.ollama.serve</string>
    <key>ProgramArguments</key>
    <array>
        <string>/usr/local/bin/ollama</string>
        <string>serve</string>
    </array>
    <key>RunAtLoad</key>
    <true/>
    <key>KeepAlive</key>
    <true/>
</dict>
</plist>
EOF
 
launchctl load ~/Library/LaunchAgents/com.ollama.serve.plist

これで、Mac起動時に自動的にOllamaが立ち上がり、Android Studioのローカル補完がすぐ使える状態になります。

機密コードを扱うプロジェクトへの導入を検討している方へ

ローカルLLMの最大のメリットは「コードがマシンから出ない」という点です。金融系・医療系・社内システムなど、コードの社外流出が許されないプロジェクトでも、AIアシストを導入できる可能性があります。

ただし、モデルの精度やレスポンス速度はクラウドAPIには及びません。「補完の品質を多少妥協してでもプライバシーを確保したい」場面に適した選択です。

より高度な活用(複数のモデルを用途別に切り替える、Gemma 4をファインチューニングしてプロジェクト特化モデルを作る)については、プレミアム記事で詳しく解説しています。

シェア

お読みいただきありがとうございます

Gemini Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

もしこの記事がお役に立ちましたら、チップ(¥150)で応援いただけると大変励みになります。広告なしでの運営を続けるため、皆さまのご支援が大きな力になっています。

関連記事

高度な活用2026-05-06
Gemma 4 + Ollama + Android Studio — 本番プロジェクトで使えるローカルAI開発環境の構築ガイド
Android Studio×Gemma 4×Ollamaを本番品質で運用するための詳細ガイド。モデル選択戦略・タスク別スイッチング・ファインチューニング・チーム展開・CI/CD統合まで、実装コード付きで解説します。
開発ツール2026-05-04
Gemma 4 26B A4B × OpenCode で『無料Claude Code』環境を作る — Mac/Linux 実機セットアップ
Apache 2.0で公開された Gemma 4 26B A4B と OpenCode を組み合わせて、ローカルで動く無料コーディング環境を構築する手順をまとめます。Ollama / LM Studio / vLLM の選び分けと、実用的なエージェント設定例も解説します。
開発ツール2026-04-23
Ollamaで『pull model manifest: file does not exist』が繰り返し出る時の診断フロー
Ollamaで `Error: pull model manifest: file does not exist` が何度も出て、モデルが取得できない——。タグ名の間違い、プロキシ、ストレージ、プライベートレジストリ設定まで、原因を1つずつ切り分ける診断フローをまとめました。Gemma 4だけでなく、他モデルにも応用できます。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →