GEMINI LABEN
DEPRECATION — 画像プレビューモデル2種が本日6/25に停止。利用中の自動化・スクリプトは本日中の移行が必須ですGA — 入れ替わりでgemini-3.1-flash-imageとgemini-3-pro-imageがネイティブ画像モデルの正式版になりましたMEDIA — 動画→画像生成に対応。動画を文脈として渡し高品質なサムネイル等を生成できます(3.1 flash image限定)AUDIO — Gemini 3.1 Flash TTSプレビューが追加。低コストで表情豊か、制御しやすい音声合成ですMODEL — Gemini 3.5 Flashは一般提供済み。3.1 Proをほぼ全ベンチで上回りつつ4倍高速に動作しますSEARCH — File Searchはマルチモーダル検索に対応。gemini-embedding-2で画像をネイティブに埋め込み・検索できますDEPRECATION — 画像プレビューモデル2種が本日6/25に停止。利用中の自動化・スクリプトは本日中の移行が必須ですGA — 入れ替わりでgemini-3.1-flash-imageとgemini-3-pro-imageがネイティブ画像モデルの正式版になりましたMEDIA — 動画→画像生成に対応。動画を文脈として渡し高品質なサムネイル等を生成できます(3.1 flash image限定)AUDIO — Gemini 3.1 Flash TTSプレビューが追加。低コストで表情豊か、制御しやすい音声合成ですMODEL — Gemini 3.5 Flashは一般提供済み。3.1 Proをほぼ全ベンチで上回りつつ4倍高速に動作しますSEARCH — File Searchはマルチモーダル検索に対応。gemini-embedding-2で画像をネイティブに埋め込み・検索できます
TAG

音声化

1 記事
タグ一覧に戻る
関連タグ:
gemini-3.1-flash-tts1text-to-speech1stand.fm1python1コスト最適化1
Gemini API/2026-06-25中級

Gemini 3.1 Flash TTS プレビューで記事を音声化する — 長文を割って繋ぐナレーション生成とコストの実際

本日プレビュー提供が始まった Gemini 3.1 Flash TTS で、書いた記事を一人語りの音声に変換するパイプラインを組みます。長文の分割と無音の継ぎ目、声を揺らさないプロンプト制御、1記事あたりの実コスト計算まで、個人開発の現場目線でまとめます。