Gemini API の料金がどのくらいかかるのか気になっていませんか。
2025年現在、Gemini APIはトークン数に応じた従量課金制を採用しており、無料枠も用意されていますよ。
本記事では、Gemini APIの料金体系や無料枠の条件、費用を抑えるためのポイントについて初心者向けに解説します。
料金の確認方法や支払い方も詳しく紹介するので、API導入を検討している方はぜひ参考にしてください。
Geminiの最新モデル「Gemini 3.0」に関しては下記の記事も確認してくださいね。

Gemini APIとは?料金が発生する仕組みを徹底解説
Gemini APIはGoogle Cloudが提供する最新AIモデルをAPI経由で利用できるサービスです。
テキスト生成や要約、コード補完など、様々なAI処理をプログラムから呼び出せるのが特徴。
料金はリクエストで扱うトークン数に応じた従量課金制となっており、使った分だけ費用が発生する仕組みです。
ユーザーが送信するプロンプト(入力トークン)と、モデルから返ってくる生成結果(出力トークン)の両方に対して、あらかじめ決められた単価が適用されますよ。
また、コンテキストのキャッシュ保存や検索連携による強化機能など、高度な機能を使った場合には追加で課金される場合もあります。
開発者向けに無料枠も用意されているため、小規模なプロジェクトや学習目的であれば費用をかけずに試すことが可能です。
Gemini APIの料金体系
Gemini APIの料金単価は100万トークンあたり○ドルという形で決められています。
小規模なリクエストの場合、消費するトークンは数百〜数千程度に収まるため、1回のAPI呼び出しにかかるコストはごくわずかですね。
たとえば高性能モデルであるGemini 2.5 Proの場合、入力トークン100万あたりの料金は1.25ドル。
仮に1000トークンのテキストを入出力しても約0.0013ドル(0.2円程度)にしかなりません。
ライトな使い方であれば費用はほとんど気にならない水準といえます。
ただし、リクエスト回数が多い場合や長大な文章をやり取りする場合にはトークン消費が積み重なり、それに比例して費用も増加する点に注意が必要です。
また、非常に長いコンテキスト(一般に20万トークン超の入力)を扱う場合には、超過分のトークンに対して通常の約2倍の単価が適用されます。
Gemini APIの無料枠はどこまで使える?

Gemini APIには無料利用枠(フリーティア)が用意されており、小規模なプロジェクトや学習目的であれば課金なしでサービスを試せます。
無料枠を利用するには、プロジェクトにCloud Billing(支払い用アカウント)をリンクしないことが条件です。
ここでは、無料枠でできることや使用感について詳しく解説しますね。
無料枠で使えるリクエスト回数の目安
無料枠には利用上限(レート制限)が設定されており、各モデルごとに分単位・日単位で発行可能なリクエスト数が定められています。
2025年12月現在、Googleは無料枠の条件を大幅に見直しており、以前より制限が厳しくなっていますよ。
たとえばGemini 2.5 Proモデルは無料での提供が停止され、Gemini 2.5 Flashモデルの1日あたり利用回数は約20回程度まで引き下げられています。
一方で、最も軽量なGemini 2.5 Flash-Liteモデルについては、無料枠でも1日数百〜約1000リクエスト程度の利用が可能で比較的余裕があります。
このように現在の無料枠は低負荷なモデルでの試用向けと位置付けられており、本格的にAPIを活用するには有料プランへの移行が必要になってきています。
1リクエストあたりに扱えるトークン量の目安
無料枠ではリクエスト当たりの入出力トークンに料金は発生しませんが、1回のリクエストで扱えるトークン量には上限があります。
Gemini 2.5 Flashモデルの場合、最大約100万トークンの長大なコンテキストも扱える仕様です。
ただし、無料枠ではモデルによって制限が異なるため、公式ドキュメントで最新の上限値を確認することをおすすめします。
一般的な文章生成やチャット応答であれば、数千トークン程度で十分なケースがほとんど。
長文の要約や大量のデータ処理を行う場合は、トークン消費量に注意しながら使うと良いでしょう。
テキスト生成・要約を中心に使った場合の使用感
無料枠ではテキスト生成や要約、コード補完といった基本的なモデル機能を追加料金なしで利用できます。
ブログ記事の下書きや、メール文の作成補助など、ライトな用途であれば無料枠内で十分対応可能ですよ。
ただし、無料枠でアクセスできるモデルは一部に限定されている点に注意が必要です。
たとえば2025年12月現在、最新のGemini 3 Proモデルやその画像生成版は無料枠の対象外となっており、主にGemini 2.5世代までのモデルを使用できます。
また、無料枠で扱われるデータ(プロンプトや出力内容)はモデル精度向上のためGoogleによって活用される点も覚えておきましょう。
チャットボット試作・検証用途での使い方
チャットボットの試作や検証用途では、無料枠を活用して初期費用ゼロでGemini APIを体験できます。
プロトタイプの作成や動作確認など、本番環境に移行する前のテスト段階では無料枠で十分なケースが多いです。
ただし、1日あたりのリクエスト回数に上限があるため、複数人でのテストや負荷試験には向いていません。
検証が終わって本番運用を始める際には、有料プランへの移行を検討しましょう。
無料枠で試行錯誤しながら仕様を固め、本格運用時に課金を開始するという流れがおすすめです。
Gemini APIの無料枠を超えたらどうなる?

無料枠の上限を超えた場合、課金設定の有無によって挙動が変わります。
課金を有効にしていない場合はエラーが返り、有効にしている場合は超過分から従量課金が開始されますよ。
ここでは、無料枠を超えた際の具体的な挙動について詳しく解説します。
無料枠の上限を超えるとリクエストが自動的に制限される
無料枠には分単位・日単位でリクエスト数やトークン量の上限が設定されています。
この上限に達すると、一定以上の利用があったことを示すエラー(HTTP 429など)が返されます。
エラーが発生した場合は、制限がリセットされるまで待つか、有料プランに移行する必要がありますよ。
分単位の制限は短時間で解除されますが、日単位の制限は翌日まで待つ必要があります。
継続的にAPIを活用したい場合は、早めに課金プランへの移行を検討しましょう。
課金設定をしていない場合はエラーが返ってAPIが停止する
Cloud Billingをプロジェクトにリンクしていない場合、無料枠の上限を超えるとAPIは停止します。
リクエストを送信してもエラーレスポンスが返され、処理は実行されません。
この仕様は、知らないうちに課金が発生するのを防ぐための安全装置として機能していますね。
無料枠だけで使い続けたい場合は、Cloud Billingをリンクせずに上限内で利用してください。
リクエスト数を抑えながら計画的に利用することで、無料枠内での運用も十分可能です。
課金を有効化すると超過分から従量課金が開始される
プロジェクトにCloud Billingアカウントをリンクしている場合、無料枠超過分は定められた単価に基づき自動的に従量課金されます。
課金アカウント有効化後のGemini API利用分はすべて設定された単価に従って請求される点に注意が必要です。
想定外の高額請求を避けるために、予算アラート機能を活用してコストの見える化を行いましょう。
また、最大出力トークン数などを指定して1回あたりの応答で消費するトークン量に制限を設けるのも有効です。
これらの対策により、異常なトークン消費に早期に気付き、必要に応じて利用を抑制できますよ。
無料枠を超えた瞬間からモデル別の料金がトークン単位で発生する
課金が有効な状態で無料枠を超えると、その瞬間から使用したモデルの料金単価に基づいてトークン単位で課金が始まります。
料金はモデルによって異なり、高性能なモデルほど単価が高く設定されています。
たとえばGemini 2.5 Flash-Liteなら入力0.10ドル/100万トークンと低価格ですが、Gemini 3 Pro Previewは入力2.00ドル/100万トークンと約20倍の差があります。
用途に応じて適切なモデルを選ぶことで、コストを抑えながらAPIを活用できますね。
軽量なタスクには低価格モデル、複雑な処理には高性能モデルと使い分けるのがおすすめです。
Gemini APIの課金方法と料金の計算方法

Gemini APIの課金はトークンベースで計算され、Google Cloudの一サービスとして請求処理が行われます。
請求は通常、他のクラウド利用料と合算され月次サイクルで発生しますよ。
ここでは、課金の仕組みと料金の計算方法について詳しく解説します。
Gemini APIの課金はトークンベースで計算される
Gemini APIの利用料金は、入力および出力のトークン数に基づいて計算されます。
ユーザーが送信するプロンプトや指示のテキストに含まれる入力トークンと、モデルから返ってくる生成結果に含まれる出力トークンのそれぞれに単価が適用されますよ。
料金単価は「100万トークンあたり○ドル」という形で設定されているため、小規模な利用であれば費用はごくわずかです。
Gemini APIでは補助関数としてcountTokensを呼び出すことで、実際にAPI呼び出しをする前にテキストのトークン量を計測できます。
この機能を活用して、想定外に巨大な入力によって膨大なトークン料金が発生しないようチェックしましょう。
実際の使用量はどのタイミングで計測・反映されるのか
使用量はAPIリクエストが実行された時点でリアルタイムに計測されます。
入力トークン数と出力トークン数が記録され、それぞれの単価に基づいて料金が算出されますね。
計測された使用量はCloud ConsoleやGoogle AI Studioのダッシュボードで確認できます。
ただし、請求金額への反映には若干のタイムラグがある場合があります。
リアルタイムで正確な利用状況を把握したい場合は、API Studioのモニタリング機能を活用すると良いでしょう。
月額料金はいつ確定し、どのタイミングで請求されるのか
Gemini APIの請求はGoogle Cloudの課金サイクルに従い、通常は月次で行われます。
月末に当月分の利用料金が確定し、翌月初めに請求書が発行される流れです。
支払い情報や利用料金の明細はCloud Billingのコンソール上で確認できますよ。
他のGCPサービスと同様に予算管理ツールやレポート機能を利用できるため、費用の可視化が容易です。
請求書払いやクレジットカード払いなど、複数の支払い方法に対応しています。
使用量と料金を管理画面で確認する方法
使用量と料金はCloud Consoleの「費用管理」セクションやGoogle AI Studio上のダッシュボードから確認できます。
Gemini APIのリクエスト回数やトークン消費量を定期的にチェックすることで、コストを把握しやすくなりますね。
有料プラン利用時は、どの程度のコストが発生しているかをリアルタイムに監視することが大切です。
モデル別の利用状況や日別の推移なども確認できるため、コスト分析にも役立ちます。
定期的なモニタリングを習慣にして、予算オーバーを防ぎましょう。
Gemini APIの料金上限設定と使用量の確認方法

費用のオーバーランを防ぐために、Google Cloudの予算機能を使って料金上限を設定することをおすすめします。
閾値に達した際にメール通知で知らせてくれるため、使いすぎによる予期せぬ高額請求を未然に防止できますよ。
ここでは、具体的な設定手順を順を追って解説します。
ステップ① Google Cloudプロジェクトを作成・選択する

まずはGoogle Cloud Consoleにアクセスし、Gemini APIを利用するプロジェクトを作成または選択します。
既存のプロジェクトがある場合は、画面上部のプロジェクト選択メニューから該当プロジェクトを選びましょう。
新規作成する場合は「新しいプロジェクト」をクリックし、プロジェクト名を入力して作成します。
プロジェクトは料金管理の単位となるため、用途別に分けておくと費用の把握がしやすくなりますね。
本番環境と開発環境でプロジェクトを分けるのも良い方法です。
ステップ② 請求先アカウント(Billing)をプロジェクトに紐づける

料金上限を設定するには、まずプロジェクトにCloud Billingアカウントをリンクする必要があります。
Cloud Consoleの左メニューから「課金」を選択し、請求先アカウントを作成または選択しましょう。
クレジットカード情報などの支払い方法を登録すると、課金が有効になります。
課金アカウントをリンクしないと予算機能が使えないため、料金管理したい場合は必須の設定ですよ。
ただし、リンクすると無料枠超過時に自動課金される点に注意してください。
ステップ③ 予算(Budget)機能から月額の料金上限を設定する

Cloud Billingの画面から「予算とアラート」を選択し、「予算を作成」をクリックします。
予算名を入力し、対象となるプロジェクトやサービスを指定しましょう。
Gemini APIのみを対象にしたい場合は、サービスフィルターで絞り込むことができます。
予算金額を入力し、月額の上限目安を設定すれば基本的な設定は完了です。
予算は日本円でも設定できるため、為替を気にせず管理できますね。
ステップ④ 料金上限に近づいた際のアラート条件を設定する

予算に対して何%に達したらアラートを送信するか、閾値を設定します。
デフォルトでは50%、90%、100%の3段階が設定されていますが、自由にカスタマイズ可能です。
たとえば30%、60%、80%、100%と細かく設定しておけば、早い段階で利用状況に気付けますよ。
アラートは予算超過を防ぐための早期警告として機能します。
余裕を持った閾値設定で、急な費用増加にも対応できるようにしておきましょう。
ステップ⑤ 通知先(メール)を指定して設定内容を保存する

アラートの通知先としてメールアドレスを指定します。
プロジェクトオーナーや請求管理者に自動で通知されるほか、追加のメールアドレスも登録できます。
チームで管理している場合は、複数人にアラートが届くよう設定しておくと安心ですね。
設定内容を確認したら「保存」をクリックして完了です。
保存後すぐに予算監視が開始され、閾値に達するとメールで通知されます。
ステップ⑥ 設定後に予算が正しく反映されているかを確認する

予算を保存したら、「予算とアラート」一覧画面で設定内容が正しく反映されているか確認しましょう。
予算名、金額、対象プロジェクト、アラート閾値が意図通りになっているかチェックします。
現在の利用額と予算に対する進捗も確認できるため、定期的にモニタリングすると良いですね。
設定に問題があれば編集ボタンから修正できます。
初期設定が完了したら、運用しながら適切な予算額に調整していきましょう。
料金上限を設定しても自動停止はされない点に注意

予算アラートは通知のみで、APIの自動停止機能は含まれていません。
予算を100%超えてもAPIは引き続き利用でき、課金も継続される点に注意が必要です。
必要に応じて、通知をトリガーにCloud Billingを一時停止する仕組みを導入することも可能です。
たとえばCloud FunctionsやPub/Subを組み合わせて、閾値超過時に自動でAPIを無効化する処理を実装できます。
厳格な予算管理が必要な場合は、こうした追加対策も検討しましょう。
Gemini APIのモデル別料金比較
Gemini APIで利用できる各モデルは、その性能や用途に応じて異なる料金単価が設定されています。
主なモデルの料金を比較すると、以下のようになります。
| モデル名 | 入力料金 (100万トークンあたり) | 出力料金 (100万トークンあたり) | 備考 |
|---|---|---|---|
| Gemini 2.5 Flash-Lite | 0.10ドル | 0.40ドル | 【コスト重視】 最も安価で高速。大量のデータ処理や高頻度なリクエストに最適。 |
| Gemini 2.5 Flash | 0.30ドル | 2.50ドル | 【バランス型】 標準的な性能と価格。長文(約100万トークン)も扱え、一般的な対話や要約向き。 |
| Gemini 2.5 Pro | 1.25ドル | 10.00ドル | 【性能重視】 複雑な推論やコード生成に強い。高精度な結果が必要な業務に。 |
| Gemini 3 Pro | 2.00ドル | 12.00ドル | 【最新・最高峰】 2025年末登場の最新モデル。※無料枠なし(有料のみ) 最先端のAI性能を試したい場合に。 |
Gemini 2.5 Flash-Liteは最もコスト効率に優れた軽量モデルで、入力トークンは0.10ドル/100万、出力トークンは0.40ドル/100万と低価格に設定されています。
高速応答・高頻度リクエスト向けで、大量の呼び出しに適しています。
Gemini 2.5 Flashは標準的な性能を持つモデルで、入力トークン単価は0.30ドル/100万、出力トークン単価は2.50ドル/100万。
最大約100万トークンの長大なコンテキストも扱えるバランス型で、一般的な対話や文章生成に幅広く使えます。
Gemini 2.5 Proは高度なコード生成や複雑な推論に強い上位モデルで、入力トークン1.25ドル/100万、出力トークン10.00ドル/100万と単価は高め。
その分リッチな応答や高精度な結果が得られます。
Gemini 3 Pro Previewは2025年末に追加された最新世代モデルで、無料枠では利用できず有料プランでのみ提供されています。
料金単価は入力2.00ドル/100万、出力12.00ドル/100万と現行モデル中で最も高額ですね。
用途や予算に応じて適切なモデルを選び、コストパフォーマンスを意識した運用を心がけましょう。
Gemini APIの料金に関するよくある質問
Gemini APIの料金について、よく寄せられる質問をまとめました。
導入前の疑問や不安を解消する参考にしてください。
- Gemini APIは商用利用しても問題ありませんか?
-
はい、商用利用可能です。有料プランであれば商用アプリケーションへの組み込みも問題なく行えます。ただし、利用規約を確認し、禁止されている用途に該当しないか事前にチェックしておきましょう。
- Gemini APIの料金は突然変更されることはありますか?
-
はい、料金は変更される場合があります。実際に2025年末には無料枠の条件が大幅に見直されています。定期的に公式ドキュメントを確認し、最新の料金情報を把握しておくことをおすすめします。
- 想定より高額請求になるケースはありますか?
-
あります。長文のプロンプトや大量のリクエスト、高性能モデルの多用などでトークン消費が想定以上に増えるケースがあります。予算アラートの設定や最大出力トークン数の制限で対策しましょう。
- Vertex AI経由とGemini APIでは料金は違いますか?
-
料金体系は異なる場合があります。Vertex AIはエンタープライズ向けの機能が充実しており、追加のサポートや管理機能が含まれます。詳細な料金比較は公式ドキュメントで最新情報を確認してください。
Gemini APIのまとめ
Gemini APIの料金はトークン従量課金制で、使った分だけ費用が発生する仕組みです。
小規模な利用であれば無料枠内で費用をかけずに十分試せますが、2025年末時点では無料枠の条件が厳格化されており、継続的な活用には有料プランへの移行がほぼ必須となっています。
料金単価はモデルによって異なり、軽量なGemini 2.5 Flash-Liteから高性能なGemini 3 Pro Previewまで、用途に応じた使い分けが大切ですね。
費用管理にはGoogle Cloudの予算アラート機能が有効で、閾値に達した際にメール通知を受け取れます。
ただし、予算アラートは通知のみで自動停止機能はないため、必要に応じて追加の対策を検討しましょう。
ビジネス用途で本格的にGemini APIを組み込む場合は、早めに課金プランへ切り替えて予算管理を徹底することが重要です。
料金体系と無料枠の仕組みを正しく理解し適切に管理することで、Gemini APIを安心して活用できるでしょう。



