Google が「 Gemini 2.5 Flash-Lite 」を正式にリリース

投稿者:

Google は 2025 年 7 月 22 日、新たな AI モデル「 Gemini 2.5 Flash-Lite 」の安定版を正式にリリースしました。このモデルは、同社が展開する Gemini 2.5 シリーズの中で「最速かつ最もコスト効率が高い」モデルとして位置づけられており、企業や開発者にとって新たな選択肢を提供します。

最大の特徴は、その圧倒的なコストパフォーマンスです。 100 万インプットトークンあたりわずか 0.10 ドル(約 15 円)、アウトプットあたり 0.40 ドル(約 59 円)という非常に安価な価格設定を実現しています。この価格は Gemini 2.5 シリーズの中で最も安価であり、大規模なリクエストを低コストで処理することが可能になります。

性能面では、「 Intelligence per dollar(費用対知能)」の最高水準を目指して設計されており、パフォーマンスとコストのバランスを重視しています。 1 秒あたり 400 トークンの処理能力を誇り、 Gemini 2.0 Flash-Lite や 2.0 Flash よりも短い応答時間を実現。特に翻訳や分類のようなレイテンシ(遅延)重視のタスクで、品質を損なわずに高速応答を提供します。

機能面では、 100 万(1M)トークンのコンテキストウィンドウをサポートし、テキスト、画像、ビデオ、オーディオといったマルチモーダル入力に対応しています。また、必要に応じて「推論能力( reasoning )」をオンにできるため、コーディング、数学、科学、推論といったより高度なユースケースにも柔軟に対応できます。 Google Search やコード実行などのツール統合もサポートしており、幅広い応用が可能です。

実際の活用事例も既に報告されています。衛星データ処理を手がける Satlyt では、 Gemini 2.5 Flash-Lite を使用することで重要なオンボード診断のレイテンシーを 45 %削減し、消費電力を 30 %低減することに成功しました。また、 HeyGen ではビデオコンテンツの自動計画、分析、最適化、 180 以上の言語への翻訳に活用し、グローバルなパーソナライズド体験を提供しています。

Gemini 2.5 Flash-Lite は、 2025 年 6 月 17 日にプレビュー版として初公開され、 2.5 Pro や 2.5 Flash とともに Gemini 2.5 シリーズの展開を補完する形でリリースされました。