Gemini の動画生成モデル Veo 2 とリアルタイムインタラクションを実現する Live API リリース
Google は、Veo 2 と Live API のリリースを発表。これらのツールは、開発者がよりインタラクティブでリアルタイムなアプリケーションを構築するのを支援する。
-
Veo 2:テキストや画像から高品質なビデオを生成する能力を持ち、リアルな動きとカメラ制御を実現。テキストからビデオを生成する Text-to-Video(t2v)や、画像からビデオを生成する Image-to-Video (i2v)機能を提供。720p の解像度で最大 8 秒のビデオクリップを生成可能で、価格は 1 秒あたり$0.35。
-
Live API:Gemini モデルのためのリアルタイムインタラクションを可能にする API で、ストリーミングオーディオ、ビデオ、テキストを低遅延で処理。30 以上の新しい言語をサポートし、音声活動検出(VAD)の設定が可能。無限に近いセッションをサポートし、強力なツール統合を提供。
これらの機能は、Google AI Studio と Vertex AI で利用可能で、開発者がより高度な AI アプリケーションを構築するのを支援する。