All Posts
News bits
Opal、「agent」ステップ機能を追加
静的なワークフローを対話型のエクスペリエンスに変換する「agent」ステップを追加。外部ツールやモデルを自律的に連携可能に。
Google Antigravity 1.15.6がTerminal Sandboxingをサポート
Google Antigravity 1.15.6にて、MacOSユーザー向けにTerminal Sandboxing機能が追加された。これにより、エージェントが実行するターミナルコマンドをサンドボックス内で実行し、ワークスペース外のファイルへの意図しない変更や損害を防ぐことが可能になった。 ### 参考文献
Google検索のAIモードがGmailやGoogle Photosと連携するPersonal Intelligenceを追加
Google AI ProおよびAI Ultraのサブスクライバー向けに、Google検索のAIモードがGmailやGoogle Photosと連携する「Personal Intelligence」機能の提供が開始された(Labs実験機能として)。
TranslateGemma: GoogleがGemma 3ベースの翻訳モデル群を公開
GoogleがGemma 3ベースのオープンな翻訳モデル「TranslateGemma」を公開した。55言語に対応し、4B、12B、27Bの3つのサイズで提供される。
Google Antigravity 1.14.2がAgent Skillsをサポート
Google Antigravity 1.14.2がリリースされ、Agent Skillsが導入された。これはエージェントの機能を拡張するためのオープンスタンダードな仕組みで、特定のタスクに関する指示やベストプラクティス、スクリプトを「スキル」としてパッケージ化できる。
AppleとGoogleが次世代Apple Foundation Modelsで提携
AppleとGoogleは、次世代のApple Foundation ModelsをGoogleのGeminiモデルとクラウド技術に基づいて構築する複数年の提携契約を締結した。
Gemini APIがファイルサイズ制限緩和と入力サポート拡大を発表
GoogleはGemini APIのアップデートを発表し、データ入力方法の拡充とファイルサイズ制限の緩和を行った。これにより、開発者は既存のデータを移動させることなく、より簡単にAIアプリケーションに統合できるようになった。
GoogleがAgentic CommerceのためのUniversal Commerce Protocol (UCP)を発表
Googleは、Agentic Commerce(エージェント主体コマース)に向けた新しいオープン標準「Universal Commerce Protocol (UCP)」を発表した。UCPは、買い物客、小売業者、プラットフォーム間でのAIエージェントの相互運用性を実現する共通言語となる。
FunctionGemma のリリース
Gemma 3 270Mモデルのファンクションコール特化バージョン「FunctionGemma」とトレーニングレシピをリリース。エッジデバイスでの関数呼び出しを可能にする。
T5Gemma 2 のリリース
Gemma 3ベースの次世代エンコーダー-デコーダーモデル「T5Gemma 2」をリリース。マルチモーダルとロングコンテキスト対応の初のモデル。
Conductor: Introducing context-driven development for Gemini CLI
Googleは、Gemini CLI向けの新しい拡張機能「Conductor」のプレビュー版を公開した。 チャットログに依存せず、Markdownファイル(specs.md、plan.md)としてコンテキストや計画を管理することで、AIエージェントによる開発を制御可能にする「context-driven development」を提案している。 コードを書く前に仕様や計画を策定し、開発者がレビュー可能な状態にすることを重視している。
Google Translate、Geminiによる翻訳機能強化
Google翻訳に、Geminiを活用した新しい翻訳モデルと機能が追加された。 テキスト翻訳では、イディオムや現地の表現、スラングなどのニュアンスを含むフレーズで、より自然で正確な翻訳が可能になった。
Nano Banana 1 が Google 検索、NotebookLM に登場
Nano Banana 1(Gemini 2.5 Flash Imageモデル)がGoogle検索のGoogleレンズとAIモードで利用可能になった。日本でも順次提供開始。
Nano Banana Proを発表
Googleが画像生成・編集モデルNano Banana Pro(Gemini 3 Pro Image)を公開した。Gemini 3 Proを基盤とし、Gemini 3の推論能力と現実世界の知識を活用して画像生成と編集を実現する。
Search ConsoleにBranded queries filterが導入
Search ConsoleにBranded queries filterが導入された。
Gemini 3をリリース
GoogleがGemini 3をリリースした。Gemini 3 Proはreasoning、multimodality、codingのベンチマークで以前のモデルを上回る。WebDev Arenaリーダーボードで1487 Eloを記録。Terminal-Bench 2.0で54.2%、SWE-bench Verifiedで76.2%を記録し、2.5 Proを大きく上回る。
Gemini APIにFile Search Toolを追加
GoogleがGemini APIにFile Search Toolを追加した。完全管理型のRAGシステムで、データグラウンディングを簡素化し、より正確な応答を実現する。
Magika 1.0をリリース
GoogleがAI駆動ファイルタイプ検出システムMagika 1.0をリリースした。初回の安定版で、200種類以上のファイルタイプに対応(以前の約100種類から倍増)。
Gemini APIのStructured Outputsを改善
GoogleがGemini APIのStructured Outputsを改善した。JSON Schemaサポートを拡張し、プロパティ順序の保持を追加。
Jules extension for Gemini CLI
Googleは、Gemini CLIのJules extensionを発表した。 Julesはターミナルでの作業中にバックグラウンドで自律的にタスクを実行する「サイドキック」エージェント。 Jules extensionをインストールし/jules コマンドを使用することで、非同期タスクの実行、バックグラウンドでのバグ修正、PR作成後のブランチ作成などを任せることができる。 ### 参考文献
Search ConsoleにQuery groupsが追加
Search Console InsightsにQuery groups機能が追加された。類似の検索クエリをAIでグループ化し、ユーザーの意図を把握しやすくする。
Grounding with Google Maps が Gemini API で利用可能に
Googleは、Gemini APIで「Google Maps」を使用したGrounding(情報の根拠付け)が利用可能になったことを発表。
Gemini CLI で新しいレベルのインタラクティブ機能が利用可能に
Googleは、Gemini CLIを拡張し、ターミナル内での複雑なインタラクティブコマンドのサポートを追加。
Gemini CLI Extensions の導入:CLIのカスタマイズが可能に
Googleは、Gemini CLIの拡張機能(Extensions)を導入。これにより、開発者はGemini CLIを自身のワークフローやツールに接続し、カスタマイズすることが可能になった。
Genkit Extension for Gemini CLI の発表
Googleは、Gemini CLI向けの新しい拡張機能「Genkit Extension」を発表。
ノーコードAIアプリビルダーOpalが日本でも利用可能に
Google Opalが15カ国に拡張。カナダ、インド、日本、韓国、ベトナム、インドネシア、ブラジル、シンガポール、コロンビア、エルサルバドル、コスタリカ、パナマ、ホンジュラス、アルゼンチン、パキスタンで利用可能。
Jules API の発表
Googleは、ソフトウェア開発ライフサイクル全体で自動化と統合を可能にする非同期コーディングエージェント「Jules」のAPIを発表。
Gemini 2.5 Flash Image GA
Gemini 2.5 Flash Imageが一般提供開始。10種類のアスペクト比と画像のみの出力に対応。
Jules Tools CLI
Googleの非同期コーディングエージェント「Jules」のコマンドラインインターフェース「Jules Tools」がリリース。ターミナルからJulesを直接操作可能。
GeminiにCustom Gemsの共有機能が追加
GeminiでCustom Gemsの共有が可能に。Google Driveと同様の共有制御で、閲覧・編集権限を個別設定が可能。 ### 参考文献
Gemini in Chrome提供開始
AIブラウジングアシスタントであるGemini in Chromeが提供開始。現在は米国のMac・Windowsユーザー(英語設定)のみ。
Agent Payments Protocol (AP2) 発表
GoogleがAgent Payments Protocol (AP2)を発表。プラットフォーム間でAIエージェント主導の決済を安全に開始・処理することを可能にするオープンプロトコル。Adyen、American Express、Coinbase、Mastercard、PayPal、Salesforceなど60以上の組織が強力。
NotebookLMがクイズやフラッシュカード生成に対応
GoogleがWorkspaceでNotebookLMの教育機能を拡張。フラッシュカード、クイズ、レポート生成機能を追加し、教育現場でのAI活用を促進するソリューションを提供する。
Gemini Batch APIが埋め込みとOpenAI互換性をサポート
GoogleがGemini Batch APIで埋め込みモデルとOpenAI互換性をサポートした。新しくリリースされたGemini Embeddingモデルに対応し、非同期処理で50%低い料金での高ボリューム処理が可能になった。
Genkit Go 1.0、Google製AIフレームワーク
GoogleがGo言語のAI開発フレームワーク「Genkit Go 1.0」を正式リリースした。
Google AIモード検索が日本語対応開始
Google検索の「AIモード」の日本語対応を開始。Gemini 2.5のカスタムバージョンを使用し、従来の2-3倍の長さの複雑な質問に回答する。
Google Veo 3が価格大幅値下げ、縦向き動画と1080p HD出力対応
GoogleがVeo 3とVeo 3 Fastの価格を大幅に値下げ。また縦向き動画(9:16アスペクト比)と1080p HD出力に対応し、モバイル・ソーシャル用途に最適化。
Cloudflare Workers AIでEmbeddingGemmaを提供開始
CloudflareがWorkers AIでEmbeddingGemmaの提供を開始。Googleとのローンチパートナーとして協力し、サイズに対して最高クラスの性能を提供する埋め込みモデルを利用可能にした。
GoogleがEmbeddingGemmaを公開、200MB未満のRAMで動作可能
GoogleがEmbeddingGemmaを公開した。308Mパラメータのコンパクトなオープン埋め込みモデルで、500M未満のモデル中最高性能を達成し、オンデバイスAIを実現する。
GoogleがGemini 2.5 Flash Imageを公開、高速画像生成に対応
GoogleがGemini 2.5 Flash Imageを公開。このモデルは発表以前からnano-bananaとして話題になっていた強力な一貫性の維持が可能な画像生成・編集モデル。Geminiアプリの他、APIでの利用も可能。
GoogleがStaxを公開、LLM評価を効率化するツール
GoogleがStaxを公開。LLM評価を効率化する実験的な開発者ツールで、"vibe testing"から脱却し、本格的な評価を可能にする。
NotebookLMのビデオ解説が日本語を含む80言語に対応
NotebookLMのビデオ解説機能が日本語を含む80言語で利用可能になった。また、音声解説機能が向上し英語と同様の品質を英語以外の言語でも得られるようになった。 ### 参考文献
Google検索のAI Mode、日本を含む180以上の国で一般公開
Google検索のAI Modeが日本を含む180以上の国と地域で一般公開された。AI Modeは、ユーザーの質問に対してAIが回答を生成し、関連情報を提供する機能。これにより、ユーザーはより迅速かつ効率的に情報を得ることができる。
Gemini APIのURLコンテキストツールが一般公開、PDFや画像のサポートを追加
Gemini APIのURLコンテキストツールが一般公開された。このツールにより、開発者はコンテンツを手動でアップロードする代わりに、URL形式でモデルに追加のコンテキストを提供できるようになる。
GoogleスライドとGoogle VidsにAI画像編集機能が追加、背景の置換や拡張が可能に
GoogleスライドとGoogle Vidsに、AIを活用した2つの画像編集機能が導入された。これにより、画像の背景置換と背景拡張が可能になる。この機能は、デザインスキルがないユーザーでも画像のニーズを満たし、プレゼンテーションの柔軟性と専門性を向上させることを目的としている。
Gemini CLI GitHub Actionsがベータ版としてリリース
リポジトリ向けのAIコーディングアシスタント「Gemini CLI GitHub Actions」がベータ版としてリリースされた。このツールは、GitHubリポジトリ上でコーディングの定型タスクを自動化するエージェント、およびオンデマンドでタスクを委任できるコラボレーターとして機能する。利用は無料。
GoogleのコーディングエージェントJulesが一般公開
Googleの非同期コーディングエージェントJulesが、ベータ版を終了し一般公開された。Gemini 2.5 Proを搭載し、コーディングプランを策定することで、より高品質なコード出力を実現する。
Gemini の月次アップデート Gemini Drops 開始、Veo 3 や Wear OS 対応を拡充
Google が Gemini Drops 月次アップデート企画を開始。Gemini アプリの新機能紹介とヒントを毎月提供する定期アップデート形式を導入。
Google 検索、Gemini 2.5 Pro・Deep Search・AI 通話機能を追加
Google が検索に Gemini 2.5 Pro、Deep Search、AI 通話機能を追加。より高度な AI 機能により検索体験を大幅に改善し、複雑な質問への回答とビジネス連絡の自動化を実現。
GitHub、Google ソーシャルログインが一般公開
GitHub で Google アカウントを使ったソーシャルログインが一般公開された。新規ユーザーは Google アカウントで GitHub アカウントを作成可能。既存ユーザーもソーシャルログインメールをアカウントに連携し、次回ログイン時に Google アカウントをパスワード代替として利用できる。
NotebookLM、専門家によるフィーチャードノートブック機能を開始
Google が NotebookLM にフィーチャードノートブック機能を追加。著名な著者、研究者、出版物、非営利団体と協力して専門的なノートブックコレクションを提供し、高品質な情報源へのアクセスを大幅に改善。
Windsurf、Google 移籍経て Cognition に買収され Devin と統合へ
Windsurf が AI 開発ツール業界で激動の週を迎えた。11 日に Google との合意で CEO Varun Mohan、共同創設者 Douglas Chen、R&D チームの一部が Google 移籍。その 3 日後の 14 日、残る Windsurf チームが Cognition(Devin 開発元)に買収されることを発表。
MedGemma、医療 AI 開発向けマルチモーダルモデル
Google が MedGemma コレクションに 2 つの新しいモデルを追加した。MedGemma 27B Multimodal は複雑なマルチモーダルと縦断的電子健康記録の解釈をサポート。MedSigLIP は分類、検索、関連タスク用の軽量画像・テキストエンコーダー(400M パラメーター)。
T5Gemma、encoder-decoder アーキテクチャの新しい Gemma モデルコレクション
Google が T5Gemma を発表した。decoder-only モデルから encoder-decoder アーキテクチャへの変換技術「model adaptation」を使用した新しい Gemma モデルコレクション。Gemma 2 フレームワークをベースに、適応済み Gemma 2 2B・9B モデルと新しく訓練された T5 サイズモデル(Small、Base、Large、XL)を提供。
Gemini API Batch Mode、50%割引で大量処理に対応
Google が Gemini API に Batch Mode を導入した。高スループット、レイテンシーが重要でないワークロード向けの新しい非同期エンドポイントで、同期 API と比較して 50%割引で提供される。
Google Gemma 3n 正式リリース - モバイルファーストのマルチモーダル AI
Google が Gemma 3n の正式版をリリース。5 月のプレビューから完全版となり、モバイルデバイス向けに最適化されたマルチモーダル AI モデル。
Gemini Code Assist、エージェントモードをプレビュー提供
Google が Gemini CLI に合わせて Gemini Code Assist のエージェントモード、マルチファイル編集、フルプロジェクトコンテキストをプレビュー版として提供開始。複雑なマルチステップタスクの自動化と大規模なコードベース変更が可能になった。同様のツールと比べて、かなり出遅れたエージェントモードのサポートだが、コンテキスト量に優位性がある。
AI ファースト Google Colab、全ユーザーに提供開始
Google が Google I/O 2025 で発表した AI ファースト Google Colab を全ユーザーに提供開始。ノートブック内で AI が真のコーディングパートナーとして機能し、困難な問題をこれまで以上に高速で解決できるよう設計されている。
Google Imagen 4、Gemini API と Google AI Studio で利用可能に
Google が Imagen 4 を Gemini API の有料プレビューと Google AI Studio の限定無料テストで提供開始。これまでで最高の text-to-image モデルとして、特にテキストレンダリングが大幅に改善された。
Gemini 2.5 の多言語音声生成
Google が Gemini 2.5 の新機能として音声ダイアログと生成機能を発表。24 以上の言語で自然な音声を生成可能に。音声の品質と自然さを向上させるため、感情表現や話者の個性を考慮した生成が可能。 ### 参考文献
Gemini 2.5 Pro のアップグレード
Gemini 2.5 Pro がアップグレードされ、より高度な機能を提供。LMArena で 24 ポイント、WebDevArena で 35 ポイントの Elo スコア向上を達成。LMArena では 1470 ポイントでリーダーボードを維持し、WebDevArena では 1443 ポイントで首位を獲得。また Google AI Studio と Vertex AI で思考予算(thinking budgets)を追加し、コストとレイテンシーの制御が可能に。 ### 参考文献
NotebookLM の共有機能強化
NotebookLM が「公開ノートブック」機能を追加。ユーザーが作成したノートブックを NotebookLM ユーザー一般と共有可能に。ノートブックの右上にある「共有」ボタンから「リンクを知っている全員」に設定することで公開可能。
Google CEO、AI Mode からの外部トラフィックを約束
Google の Sundar Pichai CEO が The Verge のインタビューで、AI Mode および AI Overview がウェブへトラフィックを送ることを製品の方向性として非常に重視していると明言。パブリッシャーの懸念に対し、AI 機能がより幅広い情報源への送客を促進し、質の高い参照トラフィックを提供すると強調した。 ### 参考文献
Gemini API に大幅な機能拡張が追加
Google I/O 2025 で Gemini API に多数の新機能と改良が発表された。新モデルの追加、思考プロセスの可視化、ツール連携強化、動画理解向上など、開発者向けの大幅な機能拡張が実施。特にエージェント開発やマルチモーダル対応、リアルタイム生成機能が大幅に強化された。
Gemini Diffusion、拡散型言語モデルが発表
Google が新しい実験的研究モデル「Gemini Diffusion」を発表。ランダムノイズからコヒーレントなテキストやコードを生成する SOTA(State-of-the-Art)の Text diffusion model で、画像・動画生成モデルと同様の仕組みを採用。従来の最速モデルよりも大幅に高速化を実現しながら、コーディング性能は同等レベルを維持。実験デモが公開され、ウェイトリストに登録可能。 ### 参考文献
Veo 3、Imagen 4、Flow など最新メディア生成モデルが発表
Google が I/O 2025 で最新のメディア生成モデルが発表。Veo 3 は初の音声付き動画生成を実現し、Imagen 4 は 2K 解像度での高品質画像生成が可能。新しい AI 映像制作ツール Flow や音楽生成の Lyria 2 も発表され、クリエイティブ業界向けの包括的なソリューションを提供。全てのコンテンツに SynthID による電子透かしを付与し、AI 生成コンテンツの識別を支援する SynthID Detector も公開。
Gemma 3n preview 発表、モバイルファーストのオープンソース AI モデル
Google が Gemma 3n preview を発表。モバイルデバイス向けに最適化されたオープンソース AI モデルで、Per-Layer Embeddings(PLE)により RAM 使用量を大幅削減。5B と 8B パラメータながら 2B と 4B 相当のメモリフットプリント(2GB・3GB)を実現。音声、テキスト、画像のマルチモーダル対応でオフライン動作が可能。Qualcomm、MediaTek、Samsung System LSI と連携して開発され、次世代 Gemini Nano の基盤技術となる。 ### 参考文献
Google AI Ultra、最高レベルの AI 機能を統合したサブスクリプションプラン発表
Google が Google AI Ultra を発表。映画製作者、開発者、クリエイティブプロフェッショナル向けの最高レベル AI サブスクリプションプラン。月額$249.99(米国、初回 3 か月は 50%オフ)で、最高の使用制限と最先端モデルへのアクセスを提供。Gemini、Flow、Whisk、NotebookLM、Project Mariner、YouTube Premium、30TB ストレージを統合し、従来の Google AI Premium(現 Google AI Pro)を大幅に上回る包括的な AI サービスパッケージを実現。
Google Jules、自律型コーディングエージェントがパブリックベータで提供開始
Google が Google Labs で開発していた自律型コーディングエージェント「Jules」をパブリックベータで提供開始。ウェイトリスト不要で世界中で利用可能(Gemini モデル利用可能地域)。既存リポジトリと直接統合し、セキュアな Google Cloud VM 上にリポジトリをクローンして非同期でタスクを実行。プライベートコードでの学習は行われず、データは実行環境内で隔離。モデルは Gemini 2.5 Pro が利用される。 ### 参考文献
Google Stitch、プロンプトと画像から UI 設計とフロントエンドコードを生成
Google が Google Labs の実験的プロジェクトとして「Stitch」を発表。Gemini 2.5 Pro のマルチモーダル機能を活用し、自然言語プロンプトや画像入力から複雑な UI 設計とフロントエンドコードを数分で生成。ホワイトボードスケッチ、スクリーンショット、ワイヤーフレームから対応するデジタル UI を作成でき、複数バリエーションでの高速イテレーションも可能。生成されたデザインは Figma に直接貼り付けてコラボレーションでき、クリーンで機能的な HTML/CSS/JavaScript コードも自動出力。stitch.withgoogle.comでアクセス可能。 ### 参考文献
NotebookLM モバイルアプリが iOS・Android 向けにリリース
Google が NotebookLM のモバイルアプリを iOS と Android 向けにリリース。外出先での Audio Overviews 視聴、リアルタイムでの質問、ブラウジング中の直接共有が可能に。オフライン再生やバックグラウンド再生に対応し、地下鉄やデータ通信制限時でも利用できる。任意のアプリから Web サイト、PDF、YouTube 動画を NotebookLM に直接共有可能。 ### 参考文献
AlphaEvolve 発表、自らアルゴリズムを改善する AI エージェント
Google DeepMind が、Gemini モデルを活用した新しいコーディングエージェント「AlphaEvolve」を発表。AlphaEvolve は大規模言語モデルの創造性と自動評価システムを組み合わせ、数学や計算機科学の複雑な問題に対して新しいアルゴリズムを自律的に発見・最適化できる。Google のデータセンターや AI トレーニング、チップ設計など実際の現場でも効率化に貢献しており、今後は学術や産業分野への応用も期待されている。
Google AI Overviews の UX 調査結果が公開
Google の AI Overviews(AIO)に関する初の大規模 UX 調査で、AIO が表示されるとデスクトップの外部クリック率は約 3 分の 1、モバイルでも半分近くまで低下することが判明。ユーザーの 7 割は AIO の上部 3 分の 1 しか読まず、88%が「もっと見る」をクリックしても平均スクロールはパネル全体の 30%にとどまる。25 ~ 34 歳のモバイルユーザーは AIO を最終回答とする割合が 2 件に 1 件と高い一方、年齢や検索意図によっては従来のリンクを重視する傾向も残る。AIO 後のクリック先は Reddit や YouTube などコミュニティや動画が多く、ブランドや権威性が信頼獲得の鍵となっている。 ### 参考文献
Gemini 2.0 Flash 画像生成プレビュー開始
Google が Gemini 2.0 Flash による画像生成機能のプレビュー提供を開始。
Gemini 2.5 Pro Preview: コーディング性能がさらに向上
Google が Gemini 2.5 Pro Preview(I/O Edition)をリリース。既存ユーザーは追加手続き不要で最新版を利用可能。
Google が AI チャットボットに広告配信を開始
Google の AdSense ネットワークが AI チャットボット向けの広告配信をテスト開始。AI 検索アプリの iAsk と Liner で実証実験を実施し、今後他の AI チャットボットプロバイダーにも展開予定。従来のウェブサイト広告から AI チャット対話へと拡張を図り、会話型 AI 体験における関連広告の表示を可能に。将来的には Gemini への広告導入も予想される展開。 ### 参考文献
NotebookLM の Audio Overviews が日本語を含む 50 言語に対応
NotebookLM の Audio Overviews が日本語を含む 50 以上の言語に対応。Gemini 2.5 Pro のマルチモーダル AI 技術により、アップロードした資料の音声要約を多言語で生成可能。Google アカウントの言語設定や NotebookLM の出力言語設定で、音声やチャットの応答言語を自由に切り替えられる。 ### 参考文献
Agent2Agent プロトコル
Google は異なる AI エージェント間の相互運用性を実現する Agent2Agent(A2A)プロトコルを発表しました。Atlassian、Salesforce、SAP、ServiceNow などの主要な技術パートナーと、Accenture、Deloitte、KPMG、PwC などの主要なサービスプロバイダーのサポートと貢献を得て開発されました。
Gemini 2.5 Flash と Pro、Live API、Veo 2 の一般提供開始
Google は Gemini 2.5 シリーズの新モデルをリリースしました。Gemini 2.5 Pro は、最も高度なコーディングモデルとして、視覚的に魅力的な Web アプリの作成やエージェントプログラミングアプリケーションの開発に優れています。また、Gemini 2.5 Flash は、低レイテンシーとコスト効率を維持しながら、思考能力を組み込んだ進化版として近日公開予定です。これらのモデルは、100 万トークンの入力コンテキストウィンドウを備え、より高度なエージェントの実現やマルチエージェントシステムの管理、コードベース全体の生成的な推論の加速を可能にします。
Gemini 2.5 Pro と Gemini 2.5 Flash リリース
Google は、最新の AI モデルである Gemini 2.5 Pro と Gemini 2.5 Flash を発表。これらのモデルは、企業向けの高度な推論能力を備え、特に複雑なタスクにおいて優れた性能を発揮する。
Gemini の動画生成モデル Veo 2 とリアルタイムインタラクションを実現する Live API リリース
Google は、Veo 2 と Live API のリリースを発表。これらのツールは、開発者がよりインタラクティブでリアルタイムなアプリケーションを構築するのを支援する。
NotebookLM がソースを検索する機能を追加
Google NotebookLM が「Discover sources」機能を追加しました。この機能により、ユーザーは興味のあるトピックを記述するだけで、ウェブから関連する情報源を自動的に発見し、まとめることができます。NotebookLM は数百の潜在的なウェブソースを数秒で収集し、トピックに基づいて最も関連性の高いものを選択します。最大 10 個のソース推奨が表示され、それぞれにトピックとの関連性を説明する注釈付きの要約が含まれています。
Google の国別ドメイン統合
Google が国別トップレベルドメイン(ccTLD)の統合を開始した。google.co.jpやgoogle.com.brなどの国別ドメインからのトラフィックをgoogle.comにリダイレクトするようになる。2017 年からローカル検索結果はgoogle.comでも提供されており、国別ドメインは不要になったため。
Gemini 2.5 が公開
Google が 3 月 25 日、推論モデルである Gemini 2.5(Gemini 2.5 Pro Experimental)を発表しました。 既に Google AI Studio と Gemini アプリで利用可能です。
Audio Overview、ポッドキャストの生成
Notebook LM のポッドキャストスタイルのディスカッション音声を生成する Audio Overview 機能が Gemini App に輸入されました。
Canvas、インタラクティブなプレビュー
インタラクティブなプレビューを表示する Canvas 機能が Gemini に追加されました。
Image Generation、画像生成
去年追加された Gemini 2.0 Flash のネイティブ画像生成機能が、Google AI Studio で試せるようになりました。
パーソナライズされた Gemini
Google 検索に基づいてカスタマイズされた応答をする Gemini Personalization が発表されました。 今後、YouTube など他の Google サービスとも接続予定とのことです。
Gems、カスタマイズ可能なエージェント
Gems の一般提供が開始されました。ChatGPT の GPTs に相当する機能であり、ユーザーが自分のニーズに合わせてカスタマイズしたエージェントを作成できます。
Meet の Take notes for me 機能が日本語に対応
昨年 8 月にリリースされた Google Meet の Take notes for me 機能が日本語に対応しました。
Google AI Mode
Google 検索の AI モードが試験的に公開されています。現時点での利用にはウェイトリストへの登録が必要です。
Google 検索に JavaScript を必須化
Google 検索が JavaScript の実行を要求するようになった。
パソコン用 Googlebot によるクロールの完全終了
2024 年 7 月 5 日以降、全てのサイトがスマートフォン用 Googlebot でクロールされるようになります。ですが、2023 年 10 月以降ほとんどのサイトはモバイル用に切り替わっており、ほとんどのサイトには影響がありません。
Notion、PDF や Google ドキュメントをサポート
PDF や Google ドキュメントを Notion ページとしてインポートできるようになりました。
FaviconのGoogle検索での表示とクロスドメイン対応
以前からモバイルではファビコンとサイト名が検索結果に表示されていました。2023 年 3 月から、PC でも正式に導入されました。
Squoosh CLI 及び libsquoosh が非推奨に
Squoosh は、Google が開発した画像圧縮ウェブアプリです。また、Squoosh CLI は、Squoosh の圧縮機能をコマンドラインから利用できるようにしたものです。
著者について
Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.
In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.
In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.
In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.
I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.