Google - Tags - ohiruneuni/blog

All Posts

0 posts

News bits

96 件

2月24日

Opal、「agent」ステップ機能を追加

静的なワークフローを対話型のエクスペリエンスに変換する「agent」ステップを追加。外部ツールやモデルを自律的に連携可能に。

1月23日

Google Antigravity 1.15.6がTerminal Sandboxingをサポート

Google Antigravity 1.15.6にて、MacOSユーザー向けにTerminal Sandboxing機能が追加された。これにより、エージェントが実行するターミナルコマンドをサンドボックス内で実行し、ワークスペース外のファイルへの意図しない変更や損害を防ぐことが可能になった。 ### 参考文献

1月22日

Google検索のAIモードがGmailやGoogle Photosと連携するPersonal Intelligenceを追加

Google AI ProおよびAI Ultraのサブスクライバー向けに、Google検索のAIモードがGmailやGoogle Photosと連携する「Personal Intelligence」機能の提供が開始された（Labs実験機能として）。

1月15日

TranslateGemma: GoogleがGemma 3ベースの翻訳モデル群を公開

GoogleがGemma 3ベースのオープンな翻訳モデル「TranslateGemma」を公開した。55言語に対応し、4B、12B、27Bの3つのサイズで提供される。

1月13日

Google Antigravity 1.14.2がAgent Skillsをサポート

Google Antigravity 1.14.2がリリースされ、Agent Skillsが導入された。これはエージェントの機能を拡張するためのオープンスタンダードな仕組みで、特定のタスクに関する指示やベストプラクティス、スクリプトを「スキル」としてパッケージ化できる。

1月12日

AppleとGoogleが次世代Apple Foundation Modelsで提携

AppleとGoogleは、次世代のApple Foundation ModelsをGoogleのGeminiモデルとクラウド技術に基づいて構築する複数年の提携契約を締結した。

1月12日

Gemini APIがファイルサイズ制限緩和と入力サポート拡大を発表

GoogleはGemini APIのアップデートを発表し、データ入力方法の拡充とファイルサイズ制限の緩和を行った。これにより、開発者は既存のデータを移動させることなく、より簡単にAIアプリケーションに統合できるようになった。

1月11日

GoogleがAgentic CommerceのためのUniversal Commerce Protocol (UCP)を発表

Googleは、Agentic Commerce（エージェント主体コマース）に向けた新しいオープン標準「Universal Commerce Protocol (UCP)」を発表した。UCPは、買い物客、小売業者、プラットフォーム間でのAIエージェントの相互運用性を実現する共通言語となる。

2025年12月18日

FunctionGemma のリリース

Gemma 3 270Mモデルのファンクションコール特化バージョン「FunctionGemma」とトレーニングレシピをリリース。エッジデバイスでの関数呼び出しを可能にする。

2025年12月18日

T5Gemma 2 のリリース

Gemma 3ベースの次世代エンコーダー-デコーダーモデル「T5Gemma 2」をリリース。マルチモーダルとロングコンテキスト対応の初のモデル。

2025年12月17日

Conductor: Introducing context-driven development for Gemini CLI

Googleは、Gemini CLI向けの新しい拡張機能「Conductor」のプレビュー版を公開した。チャットログに依存せず、Markdownファイル（specs.md、plan.md）としてコンテキストや計画を管理することで、AIエージェントによる開発を制御可能にする「context-driven development」を提案している。コードを書く前に仕様や計画を策定し、開発者がレビュー可能な状態にすることを重視している。

2025年12月12日

Google Translate、Geminiによる翻訳機能強化

Google翻訳に、Geminiを活用した新しい翻訳モデルと機能が追加された。テキスト翻訳では、イディオムや現地の表現、スラングなどのニュアンスを含むフレーズで、より自然で正確な翻訳が可能になった。

2025年11月21日

Nano Banana 1 が Google 検索、NotebookLM に登場

Nano Banana 1（Gemini 2.5 Flash Imageモデル）がGoogle検索のGoogleレンズとAIモードで利用可能になった。日本でも順次提供開始。

2025年11月20日

Nano Banana Proを発表

Googleが画像生成・編集モデルNano Banana Pro（Gemini 3 Pro Image）を公開した。Gemini 3 Proを基盤とし、Gemini 3の推論能力と現実世界の知識を活用して画像生成と編集を実現する。

2025年11月20日

Search ConsoleにBranded queries filterが導入

Search ConsoleにBranded queries filterが導入された。

2025年11月18日

Gemini 3をリリース

GoogleがGemini 3をリリースした。Gemini 3 Proはreasoning、multimodality、codingのベンチマークで以前のモデルを上回る。WebDev Arenaリーダーボードで1487 Eloを記録。Terminal-Bench 2.0で54.2%、SWE-bench Verifiedで76.2%を記録し、2.5 Proを大きく上回る。

2025年11月6日

Gemini APIにFile Search Toolを追加

GoogleがGemini APIにFile Search Toolを追加した。完全管理型のRAGシステムで、データグラウンディングを簡素化し、より正確な応答を実現する。

2025年11月6日

Magika 1.0をリリース

GoogleがAI駆動ファイルタイプ検出システムMagika 1.0をリリースした。初回の安定版で、200種類以上のファイルタイプに対応（以前の約100種類から倍増）。

2025年11月5日

Gemini APIのStructured Outputsを改善

GoogleがGemini APIのStructured Outputsを改善した。JSON Schemaサポートを拡張し、プロパティ順序の保持を追加。

2025年10月29日

Jules extension for Gemini CLI

Googleは、Gemini CLIのJules extensionを発表した。 Julesはターミナルでの作業中にバックグラウンドで自律的にタスクを実行する「サイドキック」エージェント。 Jules extensionをインストールし/jules コマンドを使用することで、非同期タスクの実行、バックグラウンドでのバグ修正、PR作成後のブランチ作成などを任せることができる。 ### 参考文献

2025年10月27日

Search ConsoleにQuery groupsが追加

Search Console InsightsにQuery groups機能が追加された。類似の検索クエリをAIでグループ化し、ユーザーの意図を把握しやすくする。

2025年10月17日

Grounding with Google Maps が Gemini API で利用可能に

Googleは、Gemini APIで「Google Maps」を使用したGrounding（情報の根拠付け）が利用可能になったことを発表。

2025年10月15日

Gemini CLI で新しいレベルのインタラクティブ機能が利用可能に

Googleは、Gemini CLIを拡張し、ターミナル内での複雑なインタラクティブコマンドのサポートを追加。

2025年10月8日

Gemini CLI Extensions の導入：CLIのカスタマイズが可能に

Googleは、Gemini CLIの拡張機能（Extensions）を導入。これにより、開発者はGemini CLIを自身のワークフローやツールに接続し、カスタマイズすることが可能になった。

2025年10月8日

Genkit Extension for Gemini CLI の発表

Googleは、Gemini CLI向けの新しい拡張機能「Genkit Extension」を発表。

2025年10月7日

ノーコードAIアプリビルダーOpalが日本でも利用可能に

Google Opalが15カ国に拡張。カナダ、インド、日本、韓国、ベトナム、インドネシア、ブラジル、シンガポール、コロンビア、エルサルバドル、コスタリカ、パナマ、ホンジュラス、アルゼンチン、パキスタンで利用可能。

2025年10月3日

Jules API の発表

Googleは、ソフトウェア開発ライフサイクル全体で自動化と統合を可能にする非同期コーディングエージェント「Jules」のAPIを発表。

2025年10月2日

Gemini 2.5 Flash Image GA

Gemini 2.5 Flash Imageが一般提供開始。10種類のアスペクト比と画像のみの出力に対応。

2025年10月2日

Jules Tools CLI

Googleの非同期コーディングエージェント「Jules」のコマンドラインインターフェース「Jules Tools」がリリース。ターミナルからJulesを直接操作可能。

2025年9月18日

GeminiにCustom Gemsの共有機能が追加

GeminiでCustom Gemsの共有が可能に。Google Driveと同様の共有制御で、閲覧・編集権限を個別設定が可能。 ### 参考文献

2025年9月18日

Gemini in Chrome提供開始

AIブラウジングアシスタントであるGemini in Chromeが提供開始。現在は米国のMac・Windowsユーザー（英語設定）のみ。

2025年9月16日

Agent Payments Protocol (AP2) 発表

GoogleがAgent Payments Protocol (AP2)を発表。プラットフォーム間でAIエージェント主導の決済を安全に開始・処理することを可能にするオープンプロトコル。Adyen、American Express、Coinbase、Mastercard、PayPal、Salesforceなど60以上の組織が強力。

2025年9月11日

NotebookLMがクイズやフラッシュカード生成に対応

GoogleがWorkspaceでNotebookLMの教育機能を拡張。フラッシュカード、クイズ、レポート生成機能を追加し、教育現場でのAI活用を促進するソリューションを提供する。

2025年9月10日

Gemini Batch APIが埋め込みとOpenAI互換性をサポート

GoogleがGemini Batch APIで埋め込みモデルとOpenAI互換性をサポートした。新しくリリースされたGemini Embeddingモデルに対応し、非同期処理で50%低い料金での高ボリューム処理が可能になった。

2025年9月9日

Genkit Go 1.0、Google製AIフレームワーク

GoogleがGo言語のAI開発フレームワーク「Genkit Go 1.0」を正式リリースした。

2025年9月9日

Google AIモード検索が日本語対応開始

Google検索の「AIモード」の日本語対応を開始。Gemini 2.5のカスタムバージョンを使用し、従来の2-3倍の長さの複雑な質問に回答する。

2025年9月8日

Google Veo 3が価格大幅値下げ、縦向き動画と1080p HD出力対応

GoogleがVeo 3とVeo 3 Fastの価格を大幅に値下げ。また縦向き動画（9:16アスペクト比）と1080p HD出力に対応し、モバイル・ソーシャル用途に最適化。

2025年9月5日

Cloudflare Workers AIでEmbeddingGemmaを提供開始

CloudflareがWorkers AIでEmbeddingGemmaの提供を開始。Googleとのローンチパートナーとして協力し、サイズに対して最高クラスの性能を提供する埋め込みモデルを利用可能にした。

2025年9月4日

GoogleがEmbeddingGemmaを公開、200MB未満のRAMで動作可能

GoogleがEmbeddingGemmaを公開した。308Mパラメータのコンパクトなオープン埋め込みモデルで、500M未満のモデル中最高性能を達成し、オンデバイスAIを実現する。

2025年8月27日

GoogleがGemini 2.5 Flash Imageを公開、高速画像生成に対応

GoogleがGemini 2.5 Flash Imageを公開。このモデルは発表以前からnano-bananaとして話題になっていた強力な一貫性の維持が可能な画像生成・編集モデル。Geminiアプリの他、APIでの利用も可能。

2025年8月27日

GoogleがStaxを公開、LLM評価を効率化するツール

GoogleがStaxを公開。LLM評価を効率化する実験的な開発者ツールで、"vibe testing"から脱却し、本格的な評価を可能にする。

2025年8月26日

NotebookLMのビデオ解説が日本語を含む80言語に対応

NotebookLMのビデオ解説機能が日本語を含む80言語で利用可能になった。また、音声解説機能が向上し英語と同様の品質を英語以外の言語でも得られるようになった。 ### 参考文献

2025年8月21日

Google検索のAI Mode、日本を含む180以上の国で一般公開

Google検索のAI Modeが日本を含む180以上の国と地域で一般公開された。AI Modeは、ユーザーの質問に対してAIが回答を生成し、関連情報を提供する機能。これにより、ユーザーはより迅速かつ効率的に情報を得ることができる。

2025年8月18日

Gemini APIのURLコンテキストツールが一般公開、PDFや画像のサポートを追加

Gemini APIのURLコンテキストツールが一般公開された。このツールにより、開発者はコンテンツを手動でアップロードする代わりに、URL形式でモデルに追加のコンテキストを提供できるようになる。

2025年8月13日

GoogleスライドとGoogle VidsにAI画像編集機能が追加、背景の置換や拡張が可能に

GoogleスライドとGoogle Vidsに、AIを活用した2つの画像編集機能が導入された。これにより、画像の背景置換と背景拡張が可能になる。この機能は、デザインスキルがないユーザーでも画像のニーズを満たし、プレゼンテーションの柔軟性と専門性を向上させることを目的としている。

2025年8月6日

Gemini CLI GitHub Actionsがベータ版としてリリース

リポジトリ向けのAIコーディングアシスタント「Gemini CLI GitHub Actions」がベータ版としてリリースされた。このツールは、GitHubリポジトリ上でコーディングの定型タスクを自動化するエージェント、およびオンデマンドでタスクを委任できるコラボレーターとして機能する。利用は無料。

2025年8月6日

GoogleのコーディングエージェントJulesが一般公開

Googleの非同期コーディングエージェントJulesが、ベータ版を終了し一般公開された。Gemini 2.5 Proを搭載し、コーディングプランを策定することで、より高品質なコード出力を実現する。

2025年7月17日

Gemini の月次アップデート Gemini Drops 開始、Veo 3 や Wear OS 対応を拡充

Google が Gemini Drops 月次アップデート企画を開始。Gemini アプリの新機能紹介とヒントを毎月提供する定期アップデート形式を導入。

2025年7月16日

Google 検索、Gemini 2.5 Pro・Deep Search・AI 通話機能を追加

Google が検索に Gemini 2.5 Pro、Deep Search、AI 通話機能を追加。より高度な AI 機能により検索体験を大幅に改善し、複雑な質問への回答とビジネス連絡の自動化を実現。

GitHub で Google アカウントを使ったソーシャルログインが一般公開された。新規ユーザーは Google アカウントで GitHub アカウントを作成可能。既存ユーザーもソーシャルログインメールをアカウントに連携し、次回ログイン時に Google アカウントをパスワード代替として利用できる。

2025年7月14日

NotebookLM、専門家によるフィーチャードノートブック機能を開始

Google が NotebookLM にフィーチャードノートブック機能を追加。著名な著者、研究者、出版物、非営利団体と協力して専門的なノートブックコレクションを提供し、高品質な情報源へのアクセスを大幅に改善。

2025年7月11日

Windsurf、Google 移籍経て Cognition に買収され Devin と統合へ

Windsurf が AI 開発ツール業界で激動の週を迎えた。11 日に Google との合意で CEO Varun Mohan、共同創設者 Douglas Chen、R&D チームの一部が Google 移籍。その 3 日後の 14 日、残る Windsurf チームが Cognition（Devin 開発元）に買収されることを発表。

2025年7月9日

MedGemma、医療 AI 開発向けマルチモーダルモデル

Google が MedGemma コレクションに 2 つの新しいモデルを追加した。MedGemma 27B Multimodal は複雑なマルチモーダルと縦断的電子健康記録の解釈をサポート。MedSigLIP は分類、検索、関連タスク用の軽量画像・テキストエンコーダー（400M パラメーター）。

2025年7月9日

T5Gemma、encoder-decoder アーキテクチャの新しい Gemma モデルコレクション

Google が T5Gemma を発表した。decoder-only モデルから encoder-decoder アーキテクチャへの変換技術「model adaptation」を使用した新しい Gemma モデルコレクション。Gemma 2 フレームワークをベースに、適応済み Gemma 2 2B・9B モデルと新しく訓練された T5 サイズモデル（Small、Base、Large、XL）を提供。

2025年7月7日

Gemini API Batch Mode、50%割引で大量処理に対応

Google が Gemini API に Batch Mode を導入した。高スループット、レイテンシーが重要でないワークロード向けの新しい非同期エンドポイントで、同期 API と比較して 50%割引で提供される。

2025年6月26日

Google Gemma 3n 正式リリース - モバイルファーストのマルチモーダル AI

Google が Gemma 3n の正式版をリリース。5 月のプレビューから完全版となり、モバイルデバイス向けに最適化されたマルチモーダル AI モデル。

2025年6月25日

Gemini Code Assist、エージェントモードをプレビュー提供

Google が Gemini CLI に合わせて Gemini Code Assist のエージェントモード、マルチファイル編集、フルプロジェクトコンテキストをプレビュー版として提供開始。複雑なマルチステップタスクの自動化と大規模なコードベース変更が可能になった。同様のツールと比べて、かなり出遅れたエージェントモードのサポートだが、コンテキスト量に優位性がある。

2025年6月24日

AI ファースト Google Colab、全ユーザーに提供開始

Google が Google I/O 2025 で発表した AI ファースト Google Colab を全ユーザーに提供開始。ノートブック内で AI が真のコーディングパートナーとして機能し、困難な問題をこれまで以上に高速で解決できるよう設計されている。

2025年6月24日

Google Imagen 4、Gemini API と Google AI Studio で利用可能に

Google が Imagen 4 を Gemini API の有料プレビューと Google AI Studio の限定無料テストで提供開始。これまでで最高の text-to-image モデルとして、特にテキストレンダリングが大幅に改善された。

2025年6月3日

Gemini 2.5 の多言語音声生成

Google が Gemini 2.5 の新機能として音声ダイアログと生成機能を発表。24 以上の言語で自然な音声を生成可能に。音声の品質と自然さを向上させるため、感情表現や話者の個性を考慮した生成が可能。 ### 参考文献

2025年6月3日

Gemini 2.5 Pro のアップグレード

Gemini 2.5 Pro がアップグレードされ、より高度な機能を提供。LMArena で 24 ポイント、WebDevArena で 35 ポイントの Elo スコア向上を達成。LMArena では 1470 ポイントでリーダーボードを維持し、WebDevArena では 1443 ポイントで首位を獲得。また Google AI Studio と Vertex AI で思考予算（thinking budgets）を追加し、コストとレイテンシーの制御が可能に。 ### 参考文献

2025年6月3日

NotebookLM の共有機能強化

NotebookLM が「公開ノートブック」機能を追加。ユーザーが作成したノートブックを NotebookLM ユーザー一般と共有可能に。ノートブックの右上にある「共有」ボタンから「リンクを知っている全員」に設定することで公開可能。

2025年5月29日

Google CEO、AI Mode からの外部トラフィックを約束

Google の Sundar Pichai CEO が The Verge のインタビューで、AI Mode および AI Overview がウェブへトラフィックを送ることを製品の方向性として非常に重視していると明言。パブリッシャーの懸念に対し、AI 機能がより幅広い情報源への送客を促進し、質の高い参照トラフィックを提供すると強調した。 ### 参考文献

2025年5月23日

Gemini API に大幅な機能拡張が追加

Google I/O 2025 で Gemini API に多数の新機能と改良が発表された。新モデルの追加、思考プロセスの可視化、ツール連携強化、動画理解向上など、開発者向けの大幅な機能拡張が実施。特にエージェント開発やマルチモーダル対応、リアルタイム生成機能が大幅に強化された。

2025年5月22日

Gemini Diffusion、拡散型言語モデルが発表

Google が新しい実験的研究モデル「Gemini Diffusion」を発表。ランダムノイズからコヒーレントなテキストやコードを生成する SOTA（State-of-the-Art）の Text diffusion model で、画像・動画生成モデルと同様の仕組みを採用。従来の最速モデルよりも大幅に高速化を実現しながら、コーディング性能は同等レベルを維持。実験デモが公開され、ウェイトリストに登録可能。 ### 参考文献

2025年5月21日

Veo 3、Imagen 4、Flow など最新メディア生成モデルが発表

Google が I/O 2025 で最新のメディア生成モデルが発表。Veo 3 は初の音声付き動画生成を実現し、Imagen 4 は 2K 解像度での高品質画像生成が可能。新しい AI 映像制作ツール Flow や音楽生成の Lyria 2 も発表され、クリエイティブ業界向けの包括的なソリューションを提供。全てのコンテンツに SynthID による電子透かしを付与し、AI 生成コンテンツの識別を支援する SynthID Detector も公開。

2025年5月20日

Gemma 3n preview 発表、モバイルファーストのオープンソース AI モデル

Google が Gemma 3n preview を発表。モバイルデバイス向けに最適化されたオープンソース AI モデルで、Per-Layer Embeddings（PLE）により RAM 使用量を大幅削減。5B と 8B パラメータながら 2B と 4B 相当のメモリフットプリント（2GB・3GB）を実現。音声、テキスト、画像のマルチモーダル対応でオフライン動作が可能。Qualcomm、MediaTek、Samsung System LSI と連携して開発され、次世代 Gemini Nano の基盤技術となる。 ### 参考文献

2025年5月20日

Google AI Ultra、最高レベルの AI 機能を統合したサブスクリプションプラン発表

Google が Google AI Ultra を発表。映画製作者、開発者、クリエイティブプロフェッショナル向けの最高レベル AI サブスクリプションプラン。月額$249.99（米国、初回 3 か月は 50%オフ）で、最高の使用制限と最先端モデルへのアクセスを提供。Gemini、Flow、Whisk、NotebookLM、Project Mariner、YouTube Premium、30TB ストレージを統合し、従来の Google AI Premium（現 Google AI Pro）を大幅に上回る包括的な AI サービスパッケージを実現。

2025年5月20日

Google Jules、自律型コーディングエージェントがパブリックベータで提供開始

Google が Google Labs で開発していた自律型コーディングエージェント「Jules」をパブリックベータで提供開始。ウェイトリスト不要で世界中で利用可能（Gemini モデル利用可能地域）。既存リポジトリと直接統合し、セキュアな Google Cloud VM 上にリポジトリをクローンして非同期でタスクを実行。プライベートコードでの学習は行われず、データは実行環境内で隔離。モデルは Gemini 2.5 Pro が利用される。 ### 参考文献

2025年5月20日

Google Stitch、プロンプトと画像から UI 設計とフロントエンドコードを生成

Google が Google Labs の実験的プロジェクトとして「Stitch」を発表。Gemini 2.5 Pro のマルチモーダル機能を活用し、自然言語プロンプトや画像入力から複雑な UI 設計とフロントエンドコードを数分で生成。ホワイトボードスケッチ、スクリーンショット、ワイヤーフレームから対応するデジタル UI を作成でき、複数バリエーションでの高速イテレーションも可能。生成されたデザインは Figma に直接貼り付けてコラボレーションでき、クリーンで機能的な HTML/CSS/JavaScript コードも自動出力。stitch.withgoogle.comでアクセス可能。 ### 参考文献

2025年5月19日

NotebookLM モバイルアプリが iOS・Android 向けにリリース

Google が NotebookLM のモバイルアプリを iOS と Android 向けにリリース。外出先での Audio Overviews 視聴、リアルタイムでの質問、ブラウジング中の直接共有が可能に。オフライン再生やバックグラウンド再生に対応し、地下鉄やデータ通信制限時でも利用できる。任意のアプリから Web サイト、PDF、YouTube 動画を NotebookLM に直接共有可能。 ### 参考文献

2025年5月14日

AlphaEvolve 発表、自らアルゴリズムを改善する AI エージェント

Google DeepMind が、Gemini モデルを活用した新しいコーディングエージェント「AlphaEvolve」を発表。AlphaEvolve は大規模言語モデルの創造性と自動評価システムを組み合わせ、数学や計算機科学の複雑な問題に対して新しいアルゴリズムを自律的に発見・最適化できる。Google のデータセンターや AI トレーニング、チップ設計など実際の現場でも効率化に貢献しており、今後は学術や産業分野への応用も期待されている。

2025年5月12日

Google AI Overviews の UX 調査結果が公開

Google の AI Overviews（AIO）に関する初の大規模 UX 調査で、AIO が表示されるとデスクトップの外部クリック率は約 3 分の 1、モバイルでも半分近くまで低下することが判明。ユーザーの 7 割は AIO の上部 3 分の 1 しか読まず、88%が「もっと見る」をクリックしても平均スクロールはパネル全体の 30%にとどまる。25 ～ 34 歳のモバイルユーザーは AIO を最終回答とする割合が 2 件に 1 件と高い一方、年齢や検索意図によっては従来のリンクを重視する傾向も残る。AIO 後のクリック先は Reddit や YouTube などコミュニティや動画が多く、ブランドや権威性が信頼獲得の鍵となっている。 ### 参考文献

2025年5月7日

Gemini 2.0 Flash 画像生成プレビュー開始

Google が Gemini 2.0 Flash による画像生成機能のプレビュー提供を開始。

2025年5月6日

Gemini 2.5 Pro Preview: コーディング性能がさらに向上

Google が Gemini 2.5 Pro Preview（I/O Edition）をリリース。既存ユーザーは追加手続き不要で最新版を利用可能。

2025年5月1日

Google が AI チャットボットに広告配信を開始

Google の AdSense ネットワークが AI チャットボット向けの広告配信をテスト開始。AI 検索アプリの iAsk と Liner で実証実験を実施し、今後他の AI チャットボットプロバイダーにも展開予定。従来のウェブサイト広告から AI チャット対話へと拡張を図り、会話型 AI 体験における関連広告の表示を可能に。将来的には Gemini への広告導入も予想される展開。 ### 参考文献

2025年4月30日

NotebookLM の Audio Overviews が日本語を含む 50 言語に対応

NotebookLM の Audio Overviews が日本語を含む 50 以上の言語に対応。Gemini 2.5 Pro のマルチモーダル AI 技術により、アップロードした資料の音声要約を多言語で生成可能。Google アカウントの言語設定や NotebookLM の出力言語設定で、音声やチャットの応答言語を自由に切り替えられる。 ### 参考文献

2025年4月9日

Agent2Agent プロトコル

Google は異なる AI エージェント間の相互運用性を実現する Agent2Agent（A2A）プロトコルを発表しました。Atlassian、Salesforce、SAP、ServiceNow などの主要な技術パートナーと、Accenture、Deloitte、KPMG、PwC などの主要なサービスプロバイダーのサポートと貢献を得て開発されました。

2025年4月9日

Gemini 2.5 Flash と Pro、Live API、Veo 2 の一般提供開始

Google は Gemini 2.5 シリーズの新モデルをリリースしました。Gemini 2.5 Pro は、最も高度なコーディングモデルとして、視覚的に魅力的な Web アプリの作成やエージェントプログラミングアプリケーションの開発に優れています。また、Gemini 2.5 Flash は、低レイテンシーとコスト効率を維持しながら、思考能力を組み込んだ進化版として近日公開予定です。これらのモデルは、100 万トークンの入力コンテキストウィンドウを備え、より高度なエージェントの実現やマルチエージェントシステムの管理、コードベース全体の生成的な推論の加速を可能にします。

2025年4月9日

Gemini 2.5 Pro と Gemini 2.5 Flash リリース

Google は、最新の AI モデルである Gemini 2.5 Pro と Gemini 2.5 Flash を発表。これらのモデルは、企業向けの高度な推論能力を備え、特に複雑なタスクにおいて優れた性能を発揮する。

2025年4月9日

Gemini の動画生成モデル Veo 2 とリアルタイムインタラクションを実現する Live API リリース

Google は、Veo 2 と Live API のリリースを発表。これらのツールは、開発者がよりインタラクティブでリアルタイムなアプリケーションを構築するのを支援する。

2025年4月2日

NotebookLM がソースを検索する機能を追加

Google NotebookLM が「Discover sources」機能を追加しました。この機能により、ユーザーは興味のあるトピックを記述するだけで、ウェブから関連する情報源を自動的に発見し、まとめることができます。NotebookLM は数百の潜在的なウェブソースを数秒で収集し、トピックに基づいて最も関連性の高いものを選択します。最大 10 個のソース推奨が表示され、それぞれにトピックとの関連性を説明する注釈付きの要約が含まれています。

2025年4月1日

Google の国別ドメイン統合

Google が国別トップレベルドメイン（ccTLD）の統合を開始した。google.co.jpやgoogle.com.brなどの国別ドメインからのトラフィックをgoogle.comにリダイレクトするようになる。2017 年からローカル検索結果はgoogle.comでも提供されており、国別ドメインは不要になったため。

2025年3月27日

Gemini 2.5 が公開

Google が 3 月 25 日、推論モデルである Gemini 2.5（Gemini 2.5 Pro Experimental）を発表しました。既に Google AI Studio と Gemini アプリで利用可能です。

2025年3月20日

Audio Overview、ポッドキャストの生成

Notebook LM のポッドキャストスタイルのディスカッション音声を生成する Audio Overview 機能が Gemini App に輸入されました。

2025年3月20日

Canvas、インタラクティブなプレビュー

インタラクティブなプレビューを表示する Canvas 機能が Gemini に追加されました。

2025年3月20日

Image Generation、画像生成

去年追加された Gemini 2.0 Flash のネイティブ画像生成機能が、Google AI Studio で試せるようになりました。

2025年3月20日

パーソナライズされた Gemini

Google 検索に基づいてカスタマイズされた応答をする Gemini Personalization が発表されました。今後、YouTube など他の Google サービスとも接続予定とのことです。

2025年3月20日

Gems、カスタマイズ可能なエージェント

Gems の一般提供が開始されました。ChatGPT の GPTs に相当する機能であり、ユーザーが自分のニーズに合わせてカスタマイズしたエージェントを作成できます。

2025年3月20日

Meet の Take notes for me 機能が日本語に対応

昨年 8 月にリリースされた Google Meet の Take notes for me 機能が日本語に対応しました。

2025年3月13日

Google AI Mode

Google 検索の AI モードが試験的に公開されています。現時点での利用にはウェイトリストへの登録が必要です。

2025年1月24日

Google 検索に JavaScript を必須化

Google 検索が JavaScript の実行を要求するようになった。

2024年6月7日

パソコン用 Googlebot によるクロールの完全終了

2024 年 7 月 5 日以降、全てのサイトがスマートフォン用 Googlebot でクロールされるようになります。ですが、2023 年 10 月以降ほとんどのサイトはモバイル用に切り替わっており、ほとんどのサイトには影響がありません。

2024年5月23日

Notion、PDF や Google ドキュメントをサポート

PDF や Google ドキュメントを Notion ページとしてインポートできるようになりました。

2023年3月14日

FaviconのGoogle検索での表示とクロスドメイン対応

以前からモバイルではファビコンとサイト名が検索結果に表示されていました。2023 年 3 月から、PC でも正式に導入されました。

2023年2月22日

Squoosh CLI 及び libsquoosh が非推奨に

Squoosh は、Google が開発した画像圧縮ウェブアプリです。また、Squoosh CLI は、Squoosh の圧縮機能をコマンドラインから利用できるようにしたものです。

著者について

Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.

In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.

In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.

In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.

I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.

All Posts

News bits

Opal、「agent」ステップ機能を追加

Google Antigravity 1.15.6がTerminal Sandboxingをサポート

Google検索のAIモードがGmailやGoogle Photosと連携するPersonal Intelligenceを追加

TranslateGemma: GoogleがGemma 3ベースの翻訳モデル群を公開

Google Antigravity 1.14.2がAgent Skillsをサポート

AppleとGoogleが次世代Apple Foundation Modelsで提携

Gemini APIがファイルサイズ制限緩和と入力サポート拡大を発表

GoogleがAgentic CommerceのためのUniversal Commerce Protocol (UCP)を発表

FunctionGemma のリリース

T5Gemma 2 のリリース

Conductor: Introducing context-driven development for Gemini CLI

Google Translate、Geminiによる翻訳機能強化

Nano Banana 1 が Google 検索、NotebookLM に登場

Nano Banana Proを発表

Search ConsoleにBranded queries filterが導入

Gemini 3をリリース

Gemini APIにFile Search Toolを追加

Magika 1.0をリリース

Gemini APIのStructured Outputsを改善

Jules extension for Gemini CLI

Search ConsoleにQuery groupsが追加

Grounding with Google Maps が Gemini API で利用可能に

Gemini CLI で新しいレベルのインタラクティブ機能が利用可能に

Gemini CLI Extensions の導入：CLIのカスタマイズが可能に

Genkit Extension for Gemini CLI の発表

ノーコードAIアプリビルダーOpalが日本でも利用可能に

Jules API の発表

Gemini 2.5 Flash Image GA

Jules Tools CLI

GeminiにCustom Gemsの共有機能が追加

Gemini in Chrome提供開始

Agent Payments Protocol (AP2) 発表

NotebookLMがクイズやフラッシュカード生成に対応

Gemini Batch APIが埋め込みとOpenAI互換性をサポート

Genkit Go 1.0、Google製AIフレームワーク

Google AIモード検索が日本語対応開始

Google Veo 3が価格大幅値下げ、縦向き動画と1080p HD出力対応

Cloudflare Workers AIでEmbeddingGemmaを提供開始

GoogleがEmbeddingGemmaを公開、200MB未満のRAMで動作可能

GoogleがGemini 2.5 Flash Imageを公開、高速画像生成に対応

GoogleがStaxを公開、LLM評価を効率化するツール

NotebookLMのビデオ解説が日本語を含む80言語に対応

Google検索のAI Mode、日本を含む180以上の国で一般公開

Gemini APIのURLコンテキストツールが一般公開、PDFや画像のサポートを追加

GoogleスライドとGoogle VidsにAI画像編集機能が追加、背景の置換や拡張が可能に

Gemini CLI GitHub Actionsがベータ版としてリリース

GoogleのコーディングエージェントJulesが一般公開

Gemini の月次アップデート Gemini Drops 開始、Veo 3 や Wear OS 対応を拡充

Google 検索、Gemini 2.5 Pro・Deep Search・AI 通話機能を追加

GitHub、Google ソーシャルログインが一般公開

NotebookLM、専門家によるフィーチャードノートブック機能を開始

Windsurf、Google 移籍経て Cognition に買収され Devin と統合へ

MedGemma、医療 AI 開発向けマルチモーダルモデル

T5Gemma、encoder-decoder アーキテクチャの新しい Gemma モデルコレクション

Gemini API Batch Mode、50%割引で大量処理に対応

Google Gemma 3n 正式リリース - モバイルファーストのマルチモーダル AI

Gemini Code Assist、エージェントモードをプレビュー提供

AI ファースト Google Colab、全ユーザーに提供開始

Google Imagen 4、Gemini API と Google AI Studio で利用可能に

Gemini 2.5 の多言語音声生成

Gemini 2.5 Pro のアップグレード

NotebookLM の共有機能強化

Google CEO、AI Mode からの外部トラフィックを約束

Gemini API に大幅な機能拡張が追加

Gemini Diffusion、拡散型言語モデルが発表

Veo 3、Imagen 4、Flow など最新メディア生成モデルが発表

Gemma 3n preview 発表、モバイルファーストのオープンソース AI モデル

Google AI Ultra、最高レベルの AI 機能を統合したサブスクリプションプラン発表

Google Jules、自律型コーディングエージェントがパブリックベータで提供開始

Google Stitch、プロンプトと画像から UI 設計とフロントエンドコードを生成

NotebookLM モバイルアプリが iOS・Android 向けにリリース

AlphaEvolve 発表、自らアルゴリズムを改善する AI エージェント

Google AI Overviews の UX 調査結果が公開

Gemini 2.0 Flash 画像生成プレビュー開始

Gemini 2.5 Pro Preview: コーディング性能がさらに向上

Google が AI チャットボットに広告配信を開始

NotebookLM の Audio Overviews が日本語を含む 50 言語に対応

Agent2Agent プロトコル