2223 words
11min read
Edit

AI Weekly 2026-01-15

#GoogleがAgentic CommerceのためのUniversal Commerce Protocol (UCP)を発表

日付:2026年1月11日

Googleは、Agentic Commerce(エージェント主体コマース)に向けた新しいオープン標準「Universal Commerce Protocol (UCP)」を発表した。UCPは、買い物客、小売業者、プラットフォーム間でのAIエージェントの相互運用性を実現する共通言語となる。

主な特徴:

  • 相互運用性: Agent2Agent (A2A)、Agent Payments Protocol (AP2)、Model Context Protocol (MCP)と互換性があり、プラットフォームや決済プロバイダーをまたいで連携可能。
  • エコシステムのサポート: Shopify、Etsy、Wayfair、Target、Walmartと共同開発された。さらにAdyen、American Express、Best Buy、Macy’s Inc.、Mastercard、Stripe、The Home Depot、Visa、Zalandoなど20社以上の業界リーダーが支持している。
  • 機能展開:
    • AI Modeでのチェックアウト: SearchやGeminiアプリ内で直接購入が可能に。Google PayやPayPalに対応。
    • Business Agent: ブランドがSearch上で顧客と直接対話できるバーチャル販売員機能。
    • Merchant Center拡張: 会話型コマース向けの新しいデータ属性を追加。
    • Direct Offers: Google Adsの新機能として、AI Mode内で購入意欲の高いユーザーに限定オファーを提示。

UCPは発見から購入、サポートまでショッピング体験全体をカバーし、開発者向けの技術仕様やSDKはGitHubで公開されている。

出展:New tech and tools for retailers to succeed in an agentic shopping era, Universal Commerce Protocol, Under the Hood: Universal Commerce Protocol (UCP)

#AnthropicがClaude Coworkのリサーチプレビューを公開

日付:2026年1月12日

AnthropicがClaude Coworkのリサーチプレビューを公開した。Claude Codeの非開発者向け版で、フォルダへのアクセス権限を与えることで、Claudeがファイルを読み書きできるようになる。

macOSアプリでClaude Max購読者向けにリサーチプレビューとして利用可能。2026年1月16日にはPro購読者にも拡張された。

主な機能:

  • フォルダ内のファイルの読み書き、作成、編集
  • ダウンロードフォルダの整理やファイル名の変更
  • スクリーンショットからスプレッドシートの作成
  • 散らばったメモからレポートの作成
  • タスクをキューに入れて並列処理
  • 既存のコネクターやスキルの使用
  • Claude in Chromeと組み合わせてブラウザアクセスも可能

Claude Codeと同じ基盤を使用しており、より多くのタスクを処理できる。通常の会話よりも自律的に動作し、タスクを設定すると計画を立てて実行する。

セキュリティ面では、アクセス可能なフォルダとコネクターを選択でき、重要なアクションの前に確認を求める。デフォルトでは、削除などの破壊的なアクションも実行可能なため、明確な指示が必要。

出展:Cowork: Claude Code for the rest of your work

#AppleとGoogleが次世代Apple Foundation Modelsで提携

日付:2026年1月12日

AppleとGoogleは、次世代のApple Foundation ModelsをGoogleのGeminiモデルとクラウド技術に基づいて構築する複数年の提携契約を締結した。

  • 今後登場するApple Intelligence機能(今年予定のパーソナライズされたSiriなど)を支える基盤となる。
  • Appleは評価の結果、GoogleのAI技術が最も優れた基盤を提供すると判断した。
  • Apple Intelligenceは引き続きAppleデバイスおよびPrivate Cloud Compute上で動作し、プライバシー基準を維持する。

出展:Joint statement from Google and Apple

#Gemini APIがファイルサイズ制限緩和と入力サポート拡大を発表

日付:2026年1月12日

GoogleはGemini APIのアップデートを発表し、データ入力方法の拡充とファイルサイズ制限の緩和を行った。これにより、開発者は既存のデータを移動させることなく、より簡単にAIアプリケーションに統合できるようになった。

主な変更点:

  • 外部URL(公開/署名付き)のサポート: 公開URLや署名付きURL(AWS S3、Azure Blob Storageなど)を直接リクエストに含めることが可能になり、中間サーバーへのダウンロードが不要になった。
  • Google Cloud Storage (GCS) オブジェクトの登録: GCS内のファイルを移動せずに直接Files APIに登録できるようになった。
  • インラインファイルサイズ制限の緩和: インラインデータの最大ペイロードサイズが20MBから100MBに増加し、プロトタイピングやリアルタイム処理が容易になった。

これらの機能は最新のGenAI SDKで利用可能。

出展:Increased file size limits and expanded inputs support in Gemini API

#Google Antigravity 1.14.2がAgent Skillsをサポート

日付:2026年1月13日

Google Antigravity 1.14.2がリリースされ、Agent Skillsが導入された。これはエージェントの機能を拡張するためのオープンスタンダードな仕組みで、特定のタスクに関する指示やベストプラクティス、スクリプトを「スキル」としてパッケージ化できる。

主な特徴:

  • Progressive Disclosure(段階的開示): エージェントは通常時はスキルのリスト(名前と説明)のみを認識し、必要になった時点でのみ詳細な手順(SKILL.md)を読み込む。これによりコンテキストウィンドウの消費を抑えながら多機能化を実現する。
  • 構成: 各スキルは SKILL.md と関連ファイル(スクリプトやテンプレートなど)を含むフォルダで構成される。
  • スコープ: プロジェクト固有のスキル(.agent/skills/)と、ユーザーごとのグローバルスキル(~/.gemini/antigravity/global_skills/)の両方をサポートする。

これにより、ユーザーは独自のワークフローやコーディング規約をエージェントに効率的に学習させ、再利用可能になる。

出展:Google Antigravity Changelog, Agent Skills

#SalesforceがSlackbotの一般公開を発表

日付:2026年1月13日

Salesforceは、AIエージェント「Slackbot」の一般公開を発表した。これはSlackに統合された「仕事のためのパーソナルエージェント」であり、Agentforce 360を基盤としている。

Business+およびEnterprise+の顧客向けに、2026年1月13日から順次提供が開始される。

主な特徴:

  • Slackに組み込まれており、インストール不要で利用可能。
  • ユーザーの会話、ファイル、チャンネルなどのコンテキストを理解し、パーソナライズされた支援を提供する。
  • メッセージの検索、会議のスケジュール調整、コンテンツの作成、アクションの実行などが可能。
  • Salesforceのデータやワークフローと連携し、CRMデータに基づいた回答やアクションが可能。
  • 権限やアクセス制御を尊重し、エンタープライズグレードのセキュリティと信頼性を提供する。
  • 将来的には、Agentforceやサードパーティのエージェントと連携するフロントドアとして機能する予定。

これまでのCopilotやAIアシスタントとは異なり、企業のデータ、ワークフロー、会話に接地(grounded)した「Agentic Enterprise」の実現を目指している。

出展:Salesforce Announces the General Availability of Slackbot – Your Personal Agent for Work

#GitHub Copilot SDKがテクニカルプレビューとして公開

日付:2026年1月14日

GitHub Copilot CLIにプログラムからアクセスするためのSDK「Copilot SDK」がテクニカルプレビューとして公開された。

Node.js/TypeScript (@github/copilot-cli-sdk)、Python (copilot)、Go、.NETの4つの言語向けに提供される。

主な特徴:

  • マルチターン会話: セッション履歴を維持したコンテキスト認識型の対話が可能。
  • ツール実行: モデルが会話中に呼び出せるカスタムツールを定義可能。
  • ライフサイクル管理: クライアントとセッションのライフサイクルをプログラムで制御可能。

開発者はこれらのSDKを使用して、Copilotの機能を独自のアプリケーションやワークフローに統合できる。

import { CopilotClient } from "@github/copilot-sdk";
// Create and start client
const client = new CopilotClient();
await client.start();
// Create a session
const session = await client.createSession({
model: "gpt-5",
});
// Wait for response using session.idle event
const done = new Promise<void>((resolve) => {
session.on((event) => {
if (event.type === "assistant.message") {
console.log(event.data.content);
} else if (event.type === "session.idle") {
resolve();
}
});
});
// Send a message and wait for completion
await session.send({ prompt: "What is 2+2?" });
await done;
// Clean up
await session.destroy();
await client.stop();

出展:Copilot SDK in technical preview - GitHub Changelog, Copilot SDK for Node.js/TypeScript

#TranslateGemma: GoogleがGemma 3ベースの翻訳モデル群を公開

日付:2026年1月15日

GoogleがGemma 3ベースのオープンな翻訳モデル「TranslateGemma」を公開した。55言語に対応し、4B、12B、27Bの3つのサイズで提供される。

12Bモデルは、Gemma 3 27Bベースラインよりも優れた性能を半分以下のパラメータ数で実現しており、モバイル向けの4Bモデルも12Bベースラインに匹敵する性能を持つ。2段階のファインチューニング(SFTとRL)により、Geminiモデルの知識を蒸留している。画像内のテキスト翻訳などのマルチモーダル機能も維持している。

KaggleやHugging Faceでダウンロード可能で、Vertex AIでもデプロイできる。

出展:TranslateGemma: A new suite of open translation models

#GitHub CopilotのAgentic MemoryがPublic Previewとして公開

日付:2026年1月15日

GitHubは、GitHub Copilotの「Agentic Memory」がパブリックプレビューになったことを発表した。すべての有料Copilotプランで利用可能。

主な特徴:

  • リポジトリ固有の記憶: Copilotは作業中にリポジトリに関する洞察を自動的に学習し、維持する。
  • 機能間の共有: 学習した内容はCoding Agent、Code Review、CLIなどのCopilot機能間で共有され、一貫した支援を提供する。
  • 自動管理: 記憶は28日間で自動的に期限切れとなり、情報が古くなるのを防ぐ。
  • 検証済み: 記憶された内容は使用前に現在のコードベースに対して検証される。

ユーザーは個人設定または組織のポリシー設定からこの機能を有効化でき、リポジトリ管理者は保存された記憶の確認や削除が可能。

出展:Agentic memory for GitHub Copilot is in public preview