編集

Claude Code、GitHub PR向けマルチエージェントCode Reviewをリサーチプレビュー公開

Claude Codeに、GitHubのプルリクエスト(PR)ごとにエージェントのチームを割り当て、浅い確認では拾いにくい不具合まで踏み込む「Code Review」が追加された。Anthropic社内のPRレビューと同型の多段レビューを、リサーチプレビューとしてTeamおよびEnterpriseプラン向けに提供。

エンジニアあたりのコード出力が1年で約200%増という前提で、レビューがボトルネック化し、多くのPRが「流し読み」止まりになりがちだという課題への回答。既存のオープンソースのClaude Code GitHub Actionより手厚い深さを狙うオプションで、GitHub Action自体は引き続きオープンソースのまま利用可能。

Anthropic社内では、実質的なレビューコメントが付いたPRの割合が16%から54%に増えたと公表。PRの承認は人間の判断のままで、自動承認は行わない。

PRがオープンされると複数エージェントが並列でバグ候補を探索し、疑いを検証して偽陽性を減らし、重大度でランク付け。PR上には高シグナルな概要コメント1件と、該当箇所へのインラインコメントが付く。変更規模に応じてエージェント数と読み深さを調整し、社内テストでは平均レビュー時間は約20分。

社内運用では、大規模PR(変更1000行超)では84%に検出が付き平均7.5件の指摘、小規模(50行未満)は31%で平均0.5件。エンジニアが指摘を誤りとマークした割合は1%未満。1行の本番サービス変更がルーチンに見えても、認証を壊す重大問題としてフラグが立ち、マージ前に修正された例が紹介されている。早期アクセス顧客側では、TrueNASミドルウェアのZFS暗号化リファクタPRにおいて、隣接コードに潜んでいた型不一致により暗号鍵キャッシュが毎回黙って消える、といった既存不具合の指摘例が挙げられている。

課金はトークン使用量ベースで、同社の公表ではレビューあたりおおむね15〜25ドル程度。PR規模と複雑さに比例。管理者向けに月次の組織上限、リポジトリ単位での有効化、分析ダッシュボード(レビューしたPR数、受容率、総コスト)が用意されている。

利用開始は、管理者がClaude Codeの設定でCode Reviewを有効化し、GitHub Appをインストールして対象リポジトリを選ぶ。開発者側は追加設定なしで新規PRに自動実行。

#参考文献

編集