GLM-5.2

399文字
2分
編集

Z.AIは長時間タスク向けのフラッグシップモデルGLM-5.2を公開した。前版GLM-5.1から長時間実行能力を大きく伸ばし、最大100万トークンのコンテキストを安定して使える設計にした。モデルウェイトはMIT LicenseでHugging FaceとModelScopeから入手でき、Z.AIのAPIやGLM Coding Plan、ZCodeデスクトップエージェントからも利用できる。

主な変更点は次のとおりである。

  • 最大100万トークンのコンテキスト(GLM-5.1は20万トークン)。コーディングエージェントの長い軌跡を想定した学習を拡大している。
  • IndexShareによるスパースアテンションの効率化。4層ごとにインデクサを共有し、100万トークン時のトークンあたりFLOPsを2.9倍削減する。
  • 推測デコード向けMTP層の改善。受理長を最大20%伸ばす。
  • 思考努力レベル(High / Max)の選択。Coding Planではピーク時3倍、オフピーク時2倍のクォータ消費(オフピークは9月末まで1倍のプロモーション)。

Z.AIの評価では、Terminal-Bench 2.1で81.0(GLM-5.1は63.5)、SWE-bench Proで62.1(58.4)と標準的なコーディングベンチで前版を大きく上回る。FrontierSWE、PostTrainBench、SWE-Marathonの3つの長時間コーディングベンチでは、いずれもオープンウェイトモデルの中で最高位となる。

#性能

モデルArtificial Analysis Intelligence Index出力速度 (tok/s)
GLM-5.2 (max)51114.5
Claude Opus 4.8 (Adaptive Reasoning, Max Effort)5663.3
GPT-5.5 (xhigh)5566.8
GLM-5.1 (Reasoning)5151.0

Intelligence IndexではOpus 4.8やGPT-5.5にわずかに及ばないものの、出力速度は比較対象の中で最も速い。

#API 価格の比較

モデル入力 ($/1M)出力 ($/1M)
GLM-5.21.44.4
Claude Opus 4.85.025.0
GPT-5.55.030.0
Gemini 3.1 Pro Preview2.012.0

入出力いずれも比較対象の中では低単価側にあり、GLM-5.1と同一料金帯である。

#参考文献