GLM-5.2とは何か：Z.aiが正式発表した7530億パラメータのオープンモデル。Claude Opus 4.7超えの実力を事実で整理

2026年6月22日 2026年6月22日

siny

SINYBLOG — GLM-5.2とは何か：Z.aiが正式発表した7530億パラメータのオープンモデル。Claude Opus 4.7超えの実力を事実で整理

1 中国発の新モデルGLM-5.2とは何か。

Z.ai Official · 2026/06/17 正式発表

中国発の新モデルGLM-5.2とは何か。

中国のAI企業 Z.ai が、新しい大規模言語モデル「GLM-5.2」を正式発表しました。一部のテストで Claude Opus 4.7 を上回り、誰でもダウンロードできるオープンモデルだ——という見出しが話題です。何がどうすごいのか。憶測を足さず、報じられた事実だけを約8分で整理します。

中国の AI 企業「Z.ai（ゼットエーアイ）」が、日本時間 2026年6月17日に新しい大規模言語モデル（人間の言葉を扱う大型のAIモデル）GLM-5.2 を正式発表しました。注目されているのは、(1) 複数のテストで OpenAI の GPT-5.5 を上回り、Claude Opus 4.8 に迫るスコアを出したこと、(2) 各種ベンチマークで Claude Opus 4.7 を上回ったこと、(3) それでいて 誰でも無料でダウンロードできるオープンモデルであること、の3点です。本記事は、報道で確認できた事実を一次情報に沿って淡々と並べ、わからない部分は「わからない」と明記します。^[1]

0億
パラメータ数（モデルの規模）
0万
対応コンテキスト（入力トークン）
0位
Design Arena コーディング（報道ベース）

user@sinyblog:~/article ❯ 01_digest.md90秒ダイジェスト：GLM-5.2を一言で

細かい話に入る前に、要点を3つだけ。忙しい人はここだけ読めば「GLM-5.2が何で、なぜ話題なのか」が分かります。

正体：中国の AI 企業 Z.ai が 2026年6月17日に正式発表した、パラメータ数 7530億・コンテキスト長 100万トークンの大規模言語モデル。
すごい点：複数のベンチマーク（AIの性能を測る共通テスト）で GPT-5.5 を上回り、Claude Opus 4.8 に迫るスコア。各種テストで Claude Opus 4.7 を上回り、コーディング系の評価では世界トップクラスに食い込んだと報じられています。
最大の特徴：これだけの性能を持ちながら、MIT License のオープンモデルとして Hugging Face で公開され、誰でも無料でダウンロードして使える点。

この記事のスタンス

ベンチマークの「順位」や「○○超え」という話は、測り方・時期・テスト内容によって結果が変わります。本記事は報道で確認できた事実だけを紹介し、数値スコアそのものが公表されていない部分はその旨を明記します。誇張せず、過小評価もせず、事実を並べるのが狙いです。

user@sinyblog:~/article ❯ 02_whois.md開発元 Z.ai と「2026年6月17日正式発表」

GLM-5.2 を開発・公開したのは、中国の AI 企業 Z.ai（ゼットエーアイ）です。GLM というモデル名は同社が継続的に開発しているシリーズで、今回の 5.2 はその最新版にあたります。発表は日本時間の2026年6月17日に行われ、同日から実際に利用できる状態で公開されました。^[1]

ニュースとして注目を集めた理由は、性能の高さもさることながら、「最新の高性能モデルをクローズド（非公開）ではなくオープンに出した」という公開スタイルにあります。GPT や Claude のように API 経由でしか使えないモデルとは違い、GLM-5.2 はモデル本体そのものが配布されているため、性質がだいぶ異なります（詳しくは第7章）。

user@sinyblog:~/article ❯ 03_spec.mdスペックを平易に：7530億パラメータと100万トークン

公表されている主なスペックは2つです。どちらも専門用語なので、まず言葉の意味から押さえましょう。

項目	GLM-5.2 の値	これは何を意味するか
パラメータ数	7530億	モデルの「規模」を表す数。おおまかに言えば、AIが学習で蓄えた知識・判断の調整つまみの数。大きいほど大型のモデル。
コンテキスト長	100万トークン	一度に読み込める入力の量。トークンは単語より少し細かい文字のかたまり。100万トークンは、書籍数冊ぶんの文章をまとめて渡せる規模。

パラメータ数 7530億は、近年の最上位クラスのモデルに並ぶ大きさです。100万トークンのコンテキスト長は、長い仕様書やコードベース全体、長時間の作業ログをまとめて扱えることを意味します。後述する「長時間実行タスクが得意」という特徴とも噛み合うスペックです。

業務での活用イメージ

100万トークンのコンテキストは、たとえば「社内の長い設計ドキュメント一式をまるごと貼り付けて、仕様の矛盾点を洗い出してもらう」「数百ファイルのコードを横断して影響範囲を調べる」といった、分割せずに一気通貫で読ませたい作業で効いてきます。

user@sinyblog:~/article ❯ 04_benchmark.md「Claude Opus 4.7 を上回る」とはどういうことか

報道によれば、GLM-5.2 は次のように評価されています。いずれもベンチマーク（AIの性能を共通の基準で測るテスト）の結果として紹介されているものです。^[1]

複数のテストで OpenAI の GPT-5.5 を上回り、Claude Opus 4.8 に迫るスコアを記録した。
各種ベンチマークで Claude Opus 4.7 を上回るスコアを出した。

ここで一つ、読み解く上での注意点があります。これらは「GLM-5.2 が Opus 4.7 を上回った」という相対的な評価として報じられていますが、具体的なベンチマーク名や数値スコアそのものは記事本文には明示されていません（グラフ画像は提示されています）。つまり「上回った」という結論は確認できても、「どのテストで何点差だったか」までは、現時点の報道だけでは追えない、というのが正確なところです。

ベンチマークの数字との付き合い方

ベンチマークは「測り方・テスト項目・実施時期」で結果が変わります。特定の1テストで上回ったからといって、あらゆる用途で上、というわけではありません。GLM-5.2 の評価も、「コーディングなど一部の領域で最上位クラスに並んだ」と捉えるのが、過不足のない読み方です。

user@sinyblog:~/article ❯ 05_arena.mdArena 世界2位・Design Arena 世界1位の意味

コーディング系の評価で、GLM-5.2 は具体的な順位とともに報じられています。まず「Arena」が何かを押さえておきましょう。

Arena（旧 LMArena）とは

同じ質問を複数のAIに答えさせ、どちらの回答が良いかを人間が投票して順位をつける、対戦形式の評価サイトです。多数の投票が集まるため、実際の使い心地に近い「体感的な強さ」のランキングとしてよく参照されます。Design Arena は、その中でもデザイン・コーディング寄りのタスクに特化した評価です。

評価	GLM-5.2 の順位	上回ったとされるモデル
Arena（旧 LMArena）コーディング	世界2位	Claude Opus 4.7 / Claude Opus 4.8
Design Arena コーディング	世界1位	Claude Fable 5

注目に値するのは、Arena コーディングで Claude Opus 4.7・4.8 の両方を上回って世界2位、Design Arena コーディングでは Claude Fable 5 にも勝って世界1位とされている点です。クローズドな最上位モデルが上位を占めてきたこれらのランキングに、オープンモデルがここまで食い込んだこと自体が、今回のニュース性の中心と言えます。

user@sinyblog:~/article ❯ 06_blindtest.md人間のブラインドテストで Fable 5 を上回った例

ベンチマークの自動スコアだけでなく、人間によるブラインドテスト（どちらのモデルの回答か伏せた状態で、人が良し悪しを判断する評価）でも、GLM-5.2 が Claude Fable 5 を上回った例があると報じられています。^[1]

ここでも言葉を選ぶ必要があります。「上回った例がある」であって、「常にあらゆる場面で上回る」ではありません。AIどうしの比較は、与えるお題によって勝ち負けが入れ替わるのが普通です。とはいえ、自動ベンチマークと人間評価の両方で上位モデルと渡り合えた、という事実は、GLM-5.2 の実力を裏づける材料になっています。

user@sinyblog:~/article ❯ 07_openmodel.md「オープンモデル × MIT License」＝誰でもDLできる、の本当の意味

GLM-5.2 の一番の特徴は、性能そのものよりむしろ公開のされ方かもしれません。GLM-5.2 は MIT License のオープンモデルとして、Hugging Face（AIモデルを配布・共有する代表的なプラットフォーム）で公開されています。^[1]

用語	意味	利用者にとっての含意
オープンモデル	モデル本体（重みデータ）が配布され、自分の環境で動かせるAI。	API経由でなく、手元のサーバーや社内環境で動かせる可能性がある。
MIT License	ソフトウェアで広く使われる、制約のとても緩い許諾条件。	商用利用・改変・再配布が幅広く認められる、自由度の高いライセンス。
Hugging Face	AIモデルを配布・共有するプラットフォーム。	ここから誰でもモデルをダウンロードできる。

この組み合わせが意味するのは、「最上位クラスに迫る性能のモデルを、誰でも無料で入手し、商用を含めて比較的自由に使える」ということです。API利用料を払い続ける形のクローズドモデルとは、コスト構造もデータの扱いも前提が変わります。ニュースの見出しにある「誰でもダウンロード可能」は、この点を指しています。

業務での活用イメージ

オープンモデルは「社外にデータを出したくない案件で、社内環境（オンプレ／自社クラウド）にモデルを置いて動かす」「ライセンス費を気にせず大量のバッチ処理に回す」といった使い方と相性が良いです。ただし、これだけ大きなモデルを快適に動かすにはそれなりの計算資源（GPU）が要る点は前提になります。

user@sinyblog:~/article ❯ 08_howtouse.mdどこで動かせるか：Z.ai チャットとコーディングエージェント

ダウンロードして自前で動かす以外にも、すぐ試せる経路が用意されています。報道で挙げられている利用方法は次のとおりです。^[1]

Z.ai のチャットAIサービス：ブラウザ上の対話サービスで GLM-5.2 をそのまま試せる。
コーディングエージェントから利用：ZCode・Claude Code・OpenCode といった、コードを書く作業を任せるAIエージェントから GLM-5.2 を使う構成に対応している。

特に、Anthropic の Claude Code（ターミナル上で動くコーディング支援ツール）や、オープンソースの OpenCode といった既存のコーディングエージェントから利用できる、という点は実務的に大きな意味を持ちます。普段使っているツールの「頭脳」部分を GLM-5.2 に差し替える、という選択肢が現実的になるからです。

user@sinyblog:~/article ❯ 09_strength.md強みは「コーディング」と「長時間タスク」

報道で繰り返し強調されているのが、GLM-5.2 のコーディング性能と、長時間実行タスクへの強さです。^[1]

「長時間実行タスク」とは、一発の質問応答で終わらず、複数の手順を連続でこなし続ける作業を指します。たとえば「要件を読む → コードを書く → テストする → エラーを直す → また書く」といった工程を、AIが何十ステップも自走するような使い方です。第5章で触れた Arena・Design Arena でのコーディング上位という結果は、この強みと整合的です。

なぜ100万トークンが効くのか

長時間タスクでは、これまでの作業履歴・コード・エラーログが積み上がっていきます。第3章で見た100万トークンの広いコンテキストは、こうした「長い文脈を忘れずに持ち続ける」ために役立ちます。スペックと得意分野がきれいに噛み合っているわけです。

user@sinyblog:~/article ❯ 10_lineage.mdGLM-5.1 から GLM-5.2 へ

GLM は一度きりのモデルではなく、継続的にバージョンアップされてきたシリーズです。今回の発表でも前バージョンの GLM-5.1 への言及があり、GLM-5.2 はその系譜を引き継ぐ最新版という位置づけです。^[1]

なお、GLM-5.1 との具体的な性能差・変更点の詳細は、今回確認した報道では深く掘り下げられていません。「シリーズの最新版である」という事実までを押さえ、世代間の細かい比較は一次情報の追加を待つのが安全です。

user@sinyblog:~/article ❯ 11_unknown.mdまだ公表されていないこと（誠実な注記）

「すごい」を正しく伝えるには、「まだ分かっていないこと」も同じくらい正直に書く必要があります。今回確認した報道の範囲では、次の点は明記されていませんでした。

論点	現時点での状況
API の利用料金・価格	記事内に記載なし。コスト面はまだ判断材料が揃っていない。
個別ベンチマークの数値スコア	「上回った」という結論は示されるが、具体的な点数・差は本文に明示なし。
モデル内部の構成（MoE 等の詳細）	パラメータ数は公表されているが、内部アーキテクチャの詳細は触れられていない。
日本語性能の独立した検証	第三者による日本語タスクでの詳細な検証は、今後の登場を待つ段階。

読者へのお願い

新モデルのニュースは、発表直後ほど数字が独り歩きしがちです。本記事も含め、「報道時点での評価」であることを前提に受け取り、実際の採用判断は、公式のモデルカードや自分の用途での試用結果も合わせて行うのが安全です。

user@sinyblog:~/article ❯ 99_summary.mdまとめ

GLM-5.2 を、事実だけで3点に集約します。

正体。中国の Z.ai が 2026年6月17日に正式発表した、7530億パラメータ・100万トークン対応の大規模言語モデル。
実力。複数テストで GPT-5.5 を上回り Opus 4.8 に迫り、各種ベンチで Opus 4.7 超え。コーディング系では Arena 世界2位・Design Arena 世界1位（報道ベース）と、最上位クラスに食い込んだ。
意義。それだけの性能を MIT License のオープンモデルとして Hugging Face で公開し、誰でも無料でダウンロードできる——この「高性能 × 開放性」の同居こそが、今回のニュースの核心。

✦

一言で言えば「高性能なのに、誰でも持って帰れる」モデル
クリックすると弾みます（anime.js の spring 物理）

本記事は GIGAZINE の報道（2026年6月17日）を WebFetchでファクトチェックしながらClaude Codeで構成したうえで、運営者（現役 IT エンジニア・15 年以上の業界経験）が編集しています。ベンチマークの順位・評価はいずれも報道時点のものであり、数値スコアが公表されていない箇所はその旨を本文に明記しています。最新かつ正確な情報は、出典元の記事および Z.ai の公式発表をご確認ください。

Post Views: 724

この記事を書いた人

siny

本職ではITエンジニアを１５年ほど。ここ数年は生成AIにはまり、社内でもAI推進担当として活躍中。