ClaudeがClaudeを作り始めた——アンソロピックの“未来からの警告”を全部やさしく解説
SINYBLOG — ClaudeがClaudeを作り始めた——アンソロピックの“未来からの警告”を全部やさしく解説

スポンサードリンク



Tech Notes · 生成AI / 2026

当にSFみたいな話ですが——「ClaudeがClaudeを作っている」。これは実は、アンソロピック自身が2026年6月に出した大真面目な研究発表の話です。AIが自分で自分をちょっと賢くして、その賢くなったAIがまた自分を強くする……いわゆる「再帰的自己改善(RSI)」がコーディングの世界で現実になりつつある。本記事では、AI研究者・今井翔太氏が出演したYouTube番組「AI QUEST」[1]の議論を下敷きに、難しい専門用語をぜんぶ噛みくだいて、楽しく解説します。読み終える頃には「最近Claudeが使いにくい問題」の正体まで腑に落ちるはずです(所要:約12分)。

user@sinyblog:~/article 01_intro.md「ClaudeがClaudeを作る」ってどういうこと?

2026年6月、アンソロピック(Anthropic)が「なぜClaudeはここまで速く賢くなり続けているのか」を説明する研究発表を出しました。要約すると、こうです——AIの開発作業そのものを、だんだんAI自身がこなすようになっている

人間の研究者がコードを書いて、AIをちょっと改良する。これまではそうでした。でも今は、Claude Code のようなコーディングエージェントが「自分でコードを書ける」レベルに到達している。すると、こんなループが回り始めます。

pseudocode— the RSI loop(イメージ)


while improving:
    ai = current_best_model          # いまの最有力モデル
    new_code   = ai.write_code()     # AIが改良コードを書く
    better_ai  = train(new_code)     # それで少し賢いAIができる
    current_best_model = better_ai   # 主役を交代
    # ← 賢くなったAIが、また自分をもっと賢くする……
番組内の議論を筆者がコード風に図解(あくまでイメージ)/ [1]

このループが本当に閉じると、「AIの開発に人間がいらなくなる」未来が見えてくる。番組ではこれを「そして誰もいなくなった」と表現していました。怖いような、ワクワクするような話ですよね。まずはこの“ループ”の正体から見ていきましょう。

user@sinyblog:~/article 02_rsi.mdRSI(再帰的自己改善)=AI版シンギュラリティの正体

研究者の間では昔から RSI(Recursive Self-Improvement/再帰的自己改善) という言葉があります。古典的な「シンギュラリティ(技術的特異点)」と同じ意味で使われることもある、由緒正しいワードです[1]

イメージはとてもシンプル。たとえば「IQ100の人工知能」がいたとします。

  1. IQ100のAIは、ちょっと賢いIQ101のAIを作れる。
  2. IQ101のAIなら、たぶんIQ102も作れる。
  3. IQ102は103を……と繰り返すと、いつのまにかIQ1万、10万へ。

「自分を強くする → 強くなった自分がまた自分を強くする」が無限に回る。これがRSIです。番組の今井氏は、研究者の本音をこう打ち明けていました。

人間がボトルネックになっている——むしろ人間がAI開発に入っていることが“制約”になる。AIが100→101→102…と作っていく方がいいに決まっている。多くの研究者がそこを目指してきたと思います。

今井翔太 氏(番組内発言の要約)/ [1]

用語ミニ解説:シンギュラリティ

AIが人間の知能を超え、自分自身を加速度的に改良し始める“転換点”のこと。長らくSF的・思弁的な概念でしたが、今回アンソロピックが「割と真面目な文脈」で取り上げたことが話題になりました。

user@sinyblog:~/article 03_numbers.md数字がエグい:AIはもう「16時間ぶっ通し」で働く

「自己改善が進んでいる」と言われても、抽象的でピンと来ませんよね。そこで番組が紹介していた“具体的な数字”が衝撃的でした。

  • アンソロピックのエンジニアが書くコード量は2025年までの平均の約8倍に。
  • AI自身が長時間ぶっ通しで働けるようになっている。

特にわかりやすいのが、AIが「どれくらい長いタスクを任せられるか」を示す“時間地平線(time horizon)”という指標です。これは評価機関 METR が測っているもので、主にソフトウェア(コーディング)タスクでの話。年代ごとに並べると、その伸びがよく分かります。

モデル(時期) こなせるタスクの長さ たとえると…
Opus 3(2024年) 約4分 「論文の表を1つ作れるかな」程度
Sonnet 3.7 約1時間半 ちょっとした実装タスク
Opus 4.6 約12時間 連続 研究の予備実験ひと塊り
Mythos(プレビュー) 16時間以上 METRの計測上限を突破

さらに恐ろしいのが伸びるスピード。当初は「7か月で2倍」と言われていたのが、いまや「約4か月で2倍」に加速。当時の試算で「2028〜2031年ごろには1か月かかる作業をAIがこなす」とされていたのが、ペースアップで前倒しになりつつある、という話です[1]

読むときの注意

これらの数字は「評価しやすいソフトウェア(コーディング)タスク」での計測です。番組でも強調されていた通り、あらゆる分野にそのまま当てはまるわけではありません。「16時間働ける=何でも16時間こなせる」ではない点に注意。

user@sinyblog:~/article 04_why_coding.mdなぜ“コーディング”だけが突出して伸びるのか

「じゃあなんでコーディングばっかり?」と思いますよね。理由は大きく2つあります。

  1. 評価がしやすい:コードは「動く/動かない」「テストが通る/通らない」で客観的に採点できる。性能を測りやすい=改善のサイクルを回しやすい。
  2. そもそもAI自身がコードで作られている:AIを強くする作業の中心がコーディング。だからコーディングを先に自動化できれば、その後のAI開発が“やりたい放題”になる。

逆に言えば、世の中の仕事すべてでRSIが起きているわけではありません。今井氏は「意外と世の中の仕事は、そんなに高い知能で実行されているわけじゃない」とも指摘していて、コーディングで超人的になったからといって他の全タスクに即転用できるわけではない、という冷静な見方も示しています[1]

ここがミソ

「AIを作る作業=コーディング」を真っ先に自動化する——これは人工知能開発において、ものすごく大きな意味を持つ“急所”なんです。だからこそ各社、ここに命をかけています。

user@sinyblog:~/article 05_scenarios.mdアンソロピックが描いた「3つの未来」

今回の発表で、アンソロピックは未来のシナリオを3つ提示しました。

シナリオ 内容 ざっくり言うと
① 頭打ち どこかでAIの進化が止まる 「意外とここで終わるかも」
② 人間が舵取り 人間が研究の方向を決め、AIが大量に実行する(今の延長) 「今に近い世界」
③ フルRSI AIがAIをまるごと作り、自己改善が本格化 「ループが閉じる未来」

番組の今井氏の見立ては「長期的には③になる」。ただし、ここで重要な“ブレーキ”の話が出てきます。

昔は「AIはプログラムの塊なんだから、自己改善は超高速で進む」と思われていました。ところが実際にフタを開けると、AIを賢くする鍵は学習データの量とGPU(計算資源)——いわゆるスケーリング則の世界。途中に「とんでもない計算リソースを食う学習ステップ」が必ず挟まるため、みんなが想像するほど爆発的には伸びないのでは、というのが今井氏の現実的な読みです[1]

user@sinyblog:~/article 06_warning.md「未来からの警告」と“後ろの橋を落とす”批判

それでもアンソロピックは慎重です。今回の発表では、こんな主旨のことを述べています。

RSIのような重大な影響を持つAIについては、社会制度やアラインメント(安全性)の研究が追いつく時間を確保するため、開発を遅らせたり一時停止できたりする選択肢が世界には必要だ。1社だけでやっても意味がない。みんなでやりましょう。

アンソロピックの発表趣旨(番組での紹介を要約)/ [1]

これ、2023年に話題になった「Pause AI(開発を一時停止しよう)」運動を思い出させる既視感があります。今回はそれを最先端を走るアンソロピック側から言い始めた、というのがポイント。番組では、こう表現していました——「みんながまだ後方にいる中、アンソロピックだけが先の景色まで走っていって『こっちはこうだよ』と警告している」。タイトルの“未来からの警告”はここから来ています。

よくある批判:“後ろの橋を落とす”

「アンソロピックは自分たちだけ先に走っておいて、後続が追いつけないように『規制が必要だ』と叫んでいる(=後ろの橋を落としている)」という批判は根強くあります。実際、同社は5月末に巨額の資金調達とIPO申請を発表しており、「商業的な思惑もあるのでは」という見方も。理念と商売、両方が混ざっているのが現実、というのが番組の結論でした[1]

user@sinyblog:~/article 07_alignment_tax.mdOpusが使いにくくなった謎=アラインメント税

ここからが、Claudeユーザーにとって一番“刺さる”話。「ベンチマークではどんどん強くなっているのに、Opus 4.7以降、なんだか使い心地が微妙……」という声、ありますよね。今井氏はこの謎を、大きく2つの角度から説明しています[1]

① そもそもベンチマークが追いついていない。 今のベンチマークは、ユーザーが本当に重視する“実用性能”を測りきれていない。だから「数字は高いのに体感は微妙」が起きる。

② アラインメント税(Alignment Tax)。 これが核心です。

アラインメント税とは?

アラインメント=AIの倫理調整・出力の安全調整のこと。安全性を担保しようとすると、意図せず別の性能が下がってしまう——この“代償”を昔から研究者は「アラインメント税」と呼んできました。安全のために払う“税金”のイメージです。

今井氏の推測はこうです。アンソロピックは Mythos のリリースに向けた“練習”として 4.7・4.8 を出している。Mythos級の強力な「脆弱性発見能力」を安全に出すには、その能力を抑え込むアラインメント調整が要る。ところが——

本当は「脆弱性を見つける能力」だけをピンポイントで抑えたいのに、それはプログラミング能力と地続き。結果、全体的なプログラミング能力まで道連れで下がってしまっているのでは。サイバー攻撃能力だけを都合よく弱体化する、なんてことは多分できない。

今井翔太 氏(番組内発言の要約)/ [1]

つまり「安全性を追求するあまり、本来の性能を出せない状態」になっている可能性がある、と。番組では「4.6が一番ちょうど良かった」という体感も語られていました。Mythosの“調整版”が近いうちに出るとみられ、リリース直後は「さすが高性能!」と盛り上がるものの、ユーザーが実際にClaude Codeで使い込むと「あれ、ここで失敗するぞ」という違和感がまた出るのでは——という、なかなかシビアな予測です。

user@sinyblog:~/article 08_mythos.md最凶AI「Mythos」——1万件の脆弱性を見つけた怪物

そして登場、話題の Mythos(ミュトス)。4月に初登場して以来、AI界隈で「最凶」と語られ続けている怪物級モデルです。当初は 「プロジェクト Glasswing」 として、一部の政府機関やITインフラ企業など 約50組織 に限定公開されていました。

その成果がエグい。先月発表された内容では、1万件以上のセキュリティ脆弱性を発見。サードパーティのセキュリティ企業やインフラ企業による独立評価も出ていて、今井氏いわく「これは(一般解放したら)まずいことになるぞ、というアンソロピックの当初の主張は妥当だった」。

特に印象的だった成果として挙げていたのが、macOSの脆弱性を突けるかもしれない、という結果。「全世界で何千万・何億人が使うOSにそれだけ影響力があるなら、金融システムの脆弱性くらい見つけるだろう」とコメントしていました[1]

Mythosだけじゃない

OpenAIやGoogleも入った、AIの脆弱性攻撃能力を評価する論文「Exploit Gym」も登場。番組では「実はGPT-5.5も相当すごい」とのこと。想定ルートでセキュリティ突破を達成できたモデルとして、純粋に高スコアだったのが GPT-5.5 と Mythos。ただし全体スコアでは Mythos がより強い、という評価でした。

6月に入って「プロジェクト Glasswing」は拡大。アクセス権が 50組織 → 15か国以上・150組織 へ広がり、日本政府や3つのメガバンクなども参加。参加組織のコードベースを総攻撃した想定で「1億人以上に影響を及ぼす規模」だといいます。サイバーセキュリティが、AIの中心的な話題に急浮上したことを象徴する動きです。

user@sinyblog:~/article 09_biorisk.mdサイバーの次はバイオ:勝手に上がる危険な能力

もう一つ、シリコンバレーで話題になっているのが バイオリスク(生物兵器のリスク)。デミス・ハサビス、サム・アルトマン、ダリオ・アモデイら“AI界のオールスター”が名を連ねた公開書簡が出ました[1]

ここで一番おさえたい、ちょっと怖いポイントがこれ。

AI開発者は、生物兵器を作る能力を“上げよう”とはしていない。なのに——モデルを賢くしていくと、そういう能力は勝手に上がってしまう。生物学の博士号を持つ人が、その研究をしていなくても“やろうと思えばできてしまう”のと同じこと。

番組内の議論を要約 / [1]

サイバーの脆弱性発見能力と同じ構図です。「プログラミング能力を上げ続けたら、狙ってもいないのにサイバー攻撃能力まで上がってしまった」——これがバイオの分野でも起きる、というわけ。

救いはどこ?

バイオの場合、AIが出せるのは「合成手順の説明」まで。実際に危険物を作るには物理的な薬品や“ウェットラボ(実験室)”が要ります。だから、合成サービスやラボの注文をスクリーニング(審査)する仕組みを整えれば歯止めになる、というのが書簡の趣旨。しかもバイオ規制は、コーディングなど一般ユーザーのユースケースと衝突しにくいので、“ここだけ抑える”がやりやすい、という指摘もありました。

user@sinyblog:~/article 10_microsoft.mdMicrosoftも参戦&「全部ローカル化」が難しい理由

番組の最後は最新ニュース。開発者会議「Microsoft Build」で、Microsoftが独自開発のAIモデル(MAIシリーズ)を本格的に打ち出しました。最先端性能ではGPTやClaudeに及ばないものの、研究者からは大歓迎だったそうです。理由が面白い。

MAIが“研究者にうれしい”わけ

多くの「オープンモデル」は、実は学習段階で何をしているか不透明(他モデルの出力を蒸留=コピーしている疑いなど)。一方MAIは、他モデルの生成データに頼らず、ちゃんとしたデータだけを使い、学習手順も公開している。「ズルをしていないモデル」として、何が性能に効くのかを研究する材料になる——だから貴重なんです。

そしてもう一つの注目テーマが「ローカルAI」。NVIDIAは、PCで巨大モデルを動かせる構想(RTX世代の新ハード)を打ち出し、ジェンスン・フアンCEOは「一家に一台 NVIDIA + エージェント」の世界を強く意識しています。でも今井氏は、最近の研究を踏まえて「何でもかんでもローカル化できるわけではない」と釘を刺します。

  • パラメータ数 ≒ 知識量。最近のモデルを見ると、モデルを小さくしても推論能力は意外と保たれるが、知識系の性能はガツンと落ちる。
  • つまりPCに収まる小型ローカルモデルは「賢く考える」はできても「物知り」ではいられない可能性が高い。
  • 仕事で使うには知識量が要る → ローカル化が万能とは限らない(RAGや巨大コンテキストで補う手はあるが)。

加えて、生成AIの推論コストが想像以上に高い(リソースを食いすぎる)ことも各所で表面化。「小さくできるはず」という当初の楽観は、研究的にはむしろ後退しつつある、というのが今のリアルです[1]

user@sinyblog:~/article 99_summary.mdまとめ

盛りだくさんでしたが、ここだけ持ち帰れば大丈夫、という3点に集約します。

  1. RSI(再帰的自己改善)はコーディングの世界で現実になりつつある。AIがAIを作るループが回り始め、時間地平線は「約4か月で2倍」のペースで伸びている。ただし計算資源という“ブレーキ”があるため、爆発的ではない可能性も。
  2. 「Opusが使いにくい問題」の有力な犯人はアラインメント税。Mythos級の脆弱性発見能力を抑え込む調整が、プログラミング能力まで道連れにしている——という見立て。安全と性能のトレードオフは、当面の最大テーマ。
  3. 主戦場はサイバー&バイオの安全性へ。Mythosは1万件超の脆弱性を発見し、各国150組織へ拡大。賢くすると危険な能力も“勝手に上がる”からこそ、業界横断で歯止めを設ける動きが加速している。

「ClaudeがClaudeを作る」は、もはや比喩ではなく、半分は現在進行形の現実。次にあなたがClaude Codeを動かすとき、その裏側でAIがAI自身を磨き続けている——そう思うと、ターミナルの景色が少し違って見えるかもしれません。

本記事は YouTube番組「AI QUEST」(出演:今井翔太 氏)の動画トランスクリプトを 一次情報として読み込み、運営者(現役 IT エンジニア・15 年以上の業界経験)が要約・編集・構成しています。番組は専門家による議論・解説であり、一部に出演者個人の推測や私見を含みます。モデル名やバージョン・数値は収録時点(2026年6月)の情報です。最新情報は Anthropic 公式ニュース などをご確認ください。

おすすめの記事