
目次
- 1 user@sinyblog:~/article ❯ 01_intro.md3分でわかる:何が起きたのか
- 2 user@sinyblog:~/article ❯ 02_fable_mythos.md「Fable」と「Mythos」——なぜ2つの名前があるのか
- 3 user@sinyblog:~/article ❯ 03_benchmarks.mdベンチマーク:SWE-Bench Pro 80.3%の衝撃
- 4 user@sinyblog:~/article ❯ 04_long_horizon.md真骨頂は「長くて複雑なタスク」
- 5 user@sinyblog:~/article ❯ 05_vision_science.md目と科学:ポケモン攻略から創薬10倍速まで
- 6 user@sinyblog:~/article ❯ 06_fallback.md安全設計の核心:危ない質問はOpus 4.8が“代打”で答える
- 7 user@sinyblog:~/article ❯ 07_three_domains.md検知される3つの領域:サイバー・バイオ・蒸留
- 8 user@sinyblog:~/article ❯ 08_mythos5_glasswing.mdClaude Mythos 5とProject Glasswing
- 9 user@sinyblog:~/article ❯ 09_pricing.md料金と提供スケジュール:6月22日までは追加費用なし
- 10 user@sinyblog:~/article ❯ 10_api.md開発者向け:APIで使うときの注意点
- 11 user@sinyblog:~/article ❯ 11_use_today.md今日から使う方法(Claude.ai / Claude Code)
- 12 user@sinyblog:~/article ❯ 12_context.md発表の文脈:あの“RSI警告”の直後だった
- 13 user@sinyblog:~/article ❯ 99_summary.mdまとめ
Anthropic Official · 2026.06.09 Release
歴代Claudeの頂点に立つモデルが、ついに一般公開されました。2026年6月9日、Anthropicが公開した「Claude Fable 5」は、これまで政府機関や一部パートナー企業しか触れなかった“Mythosクラス”のAIを、安全装置を付けて一般開放したモデルです。ほぼすべてのベンチマークでSOTA、コーディングでは前世代Opus 4.8に10ポイント以上の差。本記事では、性能・料金・「危ない質問は弱いモデルが代わりに答える」というユニークな安全設計・兄弟モデルMythos 5まで、公式発表と海外報道を突き合わせて全部わかりやすく解説します(所要:約12分)。
user@sinyblog:~/article ❯ 01_intro.md3分でわかる:何が起きたのか
まず全体像を3行でまとめると、こうなります。
- Claude Fable 5が一般公開——Anthropic史上もっとも賢いモデル。ほぼ全ベンチマークでSOTA(state-of-the-art=最先端水準)[1]。
- ただし“安全装置”付き——サイバー攻撃・生物/化学・モデル蒸留に関わる一部の質問は、Fable 5本人ではなく一段下のOpus 4.8が代わりに回答する。
- 安全装置を外した「Mythos 5」も同時発表——こちらはサイバー防御の専門家など、ごく限られたパートナー限定。
Anthropicは公式発表で、Fable 5をこう位置づけています。
Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of any model we've ever made generally available.
Anthropic公式発表(2026年6月9日)/ [1]
ポイントは「Mythos-class(Mythosクラス)」という言葉。これは単なる新バージョンではなく、「これまで一般公開できないと判断していた水準の能力を持つモデル」という意味です。つまり今回の発表は、“公開をためらうレベルのAI”を、安全装置とセットでなら出せると判断した、という宣言でもあります。
「現時点での最先端性能」を意味するAI業界の定番ワード。ベンチマーク(共通テスト)で首位のスコアを取ると「SOTAを達成した」と言います。Fable 5は「テストしたほぼすべてのベンチマークでSOTA」と主張されており、報道ではOpenAIやGoogle DeepMindの競合モデルを全ベンチマークで上回ったとされています[4]。
user@sinyblog:~/article ❯ 02_fable_mythos.md「Fable」と「Mythos」——なぜ2つの名前があるのか
今回の発表でいちばん混乱しやすいのが命名です。整理しましょう。
| Claude Fable 5 | Claude Mythos 5 | |
|---|---|---|
| 中身のモデル | まったく同じ(same underlying model) | |
| 安全装置 | フル装備(3領域で検知) | 一部解除(サイバー領域など) |
| 使える人 | 一般ユーザー(本日から) | Glasswingパートナー限定 |
| 想定用途 | 一般利用すべて | サイバー防御・重要インフラ保護 |
つまりFableとMythosは“同じ脳みそ”の双子で、違いは安全装置の設定だけ。「Fable(寓話)=物語として安全に語れる形にしたもの」「Mythos(神話)=原典そのまま」という命名は、なかなか示唆的です。
Mythosという名前に聞き覚えがある方もいるはず。AnthropicはこれまでMythosをプレビュー版として政府機関・重要インフラ事業者に限定提供しており、日本では日立製作所がアクセス権を得たことが話題になりました(詳しくは過去記事で解説しています)。今回の発表は、その系譜の最新版を「一般向けFable」と「専門家向けMythos」に分けて出した、という構図です。
よくある「小型化して安全にした廉価版」ではありません。Fable 5の中身はMythos 5と同一で、危険になり得る出力だけを検知してブロック(正確には別モデルに交代)する方式。だから通常用途では一切性能が落ちません。
user@sinyblog:~/article ❯ 03_benchmarks.mdベンチマーク:SWE-Bench Pro 80.3%の衝撃
では実力を数字で見ていきます。海外メディアThe Decoderがまとめた主要スコアがこちら[2]。
| ベンチマーク | Fable 5 | Opus 4.8 | GPT 5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| SWE-Bench Pro(実務コーディング) | 80.3% | 69.2% | 58.6% | 54.2% |
| FrontierCode(Cognition社の高難度評価) | 29.3% | 13.4% | 5.7% | — |
注目すべきは差の付き方です。SWE-Bench Proで前世代Opus 4.8に+11.1ポイント、競合GPT 5.5には+21.7ポイント。さらに高難度のFrontierCodeでは、Opus 4.8の2倍以上、GPT 5.5の5倍以上のスコアです。簡単な問題はどのモデルも解けるようになった今、難しい問題ほど差が開く——フロンティアモデルの実力差は、こういう“上限の高さ”に現れます。
コーディング以外でも、Hebbia社の金融分析ベンチマークで「既存モデル中で首位のスコア」、文書ベースの推論やチャート・表の読み取りで大幅な性能向上が報告されています[1]。早期アクセスした企業からの声も具体的です。
- Cursor:「これまでのモデルでは手が届かなかった長時間タスク(long-horizon problems)を解けるようになった」
- GitHub:「自律性と信頼性が過去のベンチマークを超えた」
- Hex:「複雑で長時間の分析タスクのコアベンチマークで初めて90%を達成」
- 楽天:「最大エフォート設定での自己検証能力が、高度な自動運用を可能にしている」[3]
user@sinyblog:~/article ❯ 04_long_horizon.md真骨頂は「長くて複雑なタスク」
Anthropic自身が、Fable 5の強みをこう要約しています。
The longer and more complex the task, the larger Fable 5's lead over our other models.(タスクが長く複雑になるほど、Fable 5と他モデルの差は大きくなる)
Anthropic公式発表 / [1]
公式発表によると、Fable 5とMythos 5は「過去のどのClaudeよりも長時間、自律的に働き続けられる」モデルで、長時間タスクでは数百万トークンを処理し続けた実績が報告されています[1]。
面白いのが、カードゲーム「Slay the Spire」を使った実験。ファイルベースの永続メモリ(自分用のメモ帳)を与えたところ、Fable 5は自分でメモを取り、それを次の判断に活かすことで、Opus 4.8と比べて最終局面への到達回数が3倍になったそうです。「長く働ける」だけでなく「長く働くためにメモを取る」——人間の仕事の進め方にどんどん近づいています。
AIの進化を測る注目指標に「時間地平線(どれだけ長いタスクを任せられるか)」があります。METRの計測ではこの指標が約4か月で2倍のペースで伸びており、Fable 5はその最前線。数分のタスクしかこなせなかった2024年から、丸一日級のタスクを自走する2026年へ——詳しくはRSI(再帰的自己改善)の解説記事をどうぞ。
user@sinyblog:~/article ❯ 05_vision_science.md目と科学:ポケモン攻略から創薬10倍速まで
Fable 5は「ビジョン(画像理解)でもSOTA」を謳っており、公式発表のデモが粒ぞろいです[1]。
- ポケモン ファイアレッドを“目だけで”クリア——最小限の構成で、画面を見るだけ(vision-only harness)でゲームを攻略。座標データやメモリ読み取りのチートなし。
- スクリーンショットからWebアプリのソースコードを再構築
- 科学論文の図から数値を精密に抽出、CADデザインの自動生成、軌道計算に基づく日食予測まで。
そして科学研究。ここはMythosクラスの本領で、数字がかなり攻めています。
| 分野 | 実績 |
|---|---|
| タンパク質設計 | 設計プロセスを10倍高速化。14標的中9つが「創薬の有力候補」と評価 |
| 分子生物学 | 生成した仮説について、科学者の約80%がOpusクラスのものよりMythos 5を選好。1つは独立機関が実験で検証済み |
| ゲノム研究 | 138種・数百万細胞のデータを処理。Science誌掲載モデルの1/100のサイズで同等以上の性能のモデルを構築 |
「AIがコードを書く」の次は「AIが研究する」フェーズに入りつつある——そんな実感のわく内容です。ただし、まさにこの“科学への強さ”こそが、次章で説明する安全装置が必要になった理由でもあります。
user@sinyblog:~/article ❯ 06_fallback.md安全設計の核心:危ない質問はOpus 4.8が“代打”で答える
ここが今回の発表でいちばんユニークな部分です。従来のAIの安全対策といえば「回答を拒否する」が定番でした。Fable 5は違うアプローチを取ります。
- ユーザーの質問を、安全分類器(safety classifiers)が常時チェック。
- サイバーセキュリティ・生物/化学・蒸留に関わる「狭い範囲のトピック」を検知すると——
- Fable 5ではなく、一段能力の低いOpus 4.8が代わりに回答する(フォールバック)。
- フォールバックが起きたことはユーザーに必ず通知される。
つまり「答えません」ではなく「危険な作業を完遂できるほど賢くないモデルが答えます」という設計。CNBCはこれを「Opus 4.8にはこれらの高リスク要求を完遂する推論能力がない」と説明しています[4]。回答がゼロになるわけではないので、正当な目的のユーザー(セキュリティを学ぶ学生など)への影響を最小化しつつ、悪用の上限だけを切り下げる狙いです。
気になる発動頻度は、公式いわく「平均してセッションの5%未満」。95%以上のセッションでは、フォールバックなしのフルパワーFable 5が使えます。さらにAnthropicは「誤検知(false positives)を減らすため、セーフガードを継続的に改善していく」と明言しています[1]。
該当トピックに触れたセッションでは、回答品質が実質Opus 4.8相当になります。セキュリティ研究や生命科学など該当分野の専門職の方は、後述のMythos 5 / trusted access programが正規ルートです。「なんか今日のClaude、切れ味が鈍い…?」と思ったら、フォールバック通知が出ていないか確認を。
ジェイルブレイク(脱獄)対策も数字付きです。公開前に外部レッドチームと協力して1,000時間以上のテストを実施し、セーフガードを一律に突破できる「ユニバーサル・ジェイルブレイク」は発見されなかったとのこと[3]。
user@sinyblog:~/article ❯ 07_three_domains.md検知される3つの領域:サイバー・バイオ・蒸留
セーフガードが見張っているのは次の3領域です。それぞれ「なぜFable 5だと危ないのか」とセットで理解すると腑に落ちます。
① サイバーセキュリティ。脆弱性の発見・悪用など攻撃的なサイバータスク全般。Mythosプレビュー版は既に実環境で1万件規模の脆弱性を発見した実績があり、この能力が攻撃側に渡ると深刻な被害につながります。Anthropicの内部評価では、セーフガードは「Fableに(攻撃タスクの)進捗を一切させない」水準とされています[1]。
② 生物学・化学。Mythosクラスのモデルはタンパク質設計タスクで「タンパク質専用に開発された高度なモデルを上回った」と評価されており、悪用されれば生物兵器設計などのリスクに直結します。このため生物学・化学関連のリクエストの多くが対象になります。
③ 蒸留(Distillation)。これは毛色が違って、競合他社対策です。蒸留とは、強いモデルの出力を大量に集めて別のモデルに学習させ、能力をコピーする手法。Fable 5の出力からMythos級の能力が流出するのを防ぐ、いわば“モデルの海賊版対策”です。
Mythosクラス以上のモデルでは、トラフィックを30日間保持する運用が導入されました(モデル学習には未使用・人間のアクセスはログ記録・30日後にほぼすべて削除)[1]。悪用パターンの検知が目的ですが、機密データを扱う企業は把握しておくべき変更です。
user@sinyblog:~/article ❯ 08_mythos5_glasswing.mdClaude Mythos 5とProject Glasswing
では、サイバー防御の専門家が脆弱性ハンティングにフル能力を使いたい場合は? そのための回答がClaude Mythos 5です。
前述のとおり中身はFable 5と同一で、サイバーセキュリティ領域のセーフガードが解除されています。サイバー評価ベンチマーク「ExploitBench」では78%を記録——Mythosプレビュー版の69%、Opus 4.8の40%から大幅な伸びです[2]。
提供先は当面、米国政府と連携して運営されるProject Glasswingのパートナー(サイバー防御組織・重要インフラ事業者)に限定されます。既存のMythosプレビューユーザーはMythos 5にアップグレード可能。そして今後の計画として、Anthropicは2段階の拡大を予告しています[1]。
- trusted access program(信頼アクセスプログラム)——申請ベースで防御的サイバーセキュリティ業務向けにMythos 5へのアクセスを開放。
- 生物医学研究者向けプログラム——医学研究者に生物学セーフガードを解除したアクセスを提供(サイバーのセーフガードは維持)。
「全開放はしない。でも、正当な専門家が正当な用途で使う道は用意する」——リスクと有用性を二択にしない設計思想が一貫しています。Project Glasswingの背景や日立の参画についてはこちらの記事で詳しく解説しています。
user@sinyblog:~/article ❯ 09_pricing.md料金と提供スケジュール:6月22日までは追加費用なし
API料金は以下のとおり。Opus 4.8のちょうど2倍ですが、Mythosプレビュー時代と比べると半額以下になりました[2]。
| モデル | 入力(100万トークン) | 出力(100万トークン) | コンテキスト |
|---|---|---|---|
| Claude Fable 5 | $10 | $50 | 100万トークン |
| Claude Opus 4.8 | $5 | $25 | 100万トークン |
| Claude Sonnet 4.6 | $3 | $15 | 100万トークン |
個人ユーザーに直結するのが提供スケジュールです[1][3]。
- 6月9日〜22日:Pro / Max / Team / Enterpriseプランに追加費用なしで含まれるお試し期間。
- 6月23日以降:利用には使用クレジットが必要に。
- その後:供給キャパシティが確保でき次第、通常のサブスクリプションプランに戻す予定。
Anthropic自身が「Fable 5への需要は非常に高く、予測が難しい」と認めており、段階的な提供はその対策です。いま課金中のProユーザーなら、6月22日までは追加費用なしでFable 5を試せる——これは触っておくしかありません。
user@sinyblog:~/article ❯ 10_api.md開発者向け:APIで使うときの注意点
API版は本日から全面公開。モデルIDは claude-fable-5、コンテキストウィンドウは100万トークン、最大出力は128Kトークンです[6]。最小構成はこちら。
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-fable-5", # Fable 5のモデルID
max_tokens=16000,
thinking={"type": "adaptive"}, # アダプティブ思考(推奨)
output_config={"effort": "high"},
messages=[{"role": "user", "content": "こんにちは、Fable 5!"}],
)
for block in response.content:
if block.type == "text":
print(block.text)Opus 4.7 / 4.8からの移行で注意すべきAPI仕様をまとめます[6]。
- thinkingはadaptiveのみ。旧来の
budget_tokens指定は400エラー。さらにFable 5固有の罠として、明示的なthinking: {"type": "disabled"}も400エラーになります(Opus 4.8では許容)。思考をオフにしたい場合はthinkingパラメータ自体を省略します。 - サンプリングパラメータ廃止。
temperature/top_p/top_kは送ると400エラー(Opus 4.7以降と同じ)。 - フォールバック/拒否のハンドリング。セーフガードに関わる応答では
stop_reason: "refusal"とともにstop_detailsオブジェクトが返り、categoryフィールドで"cyber"/"bio"といった分類が取得できます。本番アプリではこの分岐を実装しておきましょう。
if response.stop_reason == "refusal" and response.stop_details:
print(f"カテゴリ: {response.stop_details.category}") # "cyber" / "bio" など
print(f"説明: {response.stop_details.explanation}")プラットフォーム展開も初日から広く、GitHub Copilot[5]やAmazon Bedrock[7]でも同日に利用可能になっています。
user@sinyblog:~/article ❯ 11_use_today.md今日から使う方法(Claude.ai / Claude Code)
開発者でなくても使い方は簡単です。
Claude.ai(Webやアプリ)の場合:モデルセレクタから「Fable 5」を選ぶだけ。Pro / Max / Team / Enterpriseプランで順次ロールアウト中です。表示されない場合は少し待ちましょう(段階的展開のため)。
Claude Codeの場合:/model コマンドでモデル一覧を開き、Fable 5を選択します。
/model
# 一覧から「Fable 5」を選択
# → "Set model to Fable 5 and saved as your default for new sessions"実はこの記事の調査・執筆作業も、Claude Code上でFable 5に切り替えて行っています。体感として顕著なのは、長いリサーチ→執筆→投稿のような多段タスクで途中の迷いが減ること。「長く複雑なタスクほど差が開く」という公式の売り文句は、使ってみると確かに実感があります。
性能差は簡単な質問ではほぼ見えません。お試し期間中に実力を測るなら、(1) 大きめのコードベースのリファクタリング、(2) 複数ソースを突き合わせる調査レポート、(3) 図表だらけのPDF読解——など“今までのモデルが息切れしていたタスク”をぶつけるのがおすすめです。
user@sinyblog:~/article ❯ 12_context.md発表の文脈:あの“RSI警告”の直後だった
最後に、この発表のタイミングについて。TechCrunchが皮肉まじりに指摘しているのですが、Fable 5の公開は、Anthropicが「AIは危険になりすぎている。フロンティアAI開発には協調的なブレーキが必要だ」と警告を発した、わずか数日後でした[3]。
当ブログでも解説記事を書いたとおり、Anthropicは2026年6月初旬に「ClaudeがClaudeを作る」再帰的自己改善(RSI)の進展と、それに伴うリスクを公表しています。「危険だと警告した会社が、その水準のモデルを一般公開するのか」というツッコミは当然あるでしょう。
ただ、両者は矛盾というより同じ戦略の表裏と見るのが正確だと思います。Anthropicの一貫した主張は「強力なAIは出てくる。問題は誰が・どんな安全装置と共に出すか」。フォールバック機構、1,000時間超のレッドチーム、Glasswing限定のMythos、trusted access program——今回の発表は「強いモデルを安全に出す方法」の実装例を世に問うた、とも読めます。アライメント評価でも「Mythos 5の不整合な振る舞いの水準は低く、Opus 4.8と同程度」と報告されています[1]。
この設計が成功とみなされるか、それとも「結局は競争圧力に屈した」と評価されるか。AI業界全体の安全基準を左右する試金石になりそうです。
user@sinyblog:~/article ❯ 99_summary.mdまとめ
Claude Fable 5の要点を3つに絞ります。
- 性能はほぼ全ベンチマークでSOTA。SWE-Bench Pro 80.3%はOpus 4.8比+11pt、GPT 5.5比+21pt。長く複雑なタスクほど差が開き、数百万トークン級の自律稼働も可能。
- 安全装置は「拒否」ではなく「代打」方式。サイバー・バイオ/ケミカル・蒸留に関わる質問はOpus 4.8がフォールバック回答(発生はセッションの5%未満、必ず通知あり)。フル能力版のMythos 5はGlasswingパートナー限定。
- 6月22日までは追加費用なしで試せる。Pro/Max/Team/Enterpriseプランに期間限定で含まれ、Claude Codeなら
/modelで即切り替え。API料金は$10/$50(Opus 4.8の2倍)。
「最先端のAIを、安全装置付きで広く一般に」という今回の試みは、モデルの性能競争が“能力”から“能力の出し方”へ移ってきたことを象徴しています。まずはお試し期間中に、手元のいちばん重いタスクをぶつけてみてください。