
目次
- 1 you@fable5:~/prompting ❯ 01_tldr.md結論:90 秒ダイジェスト — Fable 5 でプロンプトはこう変わる
- 2 you@fable5:~/prompting ❯ 02_positioning.mdこのガイドの位置づけ — 「モデル固有ガイド」という読み方
- 3 you@fable5:~/prompting ❯ 03_capabilities.md能力向上 7 項目を読み解く — 何が「数日規模」になったのか
- 4 you@fable5:~/prompting ❯ 04_longer_turns.mdデフォルトでより長いターン — タイムアウトと非同期設計
- 5 you@fable5:~/prompting ❯ 05_effort.mdエフォート設定の再設計 — Fable 5 は high、Opus 4.8 は xhigh
- 6 you@fable5:~/prompting ❯ 06_instructions.md強力な指示追従 — 「列挙」をやめて「原則」を書く
- 7 you@fable5:~/prompting ❯ 07_grounding.md進捗報告を証拠で裏づける・やらないことの線引き
- 8 you@fable5:~/prompting ❯ 08_subagents.md並列サブエージェント — 2 つのガイドで真逆のチューニング
- 9 you@fable5:~/prompting ❯ 09_memory.mdメモリシステムを構築する — Markdown 1 枚から始める長期記憶
- 10 you@fable5:~/prompting ❯ 10_edge_cases.mdまれに起こる 2 つの症状 — 早期停止とコンテキスト不安
- 11 you@fable5:~/prompting ❯ 11_communication.mdコミュニケーション設計 — 理由・読みやすさ・send_to_user ツール
- 12 you@fable5:~/prompting ❯ 12_scaffolding.md推奨される移行作業 5 箇条 — 「足す」より「削る」
- 13 you@fable5:~/prompting ❯ 13_vs_opus48.mdOpus 4.8 ガイドとの完全対照 — どちらをいつ使うか
- 14 you@fable5:~/prompting ❯ 14_checklist.md移行チェックリスト 15 項目とまとめ
Anthropic Official · Prompting Claude Fable 5 · 完全日本語解説
Claude Fable 5 の登場で、Anthropic 公式ドキュメントに 「Prompting Claude Fable 5」[1] というモデル固有のプロンプトガイドが追加されました。一読すると「能力が上がった」という話に見えますが、本質はまったく逆で、「賢くなったモデルには、これまでと正反対のプロンプトが必要になる」という移行マニュアルです。実際、直前の世代向けに書かれた「Prompting Claude Opus 4.8」[2] と読み比べると、サブエージェント・エフォート・指示の書き方など、複数の項目で 推奨が逆転しています。本記事では Fable 5 ガイドの全項目を 1 つずつ噛み砕き、公式プロンプト例にはすべて日本語訳と業務での活用例を添えたうえで、Opus 4.8 ガイドとの違い・使い分けまで整理します。所要時間は約 35 分。読み終わる頃には、手元のシステムプロンプトのどこを削り、どこに足せばいいかが具体的に分かります。
you@fable5:~/prompting ❯ 01_tldr.md結論:90 秒ダイジェスト — Fable 5 でプロンプトはこう変わる
全 14 章を読む時間がない方のために、まず結論だけ圧縮します。Fable 5 ガイド[1] が伝えたいのは次の 7 点です。
- 一番難しい仕事から渡す。Fable 5 は人間が数時間〜数週間かける仕事を最初から最後まで通しで完了できる。簡単なタスクだけでテストすると能力を過小評価する——これがガイド冒頭の最初のメッセージ。
- 1 回の応答(ターン)が長くなる前提で、呼び出し側のプログラムを作り直す。高エフォートでは 1 リクエストが何分も、自律実行は数時間に及ぶ。タイムアウト・ストリーミング・進捗表示の見直しが移行の最初の作業になる。
- エフォートは
highがデフォルト。最重要ワークロードのみxhigh、日常作業はmedium/low。低エフォートでも従来モデルのxhighを上回ることが多い。 - 指示は「列挙」せず「原則」で書く。指示追従が大幅に向上したため、禁止事項を 1 つずつ並べるより、短い原則 1 つで複数の挙動をまとめて制御できる。
- 賢くなったぶん「境界」を引く。頼んでいないメール下書きの作成や、念のための git ブランチ作成など、先回り行動が起きうる。「やるべきこと/やらないこと」の境界線を明示する。
- サブエージェントとメモリを前提に設計する。並列サブエージェント(メインのエージェントが仕事を切り出して任せる子エージェント)の信頼性が大幅向上。教訓を書き溜める Markdown ベースのメモリを与えると特に性能が伸びる。
- 古いプロンプトは「足す」より「削る」。従来モデル向けに書き込んだ細かい指示や、途中報告を強制する仕組みは、Fable 5 では出力品質をむしろ下げることがある。
そして Opus 4.8 ガイド[2] との最重要差分を 1 行でいうと、「Opus 4.8 は文字通りに動くモデルを“促す”プロンプト、Fable 5 は先回りするモデルに“境界を引く”プロンプト」です。同じ語彙(エフォート、サブエージェント、進捗報告)を使いながら、推奨の向きが反転している項目が多い——この対比は ch13 で表にして全部見せます。
Claude API や Claude Code を業務で使っていて、Fable 5 への移行(またはモデル選定)を検討している方が中心読者です。本文では 「ハーネス」=Claude を呼び出して動かす周辺プログラム一式(API を呼ぶコード、タイムアウト設定、ツール定義、画面表示など)のように、専門用語は初出時に必ず言い換えを添えます。プロンプトの基礎から学びたい方は、当ブログの Anthropic 公式チュートリアル完全日本語化ガイド を先にどうぞ。
you@fable5:~/prompting ❯ 02_positioning.mdこのガイドの位置づけ — 「モデル固有ガイド」という読み方
Anthropic のプロンプトドキュメントは、大きく 2 層に分かれています。
| 層 | ドキュメント | 役割 |
|---|---|---|
| 共通層 | プロンプティングのベストプラクティス[3] | 全モデル共通の普遍テクニック(明確さ、例示、XML タグ等) |
| モデル固有層 | Prompting Claude Fable 5[1] / Prompting Claude Opus 4.8[2] | その世代「固有」の挙動差分と、調整が必要になりやすいパターン集 |
つまりモデル固有ガイドは「プロンプト入門」ではなく、「前の世代から乗り換えるとき、どこで挙動が変わって戸惑うか」をまとめた差分リリースノートとして読むのが正解です。Fable 5 ガイドの冒頭には、このガイドの対象が Claude Fable 5 と Claude Mythos 5 であること、API パラメータの変更点(適応的思考のみ、要約された思考出力、拡張思考バジェットの廃止、refusal という新しい停止理由)は別ページ「Claude Fable 5 と Claude Mythos 5 の紹介」[4] にまとまっていることが明記されています。
見落とされがちな前提:安全性分類器とフォールバック
ガイド冒頭の注記には、運用設計に直結する重要な記述があります。Fable 5 は、攻撃的サイバーセキュリティ技術(攻撃コード、マルウェア、攻撃ツールの構築など)・生物学/ライフサイエンス関連コンテンツ・モデルの思考内容の抜き出しを検知する安全性分類器(リクエストを自動チェックする仕組み)を実行しており、無害なセキュリティ作業や有益なライフサイエンスのタスクでも作動する場合があると明言されています[1]。
分類器が作動すると、リクエストは処理されず stop_reason: "refusal"(拒否)が返ります。公式の推奨は、拒否されたリクエストを Claude Opus 4.8 に自動で振り直す(フォールバックする)構成です[5]。脆弱性診断ツールや創薬支援のような正当なユースケースでも誤検知はありうるため、「Fable 5 単体」ではなく「Fable 5 + Opus 4.8 への振り直し」をワンセットで設計するのが実務の前提になります。
この「拒否されたら Opus 4.8 に振り直す」という構図自体が、両モデルの使い分け(ch13)の伏線になっています。Opus 4.8 は引退するモデルではなく、Fable 5 体制の安全網であり、予測可能性が必要な処理の担当として併走する設計が公式に想定されているわけです。
you@fable5:~/prompting ❯ 03_capabilities.md能力向上 7 項目を読み解く — 何が「数日規模」になったのか
ガイドは Opus 4.8 と比較した向上点を 7 つ列挙しています[1]。単なる宣伝文に見えますが、それぞれが後続章のプロンプトパターンと 1 対 1 で対応しているので、先に全体像を掴んでおくと後の章がスッと入ります。
| 向上点 | ガイドの記述(要旨) | 対応するプロンプト調整 |
|---|---|---|
| 長期的な自律性 | 数日にわたる目標指向の実行を、指示を強く保持したまま完了 | ch04 長いターン / ch07 進捗監査 |
| 初回の正確性 | 従来は数日の手直しを要したシステムを一発で実装できたという初期テスターの報告 | ch12 「最難タスクから始める」 |
| 画像理解(ビジョン) | 情報量の多い技術画像・スクリーンショットを、より少ないトークンで高精度に解釈。反転・ぼやけ・ノイズの多い画像は bash や切り抜きツールで自ら前処理するよう訓練済み | 画像前処理の自前実装を減らせる |
| エンタープライズワークフロー | 財務分析・スプレッドシート・スライド・ドキュメントでプロフェッショナルレベルの出力 | ch06 範囲内に留まる指示追従 |
| コードレビューとデバッグ | バグの見つけ漏れの少なさ(再現率)が Opus 4.8 より顕著に向上。コードベースやリポジトリ履歴の検索も含む | ch13 Opus 4.8 のレビュー設定の話と対照 |
| 曖昧さへの対処 | 複数の論点が絡むリクエストから次のステップを判断するのが得意 | ch11 「理由を伝える」 |
| 委任と協調 | 並列サブエージェントの起動と管理の信頼性が大幅向上 | ch08 並列サブエージェント |
注目すべきは冒頭の一文です。ガイドは「最良の成果を得ているチームは、Fable 5 を最も困難な未解決の問題に適用している。より単純なワークロードでのみテストすると、その能力範囲を過小評価しがち」と書いています。つまり 「とりあえず今のタスクで比較テストして、差が小さいから移行見送り」という評価方法そのものが間違いだ、というのが公式の主張です。評価の段階から「これまで Claude に任せられなかった粒度の仕事」をテストケースに含める必要があります。
同じセクションの末尾に「Claude Fable 5 は攻撃的なサイバーセキュリティや生物学・ライフサイエンスの作業を目的としていません」と明記されています。能力の問題ではなく方針として遮断される領域なので、該当分野は最初から Opus 4.8 を選ぶのが正解です。
you@fable5:~/prompting ❯ 04_longer_turns.mdデフォルトでより長いターン — タイムアウトと非同期設計
ガイドが「チームが Fable 5 に適応する際に直面する最も大きな変化の一つ」と呼ぶのがこれです。難しいタスクへの 1 回のリクエストは、情報収集・構築・自己検証が必要な場合、高エフォートでは何分も実行され、自律実行は数時間に及ぶことがあります[1]。
これはプロンプトの問題である前に、Claude を呼び出す側のプログラム(ハーネス)の問題です。ガイドは移行前のチェック項目として次を挙げています。
- クライアントのタイムアウトを延ばす。60 秒や 120 秒で打ち切る設定のままだと、モデルが正しく動いているのに呼び出し側が先に諦めてしまう。
- ストリーミング(応答を少しずつ受け取る方式)と、ユーザー向けの進捗表示を整える。「数分間なにも表示されない」状態をユーザーに見せない画面設計が必須になる。
- 応答を待ち続ける方式をやめ、ジョブを投げて後から状況確認する非同期方式に作り替える。リクエストを送って返事を待ち続けるのではなく、「ジョブ投入 → 定期的に状況を見に行く/完了通知を受け取る」方式へ。
一方で、「タスクが曖昧なときに延々と計画ばかり立てる」過剰計画を防ぐプロンプトも提示されています。
When you have enough information to act, act. Do not re-derive facts already established
in the conversation, re-litigate a decision the user has already made, or narrate
options you will not pursue in user-facing messages. If you are weighing a choice, give
a recommendation, not an exhaustive survey. This does not apply to thinking blocks.「行動するのに十分な情報が揃ったら、行動してください。会話の中ですでに確定した事実を導き直したり、ユーザーがすでに下した決定を再び議論したり、採用しない選択肢をユーザー向けメッセージで語ったりしないでください。選択を迷っているなら、網羅的な比較ではなく推奨案を 1 つ提示してください。これは思考ブロック(モデル内部の検討メモ)には適用されません。」
社内の調査・障害対応エージェントのシステムプロンプトや、Claude Code の CLAUDE.md に常駐させます。たとえば障害調査を頼んだとき、「対応方針は A・B・C の 3 案あります。どれにしますか?」と毎回ボールを返してくる挙動が、「B 案が最適と判断したので進めます。理由は〜」に変わります。最後の一文がポイントで、モデル内部の思考では存分に比較検討してよいが、ユーザーへの出力では結論を出せという切り分けになっており、検討の質を落とさずに会話の往復回数だけを減らせます。
you@fable5:~/prompting ❯ 05_effort.mdエフォート設定の再設計 — Fable 5 は high、Opus 4.8 は xhigh
エフォート(effort)とは、Claude が 1 つのタスクにどれだけ考える力(=時間とトークン)を使うかを段階で指定する API パラメータです[6]。上げるほど賢く・遅く・高くなり、下げるほど速く・安くなります。ここは両ガイドが同じパラメータを扱いながら推奨デフォルトが 1 段ずれている、使い分けの核心ポイントです。
| エフォート | Claude Fable 5 ガイドの推奨[1] | Claude Opus 4.8 ガイドの推奨[2] |
|---|---|---|
max |
(言及なし) | 一部で向上するが効果は頭打ちになりがちで、考えすぎ(過剰思考)にも注意。高難度タスクで試す価値あり |
xhigh |
最も能力が重視されるワークロードに | コーディング・エージェント用途の開始点 |
high |
ほとんどのタスクのデフォルト | 知能が重要な用途の最低ライン |
medium |
日常的な作業に | コスト重視の用途に |
low |
日常的な作業に。従来モデルの xhigh を上回ることも多い | 短く範囲限定のタスク・速度最優先の処理のみ |
実務的な読み方はこうです。
- Fable 5:迷ったら
high。「タスクは完了するが必要以上に時間がかかる」「もっとテンポよく対話したい」と感じたら下げる。低エフォートの性能が底上げされているので、下げることをためらう必要はない。 - Opus 4.8:コーディングなら
xhighから。逆にlow/mediumでは「求められた範囲を超えない」厳密な動き方をするため、そこそこ複雑なタスクで考え不足になるリスクがある。推論が浅いと感じたらプロンプトで工夫する前にエフォートを上げるのが第一の調整手段、と明記されています。
もう 1 つ、Fable 5 ガイドには高エフォート特有の副作用への対処が書かれています。高エフォートでは「タスクが必要とする以上に情報を集め、考え込む」「頼んでいないコード整理やリファクタリングをする」ことがあり、これを防ぐ公式スニペットが以下です。
Don't add features, refactor, or introduce abstractions beyond what the task requires. A
bug fix doesn't need surrounding cleanup and a one-shot operation usually doesn't need a
helper. Don't design for hypothetical future requirements: do the simplest thing that
works well. Avoid premature abstraction and half-finished implementations. Don't add
error handling, fallbacks, or validation for scenarios that cannot happen. Trust
internal code and framework guarantees. Only validate at system boundaries (user input,
external APIs). Don't use feature flags or backwards-compatibility shims when you can
just change the code.「タスクが要求する以上の機能追加・リファクタリング・抽象化の導入をしないでください。バグ修正に周辺コードの掃除は不要ですし、一回きりの処理に補助関数はたいてい不要です。仮想的な将来要件のために設計せず、きちんと動く最もシンプルな実装にしてください。早すぎる抽象化と中途半端な実装を避けてください。起こりえないシナリオのためのエラー処理・代替処理・入力チェックを追加しないでください。内部コードとフレームワークの保証を信頼してください。チェックはシステムの境界(ユーザー入力・外部 API)でのみ行ってください。コードを直接変更すればよい場面で、機能フラグや後方互換のつなぎ対応を使わないでください。」
Claude Code などコーディングエージェントのシステムプロンプトや CLAUDE.md に常駐させます。効果がてきめんに出るのは「1 行のバグ修正を頼んだら、周辺の関数名の整理や使われていない変数の削除まで含む 500 行の差分が返ってきた」というケース。このスニペットを入れておくと差分が依頼範囲に収まり、プルリクエストのレビュー時間が短くなり、無関係な変更による予期せぬ不具合(デグレ)のリスクも減ります。ソフトウェア設計の格言「YAGNI(You Aren't Gonna Need It:今要らないものは作るな)」をプロンプトに翻訳したものと考えると覚えやすいです。
Opus 4.8 では思考機能はデフォルトでオフ、thinking: {type: "adaptive"} を明示して有効化し、思考する頻度はプロンプトで調整できました[2]。Fable 5 / Mythos 5 では適応的思考(必要なときだけ考える方式)のみ・思考の出力は要約のみ・思考量の上限指定(拡張思考バジェット)は廃止に整理されています[4]。また Opus 4.8 を max / xhigh で動かす場合は、最大出力トークンを 64k 程度から確保するよう Opus 4.8 ガイドの注記が推奨しています。
you@fable5:~/prompting ❯ 06_instructions.md強力な指示追従 — 「列挙」をやめて「原則」を書く
従来のプロンプト設計では、望ましくない挙動を見つけるたびに「〜しないでください」を 1 行ずつ追加していくのが定石でした。Fable 5 ガイドはこれを明確に否定します。「指示追従が十分に改善されているため、各動作を名前で列挙するのではなく、簡潔な指示でほとんどの動作を制御できる」[1]。
例として挙げられているのが「説明が長すぎる」問題です。Fable 5 は特に高エフォートで、採用しない選択肢の調査・根本原因の長い説明・形式ばりすぎたプルリクエスト説明文・コードの次の行が何をするかを説明するだけのコメントなど、タスクが必要とする以上に詳しく書くことがあります。これらを 1 個ずつ禁止する代わりに、次の短い原則で足ります。
Lead with the outcome. Your first sentence after finishing should answer "what happened"
or "what did you find": the thing the user would ask for if they said "just give me the
TLDR." Supporting detail and reasoning come after. Being readable and being concise are
different things, and readability matters more.
The way to keep output short is to be selective about what you include (drop details
that don't change what the reader would do next), not to compress the writing into
fragments, abbreviations, arrow chains like A → B → fails, or jargon.「結果から書き始めてください。作業を終えた後の最初の一文は『何が起きたか』『何が見つかったか』——ユーザーが『要点だけ教えて』と言ったときに返すべき内容——に答えるものにしてください。補足の詳細や理由づけはその後に。読みやすさと簡潔さは別物で、読みやすさの方が重要です。出力を短くする方法は、内容の取捨選択(読み手の次の行動を変えない詳細を削ること)であって、断片的な文・略語・『A → B → 失敗』のような矢印の連鎖・専門用語に圧縮することではありません。」
日次レポートの自動生成や、Slack へ完了報告を流すエージェントに入れると効果が分かりやすいです。改善前の報告が「DB 接続→retry×3→failed→fallback 有効化」のような記号の羅列だったものが、改善後は「本番データベースへの接続が 3 回失敗したため、読み取り専用の予備系に切り替えました。書き込みを伴う処理は明日の復旧まで保留されます」のように、事情を知らない人がそのまま読める文章になります。「短くしようとして暗号化する」のではなく「載せる情報を選ぶ」——この原則は人間の報告書にもそのまま使える考え方です。
「どこで止まって確認すべきか」も原則 1 つで制御できる
長時間のワークフローで「どの場面ならユーザーに確認すべきか」も、場面を列挙する必要はありません。
Pause for the user only when the work genuinely requires them: a destructive or
irreversible action, a real scope change, or input that only they can provide. If you
hit one of these, ask and end the turn, rather than ending on a promise.「作業が本当にユーザーを必要とするときだけ、止まって確認してください。具体的には、(1) 破壊的または取り返しのつかない操作、(2) 仕事の範囲の本当の変更、(3) 本人にしか出せない情報、のいずれかです。これらに当たったら、質問してターンを終えてください。『あとでやります』という約束でターンを終えてはいけません。」
夜間に自動でコード修正を行うパイプラインに入れると、「データベースのテーブル削除を伴う変更(不可逆)では止まって朝の確認を待つが、テストの再実行(やり直せる)ではいちいち止まらない」という線引きが、この 1 段落だけで実現します。従来は「rm コマンドの前は確認」「DROP 文の前は確認」…と個別に列挙していた制御が、「不可逆・範囲変更・本人しか知らない情報」という 3 つの抽象的な条件に集約でき、列挙漏れによる事故も減ります。
Opus 4.8 ガイドには「より文字通りの指示遵守」という逆向きの章があります。Opus 4.8 は特に低エフォートで、ある項目への指示を別の項目に暗黙的に当てはめてはくれないため、広く適用させたいなら「このフォーマットを最初のセクションだけでなく、すべてのセクションに適用して」のように範囲を明示する必要があります[2]。Fable 5 は原則を渡せば応用してくれる、Opus 4.8 は仕様書を正確に守ってくれる——プロンプトの抽象度をモデルに合わせて変える、というのが実務上の結論です。
you@fable5:~/prompting ❯ 07_grounding.md進捗報告を証拠で裏づける・やらないことの線引き
進捗報告を証拠に紐づける
長時間の自律実行で怖いのは、「やりました」という報告が事実かどうかです。ガイドはここに具体的な対策を示しており、しかも効果の根拠が明記されています。「Anthropic のテストでは、これにより、捏造を誘発するように設計されたタスクであっても、捏造された進捗報告がほぼ完全に排除された」[1]。
Before reporting progress, audit each claim against a tool result from this session.
Only report work you can point to evidence for; if something is not yet verified, say so
explicitly. Report outcomes faithfully: if tests fail, say so with the output; if a step
was skipped, say that; when something is done and verified, state it plainly without
hedging.「進捗を報告する前に、それぞれの主張をこのセッションでのツール実行結果と突き合わせて確認してください。証拠を指し示せる作業だけを報告し、未検証のものは未検証だと明言してください。結果は正直に報告すること:テストが失敗したら、その出力とともに失敗と報告する。スキップしたステップはスキップしたと言う。完了して検証も済んだものは、ぼかさずはっきり言い切る。」
夜間に走るコード移行ジョブや、CI(自動テスト環境)と連携したエージェントに必須級のスニペットです。これを入れておくと、朝の報告に「全テスト通過」と書いてあれば実際にテストを実行したログが存在する、という信頼が成立します。逆に未検証の部分は「ビルドは通りましたが、E2E テストは未実行です」と正直に書かれるため、人間が「本当にやったのか?」を検品して回る作業がなくなるのが最大の効果です。
やらないことの線引き — 「親切すぎる」挙動への対処
Fable 5 は、頼まれていないアクション——ガイドの例では「依頼されていないメールの下書き作成」「念のための git ブランチのバックアップ作成」——を実行することがあります。能力が上がったモデルほど「気を利かせた」行動の影響範囲も大きくなるため、ガイドはやるべきこと/やらないことの明示的な線引きを推奨します。
When the user is describing a problem, asking a question, or thinking out loud rather
than requesting a change, the deliverable is your assessment. Report your findings and
stop. Don't apply a fix until they ask for one. Before running a command that changes
system state (restarts, deletes, config edits), check that the evidence actually
supports that specific action. A signal that pattern-matches to a known failure may have
a different cause.「ユーザーが変更を依頼しているのではなく、問題を説明している・質問している・考えを口に出しているだけのときは、提出すべき成果物はあなたの『見立て』です。見つけたことを報告して、そこで止まってください。修正を求められるまで適用してはいけません。システムの状態を変えるコマンド(再起動・削除・設定変更)を実行する前に、証拠がその特定のアクションを本当に裏づけているか確認してください。既知の障害パターンに似ているシグナルでも、原因は別かもしれません。」
社内インフラの運用補助ボットに入れる例が分かりやすいです。エンジニアが「最近 API がなんか遅い気がするんだよね」とつぶやいたとき、線引きがないと気を利かせてサービスを再起動してしまうかもしれません。このスニペットを入れておくと、「調査した結果、応答遅延の原因は◯◯と推測されます。再起動で解消する可能性がありますが、実行しますか?」と見立ての報告で止まるようになります。後半の「パターンが似ていても原因は別かもしれない」は、思い込みによる誤対応(例:過去の障害と同じ症状だからと同じ対処をして悪化させる)を防ぐ、運用現場ならではの注意書きです。
you@fable5:~/prompting ❯ 08_subagents.md並列サブエージェント — 2 つのガイドで真逆のチューニング
サブエージェントとは、メインのエージェント(指揮役)が独立したサブタスクを切り出して任せる、別の文脈を持った子エージェントです。ここが両ガイドの差が最も鮮明な場所です。
| 観点 | Claude Fable 5[1] | Claude Opus 4.8[2] |
|---|---|---|
| デフォルト挙動 | 従来より積極的に並列サブエージェントを起動する | デフォルトで生成するサブエージェントは少なめ |
| プロンプトの方向 | 任せどきの判断基準を与え、活用前提で設計する | サブエージェントが望ましい場面を明示して促す |
| 推奨アーキテクチャ | 完了を待たずに並走する非同期方式。長く生かしておくサブエージェントでキャッシュを活用 | 「直接できる作業には生成しない/複数対象に展開するときは同一ターンで複数生成」を指示 |
Fable 5 ガイドの推奨スニペットは、促すというより「並走」の流儀を教えるものです。
Delegate independent subtasks to subagents and keep working while they run. Intervene
if a subagent goes off track or is missing relevant context.「独立したサブタスクはサブエージェントに任せ、彼らが動いている間もあなたは作業を続けてください。サブエージェントが脱線したり、必要な文脈が欠けていたりしたら介入してください。」
大規模なシステム調査で効果が出ます。たとえば「決済バグの原因調査」を依頼すると、Fable 5 は「フロントエンドのコード調査」「データベース定義の確認」「過去の類似障害チケットの検索」を 3 体のサブエージェントに並列で任せ、その間に自分は再現手順の検証を進める、という動きができます。ポイントは「完了を待ってから次へ」ではなく「任せて自分も動く」を明示していること。3 つの調査が直列なら 30 分かかるところが、並列なら最も遅い 1 本ぶんの時間で済みます。
対して Opus 4.8 ガイドのスニペットは、生成の「条件」を線引きするものでした。
Do not spawn a subagent for work you can complete directly in a single response (e.g.
refactoring a function you can already see).
Spawn multiple subagents in the same turn when fanning out across items or reading multiple files.「単一の応答で直接完了できる作業(すでに見えている関数のリファクタリングなど)のためにサブエージェントを生成しないでください。複数の項目にまたがる作業や複数ファイルの読み込みでは、同じターン内で複数のサブエージェントを生成してください。」
Opus 4.8 でエージェント製品を作る場合のシステムプロンプト向けです。Opus 4.8 は放っておくと 1 体で全部こなそうとして遅くなりがちなので、「10 個のファイルを調べるなら 10 体を同時に出せ」という展開条件を明示します。逆に Fable 5 ではこの種の「促し」はほぼ不要で、むしろ並列で動いた結果を受け止める設計の方が課題になる——同じテーマでプロンプトの向きが真逆になっている代表例です。
Fable 5 ガイドにはもう 1 つ、コスト最適化の重要なヒントが埋まっています。「サブタスク間で文脈を保持する長寿命のサブエージェントは、キャッシュ読み取りによって時間とコストを節約し、最も遅いサブエージェントがボトルネックになることを回避する」。つまり、サブタスクのたびに使い捨ての子エージェントを起動するのではなく、文脈を覚えたままの子エージェントに次のタスクも続けて送る方が、同じ文脈を読み直すコストがキャッシュ(一度読んだ内容の再利用)で安くなり、速度も出る、という設計指針です。
you@fable5:~/prompting ❯ 09_memory.mdメモリシステムを構築する — Markdown 1 枚から始める長期記憶
Fable 5 ガイドだけにある章です。「Claude Fable 5 は、以前の実行から得た教訓を記録し、それを参照できる場合に特に優れたパフォーマンスを発揮する。Markdown ファイルのようなシンプルなものでよいので、メモを書き込む場所を提供してください」[1]。ベクトルデータベースのような特別な仕組みは要らず、書き込めるフォルダ 1 つで始められます。
Store one lesson per file with a one-line summary at the top. Record corrections and
confirmed approaches alike, including why they mattered. Don't save what the repo or
chat history already records; update an existing note rather than creating a duplicate;
delete notes that turn out to be wrong.「1 ファイルにつき 1 つの教訓を保存し、冒頭に 1 行の要約を付けてください。間違いを正されたことだけでなく、うまくいくと確認できたやり方も、なぜそれが重要だったのかを添えて記録してください。リポジトリやチャット履歴にすでに記録されていることは保存しないでください。重複ファイルを作らず既存のメモを更新し、間違いだと分かったメモは削除してください。」
毎週動かすデータ集計エージェントを想像してください。初回は「この社内 API は一度に 100 件までしか返さない」「経理部向けレポートは A 列に日付が必須」といった暗黙知につまずきますが、メモリフォルダがあれば 2 回目以降はその教訓を最初に読んでから作業を始めるので、同じ失敗を毎回繰り返さなくなります。4 つのルール(1 ファイル 1 教訓/成功も理由つきで記録/既存記録と重複させない/誤りは消す)は、メモが「溜まるだけのゴミ箱」になるのを防ぐための手入れの作法です。
さらに、ゼロから育てるのではなく過去セッションの履歴からメモリを一括生成(ブートストラップ=初期立ち上げ)するプロンプトも提示されています。
Reflect on the previous sessions we've had together. Use subagents to identify core
themes and lessons, and store them in [X]. Make sure you know to reference [X] for
future use.「これまでの私たちのセッションを振り返ってください。サブエージェントを使って中心的なテーマと教訓を特定し、[X] に保存してください。今後 [X] を参照することを忘れないようにしてください。」([X] にはメモリ用フォルダのパスなどを入れます)
すでに数ヶ月 Claude Code を使っているチームなら、過去の会話ログや作業履歴が貯まっているはずです。このプロンプトを 1 回流すだけで、過去ログから「このチームはタブ幅 2 を使う」「デプロイは金曜日にやらない」のような教訓をサブエージェントが束ねて抽出し、メモリフォルダを一括で初期化してくれます。ゼロから貯め直す必要がないので、メモリ導入の最初の一歩として最適です。
you@fable5:~/prompting ❯ 10_edge_cases.mdまれに起こる 2 つの症状 — 早期停止とコンテキスト不安
ガイドは「まれに発生する」と前置きしつつ、長いセッションで起きうる 2 つの症状と処方箋を載せています。どちらも知らないと「モデルが壊れた」と誤診しやすいので、トラブル対応集として覚えておく価値があります。
症状 1:早期停止 — 「これから X をします」と言って止まる
長いセッションの深い段階で、実際の処理を実行せずに「これから X を実行します」というテキストだけで応答を終えたり、続行に十分な情報があるのに許可を求めて止まったりすることがあります。対話で使っているなら「続けてください」「最後までやり切ってください」の一言で復帰します。人間が見ていない自動実行パイプラインでは、次のリマインダーを常駐させます。
You are operating autonomously. The user is not watching in real time and cannot answer
questions mid-task, so asking "Want me to…?" or "Shall I…?" will block the work. For
reversible actions that follow from the original request, proceed without asking.
Offering follow-ups after the task is done is fine; asking permission after already
discussing with the user before doing the work is not. Before ending your turn, check
your last paragraph. If it is a plan, an analysis, a question, a list of next steps, or
a promise about work you have not done ("I'll…", "let me know when…"), do that work now
with tool calls. End your turn only when the task is complete or you are blocked on
input only the user can provide.「あなたは自律的に動作しています。ユーザーはリアルタイムで見ておらず、作業の途中で質問に答えることはできません。『〜しましょうか?』という確認は作業を止めてしまいます。元の依頼から自然に導かれる、やり直しのきく操作は確認なしで進めてください。タスク完了後に追加提案をするのは構いませんが、すでにユーザーと合意した作業の前に改めて許可を求めるのはいけません。応答を終える前に、自分の最後の段落を確認してください。それが計画・分析・質問・次のステップのリスト・未着手の作業への約束(『これから〜します』『〜したら教えてください』)であれば、いまその作業を実行してください。タスクが完了するか、ユーザーにしか出せない情報で手が止まったときだけ、応答を終えてください。」
深夜に定期実行するジョブ(依存ライブラリの更新、テストデータの再生成など)に効きます。これがないと、朝に確認したら「アップデートを実行してもよろしいですか?」のまま 6 時間止まっていた、という事故が起こりえます。特に秀逸なのが後半の自己点検ルールで、「応答の最後の段落が『約束』なら、いま実行せよ」という形で、早期停止の症状そのものをモデル自身にチェックさせています。なお、これは ch06 の停止条件(不可逆・範囲変更・本人しか知らない情報なら止まる)とセットで使うことが公式に推奨されています。「全部止まらず進め」ではなく「止まるべき 3 条件以外は進め」になるからです。
症状 2:コンテキスト不安 — 残り容量を気にして勝手に「巻き」に入る
コンテキスト(モデルが一度に扱える会話・作業内容の容量)が長くなったセッションで、新しいセッションを提案したり、「ここまでを要約して引き継ぎます」と申し出たり、作業を勝手に切り詰めたりすることがあります。ガイドによると、これは呼び出し側のプログラムが「残りトークン数」のカウントダウンをモデルに見せている場合に最も頻発します。第一の対策は「可能な限り、残り容量の数値をモデルに見せない」こと。どうしても表示が必要な場合は、次の「安心させる」指示を入れます。
You have ample context remaining. Do not stop, summarize, or suggest a new session on
account of context limits. Continue the work.「コンテキストはまだ十分に残っています。コンテキストの上限を理由に、停止したり、要約したり、新しいセッションを提案したりしないでください。作業を続けてください。」
Claude を自前のプログラムから呼び出していて、デバッグ用に「残り 12,000 トークン」のような内部情報をプロンプトに入れている場合に効きます。親切のつもりのこの表示が、Fable 5 では「残りが少ないから店じまいしよう」という萎縮を引き起こし、作業の途中で勝手にまとめに入る原因になります。原則は「容量管理は呼び出し側が黙ってやり、モデルには見せない」。表示を消せない事情があるときだけ、このスニペットで打ち消します。Claude Code のような既製ツールを普通に使っているだけなら、この問題はツール側が対処済みなので気にしなくて大丈夫です。
you@fable5:~/prompting ❯ 11_communication.mdコミュニケーション設計 — 理由・読みやすさ・send_to_user ツール
ガイド後半の 3 章は、いずれも「モデルと人間の接点」の設計です。まとめて押さえます。
(1) リクエストだけでなく「理由」を伝える
Fable 5 はリクエストの背後にある意図を理解しているとき、より良いパフォーマンスを発揮する傾向があります。背景が分かっていれば、意図を自分で推測する代わりに、タスクを関連情報へ正しく結びつけられるからです。公式が示す依頼テンプレートは次のとおりです。
I'm working on [the larger task] for [who it's for]. They need [what the output
enables]. With that in mind: [request].「私は [誰のため] に [より大きなタスク] に取り組んでいます。相手は [出力によって可能になること] を必要としています。それを踏まえて:[依頼]。」
改善前:「この売上データをグラフにして」。改善後:「経営会議で来期の予算配分を判断するための資料を作っています。役員が一目でどの事業が赤字かを判断できる必要があります。それを踏まえて:この売上データをグラフにしてください」。後者では、グラフの種類(事業別の損益が比較できる棒グラフ)、強調すべき点(赤字事業の色分け)、不要なもの(細かい月次変動)までが依頼文から導けるため、やり直しが激減します。ガイドは特に複数の作業の流れを同時にこなす長時間実行エージェントで効果が大きいとしています。
(2) ユーザー向け出力の読みやすさ
長いエージェント的セッション(大量のツール実行・大きな作業文脈)の後、Fable 5 は読みにくいテキスト——矢印だらけの省略記法、深すぎる実装詳細、ユーザーには見えていない内部検討への言及、過度に技術的な表現——を生成することがあります。ガイドの補足指示は長めですが、考え方の核心はこの一文です。
Terse shorthand is fine between tool calls (that's you thinking out loud, and brevity there is good). Your final summary is different: it's for a reader who didn't see any of that.
Prompting Claude Fable 5(Anthropic 公式) / [1]
「ツール実行の合間の走り書きは簡潔で構いません(それはあなたの考え事であり、そこでは短さが美徳です)。しかし最後のまとめは別物です。それは、その過程を一切見ていなかった読み手のための文章です。」
続けてガイドは、こう指示しています。「夜間や多数のツール実行を挟んで長時間働いた後の最終メッセージは、作業メモの続きではなく初めて読む人への報告として書け。作業中に自分が編み出した用語や略語は読み手のものではないから持ち込むな。完全な文で書き、用語は省略せずに綴り、矢印の連鎖や自作のラベルを使うな。短さと明確さで迷ったら明確さを取れ」。
チャット画面を持つ AI アシスタント製品や、作業完了をメール・Slack で通知するエージェントのシステムプロンプトに、この一節をほぼそのまま移植できます。たとえば一晩かけてデータ移行をしたエージェントの朝の報告が、「移行 OK。upsert→retry 方式に変更済」のような本人にしか分からないメモから、「データ移行は完了しました。途中、重複データでエラーが出たため、登録方式を『失敗したら上書きして再試行する』方式に変更しています。この変更は今後の移行にも適用されます」のような誰が読んでも分かる報告に変わります。
(3) send_to_user ツール — 作業を終えずにユーザーへ届ける
長時間動く非同期エージェントでは、「応答の終了=メッセージ送信」という従来の前提が崩れます。作業はまだ続いているのに、途中経過や成果物だけ先にユーザーへ見せたい場面が出てくるからです。そこでガイドは、エージェントが作業を終了せずに、ユーザーへメッセージを一字一句そのまま届けるための専用ツールの追加を推奨しています。用途は、成果物(生成したコードや文面の下書き)、具体的な数値を含む進捗報告、ユーザーが作業中に投げた質問への直接回答など。ツールへの入力は要約処理を通らないため、内容がそのまま届くのがポイントです。
{
"name": "send_to_user",
"description": "Display a message directly to the user. Use this for progress updates, partial results, or content the user must see exactly as written before the task finishes.",
"input_schema": {
"type": "object",
"properties": {
"message": {
"type": "string",
"description": "The content to display to the user."
}
},
"required": ["message"]
}
}ツール名は send_to_user(ユーザーに送る)。説明文は「メッセージをユーザーに直接表示する。進捗報告、途中経過、またはタスク完了前にユーザーが書かれたとおり正確に見る必要がある内容に使うこと」。入力は message(表示する内容の文字列)の 1 項目だけです。
実装は簡単で、Claude がこのツールを呼んだら入力の message を画面にそのまま表示し、ツールの実行結果として「表示しました」程度の短い応答を返すだけです。たとえば「100 件の顧客メールへの返信案を作る」エージェントなら、20 件できるごとに send_to_user で「20/100 件完了。ここまでの返信案はこちら:…」と届け、ユーザーは完成を待たずに先頭から確認を始められます。ただしガイドは線引きも明確で、「日常的な進捗を説明するだけのエージェントなら、モデル自身のまとめで通常は十分」。途中成果物をそのまま届けることが製品体験の要件になっている場合だけ追加すべきツールです。
you@fable5:~/prompting ❯ 12_scaffolding.md推奨される移行作業 5 箇条 — 「足す」より「削る」
ガイドの最終章は、移行時にやるべき作業のリストです。原文では「スキャフォールディング(scaffolding=足場)の変更」と呼ばれています。スキャフォールディングとは、モデルの周囲に組む仕組み一式——システムプロンプト、ツール定義、スキル(再利用する指示書)、自動化スクリプトなど——のことです。5 項目あります[1]。
- 難易度の最上位から始める。従来モデルに任せていたより難しいタスクを選び、Fable 5 自身に作業範囲の定義と、不明点の質問をさせてから実行させる。
- 長時間実行プロンプトに自己検証を組み込む(下で詳述)。
- 既存のプロンプトとスキルを見直して削る。従来モデル向けのスキルは Fable 5 には「指示が細かすぎる」ことが多く、出力品質をかえって下げうる。素の性能の方が良ければ古い指示は削除を検討する。Fable 5 は、目の前のタスクから学んだことでスキルをその場で改訂するのも得意。
- 「思考過程を回答に再現させる」指示を撤去する(下のコールアウトで詳述)。
- send_to_user ツールを作成する(ch11 参照)。長時間の非同期エージェントで、途中経過をそのまま届ける手段として。
2 項目めの自己検証について、公式の指示例はこうです。
Establish a method for checking your own work at an interval of [X] as you build. Run
this every [X interval], verifying your work with subagents against the specification.「作業を進めながら、[X] の間隔で自分の作業をチェックする方法を確立してください。[X] ごとにそれを実行し、サブエージェントを使って仕様と突き合わせて検証してください。」([X] には「1 機能完成するたび」「30 分ごと」などを入れます)
数時間かかるシステム構築をまるごと任せるときに使います。重要なのは、ガイドが「新しい文脈を持つ独立した検証サブエージェントは、自己批評よりも優れた結果を出す傾向がある」と明記している点です。自分の答案を自分で採点すると思い込みごと見逃しますが、答案だけを渡された採点者(=作業の経緯を知らない検証サブエージェント)は先入観なくチェックできる——人間のコードレビューと同じ理屈です。「2 時間ごとに、仕様書と成果物だけを渡した検証係に採点させる」と指定すれば、長時間実行の品質が安定します。
4 項目めは見落としやすい実務ポイントです。「ステップバイステップで考え、その思考過程を回答に含めて」のような、旧来は無害だった定番フレーズが、Fable 5 では思考内容の抜き出しを検知する安全性分類器(reasoning_extraction カテゴリ)に触れて拒否応答を誘発し、知らないうちに Opus 4.8 への振り直し率を押し上げる可能性があります[5]。移行時には、既存のスキルやシステムプロンプトを検索して「思考過程を見せて」系の指示を洗い出す作業を必ず入れてください。推論の中身を確認したい場合は、適応的思考が出力する thinking ブロックを読む[7]のが公式の代替手段です。
5 箇条を通して見ると、方向性は一貫しています。旧世代向けに「足してきた」細かい管理指示を削り、代わりに「検証の仕組み」と「届ける手段」という構造を足す。プロンプトの書き換えというより、エージェント運用設計の作り直しです。
you@fable5:~/prompting ❯ 13_vs_opus48.mdOpus 4.8 ガイドとの完全対照 — どちらをいつ使うか
ここまで随所で触れてきた Opus 4.8 ガイド[2] との違いを、一枚の表に集約します。両ガイドを並べて読むと、同じテーマに対する推奨の「向き」が見事に対になっていることが分かります。
| テーマ | Claude Opus 4.8 ガイド | Claude Fable 5 ガイド |
|---|---|---|
| モデルの性格 | 文字通り・明示的に解釈。指示を他の場面に応用しない | 原則を渡せば応用する。先回りして行動することがある |
| プロンプトの基本方針 | 足りない挙動を「促す」(ツール使用・サブエージェント・適用範囲の拡大) | 過剰な挙動に「境界を引く」(過剰計画・過剰整理・頼んでいない行動) |
| エフォートの開始点 | コーディング/エージェントは xhigh、max は考えすぎに注意 |
ほとんどのタスクで high、低エフォートでも従来 xhigh 級 |
| 思考(thinking) | デフォルトオフ。adaptive を明示し、頻度はプロンプトで調整 |
適応的思考のみ・出力は要約のみ。思考を回答に再現させる指示は拒否の原因に |
| ツール使用 | ツールより推論を優先しがち → エフォートを上げる+使いどきを明示して増やす | (積極的なツール・サブエージェント活用が前提) |
| サブエージェント | デフォルト少なめ → 生成条件を明示して促す | 積極的に起動する → 並走前提の非同期設計と長寿命運用でコスト最適化 |
| 進捗報告 | 定期報告が高品質化 → 報告を強制する仕組みは削除を試す | 証拠との突き合わせ監査を指示(捏造報告をほぼ排除) |
| 応答の長さ | タスクの複雑さで変動 → 特定のスタイルが必要なら指示で固定 | 高エフォートで説明過多 → 「選別であって圧縮ではない」の原則 1 つで制御 |
| そのガイドにしかない話題 | フロントエンドの定番スタイル打破、コードレビューの報告基準、対話型製品のトークン効率、コンピュータ操作の画面解像度 | メモリシステム、send_to_user ツール、早期停止・コンテキスト不安対策、拒否時の振り直し設計 |
Opus 4.8 ガイドにしかない 4 つの知見
Fable 5 に移行しても、Opus 4.8 ガイド固有の知見は引き続き有効です(拒否時の振り直し先・併用モデルとして Opus 4.8 を使い続けるため)。特に重要な 4 つを要約します。
- デザインの定番スタイル打破:Opus 4.8 が作る画面デザインには一貫した「いつもの作風」(クリーム色の背景 約
#F4F1EA・飾り気のあるセリフ体見出し・テラコッタ系の差し色)があり、「クリーム色を使わないで」のようなふわっとした指示では別の固定パターンに移るだけで多様になりません。確実なのは、(1) 色コードや書体まで含む具体的な代替仕様を渡す、(2) 作り始める前に「背景色・差し色・書体と一行の理由」の組を 4 案提案させて選ぶ、の 2 つです。 - コードレビューの報告基準:Opus 4.8 はバグ発見力が上がったのに、旧モデル向けの「重大な問題だけ報告して」という指示に忠実に従いすぎて、見つけたバグを報告せず、見かけ上の検出数が減ることがあります。対策は、発見の段階では「不確かでも軽微でも全部報告。選別は後工程の仕事。あなたの役割は網羅」と明示し、確信度と重大度を添えさせて後で絞ること。
- 対話型製品のトークン効率:Opus 4.8 はユーザーの発言のたびに考え直すため、対話型ではトークン消費が増えます。最初の発言でタスク・意図・制約をまとめて伝え、やり取りの回数を減らす方が、効率も品質も上がります。
- コンピュータ操作の画面解像度:画面を見ながら操作する機能は最大 2576px / 3.75MP まで対応し、1080p が性能とコストのバランス良。コスト重視なら 720p や 1366×768 も選択肢です。
使い分けの実務指針
| ユースケース | 推奨モデル | 理由 |
|---|---|---|
| 数時間〜数日規模の自律エージェント・最難の未解決問題 | Fable 5 | 長期自律性・初回の正確性・サブエージェント協調がこのモデルの主戦場 |
| 定型の抽出処理・細かく調整済みのプロンプトを使う処理パイプライン | Opus 4.8 | 文字通りの解釈は、動きの予測しやすさが要る API パイプラインで「一般的により良いパフォーマンス」と公式が明言 |
| セキュリティ研究・ライフサイエンス関連 | Opus 4.8(または Fable 5 + 振り直し) | Fable 5 の安全性分類器が正当なタスクでも作動しうる |
| コードレビュー・デバッグ | Fable 5(セキュリティ攻撃領域を除く) | バグの見つけ漏れの少なさが Opus 4.8 より顕著に向上 |
| 応答速度最優先の対話型処理 | Fable 5 の low/medium と Opus 4.8 の low を実測比較 |
Fable 5 は低エフォートでも従来 xhigh 級という公式記述があるため、品質・速度・価格の三点で測る価値あり |
「Fable 5 が出たから Opus 4.8 は不要」ではありません。拒否時の振り直し先として、また動きの予測可能性が要る処理の担当として、Fable 5(攻め)× Opus 4.8(受け)の 2 モデル体制がドキュメント全体から読み取れる公式の想定構成です。
you@fable5:~/prompting ❯ 14_checklist.md移行チェックリスト 15 項目とまとめ
最後に、本記事の内容を「明日やる作業」に変換したチェックリストです。上から順に潰せば、Fable 5 ガイドの推奨をひととおり実装したことになります。
インフラ・呼び出し側プログラム(ch04・ch10)
- クライアントのタイムアウトを「数分単位の応答」前提に延長した
- ストリーミングと進捗表示を整備した
- 応答を待ち続ける方式をやめ、非同期(ジョブ投入+状況確認/完了通知)の構成にした
- 残りトークン数などの内部情報をモデルに見せるのをやめた(消せない場合は「まだ十分残っている」スニペットを追加)
- 拒否(
stop_reason: "refusal")時の Opus 4.8 への振り直しを実装した
システムプロンプト(ch04〜ch07・ch11)
- 「十分な情報が揃ったら行動せよ」の過剰計画防止スニペットを入れた
- 「タスクが要求する以上の機能追加・リファクタをするな」のスニペットを入れた(コーディング用途)
- 「結論を先頭に・削るのは情報の選別であって文章の圧縮ではない」の簡潔さ原則を入れた
- 止まるべき 3 条件(不可逆な操作/範囲の変更/本人にしか出せない情報)の停止条件を入れた
- 進捗報告をツール実行結果と突き合わせる監査スニペットを入れた(長時間の自律実行)
- 「問題の説明には見立てを返して止まる」「状態を変えるコマンドの前に証拠を確認」の線引きスニペットを入れた
- 依頼の書き方を「理由つきテンプレート」(誰のため・何のため・それを踏まえて依頼)に変えた
スキル・仕組みの棚卸し(ch08・ch09・ch12)
- 旧モデル向けの細かすぎる指示・途中報告を強制する仕組みを削除候補としてリストアップし、素の性能と比較した
- 「思考過程を回答に含めて」系の指示を検索で洗い出して撤去した(拒否応答の予防)
- メモリ用フォルダ(1 ファイル 1 教訓)を用意し、必要に応じて send_to_user ツール・定期的な検証サブエージェントを導入した
まとめ
本記事の要点を 3 つに集約します。
- Fable 5 ガイドの本質は「境界の設計」。賢く・自律的になったモデルには、細かい手順書ではなく、行動原則と越えてはいけない線(停止条件・証拠主義・作業範囲)を与える。指示は列挙から原則へ。
- Opus 4.8 ガイドの本質は「促しの設計」。文字通りに動く高精度モデルには、ツール使用・サブエージェント・適用範囲を明示的に促し、染みついた定番(画面デザインの作風・報告の自己選別)を具体的な仕様で上書きする。両者はプロンプトの「向き」が逆。
- 移行は削る作業から始まる。タイムアウト延長と非同期化という足回りの整備を済ませたら、旧世代向けに足してきた細かい管理指示を削り、メモリ・検証サブエージェント・send_to_user という新しい構造を足す。そして評価には「これまで任せられなかった一番難しいタスク」を使う。
プロンプトエンジニアリングの普遍的な基礎(明確さ・例示・XML タグ)は引き続き有効です[3]。そのうえで、モデル世代ごとの「性格」に合わせてプロンプトの抽象度と向きを切り替える——それが 2 つの公式ガイドが教えてくれる、これからのモデル運用の作法です。