Claude Fable 5 API セーフガード:Opus 4.8 フォールバックが開発者ワークフローをどう変えるか
2026年6月15日 · 18分で読めます · Claude

Claude Fable 5 は 6 月 9 日にリリースされましたが、開発者にとって非常に目に見える注意点があります。claude-fable-5 への一部のリクエストは、Fable 5 ではまったく回答されません。Anthropic のセーフガードがリクエストをフラグすると、想定される経路は代わりに Claude Opus 4.8 へのフォールバックになります。
開発者が理解しておくべきワークフロー変更はここです。モデル選択は、もはや設定内の単なる文字列ではありません。サイバー、バイオロジー、化学、推論抽出に近い一部のリクエストでは、アプリがあるモデルを指定し、フォールバック経路に従って課金され、別のモデルの振る舞いを受け取る可能性があります。
まず重要な更新です。2026 年 6 月 15 日時点で、Fable 5 は現在利用できません。Anthropic は 6 月 12 日の更新で Claude Fable 5 と Claude Mythos 5 へのアクセスを停止したと述べ(Anthropic のリリース投稿)、さらに別の声明で、米国政府の指令により、サービス復旧に取り組む間、すべての顧客のアクセスを無効化せざるを得なくなったと発表しました(Anthropic の声明)。それでも API の仕組みは重要です。これは Anthropic がこのモデルをどのように使われるものとして設計したか、そして本番環境で再度有効にする前にチームが何をテストすべきかを定義しているからです。

何が変わったのか
Anthropic は Fable 5 を一般提供される「Mythos-class」モデルと説明し、Mythos 5 は審査済みのサイバーおよびバイオロジー用途向けの、より制限されたバージョンだとしています。リリース投稿によれば、Fable 5 と Mythos 5 は同じ基盤能力レベルを共有していますが、Fable 5 には、Fable に直接回答させる代わりに一部のリクエストを Opus 4.8 へルーティングするセーフガードが追加されています(Anthropic)。
セーフガードは意図的に広めに設計されています。Anthropic は、平均してセッションの 5% 未満でトリガーされ、Fable セッションの 95% 超ではフォールバックがまったく発生しないと述べています(Anthropic)。開発者ツール、セキュリティ製品、バイオインフォマティクス支援、コードレビューエージェント、ドキュメントワークフローを作る場合、その「エッジケース」がコア製品になるまでは、小さな数字に見えるかもしれません。
製品ページは、このルーティングの挙動について率直です。フラグされたサイバーセキュリティおよびバイオロジー関連リクエストは自動的に Opus 4.8 にルーティングされ、再ルーティングされたリクエストについてユーザーは Fable の料金を請求されません(Claude Fable 製品ページ)。Help Center は運用上の詳細を追加しています。Claude アプリでは自動切り替えがデフォルトで有効ですが、API ユーザーは自分でオプトインし、フォールバックを設定する必要があります(Claude Help Center)。
最後の一文が落とし穴です。あなたのアプリが「Fable の拒否」を単なる別のモデルエラーだと見なしているなら、Claude Web アプリより劣るプロダクトを出荷することになります。
開発者向けの事実
私なら、エンジニアリングの移行チケットに次の小さな表を入れます。
| 項目 | 確認済みの詳細 |
|---|---|
| リリース日 | 2026 年 6 月 9 日 |
| 現在のアクセス状態 | 2026 年 6 月 12 日に停止 |
| API モデル ID | claude-fable-5 |
| フォールバックモデル | claude-opus-4-8 |
| Fable 5 の価格 | 入力トークン 100 万あたり $10、出力トークン 100 万あたり $50 |
| プロンプトキャッシュ | 既存の入力トークン 90% 割引 |
| 米国のみの推論 | 入力および出力トークン価格の 1.1 倍 |
| 平均フォールバック発生率 | セッションの 5% 未満 |
| データ保持 | Fable では 30 日間の保持が必要 |
価格の数字はリリース投稿と製品ページの両方に基づいています。入力トークン 100 万あたり $10、出力トークン 100 万あたり $50 です(Anthropic、Claude Fable)。製品ページでは、プロンプトキャッシュが既存の入力トークン 90% 割引を維持し、米国のみの推論が 1.1 倍の価格で利用可能とも述べています(Claude Fable)。Anthropic のデータレジデンシー文書によれば、1.1 倍の乗数は Opus 4.6、Sonnet 4.6、およびそれ以降のモデルについて、入力、出力、キャッシュ書き込み、キャッシュ読み取りを含むトークン価格カテゴリ全体に適用されます(Claude API docs)。

フォールバックは UX の細部ではなく API 契約である
API ユーザーにとって重要なレスポンスは「エラー」ではありません。Anthropic のドキュメントによれば、分類器によるブロックは stop_reason: "refusal" を含む通常の HTTP 200 レスポンスを返し、stop_details.category には cyber、bio、reasoning_extraction などの値が含まれる場合があります(Claude Cookbook)。つまり、リトライミドルウェア、オブザーバビリティ、テストアサーションは、HTTP ステータスだけでなくレスポンス本文を検査する必要があります。
推奨されるサーバーサイドのパターンでは、ベータ版フォールバック API を使います。
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: server-side-fallback-2026-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-fable-5",
"max_tokens": 1024,
"fallbacks": [{ "model": "claude-opus-4-8" }],
"messages": [{ "role": "user", "content": "Summarize this security review." }]
}'
Anthropic の cookbook によれば、サーバーサイドフォールバックはネイティブの Claude API と AWS 上の Claude Platform で利用でき、現時点では Fable 5 から Opus 4.8 へのフォールバックをサポートしています(Claude Cookbook)。Bedrock、Vertex AI、Microsoft Foundry、Message Batches、またはクライアントサイドで制御したいチームについては、Anthropic は代わりに SDK ミドルウェアを案内しています。
プロダクト上の含意は単純です。すべてのリクエスト経路にフォールバック設定が必要です。チャットのターン、再生成ボタン、エージェントのサブコール、ツール継続、評価ハーネス、バッチ再実行ジョブ。どこか 1 つの経路でフォールバックを省くと、メインのチャット経路なら復旧できたはずのところで、ユーザーは拒否を目にすることになります。
課金はキャッシュ境界付近でやや複雑になる
課金ルールは単純なリトライより開発者に優しいものですが、それは正しく配線した場合に限ります。
Anthropic の Help Center によれば、Fable が出力を生成する前にリクエストがブロックされた場合、会話は即座に Opus に切り替わり、ユーザーには Opus の料金のみが請求されます。リクエストがストリームの途中でブロックされた場合、ブロック前の入力とストリーミング済みトークンには Fable の料金が適用され、その後の部分には Opus の料金が適用されます(Claude Help Center)。
cookbook はプロンプトキャッシュに関するひねりを加えています。直接の分類器ブロックでは、出力が返されていない場合、入力トークンは課金されません。Fable 5 から Opus 4.8 へのフォールバックでは、サーバーサイドフォールバックを使う場合、Anthropic はフォールバック入力トークンをキャッシュ書き込みではなくキャッシュヒットとして請求します。クライアントサイドフォールバックを構築する場合、同じ org、workspace、system、messages、tools フィールドを使って、5 分以内に fallback_credit_token を引き換える必要があるかもしれません(Claude Cookbook)。
この要件は、積極的なプロンプト整形を行っている人にとって警戒すべきものです。フォールバックリトライでプロンプトを「クリーンアップ」したり、新しい system メッセージを注入したり、ツールを削除したり、会話状態を書き換えたりすると、意図されたキャッシュクレジットの挙動を失い、コスト差分にノイズを生む可能性があります。
サイバーまたはバイオロジーに触れるアプリをどうテストするか
Fable 5 を一般的なコーディングプロンプトだけでテストしてはいけません。それでは、Fable を異なるものにしているまさにその統合ポイントを見逃します。
「安全だが分類器に近い」リクエストの評価スライスを作りましょう。脆弱性トリアージの要約、防御的な脅威モデリングの表現、SBOM レビュー、バイオテック市場文書、医用画像の管理ワークフロー、良性の分子生物学教育、そして chain-of-thought 的な推論テキストを求めるプロンプトです。Anthropic の Help Center によれば、チェックは最新メッセージだけでなく、メモリ、コネクタの内容、Web 結果、ファイルもレビューします(Claude Help Center)。そのため、おもちゃのプロンプトではなく、現実的な添付ファイルと取得済みコンテキストを含めてください。
堅実なテスト計画では、次の 5 点を検証すべきです。
stop_reason: "refusal"が例外ではなく、成功したレスポンス状態として処理されること。- Fable に到達し得るすべてのリクエストビルダーにサーバーサイドフォールバックが存在すること。
- オブザーバビリティが、最終的に提供したモデル、フォールバックのホップ、利用可能な場合は拒否カテゴリを記録すること。
- コストダッシュボードが Fable、Opus フォールバック、キャッシュ読み取り、キャッシュ書き込み、米国のみの推論を分離して表示すること。
- フォールバック後も会話状態が意図どおりに振る舞うこと。Claude アプリでは、切り替え後、会話の残りではピッカーが Opus のままになると Help Center は述べています。あなたのアプリにも同じくらい明示的なポリシーが必要です。
マルチエージェントシステムでは、エージェントごとの挙動をテストしてください。Anthropic の cookbook は、あるエージェントがフォールバックした場合、フォールバックモデルへ移行するのはそのエージェントだけで、他のエージェントは Fable のまま残る可能性があると警告しています(Claude Cookbook)。計画していたなら問題ありません。タスク全体を単一のモデルが処理したと評価器が仮定している場合は厄介です。
実務上の要点
Fable 5 のリリースは、単に価格が高く、ベンチマーク主張が優れた別のフロンティアモデルのリリースではありませんでした。安全性分類器がワークフロー内で提供モデルを変更できる、モデルルーティング契約を導入したのです。通常のコーディングや長期的なエージェントタスクでは、Anthropic はほとんどのセッションが Fable のままだと述べています。セキュリティ、バイオロジー、化学、推論抽出に近い製品では、フォールバックが正しさの一部になります。
6 月 15 日時点でアクセスが停止されているため、今すぐ行うべきことは「本番環境を Fable に切り替える」ことではありません。今のうちにモデルレイヤーをフォールバック対応にすることです。提供されたモデルをログに記録し、拒否経路をテストし、プロンプトキャッシュのセマンティクスを維持し、リクエストしたモデルを保証されたモデルとして扱うのをやめましょう。Fable へのアクセスが戻ったとき、この作業を済ませたチームは、model="claude-fable-5" だけを変更したチームよりもクリーンにロールアウトできます。
これらのモデルを実際に試したい読者は、base_url を 1 つ変更するだけで、OpenAI 互換 API により onehop 上で Claude やその他のモデルを呼び出せます:onehop で Claude やその他のモデルを呼び出す。onehop はファーストパーティより安く、新規アカウントにはカード不要で $10 の無料クレジットが付与されます: $10 の無料クレジットに登録する。
関連記事

SuperGrok または X Premium サブスクリプションで Warp の Grok Build を使う
xAI により、Warp ユーザーは Grok または X Premium を連携し、ターミナルエージェントのワークフロー内で grok-build-0.1 を実行できるようになりました。
2026年6月16日 · 15分で読めます

OpenAI SDKでGroq GPT-OSS 120Bを使う:Base URL、料金、キャッシュ
OpenAI SDKのbase URLを1つ差し替えてGroq上でGPT-OSS 120Bを動かし、キャッシュ済みトークンのコストを見積もり、ツール課金の想定外を避ける。
2026年6月17日 · 21分で読めます

Aider Polyglot Codingで比較するGPT-5 vs Gemini 2.5 Pro vs Claude Opus 4
Aider Polyglotのコーディング性能でGPT-5、Gemini 2.5 Pro、Claude Opus 4をデータ重視で比較。
2026年6月17日 · 15分で読めます