Claude Fable 5 API सुरक्षा उपाय: Opus 4.8 फ़ॉलबैक कैसे डेवलपर वर्कफ़्लो बदलता है
15 जून 2026 · 24 मिनट पढ़ें · Claude

Claude Fable 5 9 जून को एक ऐसी बात के साथ लॉन्च हुआ जो डेवलपर्स को साफ़ दिखाई देती है: claude-fable-5 को भेजे गए कुछ अनुरोधों का जवाब Fable 5 बिल्कुल नहीं देता। अगर Anthropic के सुरक्षा उपाय अनुरोध को फ़्लैग कर देते हैं, तो अपेक्षित रास्ता इसके बजाय Claude Opus 4.8 पर फ़ॉलबैक करना है।
यही वह वर्कफ़्लो बदलाव है जिसे डेवलपर्स को अच्छी तरह समझना होगा। मॉडल चुनना अब सिर्फ़ आपके कॉन्फ़िग में एक स्ट्रिंग नहीं रहा। कुछ साइबर, बायोलॉजी, केमिस्ट्री और रीजनिंग-एक्सट्रैक्शन से सटे अनुरोधों के लिए आपका ऐप एक मॉडल माँग सकता है, फ़ॉलबैक पाथ के अनुसार भुगतान कर सकता है, और व्यवहार किसी दूसरे मॉडल से प्राप्त कर सकता है।
पहले एक महत्वपूर्ण अपडेट: 15 जून, 2026 तक, Fable 5 वर्तमान में उपलब्ध नहीं है। Anthropic ने 12 जून का अपडेट जोड़ा, जिसमें कहा गया कि उसने Claude Fable 5 और Claude Mythos 5 की पहुँच निलंबित कर दी है (Anthropic लॉन्च पोस्ट), और एक अलग बयान प्रकाशित किया कि अमेरिकी सरकार के निर्देश ने उसे सेवा बहाल करने पर काम करते समय सभी ग्राहकों के लिए पहुँच बंद करने को मजबूर किया (Anthropic बयान). API मैकेनिक्स फिर भी मायने रखते हैं, क्योंकि वे बताते हैं कि Anthropic ने मॉडल को उपयोग के लिए कैसे डिज़ाइन किया था, और प्रोडक्शन में वापस चालू करने से पहले टीमों को क्या टेस्ट करना चाहिए।

क्या बदला
Anthropic ने Fable 5 को सामान्य रूप से उपलब्ध “Mythos-class” मॉडल बताया, जबकि Mythos 5 जाँचे-परखे साइबर और बायोलॉजी उपयोग मामलों के लिए अधिक प्रतिबंधित वर्ज़न है। लॉन्च पोस्ट कहती है कि Fable 5 और Mythos 5 एक ही अंतर्निहित क्षमता स्तर साझा करते हैं, लेकिन Fable 5 ऐसे सुरक्षा उपाय जोड़ता है जो कुछ अनुरोधों को Fable से सीधे जवाब दिलाने के बजाय Opus 4.8 पर रूट कर देते हैं (Anthropic).
सुरक्षा उपाय जानबूझकर व्यापक रखे गए हैं। Anthropic ने कहा कि वे औसतन 5% से कम सेशनों में ट्रिगर होते हैं, और Fable सेशनों के 95% से अधिक में कोई फ़ॉलबैक नहीं होता (Anthropic). यह छोटा लगता है, जब तक आप कोई डेवलपर टूल, सुरक्षा उत्पाद, बायोइन्फ़ॉर्मेटिक्स असिस्टेंट, कोड रिव्यू एजेंट या डॉक्युमेंट वर्कफ़्लो नहीं बनाते जहाँ “एज केस” ही मुख्य उत्पाद हो।
प्रोडक्ट पेज रूटिंग व्यवहार को सीधे शब्दों में बताता है: फ़्लैग किए गए साइबरसिक्योरिटी और बायोलॉजी अनुरोध स्वतः Opus 4.8 पर रूट किए जाते हैं, और रीरूट किए गए अनुरोधों के लिए उपयोगकर्ताओं से Fable कीमतें नहीं ली जातीं (Claude Fable प्रोडक्ट पेज). Help Center ऑपरेशनल विवरण जोड़ता है: Claude ऐप्स में, ऑटोमैटिक स्विचिंग डिफ़ॉल्ट रूप से चालू है, लेकिन API उपयोगकर्ताओं को खुद opt in करके फ़ॉलबैक कॉन्फ़िगर करना होगा (Claude Help Center).
आख़िरी वाक्य ही फँसाने वाली बात है। अगर आपका ऐप मानता है कि “Fable ने इंकार किया” बस एक और मॉडल एरर है, तो आप Claude वेब ऐप से ख़राब उत्पाद शिप करेंगे।
डेवलपर-फेसिंग तथ्य
यह वह छोटी टेबल है जिसे मैं इंजीनियरिंग माइग्रेशन टिकट में डालूँगा:
| आइटम | सत्यापित विवरण |
|---|---|
| लॉन्च तारीख | 9 जून, 2026 |
| मौजूदा एक्सेस स्थिति | 12 जून, 2026 को निलंबित |
| API मॉडल ID | claude-fable-5 |
| फ़ॉलबैक मॉडल | claude-opus-4-8 |
| Fable 5 कीमत | $10 / 1M इनपुट टोकन, $50 / 1M आउटपुट टोकन |
| प्रॉम्प्ट कैशिंग | मौजूदा 90% इनपुट टोकन छूट |
| US-only inference | 1.1x इनपुट और आउटपुट टोकन प्राइसिंग |
| औसत फ़ॉलबैक घटना | सेशनों के 5% से कम |
| डेटा रिटेंशन | Fable के लिए 30-दिन रिटेंशन आवश्यक |
कीमतों के आँकड़े लॉन्च पोस्ट और प्रोडक्ट पेज दोनों से आते हैं: प्रति मिलियन इनपुट टोकन $10 और प्रति मिलियन आउटपुट टोकन $50 (Anthropic, Claude Fable). प्रोडक्ट पेज यह भी कहता है कि प्रॉम्प्ट कैशिंग मौजूदा 90% इनपुट टोकन छूट बनाए रखती है और US-only inference 1.1x प्राइसिंग पर उपलब्ध है (Claude Fable). Anthropic के डेटा रेज़िडेंसी डॉक्स कहते हैं कि 1.1x मल्टिप्लायर Opus 4.6, Sonnet 4.6 और बाद के मॉडलों के लिए टोकन प्राइसिंग कैटेगरीज़ में लागू होता है, जिनमें इनपुट, आउटपुट, कैश राइट और कैश रीड शामिल हैं (Claude API docs).

फ़ॉलबैक एक API कॉन्ट्रैक्ट है, UX डिटेल नहीं
API उपयोगकर्ताओं के लिए महत्वपूर्ण प्रतिक्रिया “एरर” नहीं है। Anthropic के डॉक्स कहते हैं कि क्लासिफ़ायर ब्लॉक सामान्य HTTP 200 प्रतिक्रिया लौटाता है, जिसमें stop_reason: "refusal" होता है और stop_details.category में cyber, bio, या reasoning_extraction जैसे मान शामिल हो सकते हैं (Claude Cookbook). इसका मतलब है कि आपके retry middleware, observability और test assertions को सिर्फ़ HTTP status नहीं, बल्कि response body भी inspect करनी होगी।
अनुशंसित server-side pattern beta fallback API का उपयोग करता है:
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: server-side-fallback-2026-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-fable-5",
"max_tokens": 1024,
"fallbacks": [{ "model": "claude-opus-4-8" }],
"messages": [{ "role": "user", "content": "Summarize this security review." }]
}'
Anthropic की cookbook कहती है कि server-side fallback नेटिव Claude API और AWS पर Claude Platform में उपलब्ध है, और आज यह Fable 5 से Opus 4.8 पर फ़ॉलबैक को सपोर्ट करता है (Claude Cookbook). Bedrock, Vertex AI, Microsoft Foundry, Message Batches, या client-side control चाहने वाली टीमों के लिए Anthropic इसके बजाय SDK middleware की ओर इशारा करता है।
प्रोडक्ट पर असर सरल है: हर request path को फ़ॉलबैक कॉन्फ़िगरेशन चाहिए। Chat turns, regenerate buttons, agent subcalls, tool continuations, eval harnesses, batch replay jobs. अगर किसी एक path में फ़ॉलबैक छूट गया, तो उपयोगकर्ताओं को वहाँ refusals दिखेंगे जहाँ आपका मुख्य chat path recover कर लेता।
कैश सीमाओं के आसपास बिलिंग अजीब हो जाती है
बिलिंग नियम naive retry की तुलना में डेवलपर-फ्रेंडली हैं, लेकिन केवल तभी जब आप उन्हें सही से वायर करें।
Anthropic का Help Center कहता है कि अगर कोई अनुरोध Fable के आउटपुट देने से पहले ब्लॉक हो जाता है, तो बातचीत तुरंत Opus पर स्विच हो जाती है और उपयोगकर्ता से केवल Opus rates पर शुल्क लिया जाता है। अगर कोई अनुरोध midstream ब्लॉक होता है, तो ब्लॉक से पहले के input और streamed tokens पर Fable rates लागू होते हैं, फिर बाकी पर Opus rates लागू होते हैं (Claude Help Center).
cookbook प्रॉम्प्ट-कैश वाली जटिलता जोड़ती है। Direct classifier blocks के लिए input tokens का बिल नहीं लगता जब कोई output वापस नहीं आया हो। Fable 5 से Opus 4.8 पर फ़ॉलबैक के लिए, server-side fallback का उपयोग करते समय Anthropic fallback input tokens को cache write के बजाय cache hit के रूप में बिल करता है। अगर आप client-side fallback बनाते हैं, तो आपको 5 मिनट के भीतर एक fallback_credit_token redeem करना पड़ सकता है, उसी org, workspace, system, messages, और tools fields के साथ (Claude Cookbook).
यह आवश्यकता aggressive prompt shaping करने वाले किसी भी व्यक्ति को सावधान कर देनी चाहिए। अगर आपका fallback retry प्रॉम्प्ट को “clean up” करता है, नया system message inject करता है, tools हटाता है, या conversation state फिर से लिखता है, तो आप intended cache-credit behavior खो सकते हैं और noisy cost deltas बना सकते हैं।
साइबर या बायोलॉजी छूने वाले ऐप्स कैसे टेस्ट करें
Fable 5 को केवल generic coding prompts से टेस्ट न करें। इससे वही integration point छूट जाएगा जो Fable को अलग बनाता है।
“safe but classifier-adjacent” अनुरोधों के लिए एक eval slice बनाएँ: vulnerability triage summaries, defensive threat-modeling language, SBOM review, biotech market documents, medical imaging admin workflows, benign molecular biology education, और कोई भी prompt जो chain-of-thought जैसी reasoning text माँगता है। Anthropic का Help Center कहता है कि checks केवल latest message नहीं, बल्कि memory, connector content, web results, और files भी review करते हैं (Claude Help Center). इसलिए toy prompts नहीं, बल्कि realistic attachments और retrieved context शामिल करें।
एक मजबूत test plan को पाँच चीज़ें verify करनी चाहिए:
stop_reason: "refusal"को exception नहीं, बल्कि successful response state के रूप में handle किया जाता है।- Server-side fallback हर उस request builder पर मौजूद है जो Fable तक पहुँच सकता है।
- Observability final serving model, fallback hops, और उपलब्ध होने पर refusal category record करती है।
- Cost dashboards Fable, Opus fallback, cache reads, cache writes, और US-only inference को अलग-अलग दिखाते हैं।
- Fallback के बाद conversation state सही व्यवहार करती है। Claude apps में, Help Center कहता है कि switch के बाद बाकी conversation के लिए picker Opus पर ही रहता है; आपके ऐप को भी उतनी ही स्पष्ट policy चाहिए।
Multi-agent systems के लिए, per-agent behavior टेस्ट करें। Anthropic की cookbook चेतावनी देती है कि अगर एक agent fallback करता है, तो केवल वही agent fallback model पर जाता है जबकि दूसरे Fable पर रह सकते हैं (Claude Cookbook). अगर आपने इसकी योजना बनाई है तो यह ठीक है। अगर आपका evaluator मानता है कि पूरे task को एक ही model ने serve किया, तो यह दर्दनाक होगा।
व्यावहारिक निष्कर्ष
Fable 5 का लॉन्च केवल एक और frontier-model release नहीं था जिसमें अधिक कीमत और बेहतर benchmark claims हों। इसने एक model-routing contract पेश किया जहाँ safety classifiers किसी workflow के अंदर serving model बदल सकते हैं। सामान्य coding और long-horizon agent tasks के लिए, Anthropic कहता है कि ज़्यादातर sessions Fable पर ही रहते हैं। Security, biology, chemistry, और reasoning-extraction-adjacent products के लिए, fallback correctness का हिस्सा बन जाता है।
क्योंकि 15 जून तक access suspended है, तुरंत उठाया जाने वाला कदम “production को Fable पर flip करना” नहीं है। कदम यह है कि अपनी model layer को अभी fallback-aware बनाएँ: served model log करें, refusal paths test करें, prompt-cache semantics preserve करें, और requested model को guaranteed model मानना बंद करें। जब Fable access वापस आएगा, जिन टीमों ने यह काम कर लिया होगा उनका rollout उन टीमों से साफ़ होगा जिन्होंने केवल model="claude-fable-5" बदला था।
जो पाठक इन मॉडलों को hands-on आज़माना चाहते हैं, वे एक base_url बदलकर OpenAI-compatible API के साथ onehop पर Claude और अन्य मॉडल कॉल कर सकते हैं: onehop पर Claude और अन्य मॉडल कॉल करें. onehop first-party से सस्ता है, और नए accounts को बिना card के $10 free credit मिलता है: $10 free credit के लिए sign up करें.
संबंधित लेख

SuperGrok या X Premium सब्सक्रिप्शन के साथ Warp में Grok Build का उपयोग
xAI अब Warp उपयोगकर्ताओं को Grok या X Premium जोड़कर terminal agent workflows में grok-build-0.1 चलाने देता है।
16 जून 2026 · 21 मिनट पढ़ें

OpenAI SDK के साथ Groq GPT-OSS 120B इस्तेमाल करें: Base URL, Pricing और Caching
OpenAI SDK का base URL बदलकर Groq पर GPT-OSS 120B चलाएँ, cached token लागत आँकें और tool billing surprises से बचें।
17 जून 2026 · 25 मिनट पढ़ें

Aider Polyglot Coding पर GPT-5 बनाम Gemini 2.5 Pro बनाम Claude Opus 4
Aider Polyglot coding पर GPT-5, Gemini 2.5 Pro और Claude Opus 4 की डेटा-आधारित तुलना।
17 जून 2026 · 20 मिनट पढ़ें