Claude Fable 5 API 안전장치: Opus 4.8 폴백이 개발자 워크플로를 바꾸는 방식

Claude Fable 5는 6월 9일 출시되었지만, 개발자 입장에서 매우 눈에 띄는 조건이 붙어 있었습니다. claude-fable-5로 보낸 일부 요청은 실제로 Fable 5가 전혀 응답하지 않습니다. Anthropic의 안전장치가 요청을 플래그하면, 의도된 경로는 대신 Claude Opus 4.8로 폴백하는 것입니다.

개발자가 내재화해야 할 워크플로 변화가 바로 이것입니다. 이제 모델 선택은 설정 파일에 들어가는 단순한 문자열이 아닙니다. 사이버, 생물학, 화학, 그리고 추론 추출에 인접한 일부 요청의 경우, 앱은 한 모델을 요청했지만 폴백 경로에 따라 비용이 청구되고 다른 모델의 동작을 받을 수 있습니다.

먼저 중요한 업데이트가 있습니다. 2026년 6월 15일 현재 Fable 5는 사용할 수 없습니다. Anthropic은 6월 12일 업데이트를 통해 Claude Fable 5와 Claude Mythos 5에 대한 접근을 중단했다고 밝혔고(Anthropic 출시 게시물), 별도 성명에서 미국 정부 지시로 인해 서비스를 복구하는 동안 모든 고객의 접근을 비활성화할 수밖에 없었다고 설명했습니다(Anthropic 성명). 그럼에도 API 메커니즘은 여전히 중요합니다. Anthropic이 이 모델을 어떤 방식으로 사용하도록 설계했는지, 그리고 프로덕션에 다시 켜기 전에 팀이 무엇을 테스트해야 하는지를 정의하기 때문입니다.

요청이 claude-fable-5로 들어가 안전 분류기를 통과한 뒤 Fa로 계속 진행되거나 다른 경로로 이동하는 흐름도

무엇이 바뀌었나

Anthropic은 Fable 5를 일반적으로 사용할 수 있는 “Mythos-class” 모델로 설명했고, Mythos 5는 검증된 사이버 및 생물학 사용 사례를 위한 더 제한적인 버전이라고 밝혔습니다. 출시 게시물에 따르면 Fable 5와 Mythos 5는 동일한 기본 역량 티어를 공유하지만, Fable 5에는 일부 요청을 Fable이 직접 답하게 하지 않고 Opus 4.8로 라우팅하는 안전장치가 추가되어 있습니다(Anthropic).

이 안전장치는 의도적으로 넓게 설계되었습니다. Anthropic은 평균적으로 세션의 5% 미만에서 트리거되며, Fable 세션의 95% 이상에서는 폴백이 전혀 발생하지 않는다고 밝혔습니다(Anthropic). 개발자 도구, 보안 제품, 생물정보학 어시스턴트, 코드 리뷰 에이전트, 문서 워크플로를 만들기 전까지는 작은 수치처럼 들립니다. 하지만 그런 제품에서는 “엣지 케이스”가 곧 핵심 제품일 수 있습니다.

제품 페이지는 라우팅 동작을 명확히 설명합니다. 플래그된 사이버보안 및 생물학 요청은 자동으로 Opus 4.8로 라우팅되며, 재라우팅된 요청에는 Fable 가격이 청구되지 않습니다(Claude Fable 제품 페이지). Help Center는 운영상의 세부사항을 덧붙입니다. Claude 앱에서는 자동 전환이 기본으로 켜져 있지만, API 사용자는 직접 옵트인하고 폴백을 구성해야 합니다(Claude Help Center).

마지막 문장이 함정입니다. 앱이 “Fable이 거부했다”를 단순한 또 하나의 모델 오류로 가정한다면, Claude 웹 앱보다 못한 제품을 출시하게 됩니다.

개발자가 알아야 할 사실

엔지니어링 마이그레이션 티켓에 넣고 싶은 작은 표는 다음과 같습니다.

항목	확인된 세부사항
출시일	2026년 6월 9일
현재 접근 상태	2026년 6월 12일 중단
API 모델 ID	`claude-fable-5`
폴백 모델	`claude-opus-4-8`
Fable 5 가격	입력 토큰 100만 개당 $10, 출력 토큰 100만 개당 $50
프롬프트 캐싱	기존 입력 토큰 90% 할인
미국 전용 추론	입력 및 출력 토큰 가격 1.1배
평균 폴백 발생률	세션의 5% 미만
데이터 보존	Fable에는 30일 보존 필요

가격 수치는 출시 게시물과 제품 페이지 모두에서 나온 것입니다. 입력 토큰 100만 개당 $10, 출력 토큰 100만 개당 $50입니다(Anthropic, Claude Fable). 제품 페이지는 또한 프롬프트 캐싱이 기존 입력 토큰 90% 할인을 유지하며, 미국 전용 추론은 1.1배 가격으로 제공된다고 설명합니다(Claude Fable). Anthropic의 데이터 레지던시 문서는 1.1배 배수가 Opus 4.6, Sonnet 4.6 및 이후 모델의 토큰 가격 범주 전반에 적용되며, 입력, 출력, 캐시 쓰기, 캐시 읽기를 포함한다고 설명합니다(Claude API 문서).

Fable 5 기본 가격, 입력 90% 할인으로 표시된 프롬프트 캐시 읽기 가격, 미국 전용 추론을 비교하는 간결한 가격 카드

폴백은 UX 세부사항이 아니라 API 계약이다

API 사용자에게 중요한 응답은 “오류”가 아닙니다. Anthropic 문서에 따르면 분류기 차단은 stop_reason: "refusal"이 포함된 정상 HTTP 200 응답을 반환하며, stop_details.category에 cyber, bio, reasoning_extraction 같은 값이 포함될 수 있습니다(Claude Cookbook). 즉 재시도 미들웨어, 관측성, 테스트 어설션은 HTTP 상태만이 아니라 응답 본문을 검사해야 합니다.

권장되는 서버 측 패턴은 베타 폴백 API를 사용합니다.

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: server-side-fallback-2026-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-fable-5",
    "max_tokens": 1024,
    "fallbacks": [{ "model": "claude-opus-4-8" }],
    "messages": [{ "role": "user", "content": "Summarize this security review." }]
  }'

Anthropic의 cookbook에 따르면 서버 측 폴백은 네이티브 Claude API와 AWS의 Claude Platform에서 사용할 수 있으며, 현재는 Fable 5에서 Opus 4.8로의 폴백을 지원합니다(Claude Cookbook). Bedrock, Vertex AI, Microsoft Foundry, Message Batches 또는 클라이언트 측 제어를 원하는 팀의 경우 Anthropic은 대신 SDK 미들웨어를 안내합니다.

제품 관점에서 결론은 간단합니다. 모든 요청 경로에 폴백 구성이 필요합니다. 채팅 턴, 다시 생성 버튼, 에이전트 하위 호출, 도구 연속 실행, eval 하네스, 배치 리플레이 작업 모두가 해당됩니다. 한 경로라도 폴백을 빠뜨리면, 사용자는 메인 채팅 경로에서는 복구되었을 상황에서 거부를 보게 됩니다.

캐시 경계 주변에서 과금이 복잡해진다

과금 규칙은 단순 재시도보다 개발자에게 더 유리하지만, 올바르게 연결했을 때만 그렇습니다.

Anthropic의 Help Center에 따르면 Fable이 출력을 생성하기 전에 요청이 차단되면 대화는 즉시 Opus로 전환되고 사용자는 Opus 요금만 청구됩니다. 요청이 스트리밍 도중 차단되면, 차단 전 입력과 스트리밍된 토큰에는 Fable 요금이 적용되고 나머지에는 Opus 요금이 적용됩니다(Claude Help Center).

cookbook은 여기에 프롬프트 캐시와 관련된 미묘한 점을 추가합니다. 직접 분류기 차단은 출력이 반환되지 않은 경우 입력 토큰이 청구되지 않습니다. Fable 5에서 Opus 4.8로 폴백할 때, Anthropic은 서버 측 폴백을 사용하는 경우 폴백 입력 토큰을 캐시 쓰기가 아니라 캐시 히트로 청구합니다. 클라이언트 측 폴백을 구현한다면, 동일한 조직, 워크스페이스, system, messages, tools 필드로 5분 이내에 fallback_credit_token을 사용해야 할 수 있습니다(Claude Cookbook).

이 요구사항은 공격적인 프롬프트 셰이핑을 사용하는 모든 사람에게 경고 신호가 되어야 합니다. 폴백 재시도가 프롬프트를 “정리”하거나, 새 시스템 메시지를 주입하거나, 도구를 제거하거나, 대화 상태를 다시 작성한다면, 의도된 캐시 크레딧 동작을 잃고 비용 차이에 노이즈를 만들 수 있습니다.

사이버 또는 생물학을 다루는 앱을 테스트하는 방법

Fable 5를 일반적인 코딩 프롬프트로만 테스트하지 마세요. 그러면 Fable을 다르게 만드는 정확한 통합 지점을 놓치게 됩니다.

“안전하지만 분류기에 인접한” 요청을 위한 eval 슬라이스를 만드세요. 취약점 분류 요약, 방어적 위협 모델링 언어, SBOM 리뷰, 바이오테크 시장 문서, 의료 영상 관리 워크플로, 무해한 분자생물학 교육, 그리고 chain-of-thought와 유사한 추론 텍스트를 요청하는 모든 프롬프트가 포함됩니다. Anthropic의 Help Center는 검사가 최신 메시지뿐 아니라 메모리, 커넥터 콘텐츠, 웹 결과, 파일도 검토한다고 설명합니다(Claude Help Center). 따라서 장난감 프롬프트가 아니라 현실적인 첨부파일과 검색된 컨텍스트를 포함하세요.

탄탄한 테스트 계획은 다음 다섯 가지를 검증해야 합니다.

stop_reason: "refusal"이 예외가 아니라 성공적인 응답 상태로 처리된다.
Fable에 도달할 수 있는 모든 요청 빌더에 서버 측 폴백이 존재한다.
관측성은 최종 서빙 모델, 폴백 홉, 사용 가능한 경우 거부 카테고리를 기록한다.
비용 대시보드는 Fable, Opus 폴백, 캐시 읽기, 캐시 쓰기, 미국 전용 추론을 분리한다.
폴백 이후 대화 상태가 올바르게 동작한다. Claude 앱에서는 전환 후 대화의 나머지 동안 선택기가 Opus에 머문다고 Help Center가 설명합니다. 여러분의 앱에도 똑같이 명시적인 정책이 필요합니다.

멀티 에이전트 시스템에서는 에이전트별 동작을 테스트하세요. Anthropic의 cookbook은 한 에이전트가 폴백되면 해당 에이전트만 폴백 모델로 이동하고 다른 에이전트는 Fable에 남을 수 있다고 경고합니다(Claude Cookbook). 계획한 동작이라면 괜찮습니다. 하지만 평가기가 전체 작업을 단일 모델이 처리했다고 가정한다면 고통스러울 수 있습니다.

실용적인 결론

Fable 5의 출시는 더 높은 가격과 더 나은 벤치마크 주장을 내세운 또 하나의 프런티어 모델 릴리스에 그치지 않았습니다. 안전 분류기가 워크플로 내부에서 서빙 모델을 바꿀 수 있는 모델 라우팅 계약을 도입했습니다. 일반적인 코딩과 장기 실행 에이전트 작업의 경우 Anthropic은 대부분의 세션이 Fable에 머문다고 말합니다. 보안, 생물학, 화학, 추론 추출에 인접한 제품에서는 폴백이 정확성의 일부가 됩니다.

6월 15일 현재 접근이 중단되어 있으므로, 지금 당장 해야 할 일은 “프로덕션을 Fable로 전환”하는 것이 아닙니다. 지금 해야 할 일은 모델 계층이 폴백을 인식하도록 만드는 것입니다. 서빙된 모델을 로깅하고, 거부 경로를 테스트하고, 프롬프트 캐시 의미론을 보존하며, 요청한 모델이 보장된 모델이라고 취급하는 일을 멈추세요. Fable 접근이 복구되면, 이 작업을 해둔 팀은 model="claude-fable-5"만 바꾼 팀보다 더 깔끔하게 롤아웃할 수 있습니다.

이 모델들을 직접 사용해 보고 싶은 독자는 base_url 하나만 바꿔 OpenAI 호환 API로 onehop에서 Claude와 다른 모델을 호출할 수 있습니다: onehop에서 Claude와 다른 모델 호출하기. onehop은 퍼스트파티보다 저렴하며, 신규 계정은 카드 없이 $10 무료 크레딧을 받을 수 있습니다: $10 무료 크레딧으로 가입하기.

Claude Fable 5 API 안전장치: Opus 4.8 폴백이 개발자 워크플로를 바꾸는 방식

무엇이 바뀌었나

개발자가 알아야 할 사실

폴백은 UX 세부사항이 아니라 API 계약이다

캐시 경계 주변에서 과금이 복잡해진다

사이버 또는 생물학을 다루는 앱을 테스트하는 방법

실용적인 결론

관련 글

SuperGrok 또는 X Premium 구독으로 Warp에서 Grok Build 사용하기

DashScope 호환 모드로 OpenAI SDK에서 Qwen3.7 Plus 호출하기

SWE-Bench Pro에서 GPT-5.6 Sol vs Claude Fable 5 vs Gemini 3.1 Pro 비교