블로그로 돌아가기
claude5.net

Claude Sonnet 4.6 심층 가이드: 적응형 사고, 벤치마크, 마이그레이션

개요

2026년 2월 17일, Anthropic은 Claude Sonnet 4.6을 출시했다. 이번 업데이트는 대부분의 프로덕션 워크로드를 처리하는 균형형 모델 라인의 대규모 업그레이드에 해당한다. 가장 중요한 변화는 Sonnet 라인 최초로 적응형 사고(adaptive thinking)를 지원한다는 점이다. 이 기능은 기존에 플래그십 모델인 Opus에서만 사용할 수 있었다. 코딩, 추론, 컴퓨터 사용 전반에 걸친 벤치마크 향상과 함께, Sonnet 4.6은 Sonnet 4.5를 대체하여 Claude Code와 claude.ai의 기본 모델이 되었다. 가격은 동일하게 입력 $3, 출력 $15 per MTok을 유지한다.

이 글에서는 구체적으로 무엇이 변경되었는지, 벤치마크 수치가 실무에서 어떤 의미를 갖는지, 마이그레이션 시점과 방법, 그리고 Opus 4.6 및 Haiku 4.5와 함께 멀티모델 아키텍처에서 Sonnet 4.6을 어떻게 활용할 수 있는지 다룬다.

Sonnet 4.5 대비 주요 변경사항

Sonnet 4.6의 핵심 업그레이드는 다음과 같다.

  • 적응형 사고: Sonnet 4.6은 작업 복잡도에 따라 추론 깊이를 동적으로 조절한다. 간단한 질문에는 빠른 답변을, 복잡한 문제에는 더 깊은 분석을 자동으로 수행한다. 이전에는 Opus에서만 사용 가능했던 기능이다.
  • SWE-bench 80.2%: Sonnet 4.5의 약 70%에서 크게 상승하여, 실전 코딩 능력의 의미 있는 도약을 나타낸다.
  • ARC-AGI-2 60.4%: 추상적 추론 과제에서 강력한 성능을 보여준다.
  • OSWorld 72.5%: 컴퓨터 사용 및 GUI 상호작용 능력이 향상되었다.
  • 70% 사용자 선호도: 직접 비교에서 사용자의 70%가 Sonnet 4.5보다 4.6을 선호했다.
  • Opus 4.5 대비 59% 승률: Sonnet 4.6은 이전 세대 플래그십 모델보다도 더 높은 사용자 선호도를 기록했다.

가격은 입력 $3, 출력 $15 per MTok으로 변동 없이 유지되어, 비용 증가 없는 순수 성능 업그레이드에 해당한다.

적응형 사고의 중요성

적응형 사고는 모델이 추론 노력을 배분하는 방식을 근본적으로 변화시킨다. 이 기능이 없으면 개발자는 확장 사고(느리지만 깊은 분석)와 표준 모드(빠르지만 얕은 분석) 사이에서 선택해야 했다. 적응형 사고는 모델이 스스로 판단하게 함으로써 이 트레이드오프를 제거한다.

프로덕션 워크로드에서 이는 다음을 의미한다.

  • 복잡도가 다양한 API 트래픽이 수동 라우팅 없이 적절한 추론을 받는다.
  • 단순한 분류나 데이터 추출 작업은 빠른 응답을 유지한다.
  • 복잡한 다단계 문제는 자동으로 더 깊은 분석을 받는다.
  • 작업 유형별로 별도의 모델 설정을 구성할 필요가 없어진다.

이 기능은 특히 Claude Code 사용자에게 가치가 크다. 하나의 세션 안에서 간단한 파일 수정부터 복잡한 멀티파일 리팩토링까지 다양한 작업이 이루어지기 때문이다.

벤치마크 해석

벤치마크 수치는 방향성을 나타내는 지표이지 성능을 보장하는 것은 아니다. 주요 결과를 해석하면 다음과 같다.

SWE-bench 80.2% --- 실제 GitHub 이슈를 해결하는 능력을 측정하는 벤치마크다. 약 70%에서 80.2%로의 상승은 Sonnet 4.6이 사람의 개입 없이 의미 있게 더 넓은 범위의 코딩 작업을 처리할 수 있음을 뜻한다. Claude Code를 사용하는 팀에게는 실패한 시도와 수동 정리 작업이 줄어드는 것으로 직결된다.

ARC-AGI-2 60.4% --- 모델이 새로운 문제에 일반화하는 능력과 상관관계가 있는 추상적 추론 역량이다. 모델이 익숙하지 않은 패턴을 마주하는 작업에서 중요하다.

OSWorld 72.5% --- GUI 상호작용을 측정하는 컴퓨터 사용 벤치마크다. 브라우저나 데스크톱 상호작용을 포함하는 자동화 워크플로우를 구축하는 팀에게 관련이 있다.

사용자 선호도 70% (vs Sonnet 4.5) --- 실질적으로 가장 의미 있는 지표일 수 있다. 실제 사용자가 결과물을 나란히 비교했을 때 Sonnet 4.6을 강하게 선호했다.

Claude Code 기본 모델 변경

Sonnet 4.6은 Claude Code에서 Sonnet 4.5를 대체하여 기본 모델이 되었다. 이는 적응형 사고, 향상된 코딩 벤치마크, 그리고 유지된 속도의 조합을 반영한다. Claude Code 사용자에게 적용되는 사항은 다음과 같다.

  • 모델 ID가 claude-sonnet-4-5-20250929에서 claude-sonnet-4-6으로 변경된다.
  • 기본 설정을 사용하는 사용자는 별도의 워크플로우 변경 없이 자동으로 업그레이드된다.
  • Opus 4.6은 가장 복잡한 작업을 위한 프리미엄 옵션으로 계속 사용할 수 있다.
  • Haiku 4.5는 빠르고 비용 효율적인 작업에 여전히 사용 가능하다.

Claude Code 설정에서 Sonnet 4.5를 고정(pin)해 두었다면, Sonnet 4.6으로 업데이트하는 것을 권장한다. API는 완전히 호환된다.

가격 및 이용 가능 여부

Sonnet 4.6은 이전 모델과 동일한 가격을 유지한다.

| 항목 | 가격 | |---|---| | 입력 | $3 / MTok | | 출력 | $15 / MTok | | 컨텍스트 윈도우 | 200K (1M 베타) | | 최대 출력 | 64K 토큰 |

이 모델은 claude.ai(무료 및 Pro 티어), Anthropic API, Amazon Bedrock, Google Cloud Vertex AI에서 사용할 수 있다. claude.ai의 무료 및 Pro 사용자에게는 Sonnet 4.6이 기본 모델로 표시된다.

마이그레이션 가이드: Sonnet 4.5에서 4.6으로

마이그레이션은 간단하다. Sonnet 4.6은 드롭인 교체(drop-in replacement)가 가능하기 때문이다.

  1. API 사용자: 모델 파라미터를 claude-sonnet-4-5-20250929에서 claude-sonnet-4-6으로 변경한다.
  2. Claude Code 사용자: 모델 설정을 업데이트하거나, 기본값을 사용한다(기본값이 이제 Sonnet 4.6이다).
  3. 프롬프트 호환성: 기존 프롬프트를 수정 없이 그대로 사용할 수 있다. 적응형 사고는 자동으로 적용된다.
  4. 테스트: 기존 평가 스위트를 실행하여 특정 워크로드에서의 개선 사항을 확인한다.

새 프로젝트에서 Sonnet 4.5를 계속 사용할 이유는 없다. 업그레이드는 무료이고, API는 호환되며, 측정된 모든 차원에서 성능이 엄격하게 향상되었다.

모델 선택 가이드: Opus 4.6 vs Sonnet 4.6 vs Haiku 4.5

Claude 모델 패밀리는 이제 더 명확한 계층 구조를 갖추고 있다.

| 모델 | 최적 용도 | 가격 (입력/출력 per MTok) | |---|---|---| | Opus 4.6 | 최고 난이도 추론, 연구, 멀티파일 코딩 | $5 / $25 | | Sonnet 4.6 | 일상 개발, 프로덕션 API, Claude Code | $3 / $15 | | Haiku 4.5 | 실시간 챗봇, 자동완성, 대량 처리 | $1 / $5 |

Sonnet 4.6이 적응형 사고를 지원하게 되면서 Sonnet과 Opus 사이의 격차가 좁아졌다. 128K 최대 출력이 필요하거나, 최대한 깊은 추론이 요구되거나, 비용과 관계없이 최고 품질이 필요한 경우에는 Opus를 선택한다. 그 외 모든 경우에는 Sonnet 4.6이 최적의 선택이다.

자주 묻는 질문

Sonnet 4.6은 단순히 Sonnet 4.5에 적응형 사고를 추가한 것인가?

아니다. 적응형 사고가 대표적인 기능이긴 하지만, Sonnet 4.6은 코딩 능력(SWE-bench 80.2%), 추론(ARC-AGI-2 60.4%), 컴퓨터 사용(OSWorld 72.5%) 전반에 걸쳐 상당한 개선을 포함한다. 종합적인 업그레이드에 해당한다.

Sonnet 4.6이 4.5보다 비싼가?

아니다. 가격은 $3/$15 per MTok으로 Sonnet 4.5와 동일하다.

Opus 4.6에서 Sonnet 4.6으로 전환해야 하는가?

워크로드에 따라 다르다. Opus 4.6은 여전히 128K 최대 출력과 가장 복잡한 작업에 대한 더 깊은 추론을 제공한다. Sonnet 4.6은 적응형 사고가 충분한 추론 깊이를 제공하는 비용 민감한 프로덕션 워크로드에 적합하다.

Sonnet 4.6의 모델 ID는 무엇인가?

모델 ID는 claude-sonnet-4-6이다.

Sonnet 4.6은 1M 컨텍스트 윈도우를 지원하는가?

지원한다. 1M 컨텍스트 윈도우는 다른 Claude 4.x 모델과 동일하게 베타로 제공된다.

기존 프롬프트를 수정해야 하는가?

수정할 필요가 없다. Sonnet 4.6은 기존 Sonnet 4.5용 프롬프트와 완전히 호환된다. 적응형 사고는 자동으로 활성화되므로 프롬프트 변경 없이 바로 사용할 수 있다.

결론

Claude Sonnet 4.6은 명확한 업그레이드다. 더 나은 성능, 동일한 가격, 간편한 마이그레이션이라는 세 가지를 동시에 충족한다. Sonnet 티어에 적응형 사고가 추가된 것은 대부분의 개발자가 매일 사용하는 모델에 동적 추론 깊이를 가져왔다는 점에서 의의가 크다. 강력한 벤치마크 향상과 70% 사용자 선호도 승률을 종합하면, Sonnet 4.5에서 마이그레이션해야 할 명확한 근거가 있다.

구현 세부사항은 모델 상세 페이지에서, 다른 모델과의 비교는 비교 페이지에서, 비용 추정은 API 비용 계산기에서 확인할 수 있다.