섹션
벤치마크

벤치마크2026년 6월 17일 · 14분 읽기
Aider Polyglot 코딩에서 GPT-5 vs Gemini 2.5 Pro vs Claude Opus 4
Aider Polyglot 코딩 벤치마크에서 GPT-5, Gemini 2.5 Pro, Claude Opus 4를 데이터 중심으로 비교합니다.

벤치마크2026년 6월 16일 · 14분 읽기
Terminal-Bench 2.0에서 Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus 4.6
Gemini 3.1 Pro가 공통 Terminal-Bench 2.0 하네스에서 앞서지만, 하네스 선택에 따라 CLI 코딩 평가는 달라진다.