セクション
ベンチマーク

ベンチマーク2026年6月17日 · 15分で読めます
Aider Polyglot Codingで比較するGPT-5 vs Gemini 2.5 Pro vs Claude Opus 4
Aider Polyglotのコーディング性能でGPT-5、Gemini 2.5 Pro、Claude Opus 4をデータ重視で比較。

ベンチマーク2026年6月16日 · 16分で読めます
Terminal-Bench 2.0におけるGemini 3.1 Pro vs GPT-5.2 vs Claude Opus 4.6
Gemini 3.1 Proは共通のTerminal-Bench 2.0ハーネスで首位。ただし、ハーネスの選択でCLIコーディング評価は変わる。