栏目
评测

评测2026年6月17日 · 13 分钟阅读
GPT-5、Gemini 2.5 Pro 与 Claude Opus 4 在 Aider Polyglot 编程基准上的对比
以数据为先,对比 GPT-5、Gemini 2.5 Pro 和 Claude Opus 4 在 Aider Polyglot 编程基准上的表现。

评测2026年6月16日 · 13 分钟阅读
Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus 4.6:Terminal-Bench 2.0 对比
Gemini 3.1 Pro 在共享 Terminal-Bench 2.0 框架中领先,但框架选择会改变 CLI 编码能力的结论。