前者聚焦平衡实用,适用于日常问答、通用Agent任务、真实应用场景下的工具调用。 推理达GPT-5水平,略低于Gemini-3.0-Pro。 后者主打极致推理,推理基准性能媲美Gemini-3.0-Pro。 还一把斩获IMO 2025、CMO ...