在 ARC-AGI-2 这个公认的推理基准测试中, Gemini 3.1 Pro 拿到了 77.1% 的分数 。什么概念?它的前辈 Gemini 3 Pro 只有 31.1%,就连专门用来「深度思考」的 Gemini 3 Deep Think 也只有 ...
在AI领域竞争白热化的当下,谷歌携Gemini 3.1 Pro强势入局,为这场技术盛宴再添一把火。当地时间2月19日,谷歌正式发布这款备受瞩目的新模型,没有华丽的宣传辞藻,而是用一组亮眼的数据彰显实力。
Anthropic 发布 Claude Sonnet 4.6,正式替代 Sonnet 4.5 成为免费和 Pro 用户的默认模型一句话总结Claude Sonnet 4.6 是 Anthropic 目前最强的 Sonnet 模型。它在几乎所有能力维度上都接近甚至追平了旗舰级别的 Opus,但价格只有 Opus 的几分之一。API 定价保持不变:输入 $3 / 百万 token,输出 $15 / 百 ...