KAT-Dev-72B-Exp是一个专门为软件工程师定制的,在SWE-Bench Verified的硬核编程能力测试里,拿到了74.6%的准确率。这个分数,直接登顶了所有开源代码模型的第一名,并且跟闭源GPT-5的74.9%成绩,就差了那么一丁点儿。
DeepSeek-R1荣登Nature封面,成为史上首个经严格同行评议的大模型。年仅18岁的天才少年涂津豪作为作者之一,以实习生身份参与其中,他的故事从高中生到Nature作者,堪称励志传奇。
前端开发排行榜中,国产开源模型更是实现了跟编程 SOTA Claude 的分庭抗礼,DeepSeek-R1 / V3.1、GLM-4.6 和 Qwen3-Coder 都排到了前 10。