为了对比现有的模型能力,有网友采用了具有代表性的顶级编程模型 Claude 4.5 Sonnet 也采用类似的提示词进行了操作系统的生成,结果发现不仅图标显示不全,而且无法和生成出的任何内容进行交互,处于完全不可用的状态。
此前,为了让社区尽早探索万亿思考模型Ring-1T的推理上限,蚂蚁早在9月30日便提前开源其预览版Ring-1T-preview。 在数学竞赛能力上,Ring-1T对比preview有所提升,在AIME25、HMMT25测试中继续保持开源SOTA。