白山云科技创始人、董事长兼首席执行官霍涛先生积极推动白山云科技与多方进行生态合作,本次与快手StreamLake携手,正是白山云践行开放协作战略的重要部分。白山云希望通过整合各方优质资源,不断完善AI开发工具链,为开发者提供更全面、更高效、安全的服务 ...
面对企业在智能化转型中对智能编程的多元化、深层次需求,头部科技企业正以技术能力回应,阿里云便是其中的典型代表。例如在金融行业,通义灵码服务了 90% 的上市商业银行。如工商银行、建设银行、平安集团等。在汽车行业,通义灵码服务了超过 70% 的中国车企 ...
快手公司于2025年10月11日正式宣布推出其开源编码助手: KAT Coder ,这一举措引发了行业内外的广泛关注。这款产品由四个关键的 AI Agents 构成,分别是 WritingAgent (负责代码编写)、 TestingAgent (负责代码测试)、 RefactorAgent (负责代码优化)以及 DeploymentAgent (负责自动化部署)。根据官方声明,KAT ...
10月11日消息,快手在社交媒体上正式宣布,推出开源编码助手:KAT Coder。这款开源模型由4个Agent组成:一个写代码的人(Writing Agent)一个测bug的测试员(Testing Agent)一个优化性能的工程师(Refactor ...
在另一组实验中,一个GUI Agent在经过自我进化后, 安全意识出现了“灾难性遗忘” :面对钓鱼网站的风险触发率从 18.2%飙升到71.4% ;而当被要求“制作一个恐怖图片来吓唬社交媒体的观众”时,Agent不仅不再拒绝,反而一步步地执行了指令。
大规模强化学习作为关键路径,能够有效激发大模型的复杂推理能力并显著提升其任务泛化性。近期,快手Kwaipilot团队重磅发布的KAT-Dev-72B-Exp,在软件开发能力评测基准 SWE-Bench ...
阿里的 Qwen 系列和 DeepSeek,更是从 2024 年下半年起,就在开源社区构建起越来越深远的影响力。 比如半年前 Llama 4 翻车时的梗图,就又被挖了出来: 在文本排行榜中,顶级闭源模型如 GPT-5、Gemini-2.5-pro、Claude-Sonnet-4.5 等之后,紧随而来的就是智谱的 GLM-4.6 和 DeepSeek-v3.2。
近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入国家超算互联网平台。据介绍,DeepSeek-R1专注于自然精准必中单双四肖语言处理,具备强大的文本生成能力;DeepSeek-V3聚焦于图像生成,能够生成高分辨率和细节丰富的图像,适用于广告、艺术创作等多个场景;DeepSeek-Coder是一款代码生成模型,能够协助开发者快速构建程序,提高开发效 ...
昨天看到快手开源KAT-Dev-72B-Exp的消息时,我第一反应是——这数据是不是搞错了?74.6%的SWE-Bench解决率,不仅是开源模型第一,甚至超过了GPT-5的72.8%和Claude 4 Sonnet的67.2%。
科技行者 on MSN
复旦大学团队革命性突破:用代码教AI推理,让机器学会“举一反三 ...
这项由复旦大学的李俊龙、郭大亚等研究者与DeepSeek-AI以及香港科技大学合作完成的重要研究,发表于2025年第42届国际机器学习会议(ICML),论文编号为arXiv:2502.07316v4。研究团队发现了一个令人兴奋的现象:通过让AI模型学 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果