Reinforcement Learning AI

打造自主学习的AI Agent：强化学习+LangGraph代码示例

在充满不确定性的现实世界里，AI的价值不在于预设规则，而在于持续学习和适应 AI Agent这个概念最近被炒得很热，从管理日程的语音助手到仓库里跑来跑去的机器人，大家都在谈论Agent的"自主性"。但是真正让Agent变得intelligent的核心技术，其实是强化学习（Reinforcement Learning, RL）。想象一下自动驾驶汽车在复杂路况中的决策，或者量化交易系统在市场波动时的 ...

4 天

李曼玲联合团队开源新训练框架VAGEN，让AI智能体学会“看懂”并推理 ...

近日，美国西北大学计算机系李曼玲教授团队联合华盛顿大学、斯坦福大学和微软研究院，提出了一个名为 VAGEN 的训练框架，专门用于训练能够在多轮交互中构建“内部世界模型 ” 的视觉语言模型（Vision-Language ...

9 天

特斯拉AI前成员卡帕西给Agent泼冷水：真正成熟还需十年

2025年被称为智能体Agent之年，当行业的热潮席卷全球之际，OpenAI创始成员、特斯拉前AI总监安德烈·卡帕西（Andrej Karpathy）近日在接受播客节目“Dwarkesh Patel ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

打造自主学习的AI Agent：强化学习+LangGraph代码示例

李曼玲联合团队开源新训练框架VAGEN，让AI智能体学会“看懂”并推理 ...

特斯拉AI前成员卡帕西给Agent泼冷水：真正成熟还需十年

今日热点