为此,微软团队推出了一个灵活、可扩展的框架Agent Lightning,其可对任何AI Agent进行基于强化学习的LLM训练,有望重塑AI Agent的未来训练范式。相关研究论文已发表在预印本网站arXiv上。