Published on2026年1月29日Agent Lightning:用“可观测执行轨迹”驱动 Agent 的系统化优化(从上手到落地)AIAgentRLPromptTracingObservabilityTraining介绍 Agent Lightning 的定位与核心架构,并给出从易到难的上手路线:先采集轨迹与回放,再做 APO 提示词优化、SFT 微调、VERL 强化学习,最后把它落到真实业务的评估与持续改进闭环。