原文标题:Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation
原文链接:https://engineering.fb.com/2026/03/17/developer-tools/ranking-engineer-agent-rea-autonomous-ai-system-accelerating-meta-ads-ranking-innovation/
Ranking Engineer Agent(REA):加速 Meta 广告排序创新的自主 AI Agent

作者:Ashwin Kumar、Erwin Gao、Matan Levi、Sheela Yadawad、Sherman Wong、Sneha Iyer、Vinodh Kumar Sunkara
核心成果
- Meta 的 Ranking Engineer Agent(REA)能够自主执行广告排序模型端到端机器学习生命周期中的关键步骤
- 本文介绍 REA 的 ML 实验能力:自主生成假设、启动训练任务、调试失败并迭代结果
- REA 通过休眠-唤醒(hibernate-and-wake)机制减少人工干预需求,管理跨越数天到数周的异步工作流,并在关键决策节点保留人类监督
- 2 倍模型精度: REA 驱动的迭代在六个模型上将平均模型精度提升至基线方法的 2 倍
- 5 倍工程产出: 三名工程师为八个模型交付了改进方案——这在过去需要每个模型配备两名工程师
传统 ML 实验的瓶颈
Meta 的广告系统为 Facebook、Instagram、Messenger 和 WhatsApp 上的数十亿用户提供个性化体验。这些交互依赖于高度复杂的、大规模分布式 ML 模型,并且持续演进。
优化这些 ML 模型一直非常耗时。工程师需要构建假设、设计实验、启动训练运行、在复杂代码库中调试失败、分析结果并反复迭代。每个完整周期持续数天到数周。随着 Meta 模型的成熟,找到有意义的改进变得越来越困难。传统 ML 实验的手动、串行特性已成为创新的瓶颈。
为了解决这一问题,Meta 构建了 Ranking Engineer Agent——一个自主 AI Agent,旨在驱动端到端 ML 生命周期,并大规模迭代演进 Meta 的广告排序模型。
介绍 REA:一种新型自主 Agent
许多用于 ML 工作流的 AI 工具本质上是助手:它们是被动的、任务范围受限的、且绑定在单次会话中。它们可以协助完成单个步骤(起草假设、编写配置文件、解读日志),但通常无法端到端地运行一次实验。工程师仍需决定下一步做什么、重新建立上下文,并在长时间运行的任务中推动进展——还要调试不可避免的失败。
REA 则不同:它是一个为驱动端到端 ML 生命周期而构建的自主 Agent,能够在跨越多天的工作流中协调和推进 ML 实验,并将人工干预降至最低。
REA 解决了自主 ML 实验中的三个核心挑战:
-
长周期异步工作流自主性: ML 训练任务运行数小时乃至数天,远超任何会话绑定助手的能力范围。REA 在跨越数天或数周的多轮工作流中维持持久状态和记忆,无需持续人工监督即可保持协调。
-
高质量、多样化的假设生成: 实验质量取决于驱动它的假设质量。REA 综合历史实验结果和前沿 ML 研究成果,挖掘出不太可能从单一方法中产生的配置方案,并在每次迭代中不断改进。
-
在真实约束条件下的弹性运行: 基础设施故障、意外错误和计算预算不能让自主 Agent 停摆。REA 在预定义的安全边界内进行适应,使工作流持续推进,而不将日常故障升级给人类。
REA 通过以下方式解决这些挑战:用于跨越多周持续运行的休眠-唤醒机制(Hibernate-and-Wake Mechanism)、结合历史洞察数据库和深度 ML 研究 Agent 的双源假设引擎(Dual-Source Hypothesis Engine),以及在工程师批准的计算预算内运行的三阶段规划框架(Validation → Combination → Exploitation)。
REA 如何自主管理多天 ML 工作流
REA 基于一个核心洞察构建:复杂的 ML 优化不是单一任务,而是一个跨越数天或数周展开的多阶段过程。Agent 必须在整个时间跨度内进行推理、规划、适应和持久化。
长周期工作流自主性
传统 AI 助手以短暂的交互方式运行,响应提示然后等待下一个查询。ML 实验不是这样工作的。训练任务运行数小时到数天,Agent 必须在较长时间线上保持协调。
REA 使用休眠-唤醒机制。当 Agent 启动训练任务时,它将等待委托给后台系统,自行关闭以节省资源,并在任务完成时自动从中断处恢复。这使得在不需要持续人工监控的情况下,实现跨较长时间段的高效、持续运行。
为了支撑这一机制,Meta 在内部 AI Agent 框架 Confucius 上构建了 REA。Confucius 专为复杂的多步推理任务设计,提供强大的代码生成能力和灵活的 SDK,可与 Meta 内部工具系统集成,包括任务调度器、实验追踪基础设施和代码库导航工具。
高质量、多样化的假设生成
假设的质量直接决定了 ML 实验的质量。REA 咨询两个专门系统来生成多样化的高质量想法:
- 历史洞察数据库(Historical Insights Database): 一个经过整理的历史实验库,支持上下文学习和对以往成功与失败的模式识别。
- ML 研究 Agent(ML Research Agent): 一个深度研究组件,利用 Meta 的历史洞察数据库,调查基线模型配置并提出新的优化策略。
通过综合两个来源的洞察,REA 能挖掘出单独使用任何一种方法都不太可能产生的配置方案。REA 最有影响力的改进往往是将架构优化与训练效率技术相结合的成果——这正是这种跨系统方法论的产物。
在真实约束条件下的弹性执行
真实世界的实验在计算约束和不可避免的失败条件下运行。REA 通过结构化规划和自主适应来应对这两个问题。
在执行任何计划之前,REA 会提出详细的探索策略,估算总 GPU 计算成本,并与工程师确认方案。一个典型的多阶段计划分三个阶段推进:
- 验证(Validation): 来自不同来源的各个假设并行测试,以建立质量基线。
- 组合(Combination): 将有前途的假设组合在一起,寻找协同改进。
- 深度优化(Exploitation): 在批准的计算预算内对最有前途的候选方案进行深度探索,以最大化结果。
当 REA 遇到失败——例如基础设施问题、意外错误或次优结果时——它在预定义的安全边界内调整计划,而不是等待人工干预。它会查阅常见失败模式的运行手册(runbook),做出优先级决策(例如排除出现内存不足错误或训练不稳定信号如损失爆炸的任务),并从第一性原理出发调试初步的基础设施故障。这种弹性对于在长周期任务中维持自主性至关重要——在这些任务中,工程师提供定期监督而非持续监控。
REA 在严格的安全机制下运行。它仅在 Meta 的广告排序模型代码库上工作。工程师通过预检清单审查授予明确的访问控制,REA 预先确认计算预算,并在达到阈值时暂停或中止运行。
REA 系统架构

Ranking Engineer Agent 基于两个相互连接的组件构建:REA Planner 和 REA Executor,并由共享的 Skill、Knowledge 和 Tool 系统提供支持,该系统提供 ML 能力、历史实验数据以及与 Meta 内部基础设施的集成。
长周期自主性由执行流驱动:工程师与假设生成器协作,通过 REA Planner 创建详细的实验计划。该计划被导出到 REA Executor,后者通过 Agent 循环和等待状态管理异步任务执行——在训练运行期间进入等待状态,在结果就绪时恢复执行,而不需要在跨越多周的工作流中进行持续的人工监控。
高质量、多样化的假设生成由知识流驱动:当 Executor 完成实验时,专用的实验记录器会将结果、关键指标和配置记录到集中式的假设实验洞察数据库中。这种持久记忆积累了 Agent 整个运行历史中的知识。假设生成器从这些洞察中识别模式,从以往的成功和失败中学习,并为每个后续轮次提出越来越复杂的假设,形成闭环并随时间不断增强系统的智能。
弹性执行贯穿两个流程:当 Executor 遇到失败、基础设施错误、内存不足信号或训练不稳定时,它会查阅常见失败模式的运行手册并应用优先级逻辑,在预定义的安全边界内自主适应。然后,它以可操作的结果恢复 Planner,而不是将日常中断暴露给工程师。
影响:模型精度与工程生产力
模型精度提升至基线方法的 2 倍
在首次针对六个模型的生产验证中,REA 驱动的迭代将平均模型精度提升至基线方法的 2 倍。这直接转化为更强的广告主成效和更好的 Meta 平台用户体验。
5 倍工程生产力提升
REA 通过自动化 ML 实验的机械性工作来放大影响力,使工程师能够专注于创造性问题解决和战略思考。过去需要多名工程师花费数周完成的复杂架构改进,现在可以由更小的团队在数天内完成。
早期采用者使用 REA 后,在相同时间内将模型改进提案从一个增加到五个。过去每个模型需要两名工程师的工作,现在三名工程师即可覆盖八个模型。
ML 工程中人机协作的未来
REA 代表着 Meta 在 ML 工程方法上的一次转变。通过构建能够自主管理整个实验生命周期的 Agent,团队正在改变 ML 开发的结构——将工程师从亲力亲为的实验执行转向战略监督、假设引导和架构决策。
这种新范式——Agent 处理迭代机制而人类做出战略决策和最终审批——只是一个开始。隐私、安全和治理仍然是 Agent 的关键优先事项。Meta 将继续通过微调专用模型以改进假设生成、扩展分析工具以及将这一方法推广到新领域来增强 REA 的能力。
引用
- 原文:Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation — Engineering at Meta,2026 年 3 月 17 日