原文标题：Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation
原文链接：https://engineering.fb.com/2026/03/17/developer-tools/ranking-engineer-agent-rea-autonomous-ai-system-accelerating-meta-ads-ranking-innovation/

Ranking Engineer Agent（REA）：加速 Meta 广告排序创新的自主 AI Agent

作者：Ashwin Kumar、Erwin Gao、Matan Levi、Sheela Yadawad、Sherman Wong、Sneha Iyer、Vinodh Kumar Sunkara

核心成果

Meta 的 Ranking Engineer Agent（REA）能够自主执行广告排序模型端到端机器学习生命周期中的关键步骤
本文介绍 REA 的 ML 实验能力：自主生成假设、启动训练任务、调试失败并迭代结果
REA 通过休眠-唤醒（hibernate-and-wake）机制减少人工干预需求，管理跨越数天到数周的异步工作流，并在关键决策节点保留人类监督
2 倍模型精度： REA 驱动的迭代在六个模型上将平均模型精度提升至基线方法的 2 倍
5 倍工程产出： 三名工程师为八个模型交付了改进方案——这在过去需要每个模型配备两名工程师

传统 ML 实验的瓶颈

Meta 的广告系统为 Facebook、Instagram、Messenger 和 WhatsApp 上的数十亿用户提供个性化体验。这些交互依赖于高度复杂的、大规模分布式 ML 模型，并且持续演进。

优化这些 ML 模型一直非常耗时。工程师需要构建假设、设计实验、启动训练运行、在复杂代码库中调试失败、分析结果并反复迭代。每个完整周期持续数天到数周。随着 Meta 模型的成熟，找到有意义的改进变得越来越困难。传统 ML 实验的手动、串行特性已成为创新的瓶颈。

为了解决这一问题，Meta 构建了 Ranking Engineer Agent——一个自主 AI Agent，旨在驱动端到端 ML 生命周期，并大规模迭代演进 Meta 的广告排序模型。

介绍 REA：一种新型自主 Agent

许多用于 ML 工作流的 AI 工具本质上是助手：它们是被动的、任务范围受限的、且绑定在单次会话中。它们可以协助完成单个步骤（起草假设、编写配置文件、解读日志），但通常无法端到端地运行一次实验。工程师仍需决定下一步做什么、重新建立上下文，并在长时间运行的任务中推动进展——还要调试不可避免的失败。

REA 则不同：它是一个为驱动端到端 ML 生命周期而构建的自主 Agent，能够在跨越多天的工作流中协调和推进 ML 实验，并将人工干预降至最低。

REA 解决了自主 ML 实验中的三个核心挑战：

长周期异步工作流自主性： ML 训练任务运行数小时乃至数天，远超任何会话绑定助手的能力范围。REA 在跨越数天或数周的多轮工作流中维持持久状态和记忆，无需持续人工监督即可保持协调。
高质量、多样化的假设生成： 实验质量取决于驱动它的假设质量。REA 综合历史实验结果和前沿 ML 研究成果，挖掘出不太可能从单一方法中产生的配置方案，并在每次迭代中不断改进。
在真实约束条件下的弹性运行： 基础设施故障、意外错误和计算预算不能让自主 Agent 停摆。REA 在预定义的安全边界内进行适应，使工作流持续推进，而不将日常故障升级给人类。

REA 通过以下方式解决这些挑战：用于跨越多周持续运行的休眠-唤醒机制（Hibernate-and-Wake Mechanism）、结合历史洞察数据库和深度 ML 研究 Agent 的双源假设引擎（Dual-Source Hypothesis Engine），以及在工程师批准的计算预算内运行的三阶段规划框架（Validation → Combination → Exploitation）。

REA 如何自主管理多天 ML 工作流

REA 基于一个核心洞察构建：复杂的 ML 优化不是单一任务，而是一个跨越数天或数周展开的多阶段过程。Agent 必须在整个时间跨度内进行推理、规划、适应和持久化。

长周期工作流自主性

传统 AI 助手以短暂的交互方式运行，响应提示然后等待下一个查询。ML 实验不是这样工作的。训练任务运行数小时到数天，Agent 必须在较长时间线上保持协调。

REA 使用休眠-唤醒机制。当 Agent 启动训练任务时，它将等待委托给后台系统，自行关闭以节省资源，并在任务完成时自动从中断处恢复。这使得在不需要持续人工监控的情况下，实现跨较长时间段的高效、持续运行。

为了支撑这一机制，Meta 在内部 AI Agent 框架 Confucius 上构建了 REA。Confucius 专为复杂的多步推理任务设计，提供强大的代码生成能力和灵活的 SDK，可与 Meta 内部工具系统集成，包括任务调度器、实验追踪基础设施和代码库导航工具。

高质量、多样化的假设生成

假设的质量直接决定了 ML 实验的质量。REA 咨询两个专门系统来生成多样化的高质量想法：

历史洞察数据库（Historical Insights Database）： 一个经过整理的历史实验库，支持上下文学习和对以往成功与失败的模式识别。
ML 研究 Agent（ML Research Agent）： 一个深度研究组件，利用 Meta 的历史洞察数据库，调查基线模型配置并提出新的优化策略。

通过综合两个来源的洞察，REA 能挖掘出单独使用任何一种方法都不太可能产生的配置方案。REA 最有影响力的改进往往是将架构优化与训练效率技术相结合的成果——这正是这种跨系统方法论的产物。

在真实约束条件下的弹性执行

真实世界的实验在计算约束和不可避免的失败条件下运行。REA 通过结构化规划和自主适应来应对这两个问题。

在执行任何计划之前，REA 会提出详细的探索策略，估算总 GPU 计算成本，并与工程师确认方案。一个典型的多阶段计划分三个阶段推进：

验证（Validation）： 来自不同来源的各个假设并行测试，以建立质量基线。
组合（Combination）： 将有前途的假设组合在一起，寻找协同改进。
深度优化（Exploitation）： 在批准的计算预算内对最有前途的候选方案进行深度探索，以最大化结果。

当 REA 遇到失败——例如基础设施问题、意外错误或次优结果时——它在预定义的安全边界内调整计划，而不是等待人工干预。它会查阅常见失败模式的运行手册（runbook），做出优先级决策（例如排除出现内存不足错误或训练不稳定信号如损失爆炸的任务），并从第一性原理出发调试初步的基础设施故障。这种弹性对于在长周期任务中维持自主性至关重要——在这些任务中，工程师提供定期监督而非持续监控。

REA 在严格的安全机制下运行。它仅在 Meta 的广告排序模型代码库上工作。工程师通过预检清单审查授予明确的访问控制，REA 预先确认计算预算，并在达到阈值时暂停或中止运行。

REA 系统架构

REA 系统架构图

Ranking Engineer Agent 基于两个相互连接的组件构建：REA Planner 和 REA Executor，并由共享的 Skill、Knowledge 和 Tool 系统提供支持，该系统提供 ML 能力、历史实验数据以及与 Meta 内部基础设施的集成。

长周期自主性由执行流驱动：工程师与假设生成器协作，通过 REA Planner 创建详细的实验计划。该计划被导出到 REA Executor，后者通过 Agent 循环和等待状态管理异步任务执行——在训练运行期间进入等待状态，在结果就绪时恢复执行，而不需要在跨越多周的工作流中进行持续的人工监控。

高质量、多样化的假设生成由知识流驱动：当 Executor 完成实验时，专用的实验记录器会将结果、关键指标和配置记录到集中式的假设实验洞察数据库中。这种持久记忆积累了 Agent 整个运行历史中的知识。假设生成器从这些洞察中识别模式，从以往的成功和失败中学习，并为每个后续轮次提出越来越复杂的假设，形成闭环并随时间不断增强系统的智能。

弹性执行贯穿两个流程：当 Executor 遇到失败、基础设施错误、内存不足信号或训练不稳定时，它会查阅常见失败模式的运行手册并应用优先级逻辑，在预定义的安全边界内自主适应。然后，它以可操作的结果恢复 Planner，而不是将日常中断暴露给工程师。

影响：模型精度与工程生产力

模型精度提升至基线方法的 2 倍

在首次针对六个模型的生产验证中，REA 驱动的迭代将平均模型精度提升至基线方法的 2 倍。这直接转化为更强的广告主成效和更好的 Meta 平台用户体验。

5 倍工程生产力提升

REA 通过自动化 ML 实验的机械性工作来放大影响力，使工程师能够专注于创造性问题解决和战略思考。过去需要多名工程师花费数周完成的复杂架构改进，现在可以由更小的团队在数天内完成。

早期采用者使用 REA 后，在相同时间内将模型改进提案从一个增加到五个。过去每个模型需要两名工程师的工作，现在三名工程师即可覆盖八个模型。

ML 工程中人机协作的未来

REA 代表着 Meta 在 ML 工程方法上的一次转变。通过构建能够自主管理整个实验生命周期的 Agent，团队正在改变 ML 开发的结构——将工程师从亲力亲为的实验执行转向战略监督、假设引导和架构决策。

这种新范式——Agent 处理迭代机制而人类做出战略决策和最终审批——只是一个开始。隐私、安全和治理仍然是 Agent 的关键优先事项。Meta 将继续通过微调专用模型以改进假设生成、扩展分析工具以及将这一方法推广到新领域来增强 REA 的能力。

引用

原文：Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation — Engineering at Meta，2026 年 3 月 17 日