跳到正文
This is Oscar
返回

Cursor 发布 Composer 2:前沿水准的编程模型

原文标题:Introducing Composer 2
原文链接:https://cursor.com/blog/composer-2

Composer 2 发布

Cursor 团队 — 2026 年 3 月 19 日

Composer 2 现已在 Cursor 中可用。

它在编程方面达到了前沿水准,定价为 $0.50/M 输入 token 和 $2.50/M 输出 token,成为智能与成本的全新最优组合。

前沿级编程智能

我们正在快速提升模型质量。Composer 2 在我们衡量的所有基准测试上都取得了大幅提升,包括 Terminal-Bench 2.0 和 SWE-bench Multilingual:

CursorBench 散点图

模型CursorBenchTerminal-Bench 2.0SWE-bench Multilingual
Composer 261.361.773.7
Composer 1.544.247.965.9
Composer 138.040.056.9

Terminal-Bench 分数对比

这些质量提升得益于我们首次进行的持续预训练(continued pretraining),这为扩展强化学习提供了更强的基础。

在此基础上,我们通过强化学习在长时间段编程任务上进行训练。Composer 2 能够解决需要数百次操作的高难度任务。

试用 Composer 2

Composer 2 定价为 $0.50/M 输入 token 和 $2.50/M 输出 token。

我们还提供了一个具有相同智能的更快变体,定价为 $1.50/M 输入 token 和 $7.50/M 输出 token,其成本低于其他快速模型。快速版本现已成为默认选项。完整详情请参阅模型文档

速度与成本对比

在个人计划中,Composer 的使用量属于一个独立的使用池,包含慷慨的免费额度。立即在 Cursor 或新界面的早期 Alpha 版本中试用 Composer 2。


注释:

  1. Terminal-Bench 2.0 由 Laude Institute 维护。Anthropic 使用 Claude Code harness;OpenAI 使用 Simple Codex harness。Cursor 的分数使用 Harbor 评估框架在默认设置下计算,每个模型-Agent 对取 5 次迭代的平均值。

  2. TPS 数据来自 2026 年 3 月 18 日 Cursor 流量快照。Anthropic 的 token 约比标准 token 小 15%,已做相应归一化处理。速度因服务商容量不同而有所差异。


引用


分享到:

上一篇
Claude Code Auto Mode:更安全地跳过权限审批
下一篇
Moda 如何用 Deep Agents 构建生产级 AI 设计 Agent