How Roblox Doubled AI Code Acceptance.jpg

Roblox 如何将 AI 代码接受率翻倍

Roblox 通过利用内部工程历史和审查数据,训练具备领域感知代码智能的 AI,将 AI 代码接受率从 30% 提升至 60% 以上。

Eliza Crichton-Stuart

Eliza Crichton-Stuart

更新于

How Roblox Doubled AI Code Acceptance.jpg

Roblox 持续扩展人工智能在游戏开发和平台工程中的应用,其最新的内部工作专注于许多工作室面临的一个问题:AI 可以编写代码,但工程师并不总是信任它。Roblox 没有依赖全新的模型,而是通过教授 AI 工程师的实际思考方式来改进其 AI。通过将 AI 工具建立在多年的内部代码、审查和生产数据之上,该公司在 10,000 个 PR 的评估集中,将 AI 生成的拉取请求接受率从约 30% 提高到 60% 以上。同时,一个自动清理代理的准确率达到了 90% 以上。

这种方法将注意力从原始模型能力转移到领域感知代码智能上,AI 能够理解特定工程环境的结构、历史和期望,而不是生成通用建议。

为什么 AI 代码仍需要人类上下文

在整个软件行业,开发时间的大部分用于维护现有系统,而不是构建新系统。Roblox 也面临同样的现实。理论上,维护任务看起来非常适合 AI,因为它们是重复性的且定义明确的。实际上,AI 助手在质量方面常常遇到困难,尤其是在大型且成熟的代码库中。

在 Roblox,挑战不在于 AI 缺乏能力,而在于缺乏上下文。一个通用模型没有经历过 Roblox 20 年的工程决策、性能限制和编码标准。它没有从数十万个已合并的拉取请求中学习,也没有从数百万条评审评论中学习,这些评论中资深工程师解释了为什么某些方法在 Roblox 的规模下效果更好。

尽管许多 Roblox 工程师使用 AI 工具,但只有一小部分 AI 建议在没有大量修改的情况下被接受。工程师们表示,AI 提高了速度,但对 AI 代码质量的信心仍然较低,尤其是在遗留的 C++ 系统和复杂的基础设施中。Roblox 的解决方案是将自身的机构知识直接嵌入到 AI 如何推理代码的方式中。

将 Roblox 的代码库转化为结构化智能

Roblox 的工程历史跨越了近 20 年的提交、设计文档和运行时遥测数据。将其转化为 AI 可以使用的东西比简单地阅读文件要复杂得多。Roblox 运行一个大型的混合语言环境,包含 C++、Lua、构建图、模板和动态依赖项,这些构成了一个网络,而不是一个平坦的代码目录。

为了使其可用,Roblox 构建了一个平台,将版本控制、构建系统和生产遥测数据统一到一个共享表示中。这保留了语法、语义以及系统之间的关系,使 AI 代理能够理解不同组件如何连接以及随时间如何演变。

另一个挑战是时间对齐。运行时数据必须映射回产生它的确切代码版本,即使代码库持续变化。通过将遥测数据链接到特定的修订版本,系统可以以一种反映经验丰富的工程师分析生产问题的方式来推理性能、行为和权衡。

结果是一个基础,AI 可以将代码视为一个活的系统,而不是孤立的文本。

大规模捕获工程师的判断

Roblox 工程文化中最有价值的部分之一体现在代码审查中。资深工程师反复指出在 Roblox 的规模下虽然技术上有效但存在风险的模式,例如在高频循环中执行阻塞调用,这会导致延迟或线程耗尽。

传统上,这种知识是通过评审员手动传递给作者的。Roblox 的对齐系统将这些时刻转化为永久性指导。工程师可以定义示例,描述模式的外观及其重要性。当 AI 或开发人员稍后接触到类似代码时,系统可以标记问题,解释风险,并链接到内部标准。

Roblox 还挖掘其历史拉取请求评论,以自动提取反复出现的教训。评审评论被嵌入到向量空间中,按主题聚类,并使用模型辅助分析提炼成通用规则。领域专家随后审查并推广最强的候选者到知识库中。

这个过程将多年的非正式反馈转化为结构化、可重用的标准,AI 代理和工程师可以一致地应用这些标准。Roblox 报告称,一旦与这些示例对齐,一个编码代理在其内部通过率从 80% 以上提高到其黄金评估数据集上的完全正确。

从失败的 AI 建议中学习

Roblox 的系统不仅从成功中学习。被拒绝的 AI 建议、糟糕的重构和回归被视为高价值数据。工程师用推理和上下文标记失败,并将这些信息嵌入和索引以供将来使用。

当 AI 提出新代码时,它会搜索过去的错误和批评,以避免重复类似的问题。随着时间的推移,这会形成一个反馈循环,每一次审查都会加强未来的行为。Roblox 没有丢弃失败,而是将它们转化为训练信号,从而改进代理如何推理代码质量和风险。

使用工程指标衡量信任

提高 AI 代码质量也需要可靠的衡量。Roblox 构建了一个评估框架,使用自动化和人工验证来跟踪代理的性能。

该系统使用可重现的模拟和专家比较,在重构、错误修复和测试任务中测试 AI。评估在更改合并前在持续集成管道中运行,同时跟踪合并后信号,如回归、回滚和延迟变化。

这会产生一个质量分数,显示代理在版本之间的改进或回归情况。在引入示例对齐和结构化评估后,Roblox 在大型测试集中看到 PR 建议的接受率从约 30% 上升到 60% 以上。一个功能标志清理代理的准确率也从 50% 以下提高到 90% 以上。

对 Roblox 而言,信任更多地建立在可预测、可衡量的行为之上,而不是承诺。

这对 Roblox 的工程未来意味着什么

Roblox 正在通过额外的工具层和自动化来扩展其平台,以便 AI 代理能够处理比孤立任务更多的内容。更长期的目标是在日常工作流程中嵌入运行时上下文和专家判断,同时持续维护代码健康。

Roblox 的目标不是将 AI 视为一个独立的助手,而是使其成为工程环境本身的一部分。通过结合领域感知智能、专家对齐和可观察性,该公司预计将实现更快的交付、更好的质量以及更少的时间花费在重复性维护工作上。

对工程师来说,这意味着机构记忆可以按需获取,并且可以花费更多时间构建功能,而不是修复可避免的问题。

在此处查看亚马逊上的Roblox 礼品卡

在此处了解其他流行的Roblox 游戏体验

Grow a Garden

Plants vs Brainrots

Steal a Brainrot

99 Nights in the Forest

Endless Horde

Blade x Zombies

常见问题解答 (FAQs)

Roblox 的领域感知代码智能是什么?
领域感知代码智能意味着使用 Roblox 自身的工程历史、标准和运行时数据来训练 AI 工具,以便系统能够理解 Roblox 代码的结构和审查方式,而不是依赖通用的编码行为。

Roblox 的 AI 代码接受率提高了多少?
在将 AI 行为与内部工程标准对齐后,Roblox 在 10,000 个 PR 的评估集中,将 AI 生成的拉取请求接受率从约 30% 提高到 60% 以上。

为什么新的 AI 模型不够用?
仅凭一个更强大的模型无法理解 Roblox 独特的架构、性能限制或编码文化。Roblox 专注于添加来自多年内部代码和审查的上下文,而不是更换模型。

Roblox 如何为 AI 捕获工程师的专业知识?
Roblox 从历史代码审查中提取模式,并允许专家定义描述模式是什么以及为什么它很重要的示例。这些成为 AI 和工程师可重用的规则。

Roblox 如何防止 AI 重复错误?
被拒绝的 AI 建议和失败的更改会被标记并嵌入到系统中。当生成新代码时,AI 会搜索过去的失败以避免重复类似的问题。

这对使用 Roblox 的开发者意味着什么?
虽然这项工作是内部的,但更好的 AI 工具可以提高平台稳定性和开发速度,最终支持在 Roblox 上构建游戏和体验的创作者。

这与 web3 开发有关吗?
不。Roblox 的 AI 代码智能专注于平台工程和大规模系统,而不是 web3 技术。

教育类

已更新

March 31st 2026

已发布

March 31st 2026

0 条评论

相关新闻

热门故事