Roblox 持續擴展人工智慧在遊戲開發與平台工程的應用,而其最新的內部工作聚焦於許多工作室面臨的難題:AI 能編寫程式碼,但工程師並不總是信任它。Roblox 並非依賴全新的模型,而是透過教授 AI 模擬 Roblox 工程師的實際思考方式來改進其 AI。透過將 AI 工具建立在多年的內部程式碼、審查和生產數據之上,該公司在 10,000 個 PR 的評估集中,將 AI 生成的 PR 接受率從約 30% 提高到 60% 以上。同時,一個自動化清理代理的準確度也達到了 90% 以上。
這種方法將注意力從原始模型能力轉移到領域感知程式碼智慧,AI 在其中理解特定工程環境的結構、歷史和期望,而不是產生通用建議。
為何 AI 程式碼仍需要人類的脈絡
在整個軟體產業中,開發時間的很大一部分用於維護現有系統,而非建構新系統。Roblox 也面臨同樣的現實。理論上,維護任務因其重複性和明確性,是 AI 的理想應用。但實際上,AI 助手在品質方面經常遇到困難,尤其是在大型且成熟的程式碼庫中。
在 Roblox,挑戰並非 AI 缺乏能力,而是缺乏脈絡。一個通用模型並未經歷 Roblox 20 年的工程決策、效能限制和編碼標準。它沒有從數十萬個合併的 PR 或數百萬則資深工程師解釋為何某些方法在 Roblox 的規模下效果更好的審查評論中學習。
即使許多 Roblox 工程師使用 AI 工具,只有一小部分 AI 建議能被接受而無需大幅修改。工程師回報 AI 提高了速度,但對 AI 程式碼品質的信心仍然較低,尤其是在舊的 C++ 系統和複雜的基礎設施中。Roblox 的解決方案是將其自身的機構知識直接嵌入 AI 思考程式碼的方式中。
將 Roblox 的程式碼庫轉化為結構化智慧
Roblox 的工程歷史橫跨近 20 年的提交、設計文件和運行時遙測數據。將這些轉化為 AI 可用的東西,比單純讀取檔案更複雜。Roblox 營運著一個大型的多語言環境,包含 C++、Lua、建構圖、模板和動態依賴,它們形成一個網路,而非平坦的程式碼目錄。
為了使其可用,Roblox 建構了一個平台,將版本控制、建構系統和生產遙測數據統一為共享表示。這保留了語法、語義以及系統之間的關係,讓 AI 代理能夠理解不同組件如何連接並隨時間演變。
另一個挑戰是時間對齊。即使程式碼庫持續變化,運行時數據也必須映射回產生它的確切程式碼版本。透過將遙測數據連結到特定修訂版,系統可以像經驗豐富的工程師分析生產問題一樣,推理效能、行為和權衡。
結果是一個基礎,讓 AI 可以將程式碼視為一個活躍的系統,而不是孤立的文字。
規模化捕捉工程師的判斷
Roblox 工程文化中最有價值的部份之一體現在程式碼審查中。資深工程師反覆指出在 Roblox 的規模下技術上有效但有風險的模式,例如在高頻迴圈中進行阻塞調用,這會引入延遲或執行緒耗盡。
傳統上,這些知識是透過審查者手動傳遞給作者。Roblox 的對齊系統將這些時刻轉化為永久性指導。工程師可以定義範例,描述模式的樣貌及其重要性。當 AI 或開發人員稍後接觸類似程式碼時,系統可以標記問題,解釋風險,並連結到內部標準。
Roblox 還會挖掘其歷史 PR 評論,自動提取重複出現的教訓。審查評論被嵌入向量空間,按主題分組,並使用模型輔助分析精煉成通用規則。然後,領域專家會審查並將最強的候選者推廣到知識庫中。
這個過程將多年的非正式回饋轉化為結構化、可重複使用的標準,AI 代理和工程師可以一致地應用。一旦與這些範例對齊,Roblox 報告稱一個編碼代理在其內部通過率從 80% 中段提升到在其黃金評估數據集上達到完全正確。
從失敗的 AI 建議中學習
Roblox 的系統不僅從成功中學習。被拒絕的 AI 建議、不良的重構和回歸都被視為高價值數據。工程師會標記失敗並提供原因和脈絡,這些資訊會被嵌入和索引以供將來使用。
當 AI 提出新程式碼時,它會搜尋先前的錯誤和批評,以避免重複類似的問題。隨著時間的推移,這會形成一個回饋循環,每一次審查都會加強未來的行為。Roblox 並非丟棄失敗,而是將其轉化為訓練信號,以精煉代理如何推理程式碼品質和風險。
透過工程指標衡量信任
提高 AI 程式碼品質也需要可靠的衡量。Roblox 建構了一個評估框架,使用自動化和人工驗證來追蹤代理的效能。
該系統使用可重現的模擬和專家比較,測試 AI 在重構、錯誤修復和測試任務中的表現。評估在變更合併前於持續整合管道中運行,而合併後信號,如回歸、撤銷和延遲變化,則在發布過程中進行追蹤。
這會產生一個品質分數,顯示代理在不同版本之間的改進或退步。在引入範例對齊和結構化評估後,Roblox 在大型測試集中,PR 建議的接受率從約 30% 上升到 60% 以上。一個功能標誌清理代理的準確度也從 50% 以下提高到 90% 以上。
對 Roblox 而言,信任的建立更多基於可預測、可衡量的行為,而非承諾。
這對 Roblox 的工程未來意味著什麼
Roblox 正在透過額外的工具層和自動化來擴展其平台,以便 AI 代理能夠處理更多孤立的任務。更長遠的目標是持續維護程式碼健康,同時將運行時脈絡和專家判斷嵌入日常工作流程。
Roblox 的目標是讓 AI 成為工程環境本身的一部分,而不是將其視為獨立的助手。透過結合領域感知智慧、專家對齊和可觀察性,該公司預期能實現更快的交付、更好的品質,以及減少在重複性維護工作上花費的時間。
對工程師而言,這意味著機構記憶可隨時取用,並能花更多時間建構功能,而非修復可避免的問題。
在此查看 Amazon 上的 Roblox 禮品卡。
在此了解其他熱門 Roblox 遊戲體驗:
常見問題 (FAQ)
Roblox 的領域感知程式碼智慧是什麼?
領域感知程式碼智慧意味著使用 Roblox 自身的工程歷史、標準和運行時數據來訓練 AI 工具,以便系統理解 Roblox 程式碼的結構和審查方式,而不是依賴通用的編碼行為。
Roblox 的 AI 程式碼接受率提高了多少?
在將 AI 行為與內部工程標準對齊後,Roblox 在 10,000 個 PR 的評估集中,將 AI 生成的 PR 接受率從約 30% 提高到 60% 以上。
為何新的 AI 模型不足夠?
單純一個更強大的模型無法理解 Roblox 獨特的架構、效能限制或編碼文化。Roblox 專注於從多年的內部程式碼和審查中添加脈絡,而不是更換模型。
Roblox 如何為 AI 捕捉工程師的專業知識?
Roblox 從歷史程式碼審查中提取模式,並讓專家定義範例,描述模式的樣貌及其重要性。這些成為 AI 和工程師可重複使用的規則。
Roblox 如何防止 AI 重複錯誤?
被拒絕的 AI 建議和失敗的變更都會被標記並嵌入系統中。當生成新程式碼時,AI 會搜尋過去的失敗以避免重複類似的問題。
這對使用 Roblox 的開發者意味著什麼?
雖然這項工作是內部進行的,但更好的 AI 工具可以提高平台穩定性和開發速度,最終支持在 Roblox 上建構遊戲和體驗的創作者。
這與 web3 開發有關嗎?
沒有。Roblox 的 AI 程式碼智慧專注於平台工程和大型系統,而非 web3 技術。







