Roblox Tăng Gấp Đôi Tỷ Lệ Chấp Nhận Mã AI

Roblox đang dần mở rộng cách thức trí tuệ nhân tạo (AI) tích hợp vào quá trình phát triển game và kỹ thuật nền tảng, và công việc nội bộ mới nhất của họ tập trung vào một vấn đề mà nhiều studio gặp phải: AI có thể viết mã, nhưng các kỹ sư không phải lúc nào cũng tin tưởng nó. Thay vì dựa vào một mô hình hoàn toàn mới, Roblox đã cải thiện AI của mình bằng cách dạy nó cách các kỹ sư Roblox thực sự suy nghĩ. Bằng cách neo giữ các công cụ AI vào nhiều năm mã nguồn nội bộ, các đánh giá và dữ liệu sản xuất, công ty đã tăng tỷ lệ chấp nhận các yêu cầu hợp nhất (pull request) do AI tạo ra từ khoảng 30% lên hơn 60% trên bộ đánh giá 10.000 PR. Đồng thời, một tác nhân dọn dẹp tự động đạt độ chính xác hơn 90%.

Cách tiếp cận này chuyển sự chú ý khỏi sức mạnh thô của mô hình sang khả năng hiểu mã nguồn theo ngữ cảnh miền (domain-aware code intelligence), nơi AI hiểu cấu trúc, lịch sử và kỳ vọng của một môi trường kỹ thuật cụ thể thay vì đưa ra các đề xuất chung chung.

Tại sao mã nguồn do AI tạo ra vẫn cần ngữ cảnh con người

Trong ngành công nghiệp phần mềm, một phần lớn thời gian phát triển được dành để bảo trì các hệ thống hiện có thay vì xây dựng hệ thống mới. Roblox cũng đối mặt với thực tế tương tự. Về lý thuyết, các tác vụ bảo trì có vẻ lý tưởng cho AI vì chúng lặp đi lặp lại và được xác định rõ ràng. Trên thực tế, các trợ lý AI thường gặp khó khăn về chất lượng, đặc biệt là trong các cơ sở mã lớn và trưởng thành.

Tại Roblox, thách thức không phải là AI thiếu khả năng, mà là thiếu ngữ cảnh. Một mô hình đa dụng chưa từng trải qua hai thập kỷ các quyết định kỹ thuật, các ràng buộc hiệu suất và các tiêu chuẩn mã hóa của Roblox. Nó chưa học hỏi từ hàng trăm nghìn yêu cầu hợp nhất đã được hợp nhất hoặc từ hàng triệu nhận xét đánh giá nơi các kỹ sư cấp cao giải thích tại sao các phương pháp nhất định hoạt động tốt hơn ở quy mô của Roblox.

Mặc dù nhiều kỹ sư Roblox sử dụng các công cụ AI, chỉ một phần nhỏ các đề xuất của AI được chấp nhận mà không cần thay đổi đáng kể. Các kỹ sư báo cáo rằng AI cải thiện tốc độ, nhưng sự tin tưởng vào chất lượng mã nguồn do AI tạo ra vẫn thấp hơn, đặc biệt là trong các hệ thống C++ cũ và cơ sở hạ tầng phức tạp. Giải pháp của Roblox là nhúng kiến thức thể chế của chính họ trực tiếp vào cách AI lý luận về mã nguồn.

Biến cơ sở mã nguồn của Roblox thành trí tuệ có cấu trúc

Lịch sử kỹ thuật của Roblox trải dài gần 20 năm cam kết (commits), tài liệu thiết kế và đo lường thời gian chạy (runtime telemetry). Biến điều đó thành thứ mà AI có thể sử dụng phức tạp hơn là chỉ đọc các tệp. Roblox vận hành một môi trường đa ngôn ngữ lớn với C++, Lua, biểu đồ xây dựng (build graphs), mẫu (templates) và các phụ thuộc động (dynamic dependencies) tạo thành một mạng lưới thay vì một thư mục mã nguồn phẳng.

Để làm cho điều này có thể sử dụng được, Roblox đã xây dựng một nền tảng thống nhất hệ thống kiểm soát phiên bản (version control), hệ thống xây dựng (build systems) và đo lường sản xuất (production telemetry) thành một biểu diễn chung. Điều này bảo tồn cú pháp, ngữ nghĩa và mối quan hệ giữa các hệ thống, cho phép các tác nhân AI hiểu cách các thành phần khác nhau kết nối và phát triển theo thời gian.

Một thách thức khác là căn chỉnh thời gian. Dữ liệu thời gian chạy phải được ánh xạ trở lại phiên bản mã nguồn chính xác đã tạo ra nó, ngay cả khi cơ sở mã nguồn tiếp tục thay đổi. Bằng cách liên kết đo lường với các bản sửa đổi cụ thể, hệ thống có thể lý luận về hiệu suất, hành vi và sự đánh đổi theo cách phản ánh cách các kỹ sư có kinh nghiệm phân tích các sự cố sản xuất.

Kết quả là một nền tảng nơi AI có thể xem mã nguồn như một hệ thống sống động thay vì văn bản cô lập.

Thu thập đánh giá của kỹ sư ở quy mô lớn

Một trong những phần có giá trị nhất trong văn hóa kỹ thuật của Roblox nằm trong các đánh giá mã nguồn. Các kỹ sư cấp cao liên tục chỉ ra các mẫu (patterns) hợp lệ về mặt kỹ thuật nhưng rủi ro ở quy mô của Roblox, chẳng hạn như các lệnh chặn (blocking calls) bên trong các vòng lặp tần số cao gây ra độ trễ hoặc cạn kiệt luồng (thread exhaustion).

Theo truyền thống, kiến thức đó được truyền thủ công từ người đánh giá sang tác giả. Hệ thống căn chỉnh của Roblox chuyển đổi những khoảnh khắc đó thành hướng dẫn vĩnh viễn. Kỹ sư có thể định nghĩa các ví dụ (exemplars) mô tả cả hình dạng của một mẫu và lý do tại sao nó quan trọng. Khi AI hoặc một nhà phát triển chạm vào mã nguồn tương tự sau này, hệ thống có thể gắn cờ vấn đề, giải thích rủi ro và liên kết đến các tiêu chuẩn nội bộ.

Roblox cũng khai thác các nhận xét yêu cầu hợp nhất lịch sử của mình để tự động hiển thị các bài học lặp đi lặp lại. Các nhận xét đánh giá được nhúng vào không gian vector, được phân cụm theo chủ đề và được tinh chỉnh thành các quy tắc chung bằng cách sử dụng phân tích hỗ trợ bởi mô hình. Sau đó, các chuyên gia miền xem xét và thúc đẩy các ứng cử viên mạnh nhất vào cơ sở kiến thức.

Quá trình này biến nhiều năm phản hồi không chính thức thành các tiêu chuẩn có cấu trúc, có thể tái sử dụng mà các tác nhân AI và kỹ sư có thể áp dụng một cách nhất quán. Sau khi được căn chỉnh với các ví dụ này, Roblox báo cáo rằng một tác nhân mã hóa đã cải thiện tỷ lệ vượt qua nội bộ của mình từ mức trung bình 80% lên độ chính xác hoàn toàn trên bộ dữ liệu đánh giá vàng của nó.

Học hỏi từ các đề xuất AI thất bại

Hệ thống của Roblox không chỉ học hỏi từ thành công. Các đề xuất AI bị từ chối, các lần tái cấu trúc (refactors) tồi và các lỗi hồi quy (regressions) được coi là dữ liệu có giá trị cao. Kỹ sư gắn nhãn các lỗi với lý do và ngữ cảnh, và thông tin đó được nhúng và lập chỉ mục để sử dụng trong tương lai.

Khi AI đề xuất mã nguồn mới, nó sẽ tìm kiếm các lỗi và phê bình trước đó để tránh lặp lại các vấn đề tương tự. Theo thời gian, điều này tạo ra một vòng lặp phản hồi, nơi mỗi đánh giá sẽ củng cố hành vi trong tương lai. Thay vì loại bỏ các lỗi, Roblox biến chúng thành các tín hiệu đào tạo để tinh chỉnh cách các tác nhân lý luận về chất lượng và rủi ro của mã nguồn.

Đo lường sự tin tưởng bằng các chỉ số kỹ thuật

Cải thiện chất lượng mã nguồn do AI tạo ra cũng đòi hỏi đo lường đáng tin cậy. Roblox đã xây dựng một khuôn khổ đánh giá theo dõi hiệu suất của tác nhân theo thời gian bằng cả xác thực tự động và thủ công.

Hệ thống kiểm tra AI trên các tác vụ tái cấu trúc, sửa lỗi và kiểm thử bằng cách sử dụng các mô phỏng có thể tái tạo và so sánh với chuyên gia. Các đánh giá chạy trong các quy trình tích hợp liên tục (continuous integration pipelines) trước khi các thay đổi được hợp nhất, trong khi các tín hiệu sau hợp nhất như lỗi hồi quy, hoàn tác (reverts) và sự thay đổi độ trễ được theo dõi trên các bản phát hành.

Điều này tạo ra một điểm số chất lượng cho thấy các tác nhân cải thiện hoặc suy giảm như thế nào giữa các phiên bản. Sau khi giới thiệu căn chỉnh ví dụ và đánh giá có cấu trúc, Roblox đã thấy tỷ lệ chấp nhận đề xuất PR tăng từ khoảng 30% lên hơn 60% trên một bộ kiểm tra lớn. Một tác nhân dọn dẹp cờ tính năng (feature-flag cleanup agent) cũng cải thiện từ độ chính xác dưới 50% lên hơn 90%.

Đối với Roblox, sự tin tưởng được xây dựng ít dựa trên lời hứa và nhiều hơn dựa trên hành vi có thể dự đoán và đo lường được.

Ý nghĩa đối với tương lai kỹ thuật của Roblox

Roblox đang mở rộng nền tảng của mình với các lớp công cụ và tự động hóa bổ sung để các tác nhân AI có thể xử lý nhiều hơn các tác vụ riêng lẻ. Mục tiêu dài hạn là duy trì sức khỏe mã nguồn liên tục đồng thời nhúng ngữ cảnh thời gian chạy và đánh giá của chuyên gia vào quy trình làm việc hàng ngày.

Thay vì coi AI như một trợ lý riêng biệt, Roblox đặt mục tiêu biến nó thành một phần của chính môi trường kỹ thuật. Bằng cách kết hợp trí tuệ theo ngữ cảnh miền, căn chỉnh chuyên gia và khả năng quan sát (observability), công ty kỳ vọng tốc độ phân phối nhanh hơn, chất lượng tốt hơn và ít thời gian dành cho công việc bảo trì lặp đi lặp lại.

Đối với các kỹ sư, điều đó có nghĩa là bộ nhớ thể chế (institutional memory) trở nên có sẵn theo yêu cầu, và nhiều thời gian hơn có thể được dành để xây dựng các tính năng thay vì sửa các vấn đề có thể tránh được.

Xem thêm Thẻ quà tặng Roblox trên Amazon tại đây.

Tìm hiểu về các trải nghiệm Roblox phổ biến khác tại đây:

Grow a Garden

Plants vs Brainrots

Steal a Brainrot

99 Nights in the Forest

Endless Horde

Blade x Zombies

Câu hỏi thường gặp (FAQs)

Trí tuệ mã nguồn theo ngữ cảnh miền (domain-aware code intelligence) tại Roblox là gì?
Trí tuệ mã nguồn theo ngữ cảnh miền có nghĩa là đào tạo các công cụ AI dựa trên lịch sử kỹ thuật, tiêu chuẩn và dữ liệu thời gian chạy của Roblox để hệ thống hiểu cách mã nguồn của Roblox được cấu trúc và đánh giá, thay vì dựa vào hành vi mã hóa chung chung.

Roblox đã cải thiện tỷ lệ chấp nhận mã nguồn do AI tạo ra bao nhiêu?
Roblox đã tăng tỷ lệ chấp nhận yêu cầu hợp nhất do AI tạo ra từ khoảng 30% lên hơn 60% trên bộ đánh giá 10.000 PR sau khi căn chỉnh hành vi của AI với các tiêu chuẩn kỹ thuật nội bộ.

Tại sao một mô hình AI mới là chưa đủ?
Một mô hình mạnh mẽ hơn đơn thuần không hiểu kiến trúc độc đáo, các ràng buộc hiệu suất hoặc văn hóa mã hóa của Roblox. Roblox tập trung vào việc bổ sung ngữ cảnh từ nhiều năm mã nguồn và đánh giá nội bộ thay vì thay thế mô hình.

Roblox thu thập chuyên môn của kỹ sư cho AI như thế nào?
Roblox trích xuất các mẫu từ các đánh giá mã nguồn lịch sử và cho phép các chuyên gia định nghĩa các ví dụ mô tả cả hình dạng của một mẫu và lý do tại sao nó quan trọng. Chúng trở thành các quy tắc có thể tái sử dụng cho AI và kỹ sư.

Roblox ngăn AI lặp lại sai lầm như thế nào?
Các đề xuất AI bị từ chối và các thay đổi thất bại được gắn nhãn và nhúng vào hệ thống. Khi mã nguồn mới được tạo ra, AI sẽ tìm kiếm các lỗi trong quá khứ để tránh lặp lại các vấn đề tương tự.

Điều này có ý nghĩa gì đối với các nhà phát triển sử dụng Roblox?
Mặc dù công việc này là nội bộ, các công cụ AI tốt hơn cải thiện tính ổn định của nền tảng và tốc độ phát triển, điều này cuối cùng hỗ trợ những người sáng tạo xây dựng các trò chơi và trải nghiệm trên Roblox.

Điều này có liên quan đến phát triển web3 không?
Không. Khả năng hiểu mã nguồn AI của Roblox tập trung vào kỹ thuật nền tảng và các hệ thống quy mô lớn, không phải công nghệ web3.