Có điều gì đó không ổn với ChatGPT trong tuần này. Không phải bị lỗi, cũng không phải tệ hơn. Chỉ là... khác biệt. Và đủ nhiều người nhận ra cùng lúc khiến điều này khó mà bỏ qua được.
Trên X, các nhà phát triển và người thử nghiệm AI đã dành vài ngày qua để so sánh ảnh chụp màn hình, đo thời gian phản hồi bằng đồng hồ bấm giờ và đi đến cùng một giả thuyết: OpenAI đang âm thầm thử nghiệm A/B một mô hình mới, được đồn đại là GPT-5.6, bên trong ChatGPT cho một số người dùng tài khoản Pro chọn GPT-5.5 Pro.

Tiết kiệm hơn khi mua game.
Nhận ưu đãi giảm giá lên đến 80%
Mô hình khởi đầu cho những đồn đoán
Tín hiệu nhất quán nhất trên các bài đăng không phải là chất lượng, mà là thời gian. Nhà phát triển Conor Dart đã chạy một bài kiểm tra game trình duyệt 3D chỉ với một câu lệnh (one-prompt), hoàn chỉnh với vật lý và điều khiển camera, và ghi nhận thời gian phản hồi chỉ hơn 60 phút. GPT-5.5 Pro thường đạt kết quả trong khoảng 10 phút với cùng kiểu câu lệnh đó. "Không hoàn hảo, nhưng đối với một bài kiểm tra dev game bằng AI chỉ với một câu lệnh, điều này thực sự ấn tượng," Dart viết trên X.
Người thử nghiệm AI Chetaslua cũng thấy tình trạng chậm tương tự trong một bài kiểm tra mô phỏng robot, lưu ý rằng thời gian phản hồi kéo dài từ 20 đến 40 phút, tốc độ mà anh cho biết chưa từng xuất hiện kể từ trước khi GPT-5.5 ra mắt. Anh cũng tuyên bố GPT-5.6 Pro đã vượt qua Fable 5 của Anthropic trong một tác vụ tạo 3D, đồng thời nói thêm "Cũng đang làm việc trên các game one shot nữa."
Nhà phát triển Anshu Chimala đã đăng một video so sánh song song các landing page one-shot từ cái mà anh gọi là GPT-5.5 Pro so với GPT-5.6 Pro, tự gọi mình là "một trong những người may mắn có quyền truy cập sớm GPT-5.6 Pro." Nhà phát triển Dobroslav Radosavljevič cũng đồng tình với quan điểm này từ bên trong Codex, tác nhân lập trình của OpenAI, nói rằng bất kể mô hình nào anh đang chạy "cảm giác khác biệt hoàn toàn" so với GPT-5.5.
Những thông số kỹ thuật bị rò rỉ thực sự tuyên bố điều gì
Một bài đăng được cho là của người rò rỉ thông tin Pankaj Kumar đã đi xa hơn các so sánh về hiệu suất. Các chi tiết được tuyên bố bao gồm mốc cắt dữ liệu kiến thức (knowledge cutoff) được đẩy đến tháng 12 năm 2025, thiết lập nỗ lực suy luận nội bộ mà một số người thử nghiệm gọi là "Juice Value" được tăng từ 768 lên 960, và khả năng tạo SVG và thiết kế 3D được cải thiện, được cho là đánh bại Fable 5 trong một số tác vụ chọn lọc. Phiên bản ứng viên phát hành (release candidate) được cho là có biệt danh là Kindle-Alpha.
Người có tầm ảnh hưởng trong lĩnh vực AI Leo đã viết trong một chuỗi bài đăng rằng mô hình bị nghi ngờ này "hiện đang được thử nghiệm lén lút khi chọn 5.5 Pro trong ChatGPT" đối với ít nhất một số tài khoản Pro, với kế hoạch ra mắt công chúng vào ngày 25 tháng 6. Thị trường dự đoán Polymarket đã có các hợp đồng cho khung thời gian ra mắt từ ngày 22-28 tháng 6 với mức giá cao tới 89% trong tuần này.
Tuy nhiên, không phải mọi so sánh đều mang tính tích cực. Người đánh giá chuẩn (benchmarker) AI Chris đã đưa cho cả hai mô hình cùng một câu lệnh xây dựng tàu vũ trụ. GPT-5.6 Pro bị nghi ngờ đã làm việc trong 87 phút so với 34 phút 42 giây của GPT-5.5 Extra High, và Fable 5 vẫn vượt trội hơn cả hai về hình học cốt lõi của tàu vũ trụ. "Kỳ vọng sơ bộ của tôi là nó sẽ cạnh tranh ngang ngửa với Fable 5 trên một số bài kiểm tra chuẩn, có thể thắng khoảng một nửa tùy thuộc vào danh mục, nhưng không vượt trội rõ ràng về tổng thể," anh viết.
Tại sao OpenAI có thể đang hành động nhanh chóng
Vấn đề là: OpenAI hiện đang chịu áp lực cạnh tranh thực sự, và điều đó thể hiện rõ qua thời điểm này.
Mô hình mã nguồn mở GLM-5.2 của Trung Quốc chỉ kém Claude Opus 4.8 của Anthropic một điểm trên FrontierSWE, một bài kiểm tra chuẩn đánh giá các tác nhân AI trên các tác vụ kỹ thuật kéo dài nhiều giờ, đồng thời đánh bại hoàn toàn GPT-5.5 trong cùng bài kiểm tra đó. Đó là một vấn đề đối với vị thế của OpenAI trên đỉnh thị trường.
Tình hình của Anthropic cũng phức tạp không kém. Các mô hình chủ lực Mythos 5 và Fable 5 của họ vẫn bị đình chỉ theo chỉ thị kiểm soát xuất khẩu của Hoa Kỳ ban hành ngày 12 tháng 6 do một lỗ hổng jailbreak đang gây tranh cãi. Nếu các mô hình đó quay trở lại thị trường, khoảng cách chất lượng giữa Anthropic và OpenAI có thể nới rộng đáng kể. Cơ hội để tung ra một bản cập nhật cạnh tranh trước khi điều đó xảy ra là rất hẹp.
Điều duy nhất gần với xác nhận chính thức là một bản ghi nhớ nội bộ được báo cáo. Giám đốc khoa học Jakub Pachocki được cho là đã nói với nhân viên OpenAI rằng mô hình tiếp theo đại diện cho một sự cải thiện đáng kể so với GPT-5.5. Đó không phải là ngày phát hành, không phải bảng thông số kỹ thuật và không phải là xác nhận về bất kỳ thử nghiệm A/B nào, nhưng nó xác nhận rằng một thứ gì đó mới đang được phát triển.
OpenAI đã không trả lời các yêu cầu bình luận trước khi xuất bản.
Điều này có ý nghĩa gì đối với những người đang xây dựng sản phẩm với nó
Đối với các nhà phát triển sử dụng ChatGPT để tạo mẫu game, công cụ và trải nghiệm tương tác, những tác động ở đây rất đáng để theo dõi. Nếu các cải tiến về tạo 3D và lập trình one-shot được giữ vững khi ra mắt, GPT-5.6 có thể thay đổi đáng kể những gì có thể thực hiện trong một phiên câu lệnh duy nhất. Các trường hợp sử dụng liên quan đến game xuất hiện trong các bài kiểm tra sớm này, như game trình duyệt, mô phỏng vật lý, thiết kế thủ tục (procedural design), chính là nơi các công cụ lập trình AI đã gặp khó khăn để đạt được sự ấn tượng đáng tin cậy.
Điều mà hầu hết người chơi và nhà phát triển bỏ lỡ trong các chu kỳ mô hình AI này là tốc độ nâng cao tiêu chuẩn. GPT-5.5 đã xử lý các tác vụ tạo mẫu game mà trước đây GPT-4 phải mất nhiều phiên và câu lệnh phức tạp. Nếu GPT-5.6 thực sự mở rộng chiều sâu suy luận với cái giá phải trả là thời gian chờ đợi lâu hơn, đó là một sự đánh đổi mà nhiều nhà phát triển sẽ chấp nhận.
Đối với những người đang xây dựng trong không gian web3, các công cụ như những công cụ được đề cập trong hướng dẫn về game của chúng tôi ngày càng dựa vào các quy trình phát triển có sự hỗ trợ của AI, và một mô hình suy luận mạnh mẽ hơn sẽ ảnh hưởng đến mọi thứ từ tạo hợp đồng thông minh (smart contract) đến tạo tài sản thủ tục (procedural asset).
Nếu ngày 25 tháng 6 được giữ làm ngày ra mắt, vài ngày tới sẽ xác nhận một tuần đồn đoán hoặc tiết lộ hiệu ứng giả dược được phối hợp kỹ lưỡng nhất trong lịch sử thử nghiệm AI. Hãy theo dõi các kênh chính thức của OpenAI và quay lại đây để cập nhật thông tin khi có diễn biến mới. Trong lúc chờ đợi, nếu bạn đang tìm kiếm thứ gì đó để làm với các công cụ AI hiện tại của mình, hướng dẫn tham gia PuffGo Preseason 5 là một bài đọc hữu ích cho bất kỳ ai đang khám phá phần thưởng game web3 trong khi chờ đợi mô hình tiếp theo. Đối với nội dung thiên về kể chuyện, hướng dẫn Coffee Talk Tokyo Tomodachill bao gồm hồ sơ, hashtag và các bài đăng ẩn đầy đủ.







