이번 주 ChatGPT에서 무언가 미묘한 변화가 감지되었습니다. 오류가 발생한 것도, 성능이 떨어진 것도 아닙니다. 그저... 달라졌습니다. 그리고 이를 동시에 알아챈 유저들이 많아지면서 단순한 해프닝으로 치부하기 어려워졌습니다.
X를 중심으로 개발자들과 AI 테스터들은 지난 며칠간 스크린샷을 비교하고 스톱워치로 응답 시간을 측정하며 하나의 가설에 도달했습니다. 바로 OpenAI가 GPT-5.5 Pro를 선택한 일부 Pro 계정 유저들을 대상으로 GPT-5.6으로 추정되는 새로운 모델을 조용히 A/B 테스트하고 있다는 것입니다.

더 저렴한 가격으로 게임을 즐기세요.
최대 80% 할인 혜택
추측의 시작이 된 패턴
게시물들에서 공통적으로 나타나는 가장 확실한 신호는 품질이 아니라 '시간'입니다. 개발자 Conor Dart는 물리 엔진과 카메라 컨트롤이 포함된 3D 브라우저 겜을 원 프롬프트로 테스트했는데, 응답 시간이 60분을 조금 넘겼습니다. 기존 GPT-5.5 Pro는 같은 스타일의 프롬프트에서 보통 10분 내외의 응답 시간을 보입니다. Dart는 X에 "완벽하진 않지만, 원 프롬프트 AI 겜 개발 테스트치고는 상당히 인상적"이라고 평가했습니다.
AI 테스터 Chetaslua 역시 로봇 시뮬레이션 테스트 중 응답 시간이 20~40분까지 늘어지는 비슷한 현상을 겪었습니다. 그는 이 정도의 속도는 GPT-5.5 출시 이전에는 볼 수 없었던 것이라고 언급했습니다. 또한 그는 GPT-5.6 Pro가 3D 생성 작업에서 Anthropic의 Fable 5를 능가했다고 주장하며 "원 샷으로 겜을 만드는 작업도 진행 중"이라고 덧붙였습니다.
개발자 Anshu Chimala는 자신이 "운 좋게 GPT-5.6 Pro를 미리 써볼 수 있게 되었다"며 GPT-5.5 Pro와 GPT-5.6 Pro로 각각 생성한 원 샷 랜딩 페이지를 비교하는 영상을 올렸습니다. OpenAI의 코딩 에이전트인 Codex 내부에서 작업 중인 개발자 Dobroslav Radosavljevič 역시 그가 사용 중인 모델이 GPT-5.5와는 "느낌이 완전히 다르다"며 같은 의견을 보탰습니다.
유출된 스펙의 실체
유출자 Pankaj Kumar의 게시물은 단순한 성능 비교를 넘어 더 구체적인 내용을 담고 있습니다. 주장된 상세 정보에 따르면 지식 컷오프는 2025년 12월로 연장되었고, 일부 테스터들이 'Juice Value'라고 부르는 내부 추론 노력 설정값이 768에서 960으로 상향되었습니다. 또한 SVG 및 3D 디자인 생성 기능이 개선되어 특정 작업에서는 Fable 5를 앞선다고 합니다. 이 릴리스 후보 모델의 별칭은 Kindle-Alpha로 알려져 있습니다.
AI 인플루언서 Leo는 스레드를 통해 "ChatGPT에서 5.5 Pro를 선택했을 때 일부 Pro 계정을 대상으로 이 모델이 은밀하게 테스트되고 있다"고 전했으며, 6월 25일 공개 출시가 예정되어 있다고 밝혔습니다. 예측 시장인 Polymarket에서는 6월 22~28일 출시를 두고 계약 가격이 이번 주 89%까지 치솟기도 했습니다.
물론 모든 비교 결과가 긍정적인 것은 아니었습니다. AI 벤치마커 Chris는 두 모델에 동일한 우주선 제작 프롬프트를 입력했습니다. GPT-5.6 Pro는 87분이 소요된 반면, GPT-5.5 Extra High는 34분 42초가 걸렸으며, 우주선의 핵심 기하학적 구조 면에서는 여전히 Fable 5가 두 모델 모두를 앞섰습니다. 그는 "일부 벤치마크에서는 Fable 5와 대등하게 경쟁하고, 카테고리에 따라 절반 정도는 이길 것으로 예상했지만, 전체적으로 확실히 압도하는 수준은 아니다"라고 평했습니다.
OpenAI가 서두르는 이유
핵심은 이렇습니다. OpenAI는 현재 강력한 경쟁 압박을 받고 있으며, 이번 타이밍이 이를 잘 보여줍니다.
중국의 오픈소스 모델 GLM-5.2는 수 시간이 걸리는 엔지니어링 작업을 평가하는 벤치마크인 FrontierSWE에서 Anthropic의 Claude Opus 4.8에 단 1점 차이로 뒤처져 있으며, 같은 테스트에서 GPT-5.5를 확실하게 따돌렸습니다. 이는 시장 점유율 1위를 유지하려는 OpenAI에게 큰 위협입니다.
Anthropic의 상황도 복잡합니다. 주력 모델인 Mythos 5와 Fable 5는 6월 12일 발표된 탈옥 취약점 관련 미국 수출 통제 지침으로 인해 시장에서 철수된 상태입니다. 만약 이 모델들이 다시 시장에 복귀한다면 Anthropic과 OpenAI 간의 품질 격차는 크게 벌어질 수 있습니다. 그전에 경쟁력 있는 업데이트를 내놓아야 하는 시간적 여유가 매우 촉박한 상황입니다.
공식 확인에 가장 근접한 것은 내부 메모입니다. 최고 과학자 Jakub Pachocki는 OpenAI 직원들에게 차기 모델이 GPT-5.5보다 의미 있는 개선을 이룰 것이라고 언급한 것으로 알려졌습니다. 이는 출시일이나 스펙 시트, A/B 테스트에 대한 공식 확인은 아니지만, 무언가 새로운 모델이 개발 중이라는 점은 확실합니다.
OpenAI는 보도 전 논평 요청에 응답하지 않았습니다.
개발자들에게 미치는 영향
ChatGPT를 활용해 겜, 툴, 인터랙티브 콘텐츠를 프로토타이핑하는 개발자들에게 이번 변화는 주목할 만한 가치가 있습니다. 만약 3D 생성 및 원 샷 코딩 개선 사항이 출시 때까지 유지된다면, GPT-5.6은 단일 프롬프트 세션에서 가능한 작업의 범위를 완전히 바꿀 수 있습니다. 이번 초기 테스트에서 나타난 브라우저 겜, 물리 시뮬레이션, 절차적 디자인 등 겜 관련 활용 사례들은 그동안 AI 코딩 툴이 신뢰할 만한 성능을 보여주기 어려웠던 영역들입니다.
대다수의 유저와 개발자들이 AI 모델 주기에서 간과하는 점은 기술의 상향 평준화 속도입니다. GPT-5.5는 이미 GPT-4로는 여러 세션과 복잡한 프롬프팅이 필요했던 겜 프로토타이핑 작업을 거뜬히 해내고 있습니다. 만약 GPT-5.6이 더 긴 대기 시간을 감수하고서라도 추론의 깊이를 확실히 확장한다면, 많은 빌더들이 기꺼이 그 대가를 지불할 것입니다.
웹3 공간에서 활동하는 빌더들에게는 저희 겜 공략에서 다루는 툴과 같이 AI 기반 개발 파이프라인에 대한 의존도가 점점 높아지고 있으며, 더 강력한 추론 모델은 스마트 컨트랙트 생성부터 절차적 에셋 제작까지 모든 것에 영향을 미칠 것입니다.
6월 25일이 출시일로 확정된다면, 앞으로 며칠 내로 지난 일주일간의 추측이 사실로 밝혀지거나 AI 테스트 역사상 가장 조직적인 플라시보 효과였음이 드러날 것입니다. OpenAI의 공식 채널을 주시하시고, 관련 소식이 나오는 대로 이곳에서 확인해 주시기 바랍니다. 그동안 현재 사용 중인 AI 툴로 무엇을 할지 고민이라면, 다음 모델을 기다리며 웹3 겜 보상을 탐색하는 유저들에게 유용한 PuffGo Preseason 5 참여 공략을 읽어보시는 것을 추천합니다. 좀 더 서사적인 내용을 원하신다면 Coffee Talk Tokyo Tomodachill 공략에서 프로필, 해시태그, 숨겨진 게시물에 대한 정보를 확인해 보세요.







