Diese Woche fühlte sich bei ChatGPT etwas seltsam an. Nicht kaputt, nicht schlechter. Einfach nur... anders. Und genug Leute haben es gleichzeitig bemerkt, als dass man es einfach ignorieren könnte.
Auf X verbrachten Entwickler und KI-Tester die letzten Tage damit, Screenshots zu vergleichen, Antwortzeiten mit Stoppuhren zu messen und kamen zu derselben Theorie: OpenAI führt im Stillen A/B-Tests für ein neues Modell durch, bei dem es sich Gerüchten zufolge um GPT-5.6 handelt, das innerhalb von ChatGPT für einige Pro-Account-Nutzer verfügbar ist, die GPT-5.5 Pro auswählen.

Sparen Sie bei Ihren Spielen.
Bis zu 80% Rabatt sichern
Das Muster, das die Spekulationen auslöste
Das konsistenteste Signal in den Beiträgen ist nicht die Qualität, sondern die Zeit. Der Entwickler Conor Dart führte einen 3D-Browsergame-Test mit einem einzigen Prompt durch, inklusive Physik und Kamerasteuerung, und stoppte die Antwortzeit bei etwas über 60 Minuten. GPT-5.5 Pro liegt bei der gleichen Art von Prompt normalerweise in einem Zeitfenster von 10 Minuten. „Nicht perfekt, aber für einen KI-Game-Dev-Test mit einem einzigen Prompt ist das wirklich beeindruckend“, schrieb Dart auf X.
Der KI-Tester Chetaslua beobachtete ähnliche Verlangsamungen während eines Robotik-Simulationstests und stellte fest, dass die Antwortzeiten auf 20 bis 40 Minuten anstiegen – ein Tempo, das er seit der Veröffentlichung von GPT-5.5 nicht mehr gesehen hatte. Er behauptete außerdem, dass GPT-5.6 Pro bei einer 3D-Generierungsaufgabe das Modell Fable 5 von Anthropic übertraf und fügte hinzu: „Arbeite auch mit One-Shot an Spielen.“
Der Entwickler Anshu Chimala postete ein Vergleichsvideo von One-Shot-Landingpages, die er mit GPT-5.5 Pro bzw. GPT-5.6 Pro erstellt hatte, und bezeichnete sich selbst als „einen der Glücklichen mit frühem Zugriff auf GPT-5.6 Pro“. Der Entwickler Dobroslav Radosavljevič bestätigte dies aus dem Inneren von Codex, dem Coding-Agenten von OpenAI, und sagte, das Modell, das er gerade laufen ließ, „fühlt sich waaaaaaaahnsinnig anders“ an als GPT-5.5.
Was die geleakten Specs tatsächlich behaupten
Ein Beitrag, der dem Leaker Pankaj Kumar zugeschrieben wird, ging über die Leistungsvergleiche hinaus. Zu den behaupteten Details gehören ein Knowledge-Cutoff, der auf Dezember 2025 verschoben wurde, ein interner Reasoning-Effort-Wert, den einige Tester „Juice Value“ nennen und der von 768 auf 960 erhöht wurde, sowie eine verbesserte SVG- und 3D-Design-Generierung, die angeblich Fable 5 bei ausgewählten Aufgaben schlägt. Der Release-Candidate trägt Berichten zufolge den Codenamen Kindle-Alpha.
Der KI-Influencer Leo schrieb in einem Thread, dass das vermutete Modell „jetzt im Stealth-Modus getestet wird, wenn in ChatGPT 5.5 Pro ausgewählt ist“, zumindest für einige Pro-Accounts, mit einem geplanten öffentlichen Launch am 25. Juni. Der Prognosemarkt Polymarket hatte diese Woche Kontrakte auf ein Launch-Fenster vom 22. bis 28. Juni mit Werten von bis zu 89% im Angebot.
Nicht jeder Vergleich fiel jedoch positiv aus. Der KI-Bencher Chris gab beiden Modellen denselben Prompt zum Bau eines Raumschiffs. Das vermutete GPT-5.6 Pro arbeitete 87 Minuten lang, verglichen mit 34 Minuten und 42 Sekunden bei GPT-5.5 Extra High, und Fable 5 übertraf beide bei der Kerngeometrie des Raumschiffs. „Meine grobe Erwartung war, dass es sich bei einigen Benchmarks ein Kopf-an-Kopf-Rennen mit Fable 5 liefern würde, vielleicht je nach Kategorie etwa die Hälfte gewinnen, aber es insgesamt nicht deutlich übertreffen würde“, schrieb er.
Warum OpenAI möglicherweise so schnell handelt
Hier ist der Punkt: OpenAI steht derzeit unter echtem Wettbewerbsdruck, und das zeigt sich im Timing.
Chinas Open-Source-Modell GLM-5.2 liegt auf FrontierSWE, einem Benchmark, der KI-Agenten bei mehrstündigen Engineering-Aufgaben bewertet, nur einen Punkt hinter Anthropic's Claude Opus 4.8, während es GPT-5.5 beim gleichen Test direkt schlägt. Das ist ein Problem für die Positionierung von OpenAI an der Spitze des Marktes.
Die Situation bei Anthropic ist ebenfalls kompliziert. Die Flaggschiff-Modelle Mythos 5 und Fable 5 wurden aufgrund einer US-Exportkontrollrichtlinie vom 12. Juni wegen einer umstrittenen Jailbreak-Schwachstelle vom Markt genommen. Sollten diese Modelle zurückkehren, könnte sich die Qualitätslücke zwischen Anthropic und OpenAI erheblich vergrößern. Das Zeitfenster, um ein wettbewerbsfähiges Update zu veröffentlichen, bevor dies geschieht, ist eng.
Das Einzige, was einer offiziellen Bestätigung nahekommt, ist ein berichtetes internes Memo. Der Chef-Wissenschaftler Jakub Pachocki soll OpenAI-Mitarbeitern mitgeteilt haben, dass das nächste Modell eine bedeutende Verbesserung gegenüber GPT-5.5 darstellt. Das ist kein Veröffentlichungsdatum, kein Datenblatt und keine Bestätigung für A/B-Tests, aber es bestätigt, dass etwas Neues in der Entwicklung ist.
OpenAI reagierte vor der Veröffentlichung nicht auf Anfragen zur Stellungnahme.
Was das für die Entwickler bedeutet
Für Entwickler, die ChatGPT zum Prototyping von Spielen, Tools und interaktiven Erlebnissen nutzen, sind die Auswirkungen hier beachtenswert. Wenn sich die Verbesserungen bei der 3D-Generierung und dem One-Shot-Coding beim Launch bewahrheiten, könnte GPT-5.6 die Möglichkeiten innerhalb einer einzigen Prompt-Session maßgeblich verändern. Die gaming-nahen Anwendungsfälle, die in diesen frühen Tests auftauchen – Browsergames, Physik-Simulationen, prozedurales Design – sind genau die Bereiche, in denen KI-Coding-Tools bisher Schwierigkeiten hatten, zuverlässig zu überzeugen.
Was die meisten Spieler und Entwickler bei diesen KI-Modellzyklen übersehen, ist, wie schnell das Basisniveau steigt. GPT-5.5 bewältigt bereits Game-Prototyping-Aufgaben, für die GPT-4 mehrere Sessions und intensives Prompting benötigt hätte. Wenn GPT-5.6 die Reasoning-Tiefe auf Kosten längerer Wartezeiten wirklich erweitert, ist das ein Kompromiss, den viele Entwickler eingehen werden.
Für diejenigen, die im Web3-Bereich bauen, verlassen sich Tools wie die in unseren Gaming-Guides zunehmend auf KI-gestützte Entwicklungs-Pipelines, und ein stärkeres Reasoning-Modell beeinflusst alles, von der Smart-Contract-Generierung bis zur Erstellung prozeduraler Assets.
Sollte der 25. Juni als Launch-Datum Bestand haben, werden die nächsten Tage entweder eine Woche voller Spekulationen bestätigen oder den am besten koordinierten Placebo-Effekt in der Geschichte der KI-Tests enthüllen. Behalten Sie die offiziellen Kanäle von OpenAI im Auge und schauen Sie hier vorbei, um Updates zu erhalten. In der Zwischenzeit, falls Sie nach einer Beschäftigung für Ihre aktuellen KI-Tools suchen: Der PuffGo Preseason 5 Teilnahme-Guide ist eine solide Lektüre für jeden, der Web3-Gaming-Rewards erkundet, während er auf den nächsten Modell-Drop wartet. Für etwas Narrativeres deckt der Coffee Talk Tokyo Tomodachill Guide Profile, Hashtags und versteckte Posts vollständig ab.







