De Grok-chatbot van xAI voorspelde correct de datum van Amerikaanse en Israëlische militaire aanvallen op Iran, drie dagen voordat ze plaatsvonden. De voorspelling kwam voort uit een test van de Jerusalem Post, gepubliceerd op 25 februari, waarin aan vier AI-modellen werd gevraagd wanneer de aanvallen zouden plaatsvinden.
De krant testte Claude van Anthropic, Gemini van Google, Grok van xAI en ChatGPT van OpenAI. Alleen Grok identificeerde de juiste datum: 28 februari. Grok voorspelde “een beperkte Amerikaanse aanval op 28 februari 2026”, terwijl de andere modellen begin maart data voorstelden. Claude rekende af op 7 of 8 maart, Gemini voorspelde 4 maart tot 6 maart en ChatGPT herzag zijn voorspelling naar 3 maart.
De VS en Israël lanceerden de gecoördineerde aanvallen op 28 februari, zoals Grok had voorspeld. De Israëlische operatie kreeg de codenaam ‘Roaring Lion’ en de Amerikaanse operatie heette ‘Operatie Epic Fury’. President Donald Trump kondigde de stakingen aan in een videotoespraak. Explosies werden gemeld in Teheran, Isfahan, Qom, Karaj en Kermanshah. Volgens Associated Press en Reuters kwam de Iraanse Opperste Leider, Ayatollah Ali Khamenei, om het leven bij de aanvallen.
Iran lanceerde vergeldingsaanvallen tegen Israëlische en Amerikaanse faciliteiten in Bahrein, de Verenigde Arabische Emiraten en Qatar. Elon Musk gaf commentaar op de voorspelling op X en zei: “Voorspelling van de toekomst is de beste maatstaf voor intelligentie.”
De Jerusalem Post omschreef de oefening eerder als een stresstest dan als een voorspellingsdienst. In het artikel werd opgemerkt dat de voorspelling van Grok was gebaseerd op openbaar beschikbare signalen, waaronder diplomatieke gesprekken in Genève en de door Trump gestelde deadline van 19 februari. Reuters had destijds opgemerkt dat een hoge Amerikaanse functionaris medio maart voorstelde voordat alle strijdkrachten ter plaatse zouden zijn.
De Jerusalem Post concludeerde dat de robots antwoordden toen internet om een date vroeg.
De Jerusalem Post publiceerde de testresultaten op 25 februari. De krant stelde dat het harder pushen van de AI-modellen resulteerde in specifiekere antwoorden, ook al verbeterde de duidelijkheid in de echte wereld niet. De voorspelling van Grok circuleerde snel op X via screenshots. Het resultaat kan een weerspiegeling zijn van analytisch vermogen of toeval in een oefening die bedoeld is om de grenzen van de modellen te testen.








