KI spielt Stratego

Die meisten von uns kennen das schöne Brettspiel Stratego, bei dem die Spielerinnen und Spieler Länder erobern können. Ein anderes Strategiespiel ist das Spiel der Könige, König der Spiele: Schach. Stratego ist schlimmer.

Denn beim Schach ist alles Nötige bekannt: Spieler, Figuren, Züge, Rahmenbedingungen. Stratego dagegen ist wie das echte Leben: ein Spiel mit unvollkommener Information. Anders gesagt: Wenn Künstliche Intelligenz jemals der Menschheit nützen soll, sollte sie gut Stratego spielen, das heißt mit unvollkommener Information denken und planen können. Genau deshalb trainiert das US-Unternehmen DeepMind seine KI mit Namen DeepNash auch, indem es sie Stratego spielen lässt, unter anderem gegen sich selbst und gegen Menschen. Wobei das längst kein Spiel mehr ist, sondern echte Arbeit.

Wie oft haben Sie Stratego gespielt? Oder jedes andere Brett- oder Computerspiel? Selbst die Unmenge der Spiele eines passionierten Gamers ist nichts im Vergleich zu den Trainingsspielen von DeepNash (benannt nach John Nash, dem modernen Begründer der Spieltheorie). Die KI hat bereits auf der ersten Trainingsstufe das Spiel 5,5 Milliarden Mal gespielt. Natürlich sehr viel schneller als wir das könnten.

Dabei lernt die KI wie wir es auch tun (sollten): Jeder Spielgewinn stärkt das Denkmodell, das zum Sieg führte und schwächt das Verlierermodell, so dass es seltener zur Anwendung kommt. Bei näherer Betrachtung müssen wir zugeben: Also exakt das Gegenteil von dem, wie der durchschnittliche Mensch lernt, über den schon Tucholsky sagte: „Man kann auch 30 Jahre lang etwas falsch machen.“

Was hat dieses rigorose Training nun der KI gebracht? Was hat sie gelernt? Und wieviel? Zum Beispiel im direkten Vergleich zu anderen KI’s – denn die gibt es längst. Das ist auch etwas, von dem viele nichts wissen (wollen): Es gibt inzwischen etliche Bots, die Stratego spielen und das recht gut. DeepNash schlägt sie alle. Denn DeepNash hat eine Erfolgsquote von 97 Prozent. Bei einem Spiel wie Stratego ist das jenseits von beeindruckend. Eben weil das Spiel die Realität so gut abbildet. Die Implikationen sind je nach Weltsicht entweder schockierend oder vielversprechend.

Wenn eine KI das wirklich wahre Leben so gut analysieren und planen kann, sollten wir bis in fünf Jahren sämtliche Regierungen abwählen und durch jemanden – oder besser: durch etwas – ersetzen, das den Job mit 97%-iger Erfolgswahrscheinlichkeit beherrscht. Und das ganz ohne Bestechungsskandale und andere zutiefst menschliche Sauereien.

Wobei diese Anregung auf leicht tönernen Füßen steht: Gegen andere Maschinen mit 97 Prozent zu gewinnen, ist keine wirkliche Empfehlung für die Arbeit in der Arena menschlicher Gemeinheiten und Sauereien. Deshalb ließen die Entwickler von DeepMind ihre KI auch gegen Menschen spielen. Wobei die KI deren Irrationalität schon nach nur zwei Wochen so gut ausrechnen konnte, dass sie auf Platz 3 der Tabelle aufstieg. Also doch die bessere Regierung?

Das ist der Schwachpunkt unserer Argumentation: Stratego ist unheimlich komplex. Schach zum Beispiel hat nur eine einzige Startposition (die immer selbe Aufstellung der Spielfiguren).  Stratego dagegen hat über 1066 Startpositionen. Das ist mehr als sämtliche Sterne im Universum. Und das ist nur ein Bruchteil unserer Realität.

Denn das wirklich wahre Leben hat noch viel mehr Variablen als selbst Stratego. Und erst wenn eine KI diese auch nur annähernd so gut analysieren und planen kann wie ein intelligenter, gut ausgebildeter, erfahrener und moralisch-charakterlich gereifter Mensch, sollten wir eine KI auf die nächste Wahlliste setzen. In der Zwischenzeit könnten wir uns auf die Suche nach diesem intelligenten, gut ausgebildeten, erfahrenen und moralisch-charakterlich gereiften Menschen machen. Kennt ihn jemand?