Künstliche Intelligenz und das Entweder – Oder (XOR)

1.  Das Entweder – Oder (XOR)

„Entweder bin ich Hier oder ich bin Dort.“  Der Satz gilt eigentlich immer. Oder formal verkürzt:  Hier XOR Dort. Das Entweder – Oder bzw. das XOR  (exklusives Oder) postuliert eine Fundamentalordnung in unserem Leben. Das ist auch so in der Kriminalistik, wenn einer behauptet „ich war Dort und nicht Hier am Orte der Tat“. Das nennt man ein Alibi. Das Ausfüllen eines Wahlzettels mit  genau einem Kreuzchen in einem Kreis ist ja auch ein Entweder – Oder bzw. ein XOR. Folgt man dem nicht, ist die Wahl ungültig.

Logisch wird das XOR,  mit A und B als Aussagen, unter anderem wie folgt gefasst:

A XOR B =  (A ∨ B) ∧¬  ( A ∧ B)

In Worten mit den Symbolen ∨ als „Oder“ , ∧ als „Und“ , ¬  als „Nicht“ :

A XOR B   ist gleich (=)     (A Oder B) und  Nicht beide also  (A Und B).

Eine Wahrheitstabelle XOR  für 1 = wahr und 0 =falsch  sieht wie folgt aus:

Wenn A und B unterschiedlich sind, dann wird auf ‘wahr‘ erkannt, bei Gleichheit ist XOR  dann ‚falsch‘

Wichtig ist zu wissen, dass  A XOR A, also das Entweder – Oder mit sich selbst, ist immer falsch oder 0. Denn das geht nicht: wenn nur A da ist, gibt es kein Entweder – Oder, es gibt gar keine Alternative. Also:

A  XOR A  =  0

Das so dargestellte  XOR als Entweder – Oder ist klassisch, aber leider ungeeignet, wenn mehr als zwei Variablen zur Debatte stehen,  also wenn  A, B, C, D, …. , meinetwegen das ganze Alphabet hinunter gefragt wird.

Was machen wir nun?  Wir greifen in die Kiste  XOR – Trick und da  geht es  wie folgt:

Wenn ich einen bestimmten Wert z. B.  ein D  aus einer Folge heraus profilieren will, dann gilt:

XOR – Trick =   A XOR B  XOR  C XOR D    XOR    ( A XOR B  XOR  C) =  D .

Bis auf D sind alle doppelt also eliminierbar. Das fehlende D (the missing D) in der anfragenden  Liste in der Klammer  rechts  führt dazu,  dass das D in der befragten Liste herausprofiliert wird. Das ist genau das, was wir wünschen. Das Problem nennt man auch „One out of many“.

XOR  war ein Stolperstein in der KI – Entwicklung .  Das XOR  ist halt  eine zusammengesetzte,  eine komplexe Verbindung. Die  beim XOR benutzten Verbindungs-Teile  „Und“ ∧, „Oder“ ∨, „Nicht“ ¬ sind  hingegen elementar.

1.1 XOR und Variantenstücklisten

Noch bedeutender wird das Entweder – Oder, das XOR, wenn wir an Variantenstücklisten z.B. im  Automobilbau denken. Es  werden Stücklisten (bill of material) oder Teileverzeichnisse (part lists) für Milliarden unterschiedlicher Exemplare eines Autotyps erzeugt und verwaltet.  Es stehen  z.B. Fragen zur Debatte, ob entweder  ein Auto mit  80 PS oder mit  120 PS  ausgewählt werden soll. Um eine Auto wunschgemäß zu konfigurieren, muss eine große Vielzahl, sagen wir Hunderte solcher XOR- Situationen abgeklärt werden. Wir lieben heute große Zahlen. In der Literatur wird in der Autobus-Produktion von  über  10100 Varianten berichtet. Diese „unmenschlich“, riesige Zahl kommt durch Kombination  zustande, wenn wir 100 XOR’s  mit jeweils 10 Variationsmöglichkeiten pro XOR in einer Stückliste annehmen, dann führt das zu 10100 Möglichkeiten. Das ist bei Autobussen offensichtlich der Fall ist.  Da wir Nebenbedingungen berücksichtigen müssen, weil einige Kombinationen technisch nicht gehen, ist die wirkliche Zahl der Kombinationen kleiner.

Abb. 1 zeigt eine  Variantenstückliste  für leider nur vier Varianten. Die Pfeile  zwischen den Knoten  bedeuten  „geht- ein- in“ und dann  mit der angefügten  Zahl.

Abb. 1:  Eine Variantenstückliste

Man muss sich den Zusammenbau der Teile von unten, den Einzelteilen, über Baugruppen nach  oben, den Fertigteilen vorstellen.

Man unterscheidet grundsätzlich zwischen Muss- und Kann-Varianten. In Kann-Varianten, die  im Abb. 1 über das XOR 2 erzeugt werden, gibt es ein Leerteil als die Darstellung von „Nichts“  oder „Null“ oder „heiße Luft“ mit dem Sonderzeichen Λ. K in Abb. 1 ist ein Knoten für ein zusammengebautes Teil. Man nennt den Knoten  auch Konjunktionsknoten (∧). Abb. 1 zeigt wissenschaftlich gesprochen  auch eine mereologische Struktur (vom Griechischen μεροξ = Teil). Mereologie ist die Lehre von Teil-Ganze Relationen.

Die 22  =  4 Varianten im Bild (zwei Muss- und zwei Kann-Varianten) sind leicht  zu erkennen:

r, g, v,  f        r, g, v, Λ    r, g, z, f       r, g, z, Λ

r und g werden Gleichteile genannt, weil sie in allen Varianten vorkommen.

Würden wir in Abb.1  beliebig viele  und nicht bloß zwei Eingänge annehmen,  müssten wir statt XOR  den oben behandelten XOR – Trick eintragen.

Wenn wir einen historischen Blick auf die Entwicklung der neuronalen Netze in der KI werfen, dann war  das weite Feld der Stücklisten  lange nicht behandelbar, weil ein XOR  neuronal nicht dargestellt werden konnte. Logisch ist das XOR, sprachlich das Entweder – Oder, kein besonderes Problem. Es ist halt nur einer von 24 = 16 weiteren Junktoren wie die Verbindungsoperation in der klassischen Aussagenlogik genannt werden. XOR fristet in der Logik leider  ein Kümmerdasein, nicht aber in vielen technischen Anwendungen, wie z.B. bei Variantenstücklisten oder in der Schaltwerktechnik oder in der Klassifikation von Begriffen.

1.2  XOR und die Klassifikation von Begriffen

Wir tragen eine Klassifikation von Begriffen  an einem Beispiel vor, das von Smith/Smith  veröffentlicht wurde. (J.M. Smith / D.C.P. Smith:“ Database Abstractions, Aggregation and Generalization“, ACM Transaction on Database Systems, Vol.2. No.1, June 1977) .

Bei Smith/ Smith  ist „Fahrzeuge“  der zu klassifizierende Begriff.

Abb. 2:   Tabelle der Gesamtklasse „Fahrzeuge“

 

Abb. 3:  Motor-Fahrzeuge und Luft-Fahrzeuge als Unterklasse

Die mit einem Pfeil versehenen Spalten heißen Klassifikatoren. „Medium“ und „Antrieb“ sind demnach Klassifikatoren. Die Menge {Land-Fz, Luft-Fz, Wasser-Fz} ist eine Klassifikation nach dem Klassifikator „Medium“. Die Elemente einer Menge heißen Klassifikations-Merkmale. Land-Fz ist z.B. ein Klassifikations-Merkmal.

Es gibt Vorschriften für die Klassifikations- Merkmale. Sie müssen disjunkt oder getrennt (elementfremd) sein  Wir waren im Frühjahr 1945 noch im Kriege überrascht, als die Amerikaner mit sogenannten Amphibien-Fahrzeugen den Rhein leicht überquerten. Das waren  Fahrzeuge, die sowohl auf Land wie auch im Wasser operieren können. Brücken über den Rhein  brauchten die Amis nicht, sie fuhren einfach rüber. Am leichtesten wird das Problem der nicht disjunkten Klassifikationsmerkmale dadurch gelöst, indem man ein separates Merkmal einführt, in unserem Falle „ Amphibien-Fz“.

Wenn beide Klassifikationen nach „Medium“ und „Antrieb“ parallel vorgenommen  werden sollen, spricht man von einer Parallel-Klassifikation. Im Gegensatz dazu steht die hintereinander geschaltete Klassifikation, z.B. erst nach dem Klassifikator „Medium“ und dann nach dem Klassifikator „ Antrieb“.

Abb. 4:   Die Klassifikation

Die disjunkten Mengen der Klassifikatoren  „Antrieb, „ Medium“, „Motor“ und „Lifting“ interessieren uns im Rahmen einer XOR- Untersuchung und ihren Anwendungen. Natürlich gelten   in unserer Abkürzung folgende  Auswahlen  unter den Klassifikations – Merkmalen:

Antrieb:   Wind  XOR  Motor XOR  Mensch

Medium:  Land  XOR  Luft  XOR  Wasser

Motor:     Rotary  XOR  Düsen  XOR  Raketen

Lifting:    plane  XOR  heliocopter

Jetzt haben wir es wieder: Das Auswahlproblem wie bei den Variantenstücklisten, und das XOR ist wieder eine logische Grundoperation.

2. Der Übergang zum Subsymbolischen

Die modernen, neuronalen Netze der Künstlichen Intelligenz bieten uns eine neue Möglichkeit, auch  alte, klassische Probleme wie  „Variantenstückliste“ oder „ Klassifikation von Begriffen“ neu zu implementieren. Das sind aber  Projekte weit außerhalb der Beschreibungsmöglichkeit in unserem Blog.

Das, was wir bisher beschrieben haben, liegt im Bereich des Symbolischen, ist also klassisch und für Normalbürger verständlich. Jetzt steigen wir hinab ins Subsymbolische der Künstlichen Intelligenz,  und da gibt es beachtliche Verständnisprobleme, etwa auch, weil die Darstellung  des XOR‘s im  Subsymbolischen  vormals ein  gewaltiges  Problem war,  heute aber  nicht mehr ist. Uns dämmert, dass der Übergang zum Subsymbolischen in Zukunft ein Paradigmawechsel sein könnte. Man kommt sich beim Gang ins Subsymbolische vor wie Orpheus, der in der Unterwelt, im Hades  der Griechen seine Geliebte Eurydike suchte. Die KI als Hades, das lässt  noch einiges erwarten. Das XOR-Problem, das eigentlich  überhaupt nicht entstehen durfte, zeigt, dass wir  uns im Hades noch zurecht finden müssen.

In dem guten Buch von J.  Steinwendner und R. Schwaiger: „Neuronale Netze programmieren mit Python“, Rheinwerk-Verlag, 2. Aufl., 2023, heißt es  auf Seite 141:

Das (XOR) Problem kann  man  so einfach nicht lösen und das hat der Popularität eines Perceptrons (eine Neurone)  nicht gutgetan. Es führte tatsächlich zu einem fundamentalen Vertrauens- und Forschungsentzugs, der für längere Zeit die Forschung im Bereich der KNN (Künstliche Neuronale Netze) negativ beeinflusste. Die gute Antwort lautet: Das XOR- Problem ist lösbar“.

 Und auf Seite 23 deuten die Autoren die Lösung an: “ Nimm mehrere Perceptrons, ordne sie in Schichten und stapele sie übereinander“

Ein Perceptron ist eine einfaches Neuron, das in unserem Blog mit dem Thema  „KI und die endliche Weite unserer Rede“ bereits beschrieben wurde.

In den achtziger Jahren wurde in akademischen Seminaren das Thema „ Implementierung  von XOR in Neuronalen Netzen“ heiß diskutiert. Das Thema wurde aber  beiseitegeschoben, weil man erkannte, dass der Aufbau- und Lernprozess eines Netzes viel zu aufwendig ist. Bei den damaligen Rechnerkapazitäten war das auch so. Die haben sich in den letzten 40 Jahren aber gewaltig verändert, so dass die Welt heute ganz anders aussieht. Im zitierten  Lehrbuch von Steinwendner und Schwaiger wird die Implementierung, d.h. Aufbau eines Netzes und das  Lernen (teach-in) im Netz  von  XOR detailliert auf den Seiten 141 ff. geschildert. Im Link Informatik in der Schule wird ebenfalls eine Kurzfassung der Lösung des XOR- Problems  vorgestellt.

Unser Blog trägt die Überschrift „Unsere Zeit in Gedanken fassen“. Die Frage „Ist die subsymbolische KI nur ein Hype oder doch ein Paradigmawechsel ?“ können wir heute leider noch nicht beantworten, in fünf Jahren aber  vielleicht; ein interessanter Aspekt bleibt uns auf jeden Fall  erhalten. Manchmal hat man heute  in Business und in  Politik doch den Eindruck, dass  es sich, wie es oben unter Hype im Netz heißt, um  „eine besonders spektakuläre, mitreißende Werbung handelt (die eine euphorische Begeisterung für ein Produkt bewirkt). Solide Forschung wird gebraucht, kein KI-Theater. Sogar Seifenserien im Fernsehen nehmen sich des Themas heute an.

 

11 Kommentare zu „Künstliche Intelligenz und das Entweder – Oder (XOR)

  1. Nur so geht es sprachkritisch und rational: Trainieren des künstlichen neuronalen Netzes auf die bekannten Begriffsbeziehungen, wie das Fallen eines Gegenstands unter einen Begriff (Elementarsätze) und diverse allgemeine Begriffsbeziehungen wie Art/Gattung, Teil/Ganzes, etc. (komplexe Sätze).

    Und andererseits erhalten wir so keine empirische, sondern eine konstruktive generative KI, mit rekonstruierten Begriffsschemata und Begriffsbeziehungen sowie der dynamischen Führung eines normierten orthosprachlichen Lexikons.

  2. Subsymbolisch würde vom Standpunkt der Konstruktiven Wissenschaftstheorie auch zutreffender protosymbolisch heißen. Und da wird im Hinblick auf eine Kognitionswissenschaft, zu der heute die KI auch zählt, viel geboten!

    1. Ich frage mich, warum keiner aus der großen Community des methodischen Konstruktivismus der Erlanger Schule das Thema „Protosymbolik“ in der KI aufgegriffen hat. Warum ist das so? Müssen wir uns daran wagen?

      Eine Prototheorie ist seit Hugo Dingler ein Herzstück der Erlanger Wissenschaftstheorie. Wenn man z.B. nach dem Stichwort „Prototheorie“ bei Wikipedia sucht, kommt sofort der Methodischen Konstruktivismus hoch.

      Ihr
      H.Wedekind

      1. Mir wird nun klar, was eine „Protosymbolik“ in der KI ist.
        Fragen Sie mich?
        Antwort:

        Es ist die wohlausgebaute Mustererkennung (pattern recognition), für die es zu meiner Zeit unter der Leitung von Prof. Heinrich Niemann einen voll ausgebauten Lehrstuhl gab, aus dem der Präsident der Universität Erlangen hervorgegangen ist.
        Muster sind ungeheuer vielfältige Schemata in unserem Leben. Provakative Gegenfragen: Was ist kein Muster ?

        Man kann also sagen: Die Mustererkennung geht der subsymbolischen Künstlichen Intelligenz aus wissenschftstheoretischer Sicht methodisch voran.
        Das wird aber heute in der bombastischen Aufblähung der KI nicht gesehen. Das sollte aber gesehen werden. KI und Mustererkennung werden heute in der Öffentlichkeit nicht mehr unterschieden, obwohl sie methodisch deutlich zu unterscheiden sind.

        Ihr
        H.Wedekind

        1. i. A. a. ai-pragmatist.de
          Die (Vor-)Wissenschaft (z. B. im Hinblick auf angewandte Sprachphilosophie und sprachbasierte Erziehungswissenschaft) hinter dem richtigen Prompting (Das richtige Prompting ist die Brücke zwischen menschlicher Absicht und KI- Funktionalität.) heißt Protosymbolik?

          Auf der grundlegendsten Ebene funktionieren KI-Modelle, insbesondere Deep-Learning-Modelle, indem sie Muster in großen Datensätzen erkennen.

          Ein Prompt dient als Wegweiser und hebt hervor, auf welche Muster sich das Modell konzentrieren sollte und wie sie interpretiert werden sollen.

          etc.

  3. Gestatten Sie einem jungen methodischen Konstruktivisten, der ausgesprochenen ungebildet auf dem Gebiet der Informatik ist, die Frage, wie einer KI jene die Sprache auszeichnende Symbolische als-Struktur schrittweise beigebracht werden könnte? Dass wir etwas als etwas anderes ’nehmen‘ können – dieser Steinhaufen sei ein Denkmal -, scheint mir aus sprachphilosophischer Perspektive eine noch schwerwiegendere Eigenschaft des Symbolischen zu sein, als die Tatsache, dass Symbole einen Modellcharakter aufweisen.

    Mit besten Grüßen aus Kiel
    Stefan Jelonnek

    1. Lieber Herr Jelonnek,
      Sie schreiben in so herrlich verschachtelten Sätzen, dass ich unweigerlich an den großen Immanuel Kant (1724-1804) denken muss. Und in seinem Sinne antworte ich nun:
      Wir betrachten das „Kantische Dreigestirn“ in seiner „Kritik der reinen Vernunft“:
      Vernunft | Verstand | Erfahrung.
      Die Vernunft lassen wir mal weg; der Text würde sonst hier zu lang. Aber das Kantische Wechselspiel zwischen Verstand und Erfahrung hat es uns angetan; dabei ist der unsägliche Ausdruck “ Künstliche Intelligenz“ entbehrlich. Es beginnt mit der Erfahrung; u.a. erfahren wir über unsere Sinne Zeichen z. B. festgelegte Zeichen als Symbole. Die nennen wir in der Informatik auch Muster (pattern). „Pattern recognition“ oder Mustererkennung ist nun das zentrale Fach, das über Merkmale Muster zu klassifizieren in der Lage ist.. Eine Klassifizierung ist nun schon Verstandesangelegenheit, denn ein Begriff oder extensional eine Klasse findet sich nicht in der Erfahrung, nur ein Stofflieferant, auch in unserer Apperzeption, wie Kant auch sagte. Vom Verstand geht es in Kantische Manier zurück in die Erfahrung. Wir gewinnen neue Klassen von Mustern. Wir schreiten zur Symbolverarbeitung, und siehe da, wir haben z.B. in der Logik eine Regelwerk entwickelt, nach dem es bei Übergängen möglich ist zu entscheiden, welche erlaubt sind und welche nicht. Mit unserem Verstand stellen wir uns ganz in die Dienste der Vernunft mit ihren Zecken und Zielen, deren Angestellter der Verstand ist, im Kantischen Sinne.
      Das dauernde Hin und Her zwischen Erfahrung und Verstand nennt man auch „Lernen“ oder auch „Teach in“. Denn es kann ja sein, dass etwas im Verstande korrigierbedürftig ist und neu aufgenommen werden muss.

      Das Ganze implementiert man heute als neuronales Netz, meistens in der objektorientierten Sprache Python. Man nimmt Python und nicht etwa Java, tja warum? Ich glaube man müsste Google fragen; die favoritisieren Python.
      Ich habe keine Lust mehr, Python zu lernen.
      Ihr
      H.Wedekind,

      Wohlgemerkt: Nicht nur Symbole (Zeichen), sondern auch Bilder (images) sind Muster. Das “ morphing“, die Gesichtserkennung wir heute schon unter Juristen debattiert. Informatik wird weiter zu einem bedrohlichen Fach aufgebaut.

  4. Lieber Herr Wedekind,

    Ihr Kommentar ist herrlich und sollte wegen seines interdisziplinären Aufklärungseffekts weltweit publiziert werden – vor allem auch unter Kognitionswissenschsftler*innen.

    Zur Kognitionswissenschaft gehören laut Wikipedia wenigstens die Fachwissenschaften Philosophie, Linguistik, Anthropologie, Neurowissenschaft, Künstliche Intelligenz und Psychologie. Während speziell die Deutsche Informatik, so berichtete mir neulich ein noch förmlich aktiver Kollege, wegen der nur Auslandserfolge der neueren KI-Systeme, in einer existentiellen Krise steckt.

    Ihr
    E. Ortner

  5. This design is spectacular! You definitely know how to keep a reader amused.
    Between your wit and your videos, I was almost moved to start my own blog (well, almost…HaHa!)
    Great job. I really enjoyed what you had to say, and more than that, how you presented it.
    Too cool!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert