Beitragsseiten

 

Schnatter-Roboter

 

Chatbots  wie ChatGPT, Llama, Bard oder T5 schlagen weltweit in vielen gesellschaftlichen Bereichen wie Bomben ein. Experten erwarten durch den leichten und öffentlichen Zugang zur Künstlichen Intelligenz (KI) Veränderungen in der Gesellschaft, wie es historisch die Dampfmaschine oder das Automobil vollbrachte.

Da ist viel dran, dennoch schraubt Technik- und Fortschrittsglaube viele Erwartungen illusionär hoch.

Zuerst, was ist ein Chatbot? Bot zeigt als Abkürzung für Roboter auf einen elektronischen Algorithmus, der bestimmte Aufgaben durchführt.

Chat kommt aus dem Englischen und meint reden, plaudern, sich unterhalten, eventuell auch im Sinne von Gerüchte streuen1. Eine wortwurzelgetreue und sehr passende Übersetzung wäre 'Schnatterroboter'. Chatbots, also Programme, die plaudernd ein menschliches Gegenüber simulieren, beherrschen derzeit die Schlagzeilen.

Doch so neu sind sie nicht. Schon 1966 entwickelte der deutsch-amerikanische Informatiker Joseph Weizenbaum den Prototypen eines Chatbots, nämlich ELIZA. An sich wollte Weizenbaum mittels eines einfachen Programms nur aufzeigen, wie natürliche Sprache im Computer verarbeitet werden kann.

Eliza jedoch wurde ein Erfolg, viele nutzten es als virtuellen Psychotherapeuten. Weizenbaum warnte in der Folge über Jahrzehnte vor dem naiven Glauben an die Wahrheit aus dem Computer.

 

Denn Begriffe KI oder AI (Artificial Intelligence) enthalten in der Wortzusammensetzung bereits überzogene Ansprüche in Richtung intelligent, einsehen oder gar erkennen. In der Informatik werden diese Chatbots präziser als große Sprach-Modelle bezeichnet.

Mit riesigen Datensätzen und hoher Rechnerleistung durch spezielle KI-Chips (etwa von Nvidia) erzeugen Chatbots Texte, die wie von Menschenhand geschrieben wirken. Große Sprach-Modelle sind wortwörtlich das, was sie sind: large language models. Und sie liefern gemäß Input und Training einen Output. Das ist vorerst mal alles.

 

Ein bisschen Begriffsarbeit, und die Prozesse samt Ergebnissen werden deutlicher:

  • Ein Modell ist etwas zutiefst Pragmatisches, also nicht mit der objektiven Wirklichkeit abgestimmt, sondern eine Selektion bestimmter Attribute oder Größen des Darzustellenden, die am nützlichen Gebrauch orientiert sind. Diese Selektion führt zur Vereinfachung bei gleichzeitiger Verzerrung komplexer Sachverhalte.

  • Sprache besteht als komplexes Zeichensysteme zur Kommunikation, welche nur begrenzt logischen Normen unterworfen ist. Neben sachinhaltlichen Funktionen zählen sozialpsychologische und soziale.

  • Groß bezeichnet eines spezifische Qualität, welche durch schiere Quantität erzeugt wird. Groß war etymologisch gesehen ursprünglich ein Wort für das Grobkörnige, nun auch „in Ausdehnung [nach irgendeiner Richtung] oder Umfang den Durchschnitt oder einen Vergleichswert übertreffend“2

Die genannten Modelle werden auf Basis der Inhalte unzähliger Web-Sites (eben auf der Basis des Großen) trainiert. Das können Inhalte von strukturierten Datenbanken wie Wikidata sein, es können Patentdatenbanken, aber auch private Blogs mit nicht immer seriösen Ansprüchen sein.

Die geheim gehaltenen Algorithmen bauen zum Schluss und jetzt erst im Abfragefenster sichtbar im Themenrahmen sukzessive Wort für Wort und Satz für Satz gemäß linguistischen Wahrscheinlichkeitsvektoren auf.

 

Was kommt heraus? Ein schriftlich eleganter und flüssig aufgebauter Essay (wortwörtlich ein ‚Versuch‘), der Themen- und Aspektspezifisches bietet. Wie von Geisterhand schreibt der Computer eine Geschichte, einen Versuch, auf der Grundlage von Konstruiertem, kombiniert mit Wahrscheinlichem und Falschem.

Selten werden Originalquellen angegeben, wie auch, wenn das Modell auf unzählbaren Quellen basiert. Systematische Verzerrungen und Fehlinformation können eingebaut sein. Diese systematischen Verzerrungen sind weder auf den ersten noch auf den zweiten Blick  erkennbar. Wie bei Gerüchten entstehen Entstellungen, Verfälschungen und Fehlinformationen. Diese Zerrbilder zeigen sich allerdings in einer wohlaufgebauten und verführerischen Sprache. 

Was heißt Verzerrung, im wissenschaftlichen Jargon: der Bias?

Ein Beispiel soll dies verdeutlichen. Angenommen, es wird gezielt ein konkretes Thema in einem bestimmten Bereich abgefragt. Nehmen wir den großen Bereich „menschliche Gemeinschaft“3. Hier dominiert Religion. Völlig befremdlich aus heutiger Sicht. Im Mittelalter in Europa wäre eine gewisse Berechtigung dafür gewesen, aber auch jetzt, und wie war bzw. ist es weltweit?

Doch es wird noch schräger: Innerhalb Religion sind von den 20 Top-Sites 16 christlich! Verzerrter geht es kaum. Weder kann der Begriff Gemeinschaft global auf Religion beschränkt sein, noch Religion wiederum auf das Christliche. Die Bühne, auf welcher die Chatbots ihre Zauberkunststücke aufführen, könnte zumindest hier nicht ir-realer sein.

1 Chambers. Dictionary of Etymology, 2008, S. 162

2 Duden. Deutsches Universalwörterbuch 8. Auflage. 2015, S. 758

3 Entnommen aus Schaul, K/Chen, S. & Tiku, N. (April 19, 2023). Inside the secret list of websites that make AI like ChatGPT sound smart. The Washington Post.

 

6. Juni 2023