Es war das perfekte Weihnachtsspielzeug für alle von 9-99, der interaktive Chatbot ChatGPT von OpenAI, der auf dem Deep-Learning-Sprachmodell GPT-3 (Generative Pretrained Transformer 3) basiert und Ende November 2022 als freie Testversion für alle freigegeben wurde. Gebracht hat mich auf das Tool mein Interview mit Jörg Piringer zu seinem neuen Buch „günstige intelligenz – hybride poetik und poetologie“ (Ritter Verlag 2022) für das Lyrikportal Poesiegalerie. Der Autor, Medienkünstler, Musiker und Programmierer beschäftigt sich schon seit Jahrzehnten mit poetischen Möglichkeiten der IT und Mensch-Maschine-Interaktionen, wofür er den Begriff „Datenpoesie“ prägte und stellt in „günstige intelligenz“ die kostenpflichtige Vollversion GPT-3, das selbst trainiert werden kann, auf den poetischen Prüfstand, wodurch eine erste „zusammenarbeitspoetik zwischen natürlicher und künstlicher intelligenz“ (günstige intelligenz, S. 45) entstanden ist. Ich beschränke mich in meinem Ausprobieren auf die kostenfreie und limitierte Mainstreamversion, die in manchen Aspekten auch schon erstaunlich stark ist, jedenfalls stärker als erwartet. In der Eingabezeile mit Schreibanweisungen (Prompts) beauftragt, kann man zuschauen, wie die KI ins Sekundenschnelle einen Text mit erstaunlicher Kohärenz auf den Monitor zaubert, als Erfüllung des in der Geschichte immer wieder auftretenden Menschheitsttraums von der „Allesschreibenden Wundermaschine“, so der Name der Apparatur von Friedrich von Knaus, Uhrmacher und Hofmechaniker unter Kaiserin Maria Theresia aus dem Barock, einer Blütezeit der Mechanik, die heute im Technischen Museum Wien (s. dazu auch mein Beitrag IT-Poesie – wenn Computer dichten auf poesiegalerie.at) besichtigt werden kann. Wichtig ist, ChatGPT derzeit als reinen Textgenerator zu sehen, als Informationsquelle ist der Bot nur sehr, sehr bedingt zu gebrauchen, er bietet also „ideale“ Voraussetzungen für die Produktion von Fake News und in schöne Sätze verpackte Falschinformationen aller Art. Hinsichtlich reiner Sprachstrukturen kann er aber schon ziemlich viel und er lässt sich sogar im Dialekt ansprechen. Dabei ist auch interessant zu sehen, welche sprachlichen Stereotype und damit Klischees er in brüchigem „Roboter-Dialekt“ generiert und reproduziert, etwa raunzen (jammern) und matschkern (herumnörgeln):
Gebrauchstexte
Die beeindruckendsten Ergebnisse liefert ChatGPT für konventionalisierte, formalisierte Gebrauchstexte, in denen bestimmte wiederkehrende Phrasen erwartet werden. Das betrifft nicht zuletzt verschiedene Testformate für Prüfungsteile „Schreiben“ in Sprachprüfungen (informelles und formelles E-Mail) oder einige Textsorten im Sprachunterricht wie die Erörterung, die das Sprachmodell in Sekundenschnelle und bis auf manchmal auftretende kleine Interferenzen aus dem Englischen fehlerfrei lösen kann. Obwohl sich die KI mit Anweisungen teilweise steuern lässt, sind die Lösungen für niedrigere Sprachniveaustufen oft sogar zu gut, mit komplexen Nebensätzen oder Komposita, die auf Anfänger*innenniveau noch nicht erbracht werden müssen. Dies führt zur Überlegung, ob die statischen und mechanischen Textsorten, die auch von einer Maschine verfasst werden können, überhaupt der Maschine überlassen werden sollten und diese Textsorten im Sprachunterricht als Redigieren von Maschinentexten zum Leseverstehen wandern könnten, das insgesamt mehr gefördert werden sollte. Die stereotypen Gebrauchstexte spiegeln ja auch die gesellschaftlich verankerte Erwartung wider, dass Menschen wie Maschinen funktionieren sollen. Für das Schreiben im Unterricht würde sich dringend notwendiger Platz für kreatives und individuelles Schreiben, auch mit der Hand, öffnen.
Das Textbeispiel Neujahrsgruß zeigt die sehr hohe Textkohärenz und Textkohäsion, lediglich mit kleinen Interferenzen („in 2023“, „lasst uns“), Tendenz zur Wiederholung („einen guten Rutsch“) und inhaltlich noch auf dem Stand 2021, auf dem die derzeitige freie Testversion von ChatGPT ist:
Auch eine Rezension mit den oft vorzufindenen texttypischen Phrasen und Worthülsen ist für die KI keine große Herausforderung und es wirkt unheimlich, wenn eine Maschine z. B. „wirklich beeindruckt“, „auf eine sehr authentische Weise“ und „berührend“ schreibt:
Der generierte, „errechnete“ Rezensionstext wirft auch ein interessantes Licht auf die konventionellen Erwartungen, die an einen Gegenwartsroman gestellt werden. Und obwohl sich die KI stets um Höflichkeit bemüht und sich im Dialog gewählter ausdrückt als manche Menschen, lässt sich auch ein Satz entlocken, den ich zunächst nur Menschen zugetraut hätte:
Literarische Texte
Von einem Gratis-Bot avancierte Literatur zu erwarten, ist auf jeden Fall viel zu hoch gegriffen, er generiert vor allem Textschablonen, die zwar strukturell kohärent, aber letztlich Blindtext voller Klischees sind. Dennoch oder gerade deshalb stellt sich die Frage, ja die Challenge, was mit den Limitierungen, die gleichsam wie eine oulipotische Contrainte wirken, dennoch an kreativem Output erzeugt werden könnte. Mit entprechenden Schreibanweisungen lassen sich Textsorten und Content verschränken, collagieren, mixen und samplen, und dies auf Englisch sicherer als auf Deutsch. So ist es für die KI etwa kein Problem, das Hilbert’sche Paradoxon aus der Mathematik, auch bekannt als Hilberts Hotel als Battle-Rap zu präsentieren:
Zwar lassen sich mit geschickten Anweisungen auf diese Weise Texte generieren, die für manche Situationen, z.B. Präsentationen, oder als Einstieg in ein Thema nützlich sein können und somit eigentlich auch unter Gebrauchstexte fallen, aber im Prinzip ist auch der Mix eine Form der Reproduktion. Der menschliche Anteil beschränkt sich auf die Anweisung, somit auf das obere Eingabefeld, d. h. je mehr eigener, menschlicher Input im oberen Feld steht, desto mehr ist das Gesamtergebnis, mit Screenshot festgehalten, ein Gemeinschaftsprodukt mit der Maschine, bei dem auch das Dada-Prinzip der Aleatorik zum Ausdruck kommt. Dies aber auch nur aus menschlicher Perspektive, die Maschine „errechnet“ ja den Text aus wahrscheinlichem Kontext. Die Maschinenanteile können dabei wie Objets trouvés/Ready-mades wirken, wodurch eine Montage entsteht:
Da anzunehmen ist, dass sich das Erscheinungsbild des Bots sehr bald wieder ändert, dürfte so ein Screenshot-Text-Bild auch sehr bald historisch und retro sein, ein Augenblickstextbild, das den Stand Ende 2022/Anfang 2023 wiedergibt. Eine weitere interessante Frage beim Testen des Bots war auch die nach dem Schreiberlebnis, der Schreiberfahrung. Für mich hat es etwas von Tamagotchi-Füttern oder auch Rumdaddeln wie am Flipperautomat:
Immerhin das „kleine Einhorn in blau“ war ein kleiner Überraschungsmoment, warum ein blaues Einhorn, aber das war’s auch schon, wenn auch mit mehr und geschickten Anweisungen schrägere Tamagotchi- und Pinball-Gedichte generierbar sein dürften. Der Flipperautomat erinnert auch an den Jahrmarkt und der Jahrmarkt daran, dass auch das Medium Film im 19. Jahrhundert z.T. als Jahrmarktsensation begann, dem daher auch etwas Verruchtes und Verbotenes anhaftete. Ein Stummfilm-Skript, von ChatGPT generiert, auf grauer Screenshot-Leinwand festgehalten:
Das Medium Film hat sich ja als „gefundener Schuh“ erwiesen. Wohin wird sich die KI entwickeln? Wird es ein Schreiben wie mit einem Synthesizer, mit dem durch bestimmte Anweisungen moduliert werden kann, auch Klischees gebrochen werden können und sich neue Sprachklangdimensionen auftun? „Gehobenere“ Gelegenheitslyrik, mit ein bisschen Spannung und Brechung drin, ist derzeit mal schon generierbar, wenn man die richtigen Regler, sprich: „Trigger“-Begriffe als Prompts für die KI erwischt:
Wobei die kostenpflichtige Vollversion von GPT-3, bald GPT-4 diesbezüglich bestimmt noch viel mehr Möglichkeiten bietet. Aber es ist Reproduktion und Imitation von Textformen, die eigentlich auch ganz ohne Computer und KI mit der Hand auf einem Stück Papier geschrieben werden können. Die KI zeigt lediglich, dass sie bis zu einem gewissen Grad auch „ausrechenbar“ sind. Ist KI-Poesie somit allenfalls glitzernder Rhinestone? Sind die KI-Stilmittel und die Überraschungsmomente nur die Programm-Fehler (Glitches), die eine computerspezifische Ästhetik begründen und ihre Spannung höchstens aus der Überaffirmation und damit zusammenhängend der Ironisierung menschlicher Textproduktion bezieht? Oder steht mit der KI nun der „Realisator“ zur Verfügung, den Max Bense in den 1960er-Jahren in seiner „generativen Ästhetik“ beschrieb?
„Und wenn ich diese Taste drück’, spielt er ein kleines Musikstück“ heißt es im Song „Taschenrechner“ der Elektronikikonen „Kraftwerk“. Ich drücke auf einen Knopf und die Maschine wirft etwas aus. Nur bekommt die KI ja (derzeit) nicht wirklich viel, d. h. eigentlich nichts von der Welt mit, kreiert alles rein nach Anweisung aus der Sprache und dem eingespeisten Korpus, ohne Emotionen, wenn sie auch dazu neigt, „überemotionalisierte“ Texte zu generieren. Häufig finden sich Wörter aus dem Bedeutungsfeld „fühlen“, erstaunlicherweise auch „Seele“, wodurch sich durch die weitere technische Bedeutung „Kern eines Kabels“ eine nicht uninteressante Doppelbödigkeit eröffnet:
Fundstücke, die auch viel über Menschen aussagen, sind möglich. Lassen wir die KI mal jodeln:
„Juchhei, juchhei, juchhei-hö. Juchhei, juchhei, juchhei-hö“. Immerhin wurde ein Kunst-Jodler generiert, den es sonst so kaum gibt, ein Roboter-Jodler sozusagen. Ja, KI-Poesie, um die KI vorzuführen, das kann lustig sein, lustig und fidel. In letzter Zeit war auch häufig zu lesen, dass KI schon wie Ernest Hemingway und mit einem entsprechenden Textkorpus trainiert eigentlich wie jede*r schreiben könne, wodurch Text-Clones und Avatare entstehen könnten. Aber ist es wirklich interessant, Hemingway zu reproduzieren, „weiterzuschreiben“ bzw. Texte im Stil von Hemingway oder anderen Autor*innen generieren zu lassen? Hat es über den reinen Gag, das eine oder andere Sampling hinaus einen ästhetischen Mehrwert? Ich habe jedenfalls keinerlei Interesse, Texte dieser Art generieren zu lassen, ich krame lieber in mir selbst und beschäftige mich mit den Mitmenschen. Lohnender ist es bestimmt, bestehende Texte von Autor*innen wie Hemingway und anderen zu lesen. Es gibt so viel Ungelesenes und so viel Geschriebenes. Daher werde ich mir auch keine Vollversion von GPT zulegen. In meinem Test ist mir nur eine einzige Stelle aus der Weltliteratur eingefallen (einzelne weitere finden sich bestimmt auch), für die es für mich – rein aus Neugier – Sinn machte, von einer Maschine ein kurze Fortsetzung generieren zu lassen. Diese Fortsetzung muss m.E. aber genau in der Stelle begründet sein. Ich wählte aus James Joyce’ „Ulysses“, Ep. 15 „Circe“, p. 534, die Passage, in der Zoe Higgins den Musikautomaten anwirft, für mich ein Moment, in dem der Farbfilm in die Literatur Einzug hält:
Bestimmt wird die KI mit immer höheren und noch leistungsstärkeren Versionen in die Literatur und insgesamt in das Schreiben Einzug halten. In welchen Formen, wird sich weisen. Als Werkzeug da und dort brauchbar, aber eben auch missbrauchbar. Daher ist es auch wichtig, die Entwicklungen im Auge zu behalten und sich mit den Algorithmen auseinanderzusetzen. Ein weiteres programmatisches Lied von „Kraftwerk“ ist ja „Wir sind die Roboter“, was auch an „I Robot“, den Roman von Isaac Asimov aus dem Jahr 1950 denken lässt und das Wort „Roboter“ wurde ja vor ca. 100 Jahren vom tschechischen Schriftsteller Karel Čapek geprägt, der in seinem Theaterstück „R.U.R“ damit künstliche Arbeiter bezeichnete. Eine künstliche Arbeitskraft ist die KI heute schon durchaus und es ist die Frage, wie sich das Zusammenwirken mit den menschlichen Arbeitskräften in allen Bereichen weiter gestalten wird. Für mich war der Erstkontakt mit ChatGPT einerseits unterhaltsam wie eine Spielkiste, andererseits unheimlich wie ein Geisterschloss. Darin kommt sich eins zwar schnell mal klein und mies vor, wenn vor eigenen Augen und bis auf ein paar Anweisungen ohne weiteres Zutun blitzschnell Text entsteht, was für manche Gebrauchstextsorten durchaus nützlich sein kann, aber es entsteht gleichzeitig auch eine Wertschätzung der menschlichen Langsamkeit und der individuellen Handschrift.
Onomatopoesie mit Tschett tschipidi.