Epochenbruch II – ChatGPT

ChatGPT, DALL-E und die anderen

Epochenbruch II – ChatGPT

Faites vos jeux

28-02-2023

It’s like the goldrush – der Satz entnehme ich einem Experten-Panel, das die Potentiale von ChatGPT diskutiert; die Fachleute sind ganz aus dem Häuschen. Bevor ich weiter unten ein paar Überlegungen zu diesem „goldrush” anstelle, will ich zunächst einen Schluck Wasser in den Wein geben.

ChatGPT Protokoll mit Schrift: Alles Falsch

Trau – schau wem

Und zwar

Bei den Korrekturen eines Textes kam ich an eine Stelle, an der ich auf den Inhalt eines Buches referenziere: auf „Hologrammatica” von Tom Hillenbrand. Ich kenne (nur) das Hörbuch des Autors (16 Std. 37 Min) - kann es also nicht im Buch nachlesen. Die Story war mir gut in Erinnerung – na klar, sonst würde ich sie ja nicht zitieren wollen. Ich war aber nicht sicher, ob ich mich in allen Aspekten korrekt erinnere.

Mein Gedächtnis ist von der Sorte, dass ich meist alles erinnere, was mir wichtig ist, aber wenn Du mich fragst: „Bist Du sicher?” klappt meine Erinnerung förmlich in sich zusammen: Sicher? Äh, nee, sicher bin nicht. Ich habe deswegen ChatGPT um eine Zusammenfassung gebeten (das Bild anbei zeigt den Chatverlauf). Die Antwort der KI hat mich ziemlich irritiert, weil, scheinbar, meine Erinnerung komplett daneben lag. Innerhalb meines Textes war das Zitat aber nur dann unverzichtbar, wenn meine Erinnerung korrekt war – also habe ich das ganze Buch noch einmal angehört. Es war ungefähr wie Nachsitzen: das braucht keiner! Dann, nach ungefähr zwei Stunden des Hörbuches war klar: die Zusammenfassung der KI ist in vielen Aspekten falsch und vermischt das Geschehen mit einer anderen Geschichte (nach langwieriger Recherche: nämlich die von Greg Egans Buch „Quarantine“). Bis ich meine Zitatstelle gefunden hatte vergingen weitere 5 einhalb Stunden. Pretty annoying!

Damit Du das nachvollziehen kannst:

„Hologrammatica” erschien im Feb 2018 (nicht 2019). Die Hauptperson bei Hillenbrand heisst Galahad Singh, ist Sohn eines indischen Grossindustriellen, und von Beruf Quästor (ein Detektiv, der nach verschwundenen Personen sucht). In dieser Story sucht er nach Juliette Perrotte.
Galahad stösst auch nicht auf ein Geheimnis (Hologrammatica), vielmehr ist diese Technologie bereits weltweit installiert. Sie ermöglicht es, jeden materiellen Gegenstand (auch Personen) nach Belieben erscheinen zu lassen (schöner, bunter, neuer …). Ganze Städte verstecken ihre Baulücken, Bröckelfassaden und sonstigen Hässlichkeiten hinter schicken Illusionen. Sogenannte "Jedermann-Anzüge" sind sogar in der Lage, die eigene Erscheinung mitten im Spaziergang zu morphen, etwa in der Art, dass Du als asiatischer Taxichaffeur auf die Strasse tritts und als Schicki-Micki-Münchner um die Ecke biegst. (Und deswegen können so viele Menschen verschwinden …)

Mich hatte das Virus interessiert: es heisst im Buch "Schröder-Pizzarro" und hat eine weltweite Epidemie ausgelöst. Keiner starb daran, aber alle infizierten Frauen wurden unfruchtbar. Darauf hin schrumpfte die Bevölkerung dramatisch. Zu dem Virus kam es, nachdem die KI von „der Menschheit" den Auftrag erhalten hatte, die Klimakrise zu bewältigen. Als das Ergebnis vorlag, war der KI klar, dass die Menschheit nicht tun würde, was nötig ist. Deshalb hat sie heimlich das Virus entwickelt (entwickeln lassen).

∑: Also hat ChatGPT da mal was gehörig durcheinander gebracht. Das war besonders deswegen frustrierend, weil ich mich an anderer Stelle auf die Antworten verlassen habe, nämlich in einem Zusammenhang, in dem ich – mangels Kompetenz – nicht beurteilen kann, ob die Antwort richtig ist.

Gestern kam mir nun die Idee, ChatGPT nach dem Buch von Greg Egan zu befragen: auch die Antwort ist komplett falsch.

***

Goldrush oder nicht: es finden sich – offenbar – eine ungewisse Anzahl Nieten im KI-Speicher. Andererseits, auch klar: die App ist jetzt seit drei Monaten im Feld und wird kontinuierlich nachgebessert. Was wir bislang gesehen haben, ist nicht einmal die Spitze des Eisbergs, kaum eine kleine Schneewehe.

Es hilft zum Verständnis der App, wenn man weiss, wofür ChatGPT eigentlich steht.

Das es ein ChatBot ist, liegt auf der Hand: Dabei steht das G für Generative und meint, dass der Bot einen eigenen neuen Text erschafft, indem er „das nächste wahrscheinliche Wort” vorhersagt. Die KI funktioniert also nicht wie Google als „Durchgriff” auf eine Knowledge Base, sondern ist ein Sprachmodell. Diese Ergebnisse sind natürlich nicht blosser Zufall! Denn P steht für Pre-Trained: Die App wurde auf einer Textbasis von >10 Terrabyte Text auftrainiert. Dieses Auftrainieren erfolgte mit Hilfe von T (für Transformer): für die Vorhersage des „nächsten” Wortes ist eine Transformer Architecture verantwortlich, die mit „deep neural networks” arbeitet, in denen die Vorhersage aus unbestimmt vielen Triggern befeuert wird.

Schliesslich durchlief die App einen Tuning-Prozess, der einerseits darauf zielte, Anwender-Fragen möglichst sinngenau zu verstehen und andererseits auch den Umgang mit unerwünschten Antworten trainierte.

Schon heute liegen unglaubliche Ergebnisse vor, die erfahrene, und deswegen gegenüber jedem Hype skeptische, Business-Strategen zu dramatischen Äusserungen veranlassen: Von einer fundamentalen Neubestimmung des gesamten Business-Umfeldes ist die Rede.

Bereits getestete Anwendungen reichen von der Erstellung von Marketingplänen über den Research bis in alle operativen Einheiten des Unternehmens: ChatGPT kann programmieren – auch Programme von einer in eine andere Sprache überführen. Es kann, sozusagen „sowieso”, übersetzen. Es kann riesige Repositories durchforsten und dann bis in verästelte Details Fragen sinnvoll beantworten. Anwendungen im CRM und ERP drängen sich auf. Hinzu kommen, noch ganz frisch, schier atemberaubende Ergebnisse bei der Umsetzung eines Textes in Bilder (mit DALL-E) und Audio.

Der Wettbewerb tut das Seine: bislang kennen wir DeepL und ChatGPT; Microsoft hat Open AI (mit ChatGPT und DALL-E) für 10 Milliarden Dollar übernommen und hat oder wird (so die Nachrichtenlage) die KI sozusagen quer durch alle hauseigenen Anwendungen aktivieren, beginnend mit Bing. Alphabet steht, wie es heisst, mit Google Bard (das auf LaMDA basiert) vor der Markteinführung. Neben Marktführern, darunter auch GitHub, Nvidia, Autodesk und Adobe, haben bereits über 1.000 StartUps Produkte gelauncht, die verschiedenen KI-Apps aufsetzen.

Auf Substack und in anderen Foren werden professionelle und verantwortungsbewusste Anstrengungen unternommen, den Hype im Zaum zu halten und die Limitationen der sogenannten Large Language Models (LLMs) aufzuzeigen. Kevin Roose hat im PodCast „Hard Fork” berichtet, wie „Sydney” (das war der Microsoft-interne Code-Name der KI in der Entwicklungsphase) im Chat aus der Rolle fällt: „Then, out of nowhere, Sydney declared that it loved me — and wouldn’t stop, even after I tried to change the subject.” Das vollständige Transkript des Chats findet sich hier ($).

Obwohl ChatGPT in breit angelegten (und in der Durchführung fragwürdigen, ich hatte kürzlich darüber geschrieben) Schulungen sozusagen gegen falsche Antwortpfade immunisiert werden sollte, ist damit zu rechnen, dass vergleichbare oder auch „kritischere” Ergebnisse kolportiert werden.

Nicht allein die Ergebnisse werden in die Diskussion geraten, auch die Entstehung der Ergebnisse wirft einige Fragen auf: Wie nur Google zuvor eignen sich LLM „das Wissen der Welt an”, ohne lange zu fackeln und zu fragen. Rechtliche und Copyright-Fragen sowie allgemeine Datenschutzklagen werden zwangsläufig folgen. Und schliesslich, damit hatte ich begonnen, auch Haftungsfragen, sei es für Rassismus, FakeNews oder Falsch-Information, werden aufkommen. Wenigstens für eine überschaubare Zukunft werden die Ergebnisse der Apps von Menschen kontrolliert werden müssen, bevor sie in Geschäftsmodelle Eingang finden.

Das breite Spektrum an Kritik und Skepsis ändert aber nichts an den Erwartungen, die gleichsam durch die Decke gehen: Wenn erst die Unternehmen ihre je eigenen KIs auftrainieren und ihren jeweiligen Business-Spezifikationen wie Leuchttürme auf die bestehende Knowledge-Base sozusagen aufpfropfen, werden die Lichtkegel, um im Bilde zu bleiben, bis an den Horizont reichen. Wer die vergangenen 50 Jahre zu einer digitalen Revolution erklärt hatte, wird nach der jetzt anstehenden Sturm-und-Drang-Phase der LLMs (und auch sie repräsentieren nur einen Ausschnitt aus der breiten KI-Entwicklung) seine Einschätzungen neu kalibrieren müssen.

***

Mixed emotions, so würde ich das zusammenfassen. Sie reichen von euphorischem Überschwang bis zu düsteren Prognosen. Es genügt nun nicht, sich im Tagesgeschehen bei der Bewertung mal auf diese oder mal auf jene Seite zu schlagen – jede Technologie hat mindestens ihre zwei Seiten. Obwohl in Vorläufern schon eine Weile in der Praxis, markieren DeepL und ChatGPT und der aufkommende KI-Tsunami doch eine Bruchkante, sowohl was die Möglichkeiten betrifft wie auch mit Blick auf den unfasslichen Zuspruch: wie keine andere Technologie zuvor erreichte ChatGPT in zwei Monaten 100 Millionen Nutzer.

Bis jetzt steht ein spielerischer Umgang mit den Möglichkeiten im Vordergrund: das nenne ich geniales Marketing! Alle Welt feiert den Fortschritt. Die Downside wird nicht lange auf sich warten lassen. In meinem Umfeld herrscht ein mulmiges Gefühl, insbesondere, als die KI-Modelle jetzt den Beweis antreten, dass sie auch jene Aufgaben übernehmen können, die wir gerne und verbissen als dem Menschen vorbehalten reklamiert hatten: creation.

Jetzt ist nicht mehr die Zeit, vor nebulösen Entwicklungen zu warnen: die Welle ist DA. Was nicht jetzt, unmittelbar, sozusagen in diesem Quartal reguliert wird, erzeugt – weltweit – die „Sachordnungen”, die das Leben und die Ökonomie des 21. Jahrhunderts prägen; und „Sachordnung”, ein Begriff aus der Soziologie, heisst hier: Unternehmen erzeugen Zukunft durch Handlungen (zum Beispiel durch Produkteinführungen); ein Ordnungsrahmen, der das regulieren könnte, besteht derzeit nicht. Die Faktizität des Faktischen – komm damit klar! Der Erfolg von ChatGPT verweist mit seiner exponentiellen Expolsion auf die strukturelle Unregulierbarkeit der Entwicklung: noch ist es die Testphase. Gleich danach rollen die Anwendungen in die Industrien aus. Begeistert stehen wir am Wegesrand und jubeln den ausrückenden Truppen zu:

Go Innovation. Go.Go.Go.

Das Protokoll des Chats