Integrierte dystopische Elemente der KI und die asoziale Rahmung der sogenannten Nutzlosen betrachte ich zunächst getrennt.
Das eine ist einfach Technologie, die - und das ist ein häufig zu beobachtender Irrtum - nicht neutral ist. Sie ist ein Mittel zum Zweck. Der Zweck ist entweder Befreiung (z.B. von Tätigkeiten, die Menschen ihrem Wesen nach als Zumutung empfinden oder einfach zur Freisetzung von Zeit) oder der Zweck ist Unterdrückung (Überwachung, Bekämpfung, u.s.w.) zum Machterhalt nach innen und außen.
Das andere ist eine Gruppe von ausgestoßenen Menschen, die im Sinne des neoliberalen Kapitalismus ebenfalls Funktionen zu erfüllen haben. Sie dienen einerseits als sichtbares Szenario, wohin es führen kann, wenn man ökonomisch nicht leistungsfähig genug ist und andererseits sind sie eine Projektionsfläche für das Narrativ von Menschen die keinen Wert haben.
Was beide Themen gemeinsam haben, ist ihre Nutzung zur Verhaltensbeeinflussung der Massen. Angst als Machtmethode die mittelbar generiert wird, um unmittelbar zu wirken. Der Eindruck, dass Obdachlose selbst verschuldet in ausweglosen Situationen stecken und dass KI Kontrolle über uns ausübt, wird schon dadurch wirkmächtig, indem es einfach erzählt wird. Egal, ob es tatsächlich so ist oder nicht. Man kann sich nun über die Frage streiten, ob das noch Neoliberalismus ist oder ob bereits der Übergang zu einem neuen Calvinismus eingeleitet ist. Das von Dir geschilderte Szenario würde Zweiteres bedeuten. Menschen wird ein Schicksal zugeordnet und es wird so getan, als ob es keine anderen Möglichkeiten gäbe.
Jedenfalls zeigen sich in der Gegenwart schwerwiegende ideologische Fallen. Augenscheinlich wird es, wenn man zum Beispiel anschaut, wie einige südostasiatische Gesellschaften funktionieren. Es gibt tatsächlich Staaten, die versuchen, so viele Menschen wie möglich in Beschäftigung zu bringen und zwar so, dass die Leute davon ein Auskommen haben. Kostendeckend zu wirtschaften ist dort wichtiger als Gewinnmaximierung. Dort werden politische Entscheidungen auch von Menschen getroffen - nur stehen die unter anderen Einflüssen als zum Beispiel im politischen Westen. Insofern sehe ich in Deiner Vorschau auf die Zukunft keine Zwangsläufigkeit. Wie sich das abwenden ließe, kann ich allerdings nicht beurteilen. Natürlich kann man immer etwas wie „Generalstreik“ rufen - bei der Suche nach realistischen Mitteln muss man aber darauf schauen, was mit den Leuten tatsächlich zu machen ist. In unserer hyperindividualisierten Gesellschaft strebt jeder nach seinem Vorteil. Effektiver kann man die Formulierung gemeinsamer Ziele nicht verhindern. Vielleicht liegst Du mit Deiner Vorschau richtig.
Das sehe ich auch nicht. Dafür müsste in unserer Gesellschaft ein anderes Menschenbild geschaffen werden. Ein „Nein, danke“ könnte sich hier nur auf den Verzicht beziehen, die Erzählung von Nutzlosen durch eigenes Reden und Verhalten zu fördern.
Ich biete Dir gerne ein Ausschlusskriterium für die Realisierbarkeit weltweit aufgespannter maschineller Autonomie unter völligem Verzicht auf menschliche Leistung an.
Deine These enthält ein unauflösbares fundamentales Paradox: Ein vollständig autonomes System hat entweder seinen Zweck von außen eingeschrieben bekommen - womit die “vollständige Autonomie” bereits gebrochen ist. Das ist keine Ingenieursfrage mehr, sondern eine, die in der Nähe von Hegels Herr-Knecht-Dialektik liegt. Eine Maschine, die ihren Zweck nicht verweigern kann, hat ihn nicht — sie vollzieht ihn nur.
Die andere Möglichkeit ist, dass dieses autonome System seinen Zweck selbst revidieren kann. Revidieren ohne externen Maßstab ist das eigentliche Hindernis. Es wird genau dann relevant, wenn das System auf unvorhergesehene Situationen trifft, die seinen eingeschriebenen Rahmen sprengen.
Dieser Punkt wird irgendwann erreicht, selbst wenn das System zuvor die knackigen Probleme in Hinsicht auf Versorgung mit Energie und hochreinen Rohstoffen sowie perfekter Reproduktion gelöst hat. Die Fehlerkorrektur ohne Referenz ist das Crash-Kriterium.
Ich glaube es kommt genau auf diesen Bewertungsrahmen an. Also das lokale Minimum erfüllt die Berechnungsregel des Systems. Aber der Nutzen und die Einordnung erfolgt doch immer von außen. Auch die Bewertung “noch besser”, oder “korrekte Faltung” ist ja die einer externen Bewertung, die eben nicht Teil des Systems selbst sein kann.
Stumpfe Exploration kann es auch nicht sein, fast alle modernen Machine-Learning-Ansätze haben ja gerade immer den Faktor Zufall um diese Exploration abzubilden. Diese ist aber kein freies Spiel, sondern immer an den externen Optimierungszweck gebunden.
Und Auch Absicht ist genau dieser externe, nicht systemimmanente, Faktor. Aus meiner Sicht müssen wir damit klären: Was ist selbstreferenziert, was ist fremdreferenziert im Kontext moderner KI? Ist sie überhaupt ein neues System im engeren Sinne?
Ich vermute, dass wir mal hier lesen könnten:
Wenn wir mal an den Thread-Liebling Luhmann denken, würde ich jetzt gucken in: Zweckbegriff und Systemrationalität → Soziale Systeme → Die Wissenschaft der Gesellschaft.
Vielleicht sogar schon Bloch mit Prinzip Hoffnung, Enscombe mit Intention oder Maturana und Varela um die Begriffe sicher zu haben?
Danke für die Gedanken. Eine Rückfrage zum Zufall bei KIs, weil du dich da wahrscheinlich besser auskennst: Ist es nicht so, dass die KI ihre Wahrscheinlichkeitsberechnungen per Token durchführt? Also dass jeder neue Baustein durch Wahrscheinlichkeiten herbeigeführt wird, die alle vorangehenden Bausteine als gegeben und vorausgesetzt annimmt?
Ich frage, weil mein Gedanke darauf abzielte, zu sagen, dass Menschen es anders machen, dass Menschen auch mal einen höchst unwahrscheinlichen Satz sagen, oder mal in eine höchst unwahrscheinliche Richtung gehen, und das eben nicht im nächsten Moment wieder Richting Wahrscheinlichkeit revidieren. Es gibt gewissermaßen „Parzellen der Unwahrscheinlichkeit“, in denen man auch mal verharren kann. Formen der Poesie kommen mir da in den Kopf, und das erinnert mich an einen Youtube-Vortrag von Leif Weatherby, bei dem er Gedichte von neuen KIs mit GPT-2 verglich und meinte, dass die KI im Dichten schlechter geworden ist. Vielleicht ja genau deswegen, weil neuere KIs auf den Gesamtkorpus von Text berechnet wahrscheinlichere Texte vorbringen?
Gute Frage. Ich versuche nochmal präziser zu sein. Was ich meinte, ist Zufälligkeit im Training des Modells, nicht in der Anwendung.
Die Anwendung also die “Sage-jetzt-Text-auf-diesen-Prompt-vorher-Phase” ist reine Ableitung und Berechnung aus den Modell-Parametern, die im Training berechnet wurden, keine weitere Evolution des Modells an sich.
Hier einmal ein Video für die absolute Basis neuronaler Netze. Es ist fantastisch und einem Computer dabei zuzuschauen wie er Mario spielen lernt, veranschaulicht den Prozess echt gut: https://m.youtube.com/watch?v=qv6UVOQ0F44 (Die biologischen Vergleiche kannst du wiederum vermutlich besser einordnen xD)
Also hier ist jetzt der Zufall real am Werk: Drück nen Knopf, je nach Ergebnis, bekommst du Punkte, mach so viele wie du kannst, wir probieren mal 24h und nehmen die komplexe Funktion, die durch das Level kommt. Es ist Learning, weil der Computer im Prinzip nichts von den Knöpfen wissen muss, sondern einfach kombinatorisch alle Inputs durchspielt um das Maximum von F(Punkte) zu finden.
Dieser Ansatz jetzt auf Sprache übertragen: Wir wollen nicht jede Antwort, die ein Kundensupportfall so erreichen kann, vorschreiben müssen, sondern, es sollte doch wie bei Mario möglich sein, den Input (also Fragen) durchzuspielen, um bessere natürliche Antworten (Punkte in Mario) anzubieten.
Das folgende Video erklärt extrem gut, was jetzt technisch gesehen, noch zu dem Mario-Netz dazu kommt und welche Verarbeitungsprozesse wann wie wo wirken ohne(!) zu sehr in die Mathematik abzudrehen. Ich glaube es gibt in der Tiefe aktuell nichts so gut Verständliches. (Playlistlink für noch mehr optionalen Deep-Deep-Deep-Dive).
Jetzt können wir auf einmal ziemlich gut auf Basis “aller Texte jemals” immer das statistisch nächste “best-passendste” Wort berechnen und weil wir Menschen miteinander (z.B. in solchen Foren wie hier) auch Worte und Sprache nutzen, um unsere Welt, uns und irgendwie alles zu beschreiben und diese logische Textur natürlich ganz viel mit dem Input im Training zu tun hat, “können” diese Modelle auf einmal Fragen beantworten und komplexe logische Zusammenhänge deutlich machen, weil sie ja auf Textzusammenhang trainiert worden sind.
Im Kern ist es aber weiterhin in einer krassen Vereinfachung gesprochen f(x) = x.
Selbst Konversation und Kontingenz einer Unterhaltung ist vorgetäuscht, Berechnung laufen nicht in Abhängigkeit zueinander, sondern seriell und autoregressiv:
Deswegen wird so viel von Kontext, der sich füllt (die linke Seite hier), gesprochen. Es ist aber immer pro Schritt nur eine Operation, die immer die komplette Geschichte enthalten muss, um weiterhin eine stimmige Vorhersage “für das nächste Wort” zu erfüllen. Wir empfinden Kontinuität und einen Strom an Gedanken, die Maschine macht immer nur einen, den mathematisch tatsächlich selben Schritt mit nur verändertem Input. Nur dem Moment ist sie “an”.
Jetzt gibt es, wieder vereinfacht gesprochen, 3 Ansätze die Maschine gangbarer und besser zu machen:
Wir stopfen einfach noch mehr Text ins Training rein in der Hoffnung, dass noch mehr und komplexere Gewichtung zwischen den Parametern noch mehr Genauigkeit produziert
Wir bewerten im Training vor, in etwa: “Das, was im Smalltalk von “Die neue Zwanziger” geschrieben wird, ist immer besser als, das was auf Twitter steht und Luhmann hat immer Recht”
Wir lassen nicht mehr nur einen Kontext rechnen, sondern geben dieser Maschine die Möglichkeit selber Prompts an andere Maschinen zu schreiben, die dann nur den einen Schritt ausführen und die Kommandomaschine sammelt nur das Ergebnis ein in der Hoffnung, dass wir um im Beispiel von oben zu bleiben, um zu Ergebnis 3 zu kommen, das Errechnen des Ergebnis 2 die Maschine selbstständig wegdelegieren und einfach nur Ergebnis 2 entgegennehmen um einfach den Ballast auszulagern.
Aktuell gibt es auf dieser Basis jetzt zwei Richtungen/Hoffnungen/Zukünfte (ja auch wieder vereinfacht):
Weg 1: Die Maschine findet selbst durch die permanente Iteration Programmcode, der sie selbst im Training verbessert und zwar so, dass die Wortvorhersage 1. besser, 2. schneller, 3. energieeffizienter funktioniert und diese Methode ist so komplex, dass wir Menschen nicht mehr verstehen, warum diese neue Mathematik funktioniert. (Auch hier spannend: Das “Besser” mindestens liegt im Auge des Betrachters, und das “nicht mehr verstehen” ist auch nur eine rezente Prognose, auf Basis des aktuellen Verständnisses. Für uns ist es selbstverständlich, dass nicht Zeus die Blitze schleudert, das war aber auch historisch mal “unvorstellbar”, ich würde das hier Projektionsverzerrung nennen.)
Weg 2: Wir bauen auf Ansatz 1 und stopfen weiterhin auch alles “Neue” aus dem Internet in die Maschine also auch ihre eigenen Kreationen, was aber natürlich den Verknüpfungsraum 1. nicht vergrößert und 2. sogar verschlechtern könnte, weil es ja bereits gemachte Wortvorhersagen überproportional betont, sie sind ja schließlich generiert worden und werden jetzt als Trainingsmaterial verwendet.
Also ja, die LLMs berechnen jeden “neuen” Baustein nur aus allen “alten” im Modell und je größer das Modell umso dichter, und logischer die Wortverknüpfungen. Schöne Beobachtung mit den Gedichten. Hier aber natürlich auch wieder Chance auf Projektionsverzerrung: Das erste Mal, “woah, die Maschine reimt, krass” vs 100x gesehen: “Wieso schaffst du doofes Ding jetzt diesen komplexen Metrumswechsel nicht??!”
Die von uns, die Videospiele spielen, kennen diesen Effekt übrigens aus der “fotorealistischen Grafik”. Diese wird jedes Jahr wieder aufs Neue versprochen wird, fühlt sich bei Release auch immer so anfühlt und dann wenige Jahre später scheint nur die reinste Pixelkotze übrig geblieben zu sein.
Danke für die Ausführung, wirklich sehr interessant Auch den Begriff der Projektionsverzerrung finde ich super.
Hier einmal der Vortrag mit dem Gedicht den ich erwähnt hatte, mit Zeitstempel. Lohnt sich alles anzuschauen, einer der interessantesten KI-Beiträge den ich in den letzten Monaten gesehen habe. Ich will mir auch mal das Buch anschauen, das er zu KI geschrieben hat.