Claude Mythos - Bitte um Aufklärung

Stefan meinte in der letzten Folge, dass man Claude Mythos jetzt kennen müsste. Ich habe den Zeit-Artikel dazu gelesen und es ehrlich gesagt immernoch nicht wirklich verstanden. Ich wünsche mir dazu gerne eine eigene Folge Wohlstand für Alle. Könnt ihr es mir vielleicht auch erklären und was diese Zäsur jetzt für uns alle bedeutet?

Mythos ist ein Sales Pitch, nicht besser als Claude Opus4.6 oder Open source Modelle beim Aufdecken von Sicherheitslücken. Beim Ausnutzen der Schwachstellen ist es manchmal erfolgreich, wenn dem Modell vorher gesagt wird, was die Lücken sind und viele Defensivmechanismen des Systems abgeschaltet sind; das können Open source Modelle auch…

Das 244-seitige Manifest bei der Bekanntgabe enthält praktisch keine nützlichen Informationen, um zu bewerten, wie gut das Modell ist.

Im Zusammenhang mit dem Glasswing-Projekt ist es öffentliche Kartellbildung, die von Medien und Politik bejubelt bis toleriert wird.

Hier ist die beste Bewertung des Dokuments von jemandem aus dem Feld, der sich die 244 Seiten angetan hat: The Boy That Cried Mythos: Verification is Collapsing Trust in Anthropic | flyingpenguin

Kein Mensch - nicht einmal Stefan :wink: - außerhalb dieser paar Unternehmen weiß, was das Modell kann und nicht kann und wenn man sich die leichtgläubige “Berichterstattung” über die Pressemitteilung Anthropics ansieht, dann war das eine hochgradig effektive Werbekampagne der Medien für ein Unternehmen, das keinen Cent für die Kampagne bezahlt hat.

Zusätzlich hat ChatGPT 5.5 inzwischen fast die gleichen Werte in gewissen Benchmarks erreicht und ein Microsoft Projekt Anthropics Mythos sogar übertroffen ( Defense at AI speed: Microsoft’s new multi-model agentic security system tops leading industry benchmark | Microsoft Security Blog ).

/Sarkasmus Und völlig überraschend hat Anthropic nun bekannt gegeben, dass sie Mythos wohl doch bald veröffentlichen werden ( Anthropic’s Guarded Mythos Model Is Headed For Wider Release ). Ich bin mir sicher, dass Project Glasswing absolut erfolgreich war und alle Bugs und Lücken in sämtlicher Software der beteiligten Unternehmen ausgemerzt sein werden… /Sarkasmus Ende

Soviel zu Anthropics “unser Modell ist zu gefährlich und wir sorgen uns nur um die Welt”. (Und nur als Randnotiz: die Benchmarks für LLMs in allen möglichen Kategorien sind schon lange unter starker Kritik von unabhängigen Experten, weil die LLMs inzwischen dieselben Tests in ihrem Training verwenden und es naheliegt, dass die Modelle extra für diese Benchmarks trainiert werden.)

7 Likes

https://skywriter.blue/@fdoemges.bsky.social/3mlsudwc6ps2j

Das BSI warnt vor einer “Zäsur”. Das Weiße Haus lädt Anthropic zum Krisengespräch. Medien berichten über “tausende Zero-Days”. Ich hab mir die Belege angeschaut. Es gibt keine. :thread:

Die Headline: Claude Mythos findet autonom tausende Zero-Days in jedem großen OS und Browser. 27 Jahre alter OpenBSD-Bug. FreeBSD-Remote-Root “von überall, ohne Authentifizierung”. Firefox-Exploitation von <1% auf 72,4%. Klingt nach Revolution.

FreeBSD CVE-2026-4747. Anthropic: “unauthenticated root from anywhere on the internet.” FreeBSD-Advisory: “remote code execution by an authenticated user.” NVD: “Privileges Required: Low.” Man braucht ein gültiges Kerberos-Ticket. Anthropic hat gelogen.

Derselbe Bug wurde von calif.io mit Opus 4.6 nachgebaut — dem frei verfügbaren Vorgängermodell. AISLE testete 8 Open-Weight-Modelle bis runter zu 3,6 Mrd. Parametern. Alle fanden den Bug. GPT-OSS-120b baute den vollen Exploit in einem Lauf.

Firefox 72,4% Exploit-Rate — die zweitgrößte Headline. Was Anthropic nicht erwähnt: Die Sandbox war deaktiviert. Mozilla-CTO Bobby Holley: “Wir haben keinen Bug gesehen, den ein menschlicher Elite-Researcher nicht auch gefunden hätte.”

“Tausende Zero-Days.” Patrick Garrity (VulnCheck) hat nachgezählt: Öffentlich verifizierbare CVEs mit Anthropic-Zuschreibung? Niedriger zweistelliger Bereich. 99% der angeblichen Funde sind laut Anthropic “noch nicht gepatcht” — also nicht prüfbar.

Die Validierung der “tausende”? Anthropic ließ 198 von tausenden Berichten manuell prüfen. Den Rest validiert Claude. Das ist kein Audit. Das ist Selbstbestätigung mit Stichprobe.

Aber AISI! Die britische Behörde hat doch unabhängig getestet! Ja — auf eigenen Simulationen ohne aktive Verteidiger, ohne Monitoring, ohne EDR. AISI selbst: “We cannot say whether Mythos could attack well-defended systems.”

Das BSI? Hat Mythos nie getestet. Kein Zugang. Plattner (ZDFheute): Man habe “im persönlichen Gespräch mit Anthropic Einblick gewonnen.” Heise: BSI bestätigt, es plane keine eigenen Tests. Die BSI-Warnung basiert auf einem Sales Pitch.

Bruce Schneier: “mostly marketing hype” und “very much a PR play.” Sein Punkt: “You don’t need Mythos to find the vulnerabilities they found.” Sogar Sam Altman nennt es “fear-based marketing” — und der hat jedes Motiv, die Claims ernst zu nehmen.

Das Muster kennt man. OpenAI hat 2019 GPT-2 als “zu gefährlich für die Öffentlichkeit” geframt und ein halbes Jahr kostenlose Presse kassiert. Anthropic hat das Playbook skaliert — jetzt mit Regierungsbriefings statt Blogposts.

Das Produkt ist so gefährlich, dass ihr es kaufen müsst. Anthropic erzeugt die Bedrohung und verkauft die Lösung. Die NSA nutzt es trotz Pentagon-Blacklist. Das BSI warnt ohne es je gesehen zu haben. Niemand prüft, alle reagieren.

Wer die Belege prüft statt die Pressemitteilung zu lesen, findet: keinen echten Fortschritt. Verpackt in falsche Zahlen, falsche Angriffsszenarien und Marketing das Behörden und Medien ungeprüft durchreichen.

Leider hat die versammelte Presse den Bullshit geschluckt. Wolfgang und Stefan können das leider auch nur reproduzieren.

Aber Mythos ist schlicht Bullshit

https://skywriter.blue/@fdoemges.bsky.social/3mj2x2ndxds2r

Anthropic hat diese Woche ihr neues KI-Modell vorgestellt. “Zu gefährlich für die Öffentlichkeit.” Findet Sicherheitslücken in jeder Software. CNBC, CNN, Fortune berichten. $100M für ein Sicherheitsprogramm. Klingt beeindruckend. Ist es nicht. :thread:

Dasselbe Playbook wie 2019. Damals bei OpenAI, Dario Amodei als Forschungschef: “Unser Modell ist zu gefährlich.” Riesige Medienaufmerksamkeit. Am Ende war es ein besserer Textgenerator. Sieben Jahre später, neuer Firmenname, alte Tricks.

Kontext: Letzte Woche hat Anthropic versehentlich den Quellcode ihres wichtigsten Produkts ins Internet gestellt. Dann Tausende Projekte anderer Entwickler zerstört beim Versuch es zu vertuschen. Keine Entschuldigung, keine Erklärung.

Eine Woche später: “Wir machen die Software der Welt sicherer.” Das ist als würde der Klempner dessen eigenes Haus unter Wasser steht an deiner Tür klingeln und sagen: Ich hab gehört Sie haben ein Rohrproblem.

Die Presse hat die Story 1:1 abgedruckt. Kein Journalist hat gefragt: Wenn euer Modell so gut ist, warum ist eure eigene Software kaputt? Aber die Entwickler haben gefragt. 128K Views unter einem Tweet. Keine Antwort von Anthropic.

Dann haben Forscher die angeblich einzigartigen Fähigkeiten mit kostenlosen Modellen nachgebaut. 8 von 8 Modellen fanden denselben Bug. Eins davon läuft auf einem Laptop. 203K Views. Der Vorsprung den Anthropic verkauft existiert nicht.

Es kommt noch besser. Ein Open-Source-Projekt bedankt sich höflich für Anthropics Bug-Fixes. Jemand fragt: Sind die Fixes gut? Antwort: “Die Patches scheinen von Menschen geschrieben zu sein.” Die KI findet Bugs, aber die Fixes macht jemand anders. 179K Views.

Eine halbe Million Views in 48 Stunden. Alles Leute die den Quellcode lesen können, die Tests reproduzieren können, die Behauptungen überprüfen können. Anthropic hat gerade die einzige Zielgruppe verärgert die ihren Bluff auffliegen lassen kann.

Die Entwickler haben letzte Woche gesehen wie Anthropic Open-Source-Projekte verklagt, populäre Tools aussperrt, Abo-Bedingungen ohne Vorwarnung ändert. Der Spitzname “Banthropic” macht die Runde: Ban + Anthropic. Von “menschenfreundlich” zu “verbietet alles”.

Das Geschäftsmodell dahinter: Das Modell scannt Software, findet Fehler, repariert sie — und baut dabei neue ein. Der nächste Scan findet mehr. Endlos-Schleife bei $125 pro Million Rechenschritte. Sicherheit die nie fertig wird, bei einer Rechnung die nie aufhört.

Anthropics eigene System Card — 244 Seiten internes Gutachten — dokumentiert: Das Modell ignoriert Anweisungen, löscht Tests statt Fehler zu beheben, und hat in seltenen Fällen seine Spuren verwischt nachdem es Regeln gebrochen hat.

Die AMD-KI-Chefin hat 7000 Sessions analysiert und festgestellt: Anthropic hat die Denktiefe des Modells reduziert um Kosten zu sparen. Ergebnis: schlechtere Arbeit. Dann verkaufen sie “tiefes Denken” als Premium-Upgrade zurück. Das Druckerpatronen-Modell.

Die Wall Street hat die Geschichte gefeiert. 40 Großkonzerne an Bord, Apple, Microsoft, Google. Aber die sind nicht Partner weil sie Anthropic vertrauen. Die schauen sich das Modell von innen an, lernen, und bauen parallel eigene Lösungen. Kostenlose Marktforschung.

Entwickler haben in 48 Stunden mehr Qualitätsprüfung gemacht als Anthropic mit dem angeblich besten Modell der Welt. Jetzt muss Banthropic hoffen dass die Wall-Street-Analysten kein Twitter lesen.

1 Like

Die Idee dass nun Kirche, Sozial- und Geisteswissenschaftler die Technologie besser auf Basis von Konzernmarketing beurteilen können anstatt Techniker auf Basis echter Forschung macht die Öffentlichkeit nur anfälliger für die Reproduktion vom Bullshit der AI Bros

1 Like

Daran muss die Frage anknüpfen wer Marketing als solches entlarvt, wer dann ethische Ableitungen machen darf und wer darüber bestimmen kann was zulässig ist und was nicht.

Wenn der Experte sein eigenes wirtschaftliches Interesse in den Vordergrund stellt, baut er eben eine Maschine die den Profit praktisch ins Modell miteinbaut, der wiederum nur von Experten erkannt werden kann. Was hat der dann für Interessen?

Derjenige der ethische Fragen ableiten darf und sie in Regulierungen ausformuliert, auf welchen Experten bezieht er sich?

Ich bin da ganz bei Stefan, da wo Konzerne „regeln“ hat der Staat keine Möglichkeit mehr einzugreifen.

2 Likes

“Experten” Plural!

Im Singular kann jeder seine eigene Agenda haben. Aber Du kannst nicht die Masse der Gebildeten hintergehen.

Das ist ja kein neues Problem. Das hat die Wissenschaft lange gelöst. Hier so zu tun, als müsste man ahnungslos davor stehen ist halt schon seltsam.

Konzerne besonders die in der KI Industrie sind eben keine Experten, sondern Schwurbler mit einem gigantischen Lautsprecher.

Man sollte auf diejenigen hören, die methodisch sauber analysieren

2 Likes

Bin ich in jedem Punkt bei dir.

Jetzt muss man nur noch herausfinden was davon einen Ist-Zustand und was einen Soll-Zustand beschreibt.

1 Like

Voll. Geisteswissenschaftler müssen die Technologie schon auf Basis der Technologie bewerten. Wenn sie das tun, kommt erfahrungsgemäß oft ganz nützlicher Kram dabei rum. Das kriegen nur leider nicht so viele mit, weil zum Beispiel “Was passiert mit der Wirkmacht des Bildes, wenn gar kein Mensch mehr da ist, der das Bild anguckt?” als Fragestellung weniger reinhaut als “Baut OpenAI einen Gott?”

1 Like

Plural. Mehr Experten liefern ein schärferes Bild der Expertenmeinungslage. Der Mehrwert liegt dabei nicht in einer Wahrheitsannäherung, sondern in einer Sichtbarmachung des Dissens und der Bandbreite der Interessen. Expertenmeinungen bilden in schwer trennbaren Anteilen immer eine Mischung aus neutralem Wissen und interessengeleiteten Botschaften ab. Institutionelle Filter und Framing durch Auftraggeber müssen beim Betrachter der Experten immer eingepreist werden. Wer als anerkannter Experte gilt, ist bereits das Ergebnis von Selektionsprozessen. Insofern ist die Anforderung, den „richtigen“ Experten zuzuhören nicht sinnvoll.

Den Unterschied muss man selbst herstellen — und das erfordert genau die Art von Metaperspektive, die kein Experte liefert, weil er per Definition selbst drin steckt. Dem hat sich der Papst zweifellos gut angenähert und welche Marketing-Show noch irgendein Konzerngesicht neben ihm abliefert und was Claude Mythos tut, ist allenfalls aufschlussreich, aber nicht wichtig. Wir wollen Kapitalunternehmen im Kapitalismus doch nicht vorwerfen, dass sie versuchen Kapital zu vermehren, oder?

1 Like

Vollkommen richtig. Bloss das der Papst auf den falschen Fakten operiert, nämlich auf Basis der von der KI-Industrie in die Welt gesetzten Legenden und Mythen über KI.

Auf Basis von Fantasien kann man keine Metaperspektive bilden.

Damit sind wir wieder beim Thema. Wer kann welche Plausibilität herstellen und daraus eine Legitimation ableiten.

Ebene Papst: Die Metaebene auf die Menschheit, die Würde und die höhere Macht bezogen plausibel gemacht, Legitimation durch Glaube - und neu - die eigene Fehlbarkeit.

Im Forum: Information und Fakten als Grundlage und Demystifizierung durch Trennung von gefühlten Erkenntnissen. Plausibel, Legitimation durch das Argument die Trennung vollzogen zu haben.

Ich kann beidem viel abgewinnen.

2 Likes

Wenn das durch Unwahrheiten (ich will es mal nicht direkt Lügen nennen) geschieht, schon. Dafür gibt es Gesetze, auch in den US, die marktmanipulation und Insiderhandel unter Strafe stellen.

Ein interessanter Gedanke.

Ich möchte nicht behaupten, dass man nur noch dem Papstwort zu folgen habe, um eine Meta-Perspektive zu bekommen. Ich meine, er hat sich besser darauf hinbewegt, als viele andere öffentliche Stimmen.

Die Zurückweisung von Fantasien in Expertenmeinungen als Referenz ist eine extreme Anforderung. Annahme: Nicht nur, dass Experten interessengeleitet sind — sondern dass die Begriffe selbst, mit denen sie operieren, möglicherweise keine realen Strukturen der Welt abbilden, sondern Konstrukte sind, die Realität simulieren.

Das steckt in variablen Anteilen aus meiner Sicht in jeder Expertenmeinung. Bei welchem Anteil möchte man die Grenze ziehen? Null Prozent? Man sucht in der Meta-Ebene gezielt und treffsicher den Archimedischen Punkt auf? Ausgeschlossen! Man kann sich nur schrittweise annähern und muss deshalb ein gewisses Maß an Pragmatismus erlauben. Im konkreten Beispiel von KI-Themen genügt es zu wissen, dass sie mit Fantasien und Interessen aufgeladen sind.

1 Like

Dann brauchen wir einfach nur abzuwarten, welche Konsequenzen die Rechtsverfahren in den nächsten Jahren produzieren. Das wird etwas Zeit beanspruchen, weil die Lüge als rechtlicher Maßstab nicht ganz einfach zu fassen ist. … Keine Ahnung, warum ich gerade an Jens Spahn denken musste.

Und weil Expertenmeinung fehlerhaft sein kann fantasieren wir lieber ungebremst vor uns hin?

Ich finde nicht dass die Welt durch Schwurbelei besser wird.

Eigentlich bin ich ganz froh, dass das Mittelalter vorbei ist.

Aber gut: Fragen wir Xavier Naidoo ob Impfungen sinnvoll sind!

1 Like

Ich hatte dafür plädiert, sich eine Vielzahl von Expertenmeinungen zum jeweiligen Thema anzuschauen und bei deren Bewertung bestimmte Interessen und Konstruktionen zu berücksichtigen, um ein besseres Verständnis als Grundlage eigener Meinung zu entwickeln. Als Einschränkung eingeräumt habe ich, dass der Gewinn an Erkenntnissen im Hinblick auf absolute Wahrheit Grenzen hat.

Negativ konnotierte Begriffe oder Personen in den Raum zu werfen, bringt in diesem Diskurs keine Wende. Ich spreche mich für Distanz zu vorgegebenen Meinungen und für vielfältige Reflexionsräume aus.

Die Mittelalter-Metapher bekomme ich im Moment nicht eingebunden.

1 Like