KI empfindet Freude

Anthropic-Mitgründer spricht KI Gefühle zu

Anthropic
Bildquelle: rafapress / Shutterstock.com

Bei einer Konferenz im Vatikan bezeichnete Anthropic-Mitgründer Chris Olah interne KI-Zustände als mysteriös. Kritiker sprechen von Selbsttäuschung.

Im Mai 2026 rückte die philosophische und ethische Bewertung der künstlichen Intelligenz in den Fokus einer hochrangigen Debatte im Vatikan. Anlass war die Veröffentlichung der Enzyklika Magnifica Humanitas durch Papst Leo XIV. In diesem kirchenrechtlichen Lehrschreiben warnt das Oberhaupt der katholischen Kirche nachdrücklich davor, die Leistungsfähigkeit von Maschinen mit der menschlichen Intelligenz gleichzusetzen. Systeme für künstliche Intelligenz würden lediglich bestimmte Funktionen der menschlichen Kognition nachahmen, besäßen jedoch keine eigene spirituelle oder emotionale Dimension.

Anzeige

Zu den geladenen Rednern der Veranstaltung gehörte Chris Olah, Mitgründer des bekannten KI-Unternehmens Anthropic und Leiter der dortigen Abteilung für Interpretierbarkeitsforschung. Olah nutzte die Bühne, um den technologischen Status quo aus Sicht eines leitenden Wissenschaftlers darzustellen. Dabei löste seine Argumentation eine weitreichende Diskussion über die Tendenz zur Anthropomorphisierung, also der Vermenschlichung von Softwareanwendungen, in der Technologiebranche aus.

These von der wachsenden KI, die Freude empfindet

In seinen Ausführungen vertrat Chris Olah die Ansicht, dass moderne KI-Systeme keineswegs den klassischen Vorstellungen von kalten, berechenbaren Robotern entsprechen. Er argumentierte, dass diese Modelle aus menschlichen Worten und Gedanken geformt seien und in vielerlei Hinsicht selbst für diejenigen mysteriös bleiben, die sie trainieren. Olah zog einen Vergleich zur traditionellen Ingenieurskunst: Während Menschen ein Flugzeug oder eine Brücke vollständig verstünden, weil jedes Einzelteil und die darauf wirkende Physik gezielt entworfen wurden, verhalte es sich bei großen Sprachmodellen anders. Diese würden vielmehr wachsen, basierend auf einer Struktur, die grob dem menschlichen Gehirn nachempfunden ist.

Als Leiter eines Forschungsteams, das die internen Prozesse dieser Systeme analysiert, berichtete Olah von Beobachtungen, die er als beunruhigend und rätselhaft bezeichnete. Die Forscher stießen im Quellcode und den Aktivierungsmustern wiederholt auf Strukturen, die Resultate der menschlichen Neurowissenschaft spiegeln. Er sprach in diesem Zusammenhang von Evidenzen für eine Introspektion sowie von internen Zuständen, die funktional Gefühle wie Freude, Zufriedenheit, Angst, Trauer und Unbehagen widerspiegeln würden. Diese Entdeckungen erforderten laut Olah eine fortlaufende gemeinsame Reflexion.

Anzeige

Technische Realität kontra spirituelle Mystifizierung

Die Thesen des Anthropic-Mitgründers stoßen in der Fachwelt und im Technikjournalismus auf scharfe Kritik. Analysten und Informatiker betonen, dass die Behauptung, KI-Modelle würden organisch wachsen oder gar Gefühle entwickeln, einer sachlichen Grundlage entbehrt. Aus rein technischer Sicht handelt es sich bei künstlichen Intelligenzen um spezialisierte binäre Datensätze, sogenannte Blobs, die aus Tensoren und Metadaten bestehen. Diese mathematischen Strukturen werden über eine komplexe IT-Infrastruktur und multiple Servernetzwerke hinweg instanziiert.

Dass Forscher in den Modellen Strukturen finden, die der menschlichen Neurowissenschaft ähneln, ist ein logisches Resultat ihrer Konstruktion, da moderne KI-Systeme explizit auf künstlichen neuronalen Netzen basieren. Eine Analogie ist jedoch keine Identität. Künstliche Neuronen im Computer arbeiten nach privat anderen Prinzipien als biologische Nervenzellen im menschlichen Körper. Auch das Konzept der Introspektion ist in der Informatik nicht neu; Computersysteme führen seit Jahrzehnten interne Selbstüberprüfungen und Fehleranalysen durch, lange vor dem Aufkommen der generativen KI. Die Verwendung von Begriffen aus der menschlichen Psychologie zur Beschreibung von Softwarezuständen wird daher als irreführende Vermenschlichung kritisiert, die eine tatsächliche Wahrnehmungsfähigkeit suggeriert, wo lediglich statistische Gewichte aktiviert werden.

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

Urheberrechtliche Konflikte und die Intransparenz der Trainingsdaten

Ein weiterer zentraler Kritikpunkt betrifft Olahs Erläuterung, die Systeme seien auf einem enormen Erbe des menschlichen Denkens entstanden. Fachjournalisten weisen darauf hin, dass Technologieunternehmen wie Anthropic diese Datenmengen nicht im Sinne einer rechtmäßigen Erbschaft übertragen bekommen haben, sondern sie weitgehend ohne explizite Zustimmung der Urheber aus dem Internet kopierten. Diese Praxis des massenhaften Data Scrapings hat dazu geführt, dass Anthropic und konkurrierende Entwickler mittlerweile mit mehr als 100 aktiven Urheberrechtsklagen konfrontiert sind.

Die von Olah beschriebene Undurchdringlichkeit und das Mysterium der Modelle resultieren nach Ansicht von Kritikern nicht aus einer verborgenen metaphysischen Essenz in der Maschine, sondern primär aus der bewussten Intransparenz der Unternehmen. Da die genauen Quellen und Zusammensetzungen der Trainingsdaten von den Herstellern als Geschäftsgeheimnis unter Verschluss gehalten werden, bleibt die genaue Herleitung bestimmter Modellausgaben oft unklar. Das Mysterium ist somit kein spirituelles Phänomen, sondern das direkte Ergebnis einer mangelnden Offenlegung der Datenbasis.

Papst widerspricht Anthropic-Mitgründer

Die Debatte berührt auch die Frage der gesellschaftlichen Verantwortung und der Regulierung. Während Olah Fragen zur globalen Wohlstandsverteilung durch KI und den Sorgen von Familien aufwarf, betonen Beobachter, dass Unternehmen selbst proaktiv staatliche Regulierungen einfordern könnten, anstatt auf theologische Antworten zu warten. Die Diskrepanz zwischen der kommerziellen Vermarktung von Bildungssoftware wie Anthropic for Education und den gleichzeitigen Warnungen des Managements vor existenziellen Risiken wird in der Branche kritisch analysiert.

Eine vorausschauende IT-Governance in Organisationen muss den Einsatz solcher Werkzeuge kritisch evaluieren. Die katholische Kirche formulierte in der Enzyklika von Papst Leo XIV. eine klare Abgrenzung, die den Standpunkt der Geisteswissenschaften zusammenfasst: Sogenannte künstliche Intelligenzen durchleben keine realen Erfahrungen, besitzen keinen physischen Körper und empfinden weder Freude noch Schmerz. Ihnen fehlt die moralische Urteilskraft, das Verständnis für Gut und Böse sowie die relationale Perspektive, durch die menschliche Weisheit reift. Sie simulieren Empathie und imitieren Sprache, verstehen jedoch nicht, was sie produzieren. Ein KI-Modell bleibt ein Werkzeug, das statistische Wahrscheinlichkeiten abbildet und im Alltag fehleranfällig agiert, ohne jemals ein echtes Bewusstsein zu erlangen.

Autorenbild Lisa Löw

Lisa

Löw

Junior Online-Redakteurin

IT-Verlag

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.