Eine neue Studie der UC Berkeley zeigt: Der KI-Chatbot „o1“ analysiert Sprache mit einer Präzision, die bislang als rein menschlich galt. Das Modell erkennt doppelte Bedeutungen, rekursive Strukturen und reflektiert, wie Sprache aufgebaut ist.
Sprachverständnis auf neuem Niveau
Künstliche Intelligenz (KI) kann weit mehr als nur kommunizieren. Forschende der University of California in Berkeley haben gezeigt, dass moderne Sprachmodelle Sprache auch auf einer abstrakten, metalinguistischen Ebene analysieren können. Besonders deutlich wird das beim neuen Modell „o1“ von OpenAI, das sich im direkten Vergleich mit anderen Systemen als besonders leistungsstark erwiesen hat.
Wenn KI über Sprache spricht
Laut Studienleiter Gašper Beguš gewinnen Large Language Models zunehmend die Fähigkeit, nicht nur Sprache zu verwenden, sondern auch darüber nachzudenken. Dieses sogenannte metalinguistische Denken umfasst das Erkennen sprachlicher Strukturen, das Analysieren grammatischer Eigenschaften und das bewusste Reflektieren über Form und Aufbau von Sätzen.
In der Untersuchung wurden insgesamt 120 komplexe Sätze in verschiedene KI-Modelle eingespeist. Die Systeme sollten jeden Satz auf eine bestimmte linguistische Eigenschaft hin analysieren und gleichzeitig einen Syntaxbaum erstellen, der die grammatische Struktur des Satzes visualisiert.
„o1“ erkennt doppelte Bedeutung
Besonders aufschlussreich war der Satz „Eliza wanted her cast out“. Hier ergibt sich eine Doppeldeutigkeit: Meinte Eliza, dass jemand ausgeschlossen werden sollte, oder dass ein Gipsverband entfernt werden muss? Die Modelle ChatGPT 3.5, GPT-4 und Llama 3.1 konnten diese Mehrdeutigkeit nicht erkennen. Das Modell „o1“ hingegen hat sie korrekt identifiziert und zusätzlich ein passendes Strukturdiagramm erstellt.
Diese Fähigkeit deutet auf ein tieferes Verständnis der Sprache hin, das über bloße Satzvervollständigung hinausgeht.
Rekursion: Ein Sprachprinzip wird gemeistert
Ein weiterer Fokus der Studie lag auf der Erkennung rekursiver Strukturen, also der Verschachtelung sprachlicher Einheiten, wie sie in menschlicher Sprache sehr häufig vorkommen. Die getesteten Systeme sollten nicht nur feststellen, ob ein Satz rekursiv ist, sondern auch eine vergleichbare rekursive Form selbst erzeugen.
Auch hier zeigte „o1“ eine klare Stärke. Beim Satz „Unidentified flying objects may have conflicting characteristics“ erweiterte es die Struktur sinnvoll zu „Unidentified recently sighted flying objects may have conflicting characteristics“. Damit gelang dem Modell eine sprachlich korrekte und inhaltlich passende Variation.
Künstliche Intelligenz mit Sprachbewusstsein
Die Ergebnisse der Studie liefern Hinweise darauf, dass maschinelles Sprachverständnis mittlerweile deutlich tiefer greift als bisher angenommen. „o1“ zeigte nicht nur technische Fähigkeiten, sondern auch ein bemerkenswertes Maß an Reflexion über Sprache selbst.
Damit stellt das Modell eine bisherige Annahme der Sprachwissenschaft infrage: dass nur Menschen die Fähigkeit besitzen, Sprache bewusst zu analysieren. In Zukunft könnten solche KI-Systeme nicht nur Texte generieren, sondern auch helfen, Sprache selbst besser zu verstehen – etwa in der Linguistik, Sprachtherapie oder Bildung.
(vp/pressetext.redaktion)