Transparenz bei KI-Antwort gefordert

Bei identischer Antwort mehr Vertrauen in KI als in Menschen

Ki-Dating

Eine Studie zeigt, dass Menschen Antworten von KI-Systemen automatisch als sicherer einstufen als menschliche Aussagen. Und zwar selbst bei identischem Inhalt.

Die Interaktion zwischen Menschen und Systemen der künstlichen Intelligenz prägt zunehmend den digitalen Alltag. Plattformen wie ChatGPT oder Gemini werden weltweit genutzt, um Informationen zu beschaffen oder Entscheidungen vorzubereiten. Eine neue wissenschaftliche Untersuchung der Universität von Waterloo und des University College London zeigt nun, dass Nutzer die Sicherheit und Verlässlichkeit dieser Systeme systematisch fehleinschätzen. Die in der Fachzeitschrift Communications Psychology veröffentlichte Studie belegt, dass Menschen Antworten, die von einer KI generiert wurden, eine höhere inhärente Gewissheit zuschreiben als identischen Antworten von menschlichen Akteuren. Diese unbewusste Verzerrung birgt Risiken für die objektive Bewertung von KI-Ratschlägen.

Anzeige

KI soll Produkte empfehlen

Das Forschungsteam um die Erstautorin Clara Colombatto untersuchte die psychologischen Mechanismen, mit denen Menschen das Selbstvertrauen oder die Gewissheit eines Gegenübers einschätzen. In der menschlichen Kommunikation ist diese Einschätzung ein zentraler Faktor für den Aufbau von Vertrauen. Clara Colombatto erklärte den Hintergrund der Untersuchung: „Da KI-Systeme immer ausgefeilter werden, verlassen sich Menschen zunehmend auf sie, wenn es um Ratschläge geht, beispielsweise darüber, welche Produkte sie kaufen oder welche Inhalte sie konsumieren sollten.“

Während Menschen in ihrer Sprache, Mimik oder Stimmlage oft direkt oder indirekt vermitteln, wie sicher sie sich einer Aussage sind, fehlt diese Dimension bei den meisten aktuellen großen Sprachmodellen. Diese sind primär darauf programmiert, eine definitive Antwort auf eine Frage zu generieren, ohne deren statistische Wahrscheinlichkeit oder Unsicherheit explizit zu benennen. Um die Auswirkungen dieses Mangels an Metainformationen zu erforschen, entwickelten die Wissenschaftler ein experimentelles Design. Colombatto führte dazu aus: „Wir wollten verstehen, ob Menschen natürlicherweise auf das Vertrauen sowohl von menschlichen als auch von KI-Systemen schließen, selbst wenn dies nicht direkt kommuniziert wird, und welche Faktoren diese Einschätzungen beeinflussen.“

Schnelligkeit erzeugt Vertrauen

Im Rahmen der durchgeführten Experimente beobachteten die Studienteilnehmer entweder menschliche Akteure oder KI-Systeme bei der Entscheidungsfindung. Anschließend mussten die Probanden bewerten, wie sicher sich der jeweilige Agent ihrer Einschätzung nach bei seiner Wahl war. Die Auswertung der gesammelten Daten zeigte, dass Versuchspersonen feste Heuristiken anwenden, um auf die Gewissheit eines Systems zu schließen. Ein wesentlicher Indikator für die Teilnehmer war die Reaktionsgeschwindigkeit. Erfolgte eine Antwort schnell oder wirkte die zugrundeliegende Aufgabe einfach, stuften die Probanden den antwortenden Agenten als hochgradig sicher ein.

Anzeige

Diese unbewusste Zuschreibung birgt insbesondere bei der Nutzung von Computernetzwerken eine Fehlerquelle. Da algorithmische Systeme datenbasierte Antworten unabhängig von deren sachlicher Richtigkeit in der Regel innerhalb von Millisekunden ausgeben, interpretieren menschliche Nutzer diese Schnelligkeit fälschlicherweise als Zeichen maximaler innerer Gewissheit und Korrektheit des Systems.

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

Menschen sehen Technologie in logischen Aufgaben überlegen

Die empirischen Ergebnisse der Studie offenbarten eine weitere psychologische Verzerrung, die das Team als Illusion von Konfidenz beschreibt. Die Probanden neigten dazu, Systemen, die sie generell für kompetent hielten, auch in spezifischen Einzelfällen eine hohe Sicherheit zu unterstellen, selbst wenn diese Annahme sachlich unbegründet war. Clara Colombatto betonte in diesem Kontext: „Wichtig ist, dass wir auch herausgefunden haben, dass die Menschen Agenten, von denen sie glaubten, sie seien genauer oder fähiger, ein größeres Vertrauen zusprachen, selbst wenn dieser Glaube eigentlich nicht gerechtfertigt war.“

Diese Verzerrung wirkt sich direkt auf das Nutzungsverhalten bei KI-Anwendungen aus. Viele Anwender gehen mit der vorgefassten Meinung an die Technologie heran, dass Computerprogramme in mathematischen, logischen oder datenintensiven Aufgaben dem Menschen grundsätzlich überlegen sind. Aus dieser allgemeinen Annahme leiten sie fälschlicherweise ab, dass jede spezifische Antwort des Systems auf einer gesicherten Datenbasis beruht.

Die Forscherin warnte vor den Konsequenzen dieser Fehleinschätzung: „Entscheidend ist, dass diese Hinweise irreführend sein können: Wenn Menschen glauben, dass ein KI-System sehr fähig ist, nehmen sie unter Umständen auch an, dass es sehr selbstbewusst ist, selbst wenn das System in dieser spezifischen Situation eigentlich nicht zuverlässig ist.“ Das menschliche Urteil folgt somit eher vorgefassten Überzeugungen über die Technologie als deren tatsächlicher Leistungsfähigkeit in der konkreten Situation.

Gewissheit einer Antwort soll transparent sein

Die Resultate der psychologischen Experimente haben direkte Auswirkungen auf die zukünftige Gestaltung von Mensch-Maschine-Schnittstellen. In der menschlichen Gesellschaft erfüllt die feine Abstufung von ausgedrückter Sicherheit oder Skepsis eine regulierende Funktion. Colombatto erläuterte dies wie folgt: „In zwischenmenschlichen Interaktionen dient Vertrauen als wichtiges soziales Signal, das uns bei der Entscheidung hilft, wann wir einem Rat vertrauen und wann wir ihn vorsichtiger behandeln sollten.“ Wenn ein KI-System diese Differenzierung nicht von sich aus vornimmt, füllt der menschliche Verstand diese Lücke selbstständig aus. Und zwar oft zum eigenen Nachteil, indem er fehlerhaften oder unsicheren Empfehlungen blind vertraut.

Das Forschungsteam plädiert daher dafür, dass Entwickler von großen Sprachmodellen Mechanismen integrieren, die den Grad der statistischen Gewissheit einer Antwort transparent machen. Dies könnte entweder direkt durch die Angabe von Wahrscheinlichkeiten oder indirekt durch visuelle und strukturelle Anpassungen geschehen. Das Team um Colombatto und Stephen M. Fleming plant bereits Folgestudien, um effektive Strategien für diese Form der Kommunikation zu testen. Da rein textbasierten Systemen die menschlichen Ausdrucksmittel fehlen, müssen neue Wege gefunden werden.

„Zu verstehen, welche Arten von Konfidenzsignalen bei Interaktionen zwischen KI und Mensch am hilfreichsten, transparentesten und vertrauenswürdigsten sind, wird daher eine wichtige Richtung für die zukünftige Forschung sein.“

Clara Colombatto, Forscherin

Autorenbild Lisa Löw

Lisa

Löw

Junior Online-Redakteurin

IT-Verlag

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.