KI-Avatare ermöglichen heute lebensechte virtuelle Kopien realer Personen, die rund um die Uhr in Service, Support und Beratung unterstützen. Was früher aufwendig war, gelingt inzwischen mit geringem Aufwand.
Es kann in vielen Fällen von Vorteil sein, ein echtes KI-Double einer Person zu erstellen. Menschen reagieren auf solche KI-Avatare durchweg positiv: Der Zugang ist niederschwellig, weil man sie einfach ansprechen kann. Die Avatare können im Service, bei Schulungen oder auch in Empfangsräumen unterstützen und für Orientierung sorgen. Die Erstellung eines KI-Doubles ist heutzutage kein Hexenwerk mehr und zudem kostengünstig möglich.
Wer zum ersten Mal mit einer KI direkt gesprochen hat (also ohne Texte per Tastatur einzugeben), wird sich daran erinnern: Das blanke Erstaunen im Gesicht des Gesprächspartners, weil die KI-Stimme so natürlich agiert. Diese natürliche Art der Kommunikation baut sofort Vertrauen auf. Und das, obwohl noch wesentliche Teile eines menschlichen Zwiegesprächs gefehlt haben: Gestik, Mimik und das vertraute Bild und die Stimme einer bekannten Person.
Diese Komplettierung zu einem lebensechten KI-Double in Ton und Bild, ist aber jetzt möglich. Das ist insbesondere im Business-Umfeld ein enormer Mehrwert, weil die Hürde sehr niedrig ist, direkt in die Kommunikation mit der KI einzusteigen. Gerade bei den Themen Service, Support oder Beratung kann das zu enormen Effizienzsteigerungen führen und die Kundenzufriedenheit deutlich erhöhen.
Geringer Erstellungsaufwand
Um ein KI-Double zu erstellen, wird in einem ersten Schritt eine reale Person in ein professionelles Videostudio eingeladen, um die visuelle Erscheinung, die Stimme sowie Gestik und Mimik zu erfassen. Diese Sitzung dauert in der Regel nur 20 bis 30 Minuten. Ein zuvor ausgearbeitetes Drehbuch stellt sicher, dass die zu erfassende Person in einem Interview viele verschiedene Gesichtsausdrücke und Posen einnimmt.
Diese Daten werden anschließend zu einem Avatar verarbeitet, der sich in Gesprächen wie die echte Person präsentieren kann. Ausgeklügelte KI-Algorithmen sorgen dafür, dass die Bewegungen von Gesicht und Extremitäten exakt zum gesprochenen Inhalt passen. Sollte ein Unternehmen keine reale Person zur Verfügung stellen wollen, bietet der Anbieter auch generische, bereits vortrainierte Avatare an.
KI-Training: Mit Dokumenten und Videos Wissen aufbauen
Neben der audiovisuellen Erscheinung gilt es im zweiten Schritt, die zugrunde liegende KI mit Informationen zu versorgen, damit das KI-Double Wissen weitergeben und auf Fragen antworten kann. Dieses Wissen basiert nicht auf allgemeinen Daten, auf die große Sprachmodelle wie ChatGPT oder Le Chat zugreifen. Stattdessen basiert der Avatar auf einem Trusted Language Model (TLM), das nur auf vorab definierte und verifizierte Wissensinhalte zugreift und auch nur darauf basierende Inhalte reproduziert.
Das verhindert einerseits, dass das KI-Double halluziniert oder Informationen erfindet. Andererseits sind die Auskünfte verlässlich und klar auf den definierten Wissensbereich beschränkt. Dadurch kann die KI ohne menschliche Aufsicht im Kundenkontakt eingesetzt werden. Ihm fehlt auch die typische „kreative Varianz“ klassischer LLMs, bei denen identische Fragen zu unterschiedlichen Antworten führen können. Der TLM-Avatar liefert immer gleiche Antworten auf gleiche Fragen und ist damit problemlos im Kundensupport nutzbar.
Angelernt werden kann das KI-Double über Textdokumente, Tabellen, Präsentation, Webseiten, Videos, Tonaufnahmen und Bilder. Diese Informationen fließen in eine analytische Aufbereitung ein, aus denen anschließend das ausführbare TLM entsteht. Es besteht aber auch die Möglichkeit, dass Wissen nutzbar zu machen, dass bisher nur im Kopf eines menschlichen Experten schlummert.
Hierfür kann ebenfalls KI eingesetzt werden, die Fachspezialisten gezielt befragt und so deren Wissen systematisch erfasst. In einem realen Anwendungsfall galt es beispielsweise, das Know-how um Prozesse, Abläufe und Abhängigkeiten einer IT-Infrastruktur vor einer IT-Migration auf eine neue Plattform zu „externalisieren“. Dazu wurden diverse Fragen ausgearbeitet und ein Avatar hat den IT-Spezialisten intensiv befragt, um die Antworten aufzunehmen. Diese Gespräche dauerten jeweils über eine Stunde und ermöglichten die Dokumentation des impliziten Wissens. Die gewonnenen Informationen flossen anschließend in die Trainingsdaten ein, um daraus einen digitalen KI-Zwilling zu erstellen.
Aus Gesprächen lernen und das Wissen nachtrainieren
Außerdem kann die KI Gespräche auch protokollieren und anschließend auswerten, um daraus Erkenntnisse für weiteres Training abzuleiten. So lässt sich beispielsweise analog zu Google Analytics ermitteln, was am häufigsten gefragt wurde und wo das KI-Double keine Antwort anbieten konnte.
Ein erneutes Training ist jederzeit möglich, erfolgt aber nicht kontinuierlich oder on-the-fly. Unternehmen können das neu zu trainierende Wissen im Vorfeld sichten und gezielt freigeben, um nur die Informationen aufzunehmen, die das KI-Double lernen soll. Diese explizite Freigabe erlaubt eine maximale Kontrolle über die Informationen, die das KI-Double weitergeben darf und kann.
Damit haben Unternehmensverantwortliche auch die Hoheit über die Qualität der Antworten, die der virtuelle Mitarbeiter gibt ‒ denn die steht und fällt mit der Qualität der Ausgangsdaten in Form von Dokumenten, Videos und Interviews.
Viele Sprachen, hohe Skalierbarkeit
Ein besonderer Vorteil eines virtuellen KI-Avatars ist die einfache Skalierbarkeit. Einmal erstellt, kann der virtuelle Mitarbeiter von beliebig vielen Nutzern gleichzeitig in Anspruch genommen werden. Niemand muss warten, bis die KI Zeit hat oder vorher einen Termin vereinbaren. Auch Urlaub und Krankheit führen nicht zu zeitlichen Engpässen.
Zusätzlich beherrschen manche Avatare eine Vielzahl an gängigen Sprachen und können diese problemlos wechseln. Damit können Mitmenschen, die Probleme haben, sich im Deutschen hinreichend präzise auszudrücken, einfach in ihrer Muttersprache kommunizieren. Das ist ein unschätzbarer Vorteil, wenn ein virtueller Mitarbeiter etwa im Servicedesk-Bereich zum Einsatz kommt, wo es auf eine genaue Fehlerbeschreibung und präzise Hilfe ankommt.
Einbindung über die Cloud
Im Falle von go AVA werden die Avatare über ein Webinterface zur Verfügung gestellt, dass sich über eine Webadresse einfach aufrufen lässt oder per iframe-Kommando in bestehende Webseiten und -Anwendungen einbinden lässt. Die dafür nötige Infrastruktur mit leistungsfähiger Grafikkarten-Hardware stellt der Anbieter in einer Private-Cloud-Umgebung zur Verfügung. Die Abrechnung erfolgt gestaffelt über die Anzahl der Aufrufe/Dialoge, die mit der KI geführt werden.
Der Einsatz lohnt sich schnell, wenn man bedenkt, dass das virtuelle KI-Double nie krank ist und nur dann Kosten verursacht, wenn auch tatsächlich Kommunikation stattfindet. Die initialen Setup-Kosten bewegen sich in einem Rahmen, der mit einem klassischen Onboarding-Prozess für einen menschlichen Mitarbeiter vergleichbar ist.
Jan Schellenberger, Mitgründer und CEO von go AVA.