Anzeige

Sprachsteuerung

Sprachdialogsysteme wie Alexa und Siri sind inzwischen große Hilfen zum Beispiel bei der Musik- und Filmauswahl, der Internetrecherche oder der Steuerung von „Smart Homes“. Die Daten allerdings, also die Sprachbefehle und Dialoge der Nutzer, werden auf Servern dieser Firmen langfristig gespeichert, was vielen Benutzern Unbehagen bereitet.

Saarbrücker Sprachtechnologen möchten nun im Verbund mit französischen, spanischen, deutschen und lettischen Kollegen ein Sprachdialogsystem entwickeln, das sowohl von der Qualität her an die großen Marktführer heranreicht, aber die Daten auch so verarbeitet, dass die Privatsphäre des Nutzers immer gewahrt bleibt. Das COMPRISE-Projekt (Cost-effective, Multilingual, Privacy-driven voice-enabled Services) wird im Rahmen des Horizon-2020-Programms der Europäischen Union mit 3,2 Millionen Euro über drei Jahre gefördert. 600.000 davon fließen an die Universität des Saarlandes.

Sie erleichtern unseren Alltag, hinterlassen aber gleichzeitig bei vielen Nutzern ein mulmiges Gefühl: Sprachdialogsysteme wie Apples Siri oder Amazons Alexa. Inzwischen sind die Kinderkrankheiten beseitigt, und die Systeme funktionieren erstaunlich gut im Alltag. Allerdings landen die Daten der Nutzer, also auch ihre Sprachbefehle und Anfragen, auf Servern der Anbieter. Was damit geschieht, ist nicht klar. Diese Unsicherheit ist häufiger Kritikpunkt beim Umgang mit den praktischen Helfern.

„Maschinelles Lernen braucht allerdings eine riesige Datenmenge, um gut zu funktionieren. Je mehr Daten, desto besser wird das System“, gibt Thomas Kleinbauer zu bedenken. Der Wissenschaftler forscht am Lehrstuhl für Sprach- und Signalverarbeitung bei Professor Dietrich Klakow, der mit seinem Team einen sprachtechnologischen Teil des COMPRISE-Projekts übernimmt. Es ist per se also nicht verwunderlich, dass die großen IT-Unternehmen aus den USA so viele Daten sammeln, wie sie können. Aus technischer Sicht ist es vielmehr sinnvoll, alle diese Daten zu speichern und zu verarbeiten.

„Aber wir wissen natürlich nicht, was in letzter Konsequenz mit den Daten geschieht“, sagt Thomas Kleinbauer. Unter den gespeicherten Daten könnten sich ja auch kritische Dinge befinden, nicht nur Musiktitel oder die Suche nach der neuen Jeans: „Will man beispielsweise die Kreditkartennummer oder seine Patientendaten, die ein Arzt per Sprachassistent in sein Computersystem eingegeben hat, dort gespeichert haben?“

Die Saarbrücker Sprachtechnologen suchen im COMPRISE-Projekt also nach Wegen, ein Sprachdialogsystem zu entwickeln, das zum einen hohe Datenschutzauflagen erfüllt und zum anderen auch die sehr gute Nutzwertigkeit der großen kommerziellen Systeme aufweist. Die Forscher haben dabei viele Punkte im Blick: „Kritische Informationen könnten beispielsweise ausgeblendet oder geändert werden, eine Stimme kann verfremdet werden, bevor sie auf einem Server gespeichert wird“, nennt Professor Klakow einige Beispiele. Das Maschinelle Lernen würde mit solchen anonymisierten Daten aber ebenso funktionieren. „Die Daten an sich blieben nutzbar“, erklärt Klakow. „Gleichzeitig aber wären weniger private Daten auf Servern gespeichert, die außerhalb der Reichweite der Nutzer stehen.“

Am Ende der dreijährigen Forschung wollen die Wissenschaftler mehrere Demonstratoren, zum Beispiel für die Bereiche E-Commerce und E-Health, entwickelt haben, welche die Technologie im kleinen Maßstab vorführen kann.

Federführend im COMPRISE-Projekt:

(Cost-effective, Multilingual, Privacy-driven voice-enabled Services) ist das nationale französische Institut für Informatik und angewandte Mathematik INRIA (www.inria.fr). Neben der Universität des Saarlandes sind außerdem folgende Partner an COMPRISE beteiligt: Netfective Technology SA (Frankreich, www.bluage.com), Ascora GmbH (Deutschland, https://ascora.net), TILDE SIA (Lettland, www.tilde.com), Rooter Analysis SL (Spanien, www.rooter.es).

Weitere Informationen auf der Projektwebseite https://project.inria.fr/comprise/.
 


Newsletter Anmeldung

Smarte News aus der IT-Welt

Sie möchten wöchentlich über die aktuellen Fachartikel auf it-daily.net informiert werden? Dann abonnieren Sie jetzt den Newsletter!

Newsletter eBook

Exklusiv für Sie

Als Newsletter-Abonnent erhalten Sie das Booklet „Social Engineering: High Noon“ mit zahlreichen Illustrationen exklusiv und kostenlos als PDF!

 

Weitere Artikel

Datenaustausch

Datenschutz und Compliance - Datenaustausch aus dem Homeoffice

Die netfiles GmbH, ein Anbieter von virtuellen Datenräumen in Deutschland, hat die Ergebnisse ihrer aktuellen Trendstudie mit dem Titel „Datenschutz und Compliance beim Datenaustausch aus dem Homeoffice – Herausforderungen für die IT in der Corona-Krise“…
Datenbank Sicherheit

Die Sicherheit von Daten beginnt in der Datenbank

Die Datenbank ist das Herzstück eines Security-Konzepts. Der Datenbank-Pionier Couchbase nennt die vier wichtigsten Sicherheitskriterien, die sie zum Schutz sensibler Daten erfüllen muss.

Anzeige

Newsletter Anmeldung

Smarte News aus der IT-Welt

Sie möchten wöchentlich über die aktuellen Fachartikel auf it-daily.net informiert werden? Dann abonnieren Sie jetzt den Newsletter!

Newsletter eBook

Exklusiv für Sie

Als Newsletter-Abonnent erhalten Sie das Booklet „Social Engineering: High Noon“ mit zahlreichen Illustrationen exklusiv und kostenlos als PDF!