KI-System lernt durch Bestrafung und Belohnung

3. April, 2017
17:05

Forscher des chinesischen Suchmaschinenriesen Baidu nutzen Modelle der Belohnungen und Bestrafungen, um KI-Systeme zu trainieren. Jedes Mal, wenn eine Künstliche Intelligenz (KI) im virtuellen 2D-Labyrinth an einer Wand anstieß, wurde das System bestraft. Konnte ein Objekt hingegen erfolgreich lokalisiert werden, folgte eine Belohnung.

Der virtuelle Agent hat nicht nur mit einem Begriff verknüpfte Gegenstände erkannt, sondern entwickelte auch ein grundlegendes Verständnis für Grammatik.

Wissen wird kombiniert

“Bei diesem Ansatz handelt es sich um ein behavioristisches Lernmodell, wie es in den 1950er-Jahren noch üblich war. Vor allem im menschlichen Kontext könnte man daher anmerken, dass diese Vorgehensweise etwas überholt erscheint”, erläutert Peter Purgathofer vom Institut für Gestaltungs- und Wirkungsforschung der TU Wien gegenüber pressetext.

Den Forschern zufolge ist die Durchführung einer neuen Aufgabe für Menschen leicht, während KI-Systeme noch Probleme damit haben. Obwohl diese beispielsweise wissen, wie eine Drachenfrucht aussieht, können sie den Befehl “Schneide die Drachenfrucht mit einem Messer!” erst ausführen, wenn sie mit einem Datensatz trainiert worden sind, der exakt diese Anweisung enthält. Im Gegensatz dazu hat der virtuelle Agent in den Versuchen demonstriert, dass er das Wissen um die Erscheinung einer Drachenfrucht sowie die Aufgabe “Schneide X mit einem Messer!” erfolgreich miteinander verbunden hat, ohne explizit mit diesem Befehl trainiert worden zu sein.

3D-Umgebung geplant

Die Forschungsergebnisse zeigen, dass Algorithmen Sprache und Navigation zeitgleich lernen und dieses Wissen in ähnlicher Weise wie Menschen anwenden können. Die Wissenschaftler hoffen, dass sie ihre Studie schon bald auf eine 3D-Umgebung übertragen können. Obwohl es sich hierbei um einen simplen Forschungsansatz handelt, stellt er unter Beweis, dass KI-Systeme ihr Wissen ähnlich wie Menschen für verschiedene Tätigkeiten einsetzen können, ohne im Vorfeld mit der spezifischen Aufgabenstellung konfrontiert worden zu sein.

www.pressetext.com

Künstliche Intelligenz

KI-System lernt durch Bestrafung und Belohnung

Wissen wird kombiniert

3D-Umgebung geplant

Weitere Artikel

Meistgelesene Artikel

Shopify mit großen Login-Problemen am Cyber Monday

Shai-Hulud 2.0: Wie sich ein Supply-Chain-Wurm weiterentwickelt

Web.de und GMX: Login-Störungen betreffen Tausende Nutzer

Cloudflare-Ausfall: Das war der Grund für die Riesen-Störung

iPhone Pocket: Apple verkauft Smartphone-Socke für 230 US-Dollar

IT Verlag

Wichtige Links

Kontakt