Anzeige

Roboter

Ein Training nur durch positive Bestärkung, wie bei Hunden üblich, ist auch für Roboter gut geeignet. Das zeigen Forscher der Johns Hopkins University (JHU). Mit einem Algorithmus, der den Roboter "Spot" ausschließlich für richtiges Verhalten belohnte, hat dieser laut dem in "IEEE Robotics and Automation Letters" erschienen Paper "Good Robot" wesentlich schneller gelernt, Bauklötze zu stapeln als mit bisherigen Methoden.

Das macht den Ansatz für praktische Anwendungen von Robotern interessant, bei denen diese möglichst zügig lernen sollen, komplexe Aufgaben korrekt auszuführen.

Versuch und Irrtum

"Die Frage war, wie wir Roboter dazu bekommen, sich eine Fertigkeit anzueignen", sagt Robotik-Doktorand Andrew Hundt. Maschinen lernen durch Versuch und Irrtum, doch sie sollten das möglichst effizient tun. Für den neuen Algorithmus hat sich Hundt von seiner Erfahrung mit dem Hundetraining inspirieren lassen: Ein guter Hund bekommt Leckerli für richtiges Verhalten. Zudem konnte der Robotiker seiner Hündin Leah beibringen, Eichhörnchen zu ignorieren, indem sie nur dann eine wirklich tolle Belohnung in Form von Käse bekam, wenn sie ein normales Leckerli ignorierte.

Analog dazu bekommt bei dem Algorithmus ein guter Roboter eine tolle Belohnung in Form vieler Punkte, wenn er Bauklötze richtig stapelt, aber nichts, wenn er Fehler macht, wie Stapel umwerfen oder ins Leere greifen. "Der Roboter will höher punkten. Er lernt schnell das richtige Verhalten, um die beste Belohnung zu bekommen", so Hundt. Den Ansatz haben die Forscher zunächst an einem simulierten Roboter getestet, dann mit dem echten Spot. Der hat es so schnell geschafft, Klötze immer erfolgreich zu stapeln. "Es hat bisher einen Monat gedauert, bis der Roboter 100 Prozent Genauigkeit erreicht. Wir haben es in zwei Tagen geschafft."

Lernen für echte Welt

Mit dem Lernen durch positive Bestätigung konnte Spot auch einige andere Fähigkeiten schnell lernen, darunter auch, ein simuliertes Navigationsspiel zu spielen. Das zeigt, dass der Ansatz breiter funktioniert. Es scheint also vorstellbar, Roboter damit schnell und effizient für komplexe Aufgaben in der realen Welt zu trainieren. Den Forschern schwebt beispielsweise vor, dass Haushaltsroboter auf diese Art lernen können, Wäsche zu waschen oder Geschirr zu spülen - also Aufgaben zu übernehmen, die auf dem Massenmarkt gefragt sein dürften, um beispielsweise Senioren ein selbständiges Leben zu erleichtern.

www.pressetext.com


Newsletter Anmeldung

Smarte News aus der IT-Welt

Sie möchten wöchentlich über die aktuellen Fachartikel auf it-daily.net informiert werden? Dann abonnieren Sie jetzt den Newsletter!

Newsletter eBook

Exklusiv für Sie

Als Newsletter-Abonnent erhalten Sie das Booklet „Social Engineering: High Noon“ mit zahlreichen Illustrationen exklusiv und kostenlos als PDF!

 

Weitere Artikel

Glasfaser

Der Glasfaserausbau kommt in Deutschland immer noch kaum voran

Jan Böhmermann hat gerade erst darauf aufmerksam gemacht: Datenautobahnen sind im Land der Autobahnen weitgehend unbekannt. 4,7 Prozent aller stationären Breitbandanschlüsse in Deutschland waren laut Daten der OECD im Juni 2020 mit einem Glasfaserkabel…
Online Shopping

Bayern häufiger auf Shoppingtour im Internet

Die Bayern gehen laut einer aktuellen Studie im Auftrag der Staatsregierung überdurchschnittlich häufig in Internet auf Einkaufstour.
Datenschutz

Neue Version HiScout Datenschutz

HiScout hat die Version 3.1.2 mit vielen Neuerungen im Modul Datenschutz herausgebracht. Alle Anforderungen des Datenschutzes können in einer einzigen Softwareanwendung DSGVO-konform verwaltet werden.
Internetnutzung

Mehr Internetnutzer sehen sich bei Datensicherheit in der Pflicht

Ohne persönliche Daten sind viele Internetdienste nicht nutzbar, in den meisten Fällen muss zumindest eine E-Mail-Adresse angegeben werden. Für die Sicherheit solcher Daten sehen sich Internetnutzer immer stärker verantwortlich.
Intel

Intel-Urteil: Zahlung von rund 2,2 Milliarden Dollar in US-Patentstreit

Der Chipkonzern Intel ist von Geschworenen in Texas zur Zahlung von knapp 2,2 Milliarden Dollar in einem Patentstreit verurteilt worden. In dem Verfahren ging es um zwei Patente für Technologien aus der Halbleiterproduktion, die laut dem Urteil von Dienstag…
Cyber Security

KI-System fälscht Dokumente gegen IP-Klau

Falsche Dokumente, die Feinde in die Irre führen, sind ein klassisches Mittel in der Spionage und Spionageabwehr. Eben darauf setzen Forscher des Dartmouth College mit dem KI-System "WE-FORGE", um im Informationszeitalter den Diebstahl geistigen Eigentums zu…

Anzeige

Newsletter Anmeldung

Smarte News aus der IT-Welt

Sie möchten wöchentlich über die aktuellen Fachartikel auf it-daily.net informiert werden? Dann abonnieren Sie jetzt den Newsletter!

Newsletter eBook

Exklusiv für Sie

Als Newsletter-Abonnent erhalten Sie das Booklet „Social Engineering: High Noon“ mit zahlreichen Illustrationen exklusiv und kostenlos als PDF!