Anzeige

Roboter

Ein Training nur durch positive Bestärkung, wie bei Hunden üblich, ist auch für Roboter gut geeignet. Das zeigen Forscher der Johns Hopkins University (JHU). Mit einem Algorithmus, der den Roboter "Spot" ausschließlich für richtiges Verhalten belohnte, hat dieser laut dem in "IEEE Robotics and Automation Letters" erschienen Paper "Good Robot" wesentlich schneller gelernt, Bauklötze zu stapeln als mit bisherigen Methoden.

Das macht den Ansatz für praktische Anwendungen von Robotern interessant, bei denen diese möglichst zügig lernen sollen, komplexe Aufgaben korrekt auszuführen.

Versuch und Irrtum

"Die Frage war, wie wir Roboter dazu bekommen, sich eine Fertigkeit anzueignen", sagt Robotik-Doktorand Andrew Hundt. Maschinen lernen durch Versuch und Irrtum, doch sie sollten das möglichst effizient tun. Für den neuen Algorithmus hat sich Hundt von seiner Erfahrung mit dem Hundetraining inspirieren lassen: Ein guter Hund bekommt Leckerli für richtiges Verhalten. Zudem konnte der Robotiker seiner Hündin Leah beibringen, Eichhörnchen zu ignorieren, indem sie nur dann eine wirklich tolle Belohnung in Form von Käse bekam, wenn sie ein normales Leckerli ignorierte.

Analog dazu bekommt bei dem Algorithmus ein guter Roboter eine tolle Belohnung in Form vieler Punkte, wenn er Bauklötze richtig stapelt, aber nichts, wenn er Fehler macht, wie Stapel umwerfen oder ins Leere greifen. "Der Roboter will höher punkten. Er lernt schnell das richtige Verhalten, um die beste Belohnung zu bekommen", so Hundt. Den Ansatz haben die Forscher zunächst an einem simulierten Roboter getestet, dann mit dem echten Spot. Der hat es so schnell geschafft, Klötze immer erfolgreich zu stapeln. "Es hat bisher einen Monat gedauert, bis der Roboter 100 Prozent Genauigkeit erreicht. Wir haben es in zwei Tagen geschafft."

Lernen für echte Welt

Mit dem Lernen durch positive Bestätigung konnte Spot auch einige andere Fähigkeiten schnell lernen, darunter auch, ein simuliertes Navigationsspiel zu spielen. Das zeigt, dass der Ansatz breiter funktioniert. Es scheint also vorstellbar, Roboter damit schnell und effizient für komplexe Aufgaben in der realen Welt zu trainieren. Den Forschern schwebt beispielsweise vor, dass Haushaltsroboter auf diese Art lernen können, Wäsche zu waschen oder Geschirr zu spülen - also Aufgaben zu übernehmen, die auf dem Massenmarkt gefragt sein dürften, um beispielsweise Senioren ein selbständiges Leben zu erleichtern.

www.pressetext.com


Weitere Artikel

Zugangsschlüssel

NFT-Kunst für Jedermann – Zugangsschlüssel in Bildern versteckt

Rocco Indovina möchte, dass hochwertige NFT-Kunst für jedermann erreichbar ist. Wer die letzten Buchstaben bzw. Zahlen des Zugangsschlüssels (Private Key) für einen sogenannten Non-Fungible Token in zwei seiner Bildern zuerst findet, bekommt diese Kunst…
Verkaufen

Verkaufen mithilfe von Smartphone-Apps fasziniert

Jeder dritte Brite zwischen 18 bis 24 Jahren überlegt, seinen Job zu kündigen oder seine Ausbildung abzubrechen, um ausschließlich Waren mithilfe von Smartphone-Apps zu verkaufen.
Ranking

Bundesländer-Ranking: Hamburg ist die Hauptstadt der IT-Profis

Hamburg ist das Bundesland mit der größten Dichte an IT-Spezialistinnen und Spezialisten. Im hanseatischen Stadtstaat arbeiten 4,4 Prozent aller sozialversicherungspflichtig Beschäftigten als Informatiker oder in anderen IT-Berufen.
Partnerschaft

valantic und SYSTEMA schließen strategische Partnerschaft

valantic, IT-Beratungs- und Softwarehaus in Europa, partnert mit SYSTEMA, einem eigentümergeführten Systemintegrator, der sich auf Softwarelösungen und Dienstleistungen zur MES-Integration, Fertigungsautomatisierung und Produktionsoptimierung spezialisiert…
Firmenerweiterung

Okta schließt Übernahme von Auth0 ab

Okta, ein unabhängiger Anbieter von Identitätslösungen, gab die erfolgreiche Übernahme von Auth0, einer Identitätsplattform für Anwendungsteams, bekannt.
Dell

Sicherheitslücke in der Treibersoftware von Dell: Was jetzt zu tun ist

Wie kürzlich bekannt wurde, existiert eine eklatante Sicherheitslücke in einem Treiber für Firmware-Updates, der auf Millionen von Endgeräten der Marke Dell installiert ist. Der Hersteller empfiehlt, diesen Treiber komplett zu entfernen.

Anzeige

Jetzt die smarten News aus der IT-Welt abonnieren! 💌

Mit Klick auf den Button "Zum Newsletter anmelden" stimme ich der Datenschutzerklärung zu.