Novum: Maschine schlägt Mensch im Verstehen von Bildmaterial

Alibaba sichert sich den ersten Platz in der jüngsten globalen VQA-Rangliste (Visual Question Answering) und übertrifft damit die Leistung eines Menschen im gleichen Kontext. Es ist das erste Mal, dass eine Maschine Vorteile gegenüber dem Menschen im Verstehen von Bildern für die Beantwortung von Textfragen hat.

Der Algorithmus des Unternehmens erzielt eine Trefferquote von 81,26 Prozent bei der Beantwortung von Fragen zu Bildern, verglichen mit der Leistung des Menschen von 80,83 Prozent (im Teststandardteil).

Anzeige

Der Wettbewerb, der seit 2015 jährlich von der weltweit führenden visuellen Konferenz CVPR organisiert wird, zieht globale Akteure wie Facebook, Microsoft und die Stanford University an. Bei der Bewertung werden ein Bild und eine dazugehörige Frage in natürlicher Sprache präsentiert, auf die Teilnehmer eine präzise Antwort in natürlicher Sprache geben sollen. In diesem Jahr umfasste der Wettbewerb mehr als 250.000 Bilder und 1,1 Millionen Fragen.

Durch den Einsatz der firmeneigenen Technologien – einschließlich verschiedener visueller Darstellungen, multimodaler vortrainierter Sprachmodelle, adaptiver crossmodaler semantischer Fusion und Alignment-Technologie – konnte das Alibaba-Team nicht nur erhebliche Fortschritte bei der Analyse der Bilder und dem Verständnis der Frageintention erzielen, sondern auch bei der Beantwortung der Fragen mit einer angemessenen Argumentation, die sich in einem authentischen Gesprächsstil ausdrückt.

Die VQA-Technologie wurde bereits in großem Umfang im gesamten Ökosystem von Alibaba eingesetzt. So wurde sie beispielsweise in Alibabas Chatbot AlimeShop Assistant implementiert. VQA kann in einer Vielzahl von Bereichen eingesetzt werden, fügt Si Luo hinzu. So kann es beispielsweise bei der Suche nach Produkten auf E-Commerce-Websites, zur Unterstützung der Analyse medizinischer Bilder für die Erstdiagnose von Krankheiten sowie beim intelligenten Fahren eingesetzt werden, da der KI-Assistent grundlegende Analysen von Fotos, die von der Fahrzeugkamera aufgenommen wurden, anbieten kann.

eu.alibabacloud.com

 

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.