ChatGPT kapituliert bei Stack-Overflow-Fragen

14. August, 2023
10:11

Bildquelle: Boumen Japet / Shutterstock.com

Der generative KI-Chatbot ChatGPT von OpenAI ist laut Forschern der Purdue University nur bedingt als Antwortgeber für Programmierfragen geeignet. Bei der Erstellung von Code-Fragmenten für Software-Vorhaben lieferte das Tool in Tests nur bedingt hilfreiche Ergebnisse – insbesondere bei Stack Overflow.

Ernüchternde Testergebnisse

Die Ergebnisse der Testreihe sind ernüchterd, denn der Chatbot hat mit 48 Prozent noch nicht einmal die Hälfte der gestellten Fragen korrekt beantwortet. Zudem fielen 78 Prozent der Antworten im Vergleich zu menschlichen Antworten auf verschiedenen Ebenen inkonsistent aus – dennoch formaler, analytischer und in weniger negativer Tonalität.

Bedingt dadurch konnten 39 Prozent der Fragestellenden dadurch überzeugt werden. Allerdingt gibt es nur bei 22 Prozent Übereinstimmungen zu den von Menschen gegebenen Antworten. Einen Pluspunkt kassiert ChatGPT allerdings in Sachen Verständlichkeit, wie es heißt. Der Bot sei zu 65 Prozent verständlich und die Antworten gut lesbar. Ein Problem bleibt nach wie vor die Fülle an gelieferten irrelevanten Infos.

www.pressetext.com

ChatGPT Generative KI

ChatGPT kapituliert bei Stack-Overflow-Fragen

Ernüchternde Testergebnisse

Weitere Artikel

Meistgelesene Artikel

Fehler eingeräumt: Mark Zuckerberg bedauert Meta-Umbau

Facebook und Instagram down: Globale Störung bei Meta

Google Gemini down: KI seit Stunden nicht erreichbar

Apple WWDC 2026: Das sind die wichtigsten Neuheiten

KI-Agenten: Architektur schlägt Modell

IT Verlag

Wichtige Links

Kontakt