DFKI-Forscher warnen vor X-Hacking in erklärbarer KI

von | Juli 25, 2025 | Digitalisierung, Forschung

Forschende des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) haben auf der International Conference on Machine Learning (ICML) 2025 ein neues Risiko im Bereich der erklärbaren Künstlichen Intelligenz (XAI) vorgestellt: „X-Hacking“. Die Studie des Teams um Prof. Sebastian Vollmer aus dem Forschungsbereich Data Science and its Applications zeigt, wie automatisierte Modellwahl durch AutoML-Tools die Vertrauenswürdigkeit von KI gefährden kann.

X-Hacking beschreibt zwei Mechanismen: Cherry-Picking, bei dem gezielt Modelle mit gewünschten Erklärungen ausgewählt werden, und gerichtete Suche, bei der AutoML-Systeme Modelle mit spezifischen Erklärungsmustern bevorzugen. Besonders problematisch ist, dass unterschiedliche Modelle trotz ähnlicher Vorhersageleistung widersprüchliche Erklärungen liefern können. Dies birgt Risiken in sensiblen Bereichen wie Medizin oder Sozialwissenschaften, wo erklärbare Modelle Entscheidungsgrundlagen bilden.

Auf der ICML 2025: Neue Studie zu „X-Hacking“ zeigt Risiken automatisierter Modellwahl | Quelle: DFKI | Copyright: DFKI
Auf der ICML 2025: Neue Studie zu „X-Hacking“ zeigt Risiken automatisierter Modellwahl | Quelle: DFKI | Copyright: DFKI

AutoML-Tools, die Modellentwicklung und -optimierung automatisieren, senken zwar Einstiegshürden, erschweren jedoch die Nachvollziehbarkeit von Entscheidungen. Das DFKI-Team empfiehlt Transparenzmaßnahmen wie Explanation Histograms, vollständige Dokumentation des Modellsuchraums und interdisziplinäre Ausbildung, um methodische Sorgfalt zu gewährleisten.

Die Studie unterstreicht den Fokus des DFKI auf „Trustworthy AI“ und plädiert für eine Wissenschaftskultur, die nicht nur Genauigkeit, sondern auch Ehrlichkeit in der Erklärbarkeit priorisiert.

Original Paper:

X-Hacking: The Threat of Misguided AutoML | OpenReview


Redaktion: X-Press Journalistenbüro GbR

Gender-Hinweis. Die in diesem Text verwendeten Personenbezeichnungen beziehen sich immer gleichermaßen auf weibliche, männliche und diverse Personen. Auf eine Doppel/Dreifachnennung und gegenderte Bezeichnungen wird zugunsten einer besseren Lesbarkeit verzichtet.