KI schlägt Ärzte im Wissenstest zur akuten Nierenschädigung deutlich

von | Apr. 20, 2026 | Forschung, Gesundheit

Künstliche Intelligenz übertrifft bei standardisierten medizinischen Wissenstests zur akuten Nierenschädigung (AKI) bereits heute das Fachwissen von Ärztinnen und Ärzten. Das zeigt eine Studie der Universität Marburg und des Universitätsklinikums Gießen und Marburg (UKGM). 13 große Sprachmodelle erreichten im Durchschnitt 90 Prozent korrekte Antworten, während 123 Teilnehmende des DGIM-Kongresses 2025 nur 49 Prozent schafften.

Das Team um Dr. Philipp Russ und Prof. Dr. Ivica Grgic ließ beide Gruppen denselben deutschsprachigen Test mit zwei realistischen Patientenfällen und 15 Multiple-Choice-Fragen bearbeiten. Mehrere KI-Modelle beantworteten alle Fragen fehlerfrei und benötigten dafür nur einen Bruchteil der Zeit. Die Probanden waren Medizinstudierende sowie Fachärztinnen und Fachärzte der Inneren Medizin, die am 131. Jahreskongress der Deutschen Gesellschaft für Innere Medizin (DGIM) in Wiesbaden teilnahmen.

Symbolbild. Credits: Pixabay
Symbolbild. Credits: Pixabay

Die Ergebnisse belegen, dass aktuelle Sprachmodelle leitlinienkonformes Fachwissen zu Nierenerkrankungen inzwischen sehr zuverlässig abrufen und anwenden können. Gleichzeitig betonen die Autoren die Grenzen der Technologie. „Menschliches Urteilsvermögen und klinische Erfahrung bleiben entscheidend. Die Letztverantwortung für die Patientenversorgung liegt weiterhin bei den behandelnden Ärztinnen und Ärzten“, erklärte Nephrologe und KI-Experte Prof. Dr. Ivica Grgic.

Studienleiter Dr. Philipp Russ sieht in den Systemen vor allem ein unterstützendes Werkzeug für den klinischen Alltag: „Große Sprachmodelle können medizinisches Faktenwissen sehr schnell bereitstellen. Das ist eine Chance. Gleichzeitig haben sie klare Grenzen: Sie können keine Empathie empfinden und erfassen den Menschen nicht in seiner ganzen Komplexität.“

Die Studie unterstreicht das enorme Potenzial von KI als Wissens- und Entscheidungsunterstützung, warnt aber zugleich vor einer Überschätzung. Eine eigenständige klinische Entscheidungsfindung durch KI sei derzeit weder möglich noch wünschenswert. Die Ergebnisse wurden in der Fachzeitschrift Scientific Reports veröffentlicht.

Original Paper:

Potential of large language models for rapid clinical information support: evidence from acute kidney injury knowledge testing | Scientific Reports

Lesen Sie auch:

VDI-Studie: KI und Robotik treiben tiefgreifende Transformation des deutschen Gesundheitswesens – MedLabPortal


Redaktion: X-Press Journalistenbüro GbR

Gender-Hinweis. Die in diesem Text verwendeten Personenbezeichnungen beziehen sich immer gleichermaßen auf weibliche, männliche und diverse Personen. Auf eine Doppel/Dreifachnennung und gegenderte Bezeichnungen wird zugunsten einer besseren Lesbarkeit verzichtet.

X
Ich bin Invi, wie kann ich dir helfen?