KI-Chatbots erhalten schlechtere Symptomangaben als menschliche Ärzte
Menschen schildern ihre Krankheitssymptome einer Künstlichen Intelligenz deutlich weniger detailliert als einem menschlichen Arzt. Das ist das zentrale Ergebnis einer neuen Studie der Julius-Maximilians-Universität Würzburg (JMU) und weiterer Partner. Die eingeschränkte Informationsqualität könnte die Zuverlässigkeit digitaler Ersteinschätzungen und die Patientensicherheit gefährden.
In dem Experiment beschrieben 500 Teilnehmerinnen und Teilnehmer simulierte Symptome bei Kopfschmerzen und Grippe. Sie glaubten, ihre Berichte würden entweder von einem KI-Chatbot oder einem Arzt gelesen. Die Auswertung zeigte, dass die Beschreibungen gegenüber der KI deutlich kürzer und weniger aussagekräftig ausfielen. Während die Texte an menschliches Fachpersonal im Schnitt 255,6 Zeichen umfassten, waren es bei der KI nur 228,7 Zeichen.

Dieser Qualitätsverlust tritt auch bei Personen auf, die tatsächlich unter den entsprechenden Beschwerden litten. Die Forschenden führen das Phänomen auf psychologische Barrieren zurück. Viele Menschen gehen davon aus, dass eine KI ihre individuelle Situation nicht ausreichend erfassen kann und nur standardisierte Muster abgleicht. Hinzu kommen Skepsis gegenüber der Diagnosefähigkeit von Algorithmen und Datenschutzbedenken.
Die Studie, die in der Fachzeitschrift Nature Health erschienen ist, zeigt damit eine bisher wenig beachtete Schwachstelle bei der zunehmenden Nutzung von KI-Systemen in der medizinischen Ersteinschätzung und Patientensteuerung. Selbst hochleistungsfähige Modelle können nur so gut arbeiten, wie die bereitgestellten Informationen es zulassen.
Die Wissenschaftlerinnen und Wissenschaftler empfehlen daher, die Benutzeroberflächen von KI-Chatbots gezielt zu verbessern. Konkrete Beispiele für gute Symptomberichte und aktives Nachfragen nach fehlenden Details könnten die Qualität der Angaben deutlich steigern. Nur so lasse sich verhindern, dass digitale Systeme falsche oder unzureichende Empfehlungen geben.
Die Ergebnisse sind besonders relevant für die Debatte um digitale Erstberatung und Self-Triage in der Gesundheitsversorgung. Die Autoren betonen, dass technische Weiterentwicklungen allein nicht ausreichen, wenn die menschliche Bereitschaft zur detaillierten Kommunikation mit der Maschine fehlt.
Original Paper:
Reduced Symptom Reporting Quality During Human-Chatbot Versus Human-Physician Interactions, Moritz Reis, Florian Reis, Yeun Joon Kim, Aylin Demir, Jess Lim, Matthias I. Gröschel, Sebastian D. Boie, Wilfried Kunde. Nature Health, DOI: 10.1038/s44360-026-00116-y
Redaktion: X-Press Journalistenbüro GbR
Gender-Hinweis. Die in diesem Text verwendeten Personenbezeichnungen beziehen sich immer gleichermaßen auf weibliche, männliche und diverse Personen. Auf eine Doppel/Dreifachnennung und gegenderte Bezeichnungen wird zugunsten einer besseren Lesbarkeit verzichtet.




