KI-Diagnose in deutschen Kliniken: Zwischen Zulassung und Alltag
Wo KI Ärzte unterstützt — und wo sie noch scheitert
Künstliche Intelligenz erobert den Behandlungsraum — aber nicht wie im Hollywood-Film. Während die KI-Euphorie in Tech-Konzernen die Decke zu sprengen droht, vollzieht sich in deutschen Kliniken ein deutlich nüchterneres, pragmatischeres Szenario. Radiologische KI-Systeme erkennen Tumore in Bildgebungsverfahren mit vergleichbarer Treffsicherheit wie erfahrene Fachärzte. Diagnosealgorithmen unterstützen die Früherkennung von Sepsis. Gleichzeitig versagen diese Systeme dort, wo Datenlage dünn ist, Patientenpopulationen von Trainingsdaten abweichen oder Klinikstrukturen die Integration schlicht nicht erlauben. Ein Bericht über die aktuelle Lage zwischen berechtigter Hoffnung und realistischen Grenzen.
KI-Diagnose in deutschen Kliniken: Stand der klinischen Praxis
KI-gestützte Diagnose ist kein Zukunftsszenario mehr. An der Charité Berlin, am Universitätsklinikum Heidelberg und an der Uniklinik Köln arbeiten Ärzte bereits mit intelligenten Analysesystemen — teils täglich, teils punktuell. Doch der Alltag unterscheidet sich erheblich von den Pressemitteilungen der Hersteller. Die Realität ist eine Geschichte mit verschiedenen Kapiteln: einige Erfolgsgeschichten, einige Desillusionierungen, viel Mittelmaß.
Das Kernproblem liegt nicht allein an der Technologie. Moderne Deep-Learning-Modelle können in spezialisierten Aufgaben — etwa beim Erkennen von Lungenknoten in CT-Bildern — Ergebnisse liefern, die mit denen erfahrener Radiologen vergleichbar sind. Eine vielzitierte Studie im Fachjournal Nature Medicine (McKinney et al., 2020) zeigte, dass KI erkennt Krebs besser als Ärzte — kommt jetzt in alle deutschen Kliniken bei der Brustkrebserkennung in Mammografien geringere Fehlerquoten aufwies als ein Panel aus sechs Radiologen. Das ist beeindruckend — aber auch ein Laborergebnis unter kontrollierten Bedingungen, nicht der rauhe Klinikalltag. Das eigentliche Problem liegt woanders: bei der Integration in bestehende Arbeitsprozesse, bei ungeklärten Haftungsfragen, bei Datenqualität und schlicht darin, dass ein erheblicher Teil der deutschen Kliniken technisch nicht ausreichend ausgestattet ist, um solche Systeme überhaupt sinnvoll zu betreiben.
Der Berufsverband Deutscher Radiologen beklagt strukturelle Unterversorgung bei der Digitalisierung — insbesondere in kleineren Häusern der Grundversorgung. Gleichzeitig werden KI-Systeme von Herstellern nicht selten als Universallösung vermarktet. Ein Universitätsklinikum in Süddeutschland investierte vor rund drei Jahren einen sechsstelligen Betrag in ein KI-System zur Pathologie-Auswertung. Derzeit nutzen es nach internen Angaben weniger als zehn Prozent der zuständigen Fachabteilung regelmäßig. Der Grund ist bezeichnend: Das System wurde installiert, ohne dass Arbeitsabläufe, Schulungskonzepte oder technische Infrastruktur darauf ausgerichtet wurden. Es wurde zur teuren Schublade.
Welche KI-Systeme haben den Weg in den Klinikalltag gefunden?
Radiologie ist das KI-Erfolgsfeld schlechthin in der klinischen Anwendung. Systeme wie Siemens Healthineers' AI-Rad Companion, Philips IntelliSite Pathology Solution oder das europäische Startup Contextflow zeigen reproduzierbare Erfolge bei der Analyse von Röntgenbildern, CT- und MRT-Aufnahmen. Diese Systeme funktionieren vergleichsweise gut, weil die Daten standardisiert vorliegen. DICOM — das internationale Format für medizinische Bilddaten — sorgt für eine Grundlage, auf der Modelle trainiert und validiert werden können. Ein pulmonaler Rundherd in einem CT-Bild weist unabhängig vom Aufnahmeort ähnliche Merkmale auf. Diese Konsistenz fehlt bei vielen anderen medizinischen Datentypen.
IBM Watson for Oncology, einst als Aushängeschild der klinischen KI gehandelt, ist hingegen ein warnendes Beispiel: Nach massiven Berichten über fehlerhafte Therapieempfehlungen — darunter Vorschläge, die Klinikärzte als unsicher oder kontraindiziert einstuften — zog IBM das System schrittweise vom Markt zurück. Eine interne Analyse des MD Anderson Cancer Centers, die 2017 publik wurde, attestierte dem System grundlegende Qualitätsmängel. Dieser Fall illustriert ein grundsätzliches Problem: Systeme, die auf Lehrbuchdaten und synthetischen Fällen trainiert wurden, können in der realen Versorgung dramatisch versagen. Dies zeigt sich auch in anderen Branchen — so wie ChatGPT verändert Arbeitswelt: Eine Zwischenbilanz nach einem Jahr deutlich machte, dass selbst hochgelobte Systeme in der praktischen Anwendung ihre Grenzen haben.
Im Bereich Kardiologie gibt es genuine Fortschritte: KI-Modelle, die aus Standard-EKG-Daten Vorhersagen über Herzinsuffizienz, Vorhofflimmern oder strukturelle Herzveränderungen treffen, sind zunehmend im klinischen Einsatz. Eine Studie der Mayo Clinic (Attia et al., 2019, veröffentlicht in Nature Medicine) zeigte, dass ein KI-Algorithmus aus einem Ruhe-EKG eine asymptomatische linksventrikuläre D