Digital

KI erkennt Krebs besser als Ärzte

Charité-System trifft 97,3 Prozent der Diagnosen. Radiologen kommen auf 91 Prozent.

Von Markus Bauer 11.07.2025, 14:09 Uhr 8 Min. Lesezeit Aktualisiert: 08.05.2026

97,3 Prozent Trefferquote bei der Krebsdiagnose — das ist das Ergebnis, mit dem ein KI-System der Berliner Charité aktuell für Aufsehen in der Medizintechnik sorgt. Erfahrene Radiologen erreichen im Vergleich durchschnittlich 91 Prozent. Die Differenz klingt klein, bedeutet in der Praxis aber: Für je 1.000 untersuchte Patienten übersieht die KI rund 63 Fälle weniger als ein menschlicher Diagnostiker.

Was das KI-System macht — und wie es das tut

Das System, das an der Charité Berlin in Zusammenarbeit mit dem Hasso-Plattner-Institut entwickelt wurde, basiert auf sogenannten Convolutional Neural Networks (CNNs) — einer Klasse künstlicher Intelligenz, die ursprünglich für die Bilderkennung auf Smartphones entwickelt wurde. Ein CNN zerlegt ein medizinisches Bild — etwa ein MRT oder ein CT-Scan — in Millionen von kleinen Bildausschnitten und analysiert Muster, die für das menschliche Auge unsichtbar oder schlicht übersehbar sind.

Trainiert wurde das Modell auf mehr als zwei Millionen anonymisierten Patientenbildern, die über mehrere Jahre an der Charité und an Kooperationskliniken gesammelt wurden. Das System lernt dabei nicht nach festen Regeln, die ein Programmierer eingibt — es erkennt selbstständig, welche Bildmerkmale statistisch häufig mit einer positiven Krebsdiagnose zusammenhängen. Dieses Verfahren nennt sich maschinelles Lernen, genauer: überwachtes Lernen, weil die Trainingsdaten mit menschlich verifizierten Diagnosen beschriftet waren.

Besonders relevant ist der Einsatz bei der Früherkennung von Lungen- und Darmkrebs, wo Tumore im Anfangsstadium auf Bildern oft nur wenige Millimeter groß sind. Genau hier zeigt das System seine größten Stärken: Die falsch-negative Rate — also der Anteil der übersehenen Krebsfälle — liegt laut Charité-Studie bei 2,7 Prozent, gegenüber 9 Prozent bei ausgebildeten Fachärzten. (Quelle: Charité Berlin, Pressemitteilung zur klinischen Studie)

Kerndaten: KI-Trefferquote Krebsdiagnose: 97,3 % | Radiologen-Durchschnitt: 91 % | Trainingsumfang: über 2 Millionen Patientenbilder | Einsatzgebiete aktuell: Lungen-, Darm- und Brustkrebsfrüherkennung | Systemtyp: Convolutional Neural Network (CNN) | Entwicklung: Charité Berlin / Hasso-Plattner-Institut | Status: klinische Erprobungsphase, noch keine EU-weite Zulassung

Der Markt dahinter wächst rasant

Krankenhaus Klinik Flur Aerzte Aerztinnen Patienten Personal Zennews24

Der globale Markt für KI in der Medizin soll laut Gartner bis zum Ende des Jahrzehnts auf über 45 Milliarden US-Dollar anwachsen. Das Analyseinstitut IDC prognostiziert, dass bis dahin mehr als 40 Prozent aller radiologischen Diagnosen in Industrieländern durch KI-Systeme unterstützt werden — in vielen Fällen ohne direkten Eingriff eines Radiologen beim ersten Screening-Schritt. Statista beziffert den aktuellen Wert von KI-gestützten Medizinprodukten auf dem europäischen Markt auf rund 6,7 Milliarden Euro jährlich, mit einem Wachstum von durchschnittlich 24 Prozent pro Jahr.

In Deutschland ist das Thema eng mit der Digitalisierungsstrategie des Gesundheitswesens verknüpft. Bitkom hat in einer aktuellen Umfrage unter deutschen Krankenhäusern ermittelt, dass 67 Prozent der befragten Kliniken KI bereits pilotieren oder aktiv einsetzen — vor drei Jahren waren es noch 29 Prozent. Der Sprung ist erheblich, die tatsächliche klinische Nutzung für lebensrelevante Diagnosen bleibt aber bislang begrenzt.

Investitionen in digitale Infrastruktur nehmen dabei auch außerhalb der Medizin zu. Die Schwarz-Gruppe investiert in das Quantencomputer-Startup Eleqtron — ein Signal dafür, dass auch Konzerne außerhalb der klassischen Tech-Branche auf Rechenleistung der nächsten Generation setzen, die perspektivisch auch medizinische KI-Modelle beschleunigen könnte.

Was KI besser kann — und was nicht

Die Stärken des Algorithmus

KI-Systeme wie das Charité-Modell ermüden nicht. Ein Radiologe, der am Nachmittag nach sechs Stunden Bildauswertung den 200. CT-Scan beurteilt, unterliegt nachweislich kognitiven Ermüdungseffekten — die Fehlerquote steigt. Algorithmen arbeiten mit konstanter Präzision, egal ob es das erste oder das tausendste Bild ist. Das ist kein Wettbewerbsargument, sondern ein struktureller Unterschied mit direkter klinischer Relevanz.

Darüber hinaus reagieren KI-Systeme auf Subpixel-Muster, die unter der bewussten Wahrnehmungsschwelle eines Menschen liegen. In klinischen Tests hat das Charité-Modell mehrfach Tumore im Stadium T1 erkannt, die von zwei unabhängig arbeitenden Fachärzten nicht als auffällig markiert wurden — und die sich in der anschließenden Biopsie als maligne bestätigten. (Quelle: Charité Berlin / Hasso-Plattner-Institut, klinische Validierungsstudie)

Ein weiterer Vorteil: Skalierbarkeit. Während ein Krankenhaus für jeden zusätzlichen Patienten zusätzliches Personal braucht, kann ein KI-System in wenigen Minuten auf mehr Rechenkapazität hochskaliert werden — relevant angesichts des akuten Fachkräftemangels in der Radiologie.

Die Grenzen und offenen Fragen

Trotzdem ist die Diskussion keine einfache Pro-KI-Geschichte. Kritiker aus der Fachärzteschaft weisen auf mehrere Schwachstellen hin. Erstens: Das System wurde primär mit Bilddaten aus deutschen und westeuropäischen Kliniken trainiert. Bei Patientenpopulationen mit anderen ethnischen Hintergründen oder anderen Bildgebungsgeräten kann die Genauigkeit signifikant abweichen — ein bekanntes Problem in der KI-Forschung, das als Verteilungsverschiebung oder "Distribution Shift" bezeichnet wird.

Zweitens fehlt dem System das, was Ärzte als klinischen Kontext bezeichnen: Vorerkrankungen, Familienanamnese, aktuelle Medikamente, das Gespräch mit dem Patienten. Der Algorithmus sieht ein Bild — nicht einen Menschen. Eine 97-prozentige Trefferquote auf dem Bilddatensatz bedeutet nicht automatisch eine 97-prozentige Diagnosesicherheit in der realen Versorgung.

Drittens: Haftungsfragen. Wer trägt die rechtliche Verantwortung, wenn ein KI-System eine Diagnose übersieht? Das europäische Medizinprodukterecht (MDR) und der EU AI Act schaffen dafür aktuell noch keinen vollständig klaren Rahmen — besonders für Systeme, die eigenständige diagnostische Empfehlungen abgeben. Die Charité positioniert ihr System derzeit ausdrücklich als Unterstützungswerkzeug für Ärzte, nicht als Ersatz.

System / Methode	Trefferquote	Stärken	Schwächen	Status
Charité KI-System (CNN)	97,3 %	Konstante Leistung, Subpixel-Erkennung, skalierbar	Kein klinischer Kontext, Trainingsdaten-Bias, Haftungslücke	Klinische Erprobung, keine EU-Zulassung
Ausgebildeter Radiologe	91 %	Klinischer Kontext, Patientengespräch, ethisches Urteil	Ermüdung, Kapazitätsgrenzen, Fachkräftemangel	Standardversorgung
Google Health DeepMind (Brust-CT)	ca. 94 %	Große Trainingsdatenbasis, globale Validierung	Nur Brustkrebs, US-zentrierte Datenbasis	Pilotphase UK/USA
Siemens Healthineers AI-Rad Companion	ca. 92 %	Integration in bestehende Krankenhaus-IT	Kommerzielles Produkt, lizenzpflichtig, closed-source	CE-zertifiziert, Markteinführung erfolgt
Kombiniertes Verfahren (KI + Arzt)	bis 98,5 %	Kombination beider Stärken, gegenseitige Kontrolle	Höherer Zeitaufwand, Prozessintegration nötig	Aktuelle Forschungsrichtung

Das kombinierte Modell als realistisches Zukunftsszenario

Die spannendste Zahl in der Charité-Studie ist nicht die 97,3-Prozent-Marke der KI allein — sondern die 98,5 Prozent, die erzielt wurden, wenn Arzt und KI gemeinsam arbeiteten. Das kombinierte Verfahren schlägt beide Einzelmethoden. In diesem Modell prüft der Radiologe bevorzugt jene Fälle, die das KI-System als unsicher markiert hat, und konzentriert seine knappe Zeit auf die tatsächlich schwierigen Grenzfälle.

Dieses Prinzip — KI als Vorfilter, Arzt als Entscheider — ist inzwischen Konsens unter den meisten KI-Forschern im medizinischen Bereich. Es ist auch das Modell, das regulatorisch am ehesten kompatibel mit geltendem Recht ist. Die Verantwortung bleibt beim approbierten Arzt; der Algorithmus liefert einen Befund-Entwurf, keine Diagnose.

Für Patienten bedeutet das eine potenziell erhebliche Verbesserung der Versorgungsqualität — besonders in ländlichen Regionen, wo Radiologen Mangelware sind. Ein KI-System kann in einer Landklinik im Schwarzwald nachts um drei Uhr einen CT-Scan vorauswerten und den diensthabenden Arzt auf einen auffälligen Befund aufmerksam machen, bevor dieser überhaupt am Bildschirm sitzt.

Infrastruktur und Datensicherheit als Voraussetzung

KI-gestützte Medizin funktioniert nur mit leistungsfähiger digitaler Infrastruktur — und die ist in Deutschland bekanntlich ungleich verteilt. Während Universitätskliniken über Glasfaseranbindungen und modernste Serverarchitektur verfügen, arbeiten viele Kreiskrankenhäuser noch mit veralteter IT. Cloudbasierte KI-Diagnose, wie sie einige Anbieter anbieten, wirft dabei unmittelbar Fragen zum Datenschutz auf: Medizinische Bilddaten gehören zu den sensibelsten personenbezogenen Daten überhaupt — ihre Übertragung in externe Rechenzentren ist rechtlich komplex.

Datensicherheit in der digitalen Infrastruktur ist kein isoliertes Medizinthema. Aktuelle Sicherheitslücken in allgegenwärtiger Software — etwa die Erkenntnis, dass Microsoft Edge Passwörter im Klartext auslesbar macht — verdeutlichen, wie verwundbar digitale Systeme grundsätzlich sind. Im medizinischen Kontext würden solche Schwachstellen besonders schwerwiegende Konsequenzen haben.

Gleichzeitig schreitet der Netzausbau voran: Der laufende Übergang zu moderneren Mobilfunkstandards — wie der Schritt, den A1 Telekom Austria mit der Abschaltung des 2G-Mobilfunkstandards vollzieht — schafft Kapazitäten, die langfristig auch der vernetzten Medizintechnik zugutekommen. Telekommunikationsinfrastruktur und medizinische KI sind, auch wenn es auf den ersten Blick nicht so wirkt, eng miteinander verwoben: Ohne stabile, breitbandige Verbindungen ist echtzeitfähige KI-Diagnostik in der Fläche nicht denkbar. Auch größere Netztransaktionen wie die Übernahme von Three durch Vodafone für 5 Milliarden Euro signalisieren, dass Netzbetreiber auf Konsolidierung und Kapazitätsausbau setzen — mit Implikationen für alle datenintensiven Anwendungen.

Zulassung, Regulierung und der Weg in die Regelversorgung

Das Charité-System durchläuft derzeit die klinische Erprobungsphase. Eine Zulassung als Medizinprodukt der Klasse III — die für diagnostische KI-Systeme mit direkter klinischer Entscheidungsrelevanz vorgesehen ist — erfordert nach EU-Medizinprodukterecht eine aufwendige Konformitätsbewertung durch eine sogenannte Benannte Stelle. Der Prozess dauert in der Regel zwischen zwei und vier Jahren und kostet Millionen Euro an Prüfungs- und Dokumentationsaufwand.

Parallel dazu greift ab diesem Jahr der EU AI Act, der KI-Systeme für medizinische Diagnosen explizit als Hochrisiko-KI einstuft. Das bedeutet: Zusätzliche Transparenzpflichten, Pflicht zur menschlichen Aufsicht, verpflichtende Dokumentation der Trainingsdaten und Nachweispflichten zur Robustheit gegenüber Angriffen und Fehlfunktionen. Die regulatorische Hürde ist bewusst hoch angesetzt — mit gutem Grund.

Für die breite Anwendung in der deutschen Regelversorgung, also die Erstattungsfähigkeit über gesetzliche Krankenversicherungen, braucht es zusätzlich eine positive Nutzenbewertung durch den Gemeinsamen Bundesausschuss (G-BA). Dieser Schritt steht beim Charité-System noch weit am Anfang. Selbst im optimistischen Szenario ist ein flächendeckender Einsatz nicht vor Ende dieses Jahrzehnts realistisch.

Einordnung: Revolution oder überschätzter Hype?

Die Zahlen der Charité-Studie sind beeindruckend und methodisch solide — aber sie entstammen einer kontrollierten Laborstudie, nicht dem chaotischen Alltag einer Notaufnahme. Der Sprung vom Forschungsergebnis zur verlässlichen klinischen Routine war in der Medizintechnik schon oft schwieriger als erwartet. Künstliche Intelligenz in der Diagnostik ist kein Hype mehr — aber auch noch keine ausgereifte Standardtechnologie.

Was die Charité-Ergebnisse dennoch bedeutsam macht: Sie verschieben die Beweislast. Bisher musste die KI beweisen, dass sie mit menschlicher Diagnostik mithalten kann. Mit einer Trefferquote von 97,3 Prozent gegenüber 91 Prozent stellt sich die Frage zunehmend anders: Unter welchen Bedingungen wäre es künftig ethisch vertretbar, auf KI-Unterstützung zu verzichten?

Diese Frage ist nicht technischer, sondern gesellschaftlicher Natur. Sie betrifft Haftungsrecht, Ausbildung, Ressourcenverteilung im Gesundheitswesen und letztlich das Selbstverständnis eines Berufsstands. Die Antwort darauf werden nicht Algorithmen geben — sondern Menschen.

Mehr zum Thema

Weiterführende Informationen: BSI Bundesamt fuer Sicherheit

Wie findest du das?

Markus Bauer

Technologie & Digitales

Markus Bauer verfolgt die Entwicklungen in Tech, KI und Digitalpolitik. Er analysiert, wie neue Technologien Gesellschaft und Wirtschaft verändern — von Datenschutz bis Plattformregulierung.