MNGHC
Titel: Übergang zu einer neuen Generation von Versorgung. Die Verwendung von Abrechnungsdaten zur Verbesserung der Prävention von Diabeteskomplikationen
Förderer: Bundesministerium für Bildung und Forschung (BMBF); Deutsches Zentrum für Diabetesforschung (DZD) 3.0
Förderungszeitraum: 2021-2022
Partner: DAK-Gesundheit
Projektziele:
- In diesem Projekt entwickeln und validieren wir Prädiktionsalgorithmen für das Auftreten von Diabeteskomplikationen bei Patienten mit Typ 2 Diabetes basierend auf Abrechnungsdaten der gesetzlichen Krankenversicherung (GKV). Dabei wenden wir sowohl konventionelle Regressions-, also auch moderne Methoden des Maschinellen Lernens an, um deren Leistungsfähigkeit zu vergleichen.
Hintergrund:
- Diabeteskomplikationen einschließlich Herzinfarkt und Schlaganfall sind häufig vermeidbar. Zielgerichtetes Screening von Patient*innen mit erhöhtem Komplikationsrisiko verspricht eine höhere Effektivität und Kosteneffektivität als reguläre universelle Screening-Aktivitäten. Bestehende GKV-Daten können potenziell dazu genutzt werden, um Hochrisiko-Patienten zu identifizieren. In solch hochdimensionalen Daten könnten Methoden des maschinellen Lernens bei der Identifikation von prädiktiven Datenmustern einen Vorteil gegenüber konventionellen Regressionsansätzen bieten.
Methoden:
- Wir nutzen retrospektiv die hochdimensionalen (ICD 10 Codes, Prozedurenschlüssel, Arzneimittel, Disease Management Programmteilnahme etc.) Abrechnungsdaten von über 300,000 Patient*innen mit Typ 2 Diabetes aus dem Zeitraum 2014-2019 und identifizieren potenziell relevante Prädiktoren für Herzinfarkt und Schlaganfall mittels Literaturrechere. Anschließend wenden wir logistische Regression, Regularisierungsmethoden und moderne Methoden des maschinellen Lernens (z.B. Random Forest, Gradient Boosting) an, um Algorithmen zu entwickeln, die Patient*innen mit hohem Risiko für Herzinfarkt oder Schlaganfall identifizieren. Die Prädiktionsgüte der Modelle wir anhand der Fläche unter der Precision-Recall-Kurve (AUPRC) verglichen. Zusätzlich berichten wir Gütekriterien wie positive und negative prädiktive Werte, Sensitivität, Spezifität, Number Needed to Evaluate und Alert Raten.
Impact:
- Das Hauptergebnis unseres Forschungsprojektes werden Prädiktionsmodelle sein, die für eine kosteneffektive Identifizierung von Hochrisikopatienten verwendet werden können. Die Leistungsfähigkeit der fortgeschritteneren statistischen Methoden wird mit jener der konventionellen Regressionsmethoden verglichen. Dies wird neue Einblicke in die Anwendungsmöglichkeiten und Herausforderungen der Nutzung von Methoden des maschinellen Lernens in Sekundärdaten bieten.
Weitere Informationen: https://www.dzd-ev.de/dzd-next/index.html
Kontakt: Dr. Anna-Janina Stephan
Veröffentlichungen aus diesem Projekt:
Stephan AJ, Hanselmann M, Laxy M. Moving to next generation healthcare: Using real world claims data to target prevention of macrovascular complications in diabetes patients (MNGHC) - Multivariable prediction model development and validation plan for prediction of stroke and myocardial infarction. 2022. https://osf.io/v7rfu