TextMining von Meldungstexten für einheitliche Klassifikationen (TeMeK)
Ressortforschung im Handlungsfeld „Digitalisierung“, Forschungsschwerpunkt „Krebsregisterdaten zusammenführen und intelligent nutzen“
Projektleitung
Krebsregister Baden-Württemberg
Prof. Dr. Marco Halber
Birkenwaldstr. 149
70191 Stuttgart
Projektlaufzeit
01.09.2022 bis 31.08.2025
Das Projekt ist Teil des Forschungsschwerpunkts „Krebsregisterdaten zusammenführen und intelligent nutzen: Innovationsprojekte für Künstliche Intelligenz“.
Projektbeteiligte
- Universitätsklinikum Freiburg, Tumorzentrum Freiburg (CCCF)
- Fraunhofer-Institut für Kommunikation, Informations-verarbeitung und Ergonomie FKIE
- Averbis GmbH
- Krebsregister Hessen
- Krebsregister Berlin-Brandenburg
- Krebsregister Rheinland-Pfalz
Ansprechperson
Dr. Anja Hillekamp
Dr. Andrea Delekate
DLR Projektträger
projekttraeger-bmg(at)dlr.de
Motivation
Die Daten der klinischen Krebsregister bilden die Grundlage für Auswertungen, die zur Verbesserung der Versorgung an Krebs erkrankter Personen beitragen. Außerdem dienen sie als externe Qualitätssicherung für die in der medizinischen Versorgung tätigen Ärztinnen und Ärzte. Bisher enthalten die Meldungen an die klinischen Krebsregister in großem Umfang unstrukturierten Freitext, aus dem nur mit großem manuellem Aufwand notwendige Informationen herausgefiltert werden können.
Das Projekt TeMeK geht der Frage nach, welche Methoden der Künstlichen Intelligenz (KI) eingesetzt und wie sie angepasst und weiterentwickelt werden können, um eine einheitliche, korrekte und effiziente Informationsgewinnung aus komplexem Freitext zu ermöglichen.
Ziele und Vorgehen
Das übergeordnete Ziel ist die schnelle Bereitstellung von qualitativ hochwertigen Daten, die bundesweit einheitlich für eine Zusammenführung am Zentrum für Krebsregisterdaten nutzbar sind. Diese können auch eine belastbare Qualitätssicherung bilden. Es soll erforscht werden, wie sogenannte „Textmining“-Methoden genutzt werden können um anhand krankheitsbedingter Befunde leichter an Informationen aus den Freitextdaten zu gelangen. Im Projekt werden die neuesten Verfahren aus dem Bereich der „Deep-Learning“-basierten Sprachverarbeitung eingesetzt, auf die Domäne der Erkrankung optimiert und bei Bedarf um nötige Module erweitert. Mit Hilfe spezieller Algorithmen sollen beispielsweise Bestätigungsprozesse automatisiert und im Freitext Unregelmäßigkeiten erkannt werden. Dies soll die Krebsregister bei Dokumentationsprozessen unterstützen und deren Effizienz steigern. Die entwickelten Algorithmen sollen einzeln untersucht und technisch möglichst unabhängig mit definierten und standardisierten Schnittstellen von den Registern genutzt werden können.
Perspektiven für die Praxis
Die Verfahren, die im Rahmen des Projektes entwickelt werden, stehen anschließend den Krebsregistern zur Nutzung zur Verfügung. Zusätzlich werden die Verfahren mit einer Schnittstelle versehen, die eine vereinfachte Nutzung durch die Krebsregister ohne KI-Fachwissen ermöglicht. Für die Krebsregister ergeben sich dadurch verschiedene Vorteile: beispielsweise kann Wissen für die Diagnosen herausgearbeitet und bereitgestellt werden. Darüber hinaus wird durch das Vorhaben ein Experten- und Wissenssystems aufgebaut, in dem molekular-pathologische Marker gesammelt werden. Somit findet eine Bündelung von hochspezialisiertem Wissen statt, welches durch die Bearbeiter abgerufen und für wissenschaftliche und klinische Fragestellungen genutzt werden kann.
Weitere Informationen
-
Handlungsfeld „Digitalisierung“
Die Digitalisierung des Gesundheitswesens und ihre Auswirkungen u. a. auf die Patientinnen- und Patientenversorgung bietet große Chancen. Hier erfahren Sie mehr zum gesundheitspolitischen Handlungsfeld „Digitalisierung“.
-
Überblick Forschungsschwerpunkte
Das BMG fördert neben Einzelvorhaben insbesondere Forschungsaktivitäten zu übergreifenden Themen. Die Förderschwerpunkte richten sich nach den Handlungsfeldern der Ressortforschung. Hier gelangen Sie zum Überblick.