Lotter-Becker, Lars Timo
(2026).
Prädiktion des KRAS-Mutationsstatus beim nicht-kleinzelligen Bronchialkarzinom mittels radiomischer Bildanalyse.
PhD thesis, Universität zu Köln.
|
PDF
digitale_Endversion_der_Doktorarbeit_1301.pdf Download (2MB) |
Abstract
Kirsten Rat Sarcoma viral oncogene homolog (KRAS) is a frequently occurring mutation in non-small-cell lung cancer (NSCLC) and influences cancer treatment and disease progression. In this study, a machine learning (ML) pipeline was applied to radiomic features extracted from public and internal CT images to identify KRAS mutations in NSCLC patients. Both datasets were analyzed using parametric (t test) and non-parametric statistical tests (Mann-Whitney U test) and dimensionality reduction techniques. Afterwards, the proposed ML pipeline was applied to both datasets using a five-fold cross-validation on the training set (70/30 train/test split) before being validated on the other dataset. The results show that the radiomic features are significantly different (Mann-Whitney U test; p < 0.05) between the two datasets, despite the use of identical feature extraction methods. Model transferability is therefore difficult to achieve, which became evident during external testing (F1 score = 0.41). Oversampling, undersampling, clustering and harmonization techniques were applied to balance and harmonize the datasets, but did not improve the classification of KRAS mutation presence. In general, due to only a single moderate result (highest test F1 score = 0.67), the accuracy of KRAS prediction is not sufficient for clinical application. In future work, the complexity of KRAS mutation might be addressed by taking submutations into consideration. Larger multicentric datasets with balanced tumor stages, including multi-scanner datasets, seem to be necessary for building robust predictive models.
| Item Type: | Thesis (PhD thesis) |
| Translated abstract: | Abstract Language Das Kirsten-Rat-Sarkom-Virus-Onkogen-Homolog (KRAS) ist eine häufig auftretende Mutation bei nicht-kleinzelligem Lungenkrebs (NSCLC) und beeinflusst die Krebsbehandlung und den Krankheitsverlauf. In dieser Studie wurde eine Machine-Learning-Pipeline (ML) auf radiomische Merkmale angewendet, die aus öffentlichen und internen CT-Bildern extrahiert wurden, um KRAS-Mutationen bei NSCLC-Patienten zu identifizieren. Beide Datensätze wurden mit parametrischen (t-Test) und nichtparametrischen statistischen Tests (Mann-Whitney-U-Test) sowie Techniken zur Dimensionsreduktion analysiert. Anschließend wurde die vorgeschlagene ML-Pipeline unter Verwendung einer fünffachen Kreuzvalidierung auf dem Trainingssatz (70/30-Trainings-/Testaufteilung) auf beide Datensätze angewendet, bevor sie auf dem anderen Datensatz validiert wurde. Die Ergebnisse zeigen, dass sich die radiomischen Merkmale zwischen den beiden Datensätzen trotz der Verwendung identischer Merkmalsextraktionsmethoden signifikant unterscheiden (Mann-Whitney-U-Test; p < 0,05). Die Übertragbarkeit des Modells ist daher schwierig zu erreichen, was sich bei externen Tests deutlich zeigte (F1-Score = 0,41). Es wurden Oversampling-, Undersampling-, Clustering- und Harmonisierungsverfahren angewendet, um die Datensätze auszugleichen und zu harmonisieren, jedoch ohne die Klassifizierung des Vorhandenseins von KRAS-Mutationen zu verbessern. Aufgrund nur eines einzigen moderaten Ergebnisses (höchster Test-F1-Score = 0,67) ist die Genauigkeit der KRAS-Vorhersage für die klinische Anwendung im Allgemeinen nicht ausreichend. In zukünftigen Arbeiten könnte die Komplexität der KRAS-Mutation durch die Berücksichtigung von Submutationen berücksichtigt werden. Oversampling-, Undersampling-, Clustering- und Harmonisierungsverfahren wurden angewendet, um die Datensätze auszugleichen und zu harmonisieren, konnten jedoch die Klassifizierung des Vorhandenseins von KRAS-Mutationen nicht verbessern. Aufgrund nur eines einzigen mäßigen Ergebnisses (höchster Test-F1-Score = 0,67) ist die Genauigkeit der KRAS-Vorhersage für die klinische Anwendung im Allgemeinen nicht ausreichend. In zukünftigen Arbeiten könnte die Komplexität der KRAS-Mutation durch die Berücksichtigung von Submutationen angegangen werden. Größere multizentrische Datensätze mit ausgewogenen Tumorstadien, einschließlich Datensätzen von mehreren Scannern, scheinen für die Erstellung robuster Vorhersagemodelle erforderlich zu sein. German |
| Creators: | Creators Email ORCID ORCID Put Code Lotter-Becker, Lars Timo lars.lotter-becker@uk-koeln.de UNSPECIFIED UNSPECIFIED |
| URN: | urn:nbn:de:hbz:38-796714 |
| Date: | 2026 |
| Language: | German |
| Faculty: | Faculty of Medicine |
| Divisions: | Faculty of Medicine > Radiologische Diagnostik > Institut und Poliklinik für Radiologische Diagnostik |
| Subjects: | Medical sciences Medicine |
| Uncontrolled Keywords: | Keywords Language NSCLC German KRAS German RADIOMICS German |
| Date of oral exam: | 12 November 2025 |
| Referee: | Name Academic Title Persigehl, Thorsten Universitätsprofessor Dr. med. Thomas, Roman Universitätsprofessor Dr. med. |
| Refereed: | Yes |
| URI: | http://kups.ub.uni-koeln.de/id/eprint/79671 |
Downloads
Downloads per month over past year
Export
Actions (login required)
![]() |
View Item |
