Lotter-Becker, Lars Timo (2026). Prädiktion des KRAS-Mutationsstatus beim nicht-kleinzelligen Bronchialkarzinom mittels radiomischer Bildanalyse. PhD thesis, Universität zu Köln.

[thumbnail of digitale_Endversion_der_Doktorarbeit_1301.pdf] PDF
digitale_Endversion_der_Doktorarbeit_1301.pdf

Download (2MB)

Abstract

Kirsten Rat Sarcoma viral oncogene homolog (KRAS) is a frequently occurring mutation in non-small-cell lung cancer (NSCLC) and influences cancer treatment and disease progression. In this study, a machine learning (ML) pipeline was applied to radiomic features extracted from public and internal CT images to identify KRAS mutations in NSCLC patients. Both datasets were analyzed using parametric (t test) and non-parametric statistical tests (Mann-Whitney U test) and dimensionality reduction techniques. Afterwards, the proposed ML pipeline was applied to both datasets using a five-fold cross-validation on the training set (70/30 train/test split) before being validated on the other dataset. The results show that the radiomic features are significantly different (Mann-Whitney U test; p < 0.05) between the two datasets, despite the use of identical feature extraction methods. Model transferability is therefore difficult to achieve, which became evident during external testing (F1 score = 0.41). Oversampling, undersampling, clustering and harmonization techniques were applied to balance and harmonize the datasets, but did not improve the classification of KRAS mutation presence. In general, due to only a single moderate result (highest test F1 score = 0.67), the accuracy of KRAS prediction is not sufficient for clinical application. In future work, the complexity of KRAS mutation might be addressed by taking submutations into consideration. Larger multicentric datasets with balanced tumor stages, including multi-scanner datasets, seem to be necessary for building robust predictive models.

Item Type: Thesis (PhD thesis)
Translated abstract:
Abstract
Language
Das Kirsten-Rat-Sarkom-Virus-Onkogen-Homolog (KRAS) ist eine häufig auftretende Mutation bei nicht-kleinzelligem Lungenkrebs (NSCLC) und beeinflusst die Krebsbehandlung und den Krankheitsverlauf. In dieser Studie wurde eine Machine-Learning-Pipeline (ML) auf radiomische Merkmale angewendet, die aus öffentlichen und internen CT-Bildern extrahiert wurden, um KRAS-Mutationen bei NSCLC-Patienten zu identifizieren. Beide Datensätze wurden mit parametrischen (t-Test) und nichtparametrischen statistischen Tests (Mann-Whitney-U-Test) sowie Techniken zur Dimensionsreduktion analysiert. Anschließend wurde die vorgeschlagene ML-Pipeline unter Verwendung einer fünffachen Kreuzvalidierung auf dem Trainingssatz (70/30-Trainings-/Testaufteilung) auf beide Datensätze angewendet, bevor sie auf dem anderen Datensatz validiert wurde. Die Ergebnisse zeigen, dass sich die radiomischen Merkmale zwischen den beiden Datensätzen trotz der Verwendung identischer Merkmalsextraktionsmethoden signifikant unterscheiden (Mann-Whitney-U-Test; p < 0,05). Die Übertragbarkeit des Modells ist daher schwierig zu erreichen, was sich bei externen Tests deutlich zeigte (F1-Score = 0,41). Es wurden Oversampling-, Undersampling-, Clustering- und Harmonisierungsverfahren angewendet, um die Datensätze auszugleichen und zu harmonisieren, jedoch ohne die Klassifizierung des Vorhandenseins von KRAS-Mutationen zu verbessern. Aufgrund nur eines einzigen moderaten Ergebnisses (höchster Test-F1-Score = 0,67) ist die Genauigkeit der KRAS-Vorhersage für die klinische Anwendung im Allgemeinen nicht ausreichend. In zukünftigen Arbeiten könnte die Komplexität der KRAS-Mutation durch die Berücksichtigung von Submutationen berücksichtigt werden. Oversampling-, Undersampling-, Clustering- und Harmonisierungsverfahren wurden angewendet, um die Datensätze auszugleichen und zu harmonisieren, konnten jedoch die Klassifizierung des Vorhandenseins von KRAS-Mutationen nicht verbessern. Aufgrund nur eines einzigen mäßigen Ergebnisses (höchster Test-F1-Score = 0,67) ist die Genauigkeit der KRAS-Vorhersage für die klinische Anwendung im Allgemeinen nicht ausreichend. In zukünftigen Arbeiten könnte die Komplexität der KRAS-Mutation durch die Berücksichtigung von Submutationen angegangen werden. Größere multizentrische Datensätze mit ausgewogenen Tumorstadien, einschließlich Datensätzen von mehreren Scannern, scheinen für die Erstellung robuster Vorhersagemodelle erforderlich zu sein.
German
Creators:
Creators
Email
ORCID
ORCID Put Code
Lotter-Becker, Lars Timo
lars.lotter-becker@uk-koeln.de
UNSPECIFIED
UNSPECIFIED
URN: urn:nbn:de:hbz:38-796714
Date: 2026
Language: German
Faculty: Faculty of Medicine
Divisions: Faculty of Medicine > Radiologische Diagnostik > Institut und Poliklinik für Radiologische Diagnostik
Subjects: Medical sciences Medicine
Uncontrolled Keywords:
Keywords
Language
NSCLC
German
KRAS
German
RADIOMICS
German
Date of oral exam: 12 November 2025
Referee:
Name
Academic Title
Persigehl, Thorsten
Universitätsprofessor Dr. med.
Thomas, Roman
Universitätsprofessor Dr. med.
Refereed: Yes
URI: http://kups.ub.uni-koeln.de/id/eprint/79671

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item