Nagel, Luise C. ORCID: 0000-0001-8844-7234 (2024). Computational methods for identifying structural protein alterations from limited proteolysis-coupled mass spectrometry data. PhD thesis, Universität zu Köln.

[thumbnail of Dissertationsschrift_LuiseNagel.pdf] PDF
Dissertationsschrift_LuiseNagel.pdf
Bereitstellung unter der CC-Lizenz: Creative Commons Attribution Non-commercial Share Alike.

Download (21MB)

Abstract

The structure of proteins plays a central role in the functional state of cells and organisms, incorporating multilayered mechanisms that contribute to the complexity of cellular processes. Understanding protein structures is essential for elucidating their functions, interactions with other molecules, and contributions to various biological processes, ultimately providing crucial insights into cellular mechanisms, metabolic pathways, pathological processes, and organismal physiology. An emerging method for quantifying structural changes on a proteome-wide scale is combining limited proteolysis with mass spectrometry (LiP-MS). LiP-MS utilizes unspecific proteinase K (PK) digest of accessible protein regions to identify structural alterations, such as conformation changes, misfolding or altered protein-protein interactions, in thousands of proteins in their native environment. We investigated whether global, in situ analysis of protein structural changes could serve as structural biomarkers to reflect pathophysiological processes. Parkinson's disease (PD) is a prevalent neurodegenerative disease that lacks reliable biomarkers for diagnosis and, as it is a prominent example of a disease associated with structural proteome changes, it is an ideal candidate for identifying structural candidate biomarkers. To define these structural changes associated with disease, we analyzed samples from both healthy individuals and those with PD using LiP-MS. Our newly developed bioinformatic pipeline allowed us to identify 76 proteins with structural alterations in the cerebrospinal fluid (CSF) of individuals with PD compared to healthy donors. Multivariate feature selection models showed that CSF protein structural information is more effective than protein abundance information in distinguishing between healthy participants and those with PD. This study suggests that LiP-MS can identify novel structural biomarker candidates for disease and help generate hypotheses about underlying disease processes. Identifying structural protein alterations from LiP-MS data requires novel analyses approaches, as it remains challenging to deconvolute the different signal contributions. To tackle this challenge, we developed a new computational processing and analysis workflow based on the PD work, which can be applied to various LiP-MS datasets. We, for the first time, compared different approaches that deal with the LiP-MS specific challenges, and propose a two-step approach that first removes unwanted variations from the LiP signal and then infers the effects of variables on the structural accessibility of proteins. Our framework provides a uniquely powerful approach for deconvolving LiP-MS signals by separating the contribution of structural changes, protein abundance, post-translational modifications and alternative splicing.

Item Type: Thesis (PhD thesis)
Translated abstract:
Abstract
Language
Die dreidimensionale Struktur von Proteinen ist von zentraler Bedeutung für die Funktion von Zellen und Organismen. Sie spiegelt eine Vielzahl molekularer Mechanismen wider, die zur Komplexität zellulärer Prozesse beitragen. Daher ist es entscheidend, die Strukturen von Proteinen und ihre Veränderungen zu entschlüsseln, um ihre Funktionen, ihre Wechselwirkungen mit anderen Molekülen und ihre Beteiligung an verschiedenen biologischen Prozessen zu verstehen. Dies ermöglicht entscheidende Einblicke in zelluläre Mechanismen, Stoffwechselwege, pathologische Prozesse und die Physiologie von Organismen. Eine neue Methode zur Identifizierung von Strukturänderungen im gesamten Proteom ist die Anwendung von limitierter Proteolyse in Kombination mit Massenspektrometrie (LiP-MS). Der unspezifische Verdau von Proteinen durch Proteinase K (PK) in strukturell zugänglichen Regionen ermöglicht die massenspektroskopische Charakterisierung struktureller Veränderungen von Proteinen wie Konformationsänderungen, Fehlfaltungen oder veränderte Protein-Protein-Wechselwirkungen in tausenden von Proteinen in situ. Da sich zelluläre pathophysiologische Prozesse in Proteinstrukturen widerspiegeln, haben wir getestet, ob globale in situ Analysen von strukturellen Veränderungen in Proteinen als strukturelle Biomarker dienen können. Morbus Parkinson (PD) ist eine weit verbreitete neurodegenerative Erkrankung, für die es bisher keine zuverlässigen diagnostischen Biomarker gibt. PD geht mit strukturellen Veränderungen im Proteom einher und ist daher eine geeignete Erkrankung für die Suche nach strukturellen Biomarker-Kandidaten. Um Biomarker-Kandidaten zu identifizieren, wurden Proben von gesunden und an Parkinson erkrankten Personen mittels LiP-MS analysiert. Ein neu entwickeltes bioinformatisches Analyseverfahren ermöglichte die Identifizierung von 76 strukturell veränderten Proteinen in der Zerebrospinalflüssigkeit (CSF) von Personen mit Parkinson im Vergleich zu gesunden Spender*innen. Modelle, die auf strukturellen Veränderungen von Proteinen basierten, um Personen mit Parkinson von gesunden Spendern zu unterscheiden, hatten eine höhere Erfolgsrate als Modelle, die auf der Häufigkeit von Proteinen basierten. Unsere Studie zeigt, dass LiP-MS verwendet werden kann, um strukturelle Biomarker-Kandidaten zu identifizieren, und dass auf dieser Basis Hypothesen über die zugrunde liegenden Krankheitsprozesse entwickelt werden können. Die Extraktion struktureller Proteinmodifikationen aus LiP-MS Daten erfordert neue analytische Ansätze, da die Entschlüsselung der verschiedenen Signalbeiträge eine Herausforderung darstellt. Um dieses Problem zu lösen, haben wir einen neuen Datenverarbeitungs- und Analyseworkflow für die Anwendung auf verschiedene LiP-MS Datensätze entwickelt, der auf den Analysen des PD-Biomarker-Kandidaten-Projektes basiert. Zum ersten Mal vergleichen wir verschiedene Ansätze, um die spezifischen Herausforderungen in der LiP-MS Datenanalyse zu adressieren, und schlagen einen zweistufigen Vorgehen vor. In dessen Rahmen werden zuerst unerwünschte Variationen aus dem LiP-Signal entfernt und anschließend die Auswirkungen von Variablen auf die strukturelle Zugänglichkeit von Proteinen berechnet. Unsere Methode bietet einen einzigartigen robusten Ansatz für die Dekonvolution von LiP-MS Signalen, indem sie zwischen den Beiträgen von strukturellen Veränderungen, Proteinabundanzen, posttranslationalen Modifikationen und alternativem Spleißen unterscheidet.
German
Creators:
Creators
Email
ORCID
ORCID Put Code
Nagel, Luise C.
luisecnagel@gmail.com
UNSPECIFIED
URN: urn:nbn:de:hbz:38-800504
Date: 2024
Language: English
Faculty: Faculty of Mathematics and Natural Sciences
Divisions: CECAD - Cluster of Excellence Cellular Stress Responses in Aging-Associated Diseases
Subjects: Natural sciences and mathematics
Life sciences
Uncontrolled Keywords:
Keywords
Language
systems biology
UNSPECIFIED
structural proteomics
UNSPECIFIED
parkinson's disease
UNSPECIFIED
Date of oral exam: 25 March 2024
Referee:
Name
Academic Title
Beyer, Andreas
Prof. Dr.
Hofmann, Kay
Prof. Dr.
Gagneur, Julien
Prof. Dr.
Refereed: Yes
URI: http://kups.ub.uni-koeln.de/id/eprint/80050

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item