Chokkalingam, Manopriya
(2018).
Understanding longevity sub-networks using network propagation algorithms.
PhD thesis, Universität zu Köln.
Abstract
Wegweisende Arbeiten an Modellorganismen haben mehrere evolutionär konservierte Signalwege in der Regulation von Langlebigkeit identifiziert. Hochdurchsatz-Experimente haben Gene und Pfadwege identifiziert, die durch diese Langlebigkeits-Interventionen reguliert werden. Diese Hochdurchsatz-Experimente liefern lange Listen von signifikant differentiell regulierten Genen, wodurch die Identifizierung der kausalen Gene des Phänotyps eine Herausforderung darstellt. Netzwerk-Ansätze sind leistungsfähige Methoden zur Entdeckung von Genen
und Modulen, die direkt mit dem Phänotypen assoziiert sind. Network Propagation ist ein systembiologischer Ansatz, der darauf basiert, dass Gene, die den gleichen Phänotyp auslösen, dazu neigen, eng zusammenzuarbeiten: das Signal einzelner Gene wird auf ein Netzwerk abgebildet, um die mit dem Phänotypen assoziierten Gene und Module zu verstärken. Network Propagation ist damit eine globale Scoring-Methode mit verschiedenen Anwendungen, wie der Vorhersage von Proteinfunktionen, der Identifizierung von spezifisch veränderten Sub-Netzwerken sowie Genprioritisierung. Es existieren verschiedene mathematische Formulierungen von Network Propagation, unter anderem Random Walks, Random Walks mit Neustart (RWR) und Heat Diffusion (HD). In dieser Arbeit haben wir systematisch die Leistung von RWR und HD Algorithmen unter Verwendung von Rattus norvegicus altersassoziierten mRNA- und Proteinexpressionsdaten in zwei metabolisch aktiven Geweben analysiert. Wir beobachteten, dass die propagierten Scores - abhängig von Netzwerk-Normalisierung und Art der Eingabedaten - von der Topologie des Netzwerkes beeinflusst werden ("Topologie-Bias"). In den Algorithmen der Network Propagation bestimmt der Streukoeffizient ("spreading coefficient", α oder "t") die Stärke und die Reichweite der Signalausbreitung im Netzwerk. Daher ist es wichtig, den Einfluss dieses Parameters auf die propagierten Scores einzuschätzen. In dieser Studie haben wir die beiden Algorithmen unter einer breiten Auswahl von α und ’t’ Parametern verglichen. Wir demonstrieren die Existenz von optimalen Streukoeffizienten und ihre Abhängigkeit von den Eingabewerten (Anfangszustände des Random Walks). Darüber hinaus zeigen wir die Anwendbarkeit und Robustheit von Network Propagation bei der Identifizierung veränderter Subnetzwerke während des Alterns, anhand von Genexpressions- und Proteinexpressionsdaten aus Gehirn- und Lebergeweben.
Im Modellorganismus C. elegans haben wir die Antwort des Transkriptoms auf Störungen der Insulin-Signalgebung, der Keimbahn-Signalübertragung, der Kalorienaufnahme und der Hypoxie untersucht. Es ist eine offene Frage, inwiefern diese Pfadwege auf gemeinsame molekulare Endpunkte wirken, die für das Altern oder die Lebensspanne relevant sind. Unter Verwendung traditioneller Methoden zur Interpretation von Transkriptomdaten, welche sich auf die Antwort einzelner Gene konzentrierten, beobachteten wir nur eine geringe Ähnlichkeit zwischen unterschiedlichen Perturbationen. Wir verwendeten daher Network Propagation für die Identifizierung von molekularen Netzwerken, die konsistent durch die betrachteten Faktoren beeinflusst werden. Diese Methode beruht auf der Annahme, dass selbst bei Ansprache derselben zellulären Funktion durch Perturbationen häufig nicht dieselben Gene verändert werden. Stattdessen können verschiedene Perturbationen zur Veränderung verschiedener Gene führen, die in einem gemeinsamen molekularen Subnetzwerk agieren. Unsere Analyse identifizierte molekulare Subnetzwerke, welche die Lebensspanne durch Perturbation verschiedener Signalwege beeinflussen. Diese Netzwerke enthielten Proteine, die an Transkription, tRNA- und rRNA-Prozessierung, Chromatin-Remodellierung, Collagen, Stressresistenz und Reproduktion beteiligt sind, was auf die Existenz gemeinsamer Module und konvergenter Downstream-Mechanismen der Kontrolle der Lebensspanne in C. elegans hindeutet.
Ein weiteres Ziel dieser Arbeit war die Identifizierung gewebespezifischer Reaktionen auf reduzierte Aktivität des Insulin-Signalweges IIS (rIIS). Mithilfe von Network Propagation sollten die molekularen Mechanismen, die über den Transkriptionsfaktor dfoxo die Lebensspanne modulieren, präzise bestimmt werden. Dafür wurden Proteine in dfoxo-abhängige und unabhängige Proteine klassifiziert und die stärke der differentiellen Expression (p-Werte) wurden in einem Protein-Protein-Interaktionsnetzwerk von Drosophila propagiert. Anschließend wurden dfoxo-abhängige und unabhängige Netwerkmodule bestimmt. Darüber hinaus wurde Network Propagtion verwendet, um die gemeinsamen molekularen Signaturen von rIIS in zwei mit Langlebigkeit assoziierten genetischen Modellen zu bestimmen.
Item Type: |
Thesis
(PhD thesis)
|
Translated abstract: |
Abstract | Language |
---|
Pioneering works on the laboratory model organisms has identified multiple evolutionarily conserved signalling pathways in regulation of longevity. High-throughput experiments have identified the genes and pathways that are regulated by these longevity interventions. However the high-throughput experiments yields a long list of significantly differentially regulated genes posing the challenge in identifying the causal genes of the phenotype. Network approaches are powerful resources in discovering genes and modules that are associated with the phenotype. Network propagation is a powerful systems biology approach that works through the principle that genes driving the same phenotype tend to interact closely, thus the gene signal is spread on the network to amplify the phenotype associated genes and modules. It is a global scoring method with various applications such as protein function prediction, inferring condition specifically altered sub-networks and prioritising the genes.
Various mathematical formulations for network propagation exists, including Random walks, Random walk with restart and Heat diffusion. In this thesis we have systematically analysed the performance of RWR and HD algorithms using the Rattus norvegicus ageing mRNA and protein abundance data from two different metabolically active tissues. We observed that depending on the network normalization approach and the nature of input scores, the propagated scores are biased by topology of the network ("topology bias"). In the algorithms of network propagation, spreading coefficient (α or ’t’) governs the amount and distance of signal spread in the network, is a tuning parameter thus it becomes extremely important to assess its impact on the propagated scores. In this study we have compared the two algorithms by employing a wide range of α and ’t’ parameters and demonstrate the existence of optimal spreading coefficients and their dependence on the input scores (initial states of the walker). Furthermore, we exemplified its utility and robustness in finding the altered sub-networks during ageing with gene expression and protein abundance datasets from brain and liver tissues.
Using C. elegans as a model we investigated the transcriptional responses to perturbations of insulin signalling, germline signalling, calorie uptake, and hypoxia. So far we lack insight into the extent to which these pathways impact on common molecular endpoints relevant for ageing or lifespan. Using traditional methods for the interpretation of transcriptomics data focussing on the responses of individual genes we observed only little similarity between the perturbations. We thus employed network propagation for the detection of molecular networks that are consistently affected across conditions. This method rests on the notion that even if the same cellular function is targeted by different perturbations we often do not observe responses of the same genes. Instead, different perturbations may lead to the alteration of different genes acting in a common molecular sub-network. Our analysis revealed molecular sub-networks that were relevant for lifespan across multiple pathway perturbations. These networks included proteins involved in transcription, tRNA & rRNA processing, chromatin remodelling, stress resistance and reproduction and collagen suggesting the existence of common modules and converging downstream mechanisms that are involved in the lifespan control of C. elegans.
Furthermore we aimed to understand the tissue specific responses to reduced IIS (rIIS) and pinpoint the lifespan specific molecular mechanisms that are mediated by the transcription factor dfoxo using network propagation. To address this, dfoxo dependent and independent proteins were classified and the individual classes of proteins differential protein abundance p-values were propagated on the protein-protein interaction network of Drosophila. Subsequently, dfoxo dependent and independent network modules were revealed. Besides that network propagation was used to identify the common molecular signatures of rIIS from two genetic models that are associated with longevity. | UNSPECIFIED |
|
Creators: |
Creators | Email | ORCID | ORCID Put Code |
---|
Chokkalingam, Manopriya | mano.c.priya@gmail.com | UNSPECIFIED | UNSPECIFIED |
|
URN: |
urn:nbn:de:hbz:38-99406 |
Date: |
23 April 2018 |
Language: |
English |
Faculty: |
Faculty of Mathematics and Natural Sciences |
Divisions: |
Weitere Institute, Arbeits- und Forschungsgruppen > Center for Data and Simulation Science (CDS) |
Subjects: |
Natural sciences and mathematics |
Uncontrolled Keywords: |
Keywords | Language |
---|
PhD Thesis | English |
|
Date of oral exam: |
20 June 2018 |
Referee: |
Name | Academic Title |
---|
Beyer, Andreas | Prof.Dr. |
|
Refereed: |
Yes |
URI: |
http://kups.ub.uni-koeln.de/id/eprint/9940 |
Downloads per month over past year
Export
Actions (login required)
|
View Item |