Jeena, Ganga
(2021).
A bioinformatics approach to quantify the effects of the underlying regulatory mechanisms on natural variation in gene expression by allele-specific expression analysis in Arabidopsis thaliana accessions using RNA-Seq Data.
PhD thesis, Universität zu Köln.
Abstract
Natural variation in gene expression plays a crucial role in evolution, natural selection
and improved response to environmental cues. Expression divergence may be caused by
localised polymorphisms within the gene or regulatory regions (cis) or induced by differences in regulatory factors (trans). The relative contribution of cis- and trans-regulatory
variants can be quantified by genome-wide analysis of Allele-specific expression (ASE)
with few F1 samples, unlike the conventional eQTL mapping methods. Differential allelic expression patterns between reciprocal crosses reflect the effect of parent-of-origin
and genomic imprinting, while deviation in gene expression of hybrids from parentals
reflects heterosis events.
This project aims to define an optimal methodology for ASE analysis using RNA-seq data
to quantify the effects of cis- and trans-regulatory variants on gene expression differences.
To develop this protocol, we used simulated and sequenced RNA-Seq data from leaf tissue in three biological replicates of Arabidopsis thaliana accessions Cape Verde Island
(Cvi), Landsberg erecta (Ler), and in their reciprocal hybrids (Cvi x Ler, Ler x Cvi).
Factors like the genome of reference, gene region, frequency and location of SNPs, are
crucial in expression quantification from mapped reads and were considered to determine
a benchmarking criteria for the pipeline.
The ASE pipeline was used to perform analysis of RNA-Seq from six accessions of Arabidopsis thaliana namely An-1, Bor-4, Bur-0, Knox-10, Sha and Ler from varying geographical locations and their reciprocal crosses with Ler. The allelic ratio within F1
hybrids was compared to the parental ratio to quantify the regulatory effects of cis, trans,
cis x trans and compensatory. Approximately 46% of genes with atleast one diagnostic
SNP could be analysed for expression profiles. Nearly 1200 genes showed significant differential expression in parentals. Only genes with similar expression measure over exons
and SNPs were analysed for allelic divergence in hybrids. ASE analysis could determine
nearly 575 genes with different patterns of regulated expression variation. Of these ∼55%
were regulated by cis-, ∼39% by trans-effects, ∼5% by compensatory and over less than
1% show cis x trans effect. Relative levels of regulatory effects were similar across all
hybrids.
Interestingly, cis-regulated patterns were found to be prominent and conserved across
multiple crosses. Most trans-effects were unique to crosses and thus explained more diversity. The cis-effects exhibit large expression divergence compared to trans-effects.
Parent-of-origin effects was assessed for genes with statistically significant allelic bias
(cis-effects) by comparing the allelic ratio of reciprocal hybrids. Majority of allele-biased
genes (∼79%) were common between pairs of reciprocal hybrids and showed similar magnitude and direction of allelic variation. Only ∼9% and ∼12% genes reflected
parental-effect with preferential paternal and maternal expressed alleles respectively.
Furthermore, gene expression of hybrids and parentals were compared to find heterosis events like overdominance, dominance, and additive effects. Preliminary analysis of
expression inheritance patterns revealed that Overdominance are extremely rare events
(∼1% ), majority of which are regulated by trans-effects.
Primary Metabolite profiling using GC/MS identified and measured relative levels of 37
metabolites across the six accessions and ten reciprocal hybrids. Proline levels were seen
to exhibit maximum diversity. Proline biosynthesis genes were tested for association with
proline levels variation. AtP5C1 Pyrroline-5-carboxylate (P5C) reductase, which plays
a crucial role in proline synthesis, exhibit a strong correlation of transcript and proline
levels, as experimentally validated by Verbruggen et al. in 1993.
In conclusion, I provide evidence to discuss the effects of parameters on expression quantification from RNA-Seq data, and suggest a framework for ASE analysis. I further used
the optimised strategy to quantify effects of regulatory variants, inheritance patterns,
parent-of-origin effects and assess association with phenotypic traits.
Item Type: |
Thesis
(PhD thesis)
|
Translated title: |
Title | Language |
---|
Ein bioinformatischer Ansatz zur Quantifizierung der Auswirkungen der zugrunde liegenden Regulationsmechanismen auf die natürliche Variation der Genexpression durch allelspezifische Expressionsanalyse in Arabidopsis thaliana-Akzessionen unter Verwendung von RNA-Seq Data | German | आरएनए-सेक डेटा का उपयोग करके अरबिडोप्सिस थालियाना परिग्रहणों में एलील-विशिष्ट अभिव्यक्ति विश्लेषण द्वारा जीन अभिव्यक्ति में प्राकृतिक भिन्नता पर अंतर्निहित नियामक तंत्र के प्रभावों को निर्धारित करने के लिए एक जैव सूचना विज्ञान दृष्टिकोण | Hindi |
|
Translated abstract: |
Abstract | Language |
---|
Die natürliche Variation der Genexpression spielt eine entscheidende Rolle für die Evolution, die natürliche Selektion und die verbesserte Reaktion auf Umweltsignale. Eine Expressionsveränderung kann durch einzelne Polymorphismen innerhalb eines Gens oder
der regulatorischen Regionen (cis) oder durch Unterschiede in den regulatorischen Faktoren (trans) verursacht werden. Der relative Beitrag von cis- und transregulatorischen
Varianten kann im Gegensatz zu den herkömmlichen eQTL-Kartierungsmethoden durch
genomweite Analyse der allelspezifischen Expression (ASE) mit wenigen F1-Proben
quantifiziert werden. Differenzielle, allelische Expressionsmuster zwischen reziproken
Kreuzungen spiegeln den Effekt des Ursprungselternteils und des genomischen Abdrucks
wider, während Abweichungen in der Genexpression von Hybriden von Elternteilen
Heterose-Ereignisse widerspiegeln.
Diese Doktorarbeit zielte darauf ab, eine optimale Methodik für die ASE-Analyse unter
Verwendung von RNA-seq-Daten zu definieren, um die Auswirkungen von cis- und
transregulatorischen Varianten auf Unterschiede in der Genexpression zu quantifizieren.
Um dieses Protokoll zu entwickeln, verwendeten wir simulierte und sequenzierte RNASeq-Daten aus Blattgewebe von drei biologischen Replikaten von Arabidopsis thalianaAkzessionen und von ihren reziproken Hybriden. Faktoren wie das Referenzgenom, die
Genregion, die Häufigkeit und die Position von SNPs sind für die Expressionsquantifizierung anhand von alignierten Reads von entscheidender Bedeutung und wurden zur
Bestimmung eines Benchmarking-Kriteriums für die Pipeline herangezogen.
Die ASE-Pipeline wurde weiter verwendet, um die RNA-Seq von sechs Akzessionen
von Arabidopsis thaliana, nämlich An-1, Bor-4, Bur-0, Knox-10, Sha und Ler, von
verschiedenen geografischen Orten und deren wechselseitigen Kreuzungen mit Ler zu
analysieren. Das Allelverhältnis innerhalb von F1-Hybriden wurde mit dem Elternverhältnis verglichen, um die regulatorischen Wirkungen von cis, trans, cis x trans und kompensatorisch zu quantifizieren. Ungefähr 46% der Gene mit mindestens einem diagnostischen SNP konnten auf Expressionsprofile analysiert werden. Nahezu 1200 Gene zeigten
eine signifikante unterschiedliche Expression bei den Eltern. Nur Gene mit einem ähnlichen Expressionsmaß über Exons und SNPs wurden auf allelische Divergenz in Hybriden analysiert. Die ASE-Analyse konnte fast 575 Gene mit unterschiedlichen Mustern
regulierter Expressionsvariation bestimmen. Davon entfielen 55% auf cis-, 39% auf transEffekte, 5% auf kompensatorische Effekte und mehr als 1% auf cis x trans. Das relative
Ausmaß regulatorischer Effekte war bei allen Hybriden ähnlich.
Interessanterweise wurde festgestellt, dass cis-regulierte Muster über mehrere Kreuze hinweg auffällig und konserviert sind. Die Mehrzahl der Trans-Effekte war für Kreuze einzigartig und erklärte somit mehr Vielfalt. Die cis-Effekte zeigen im Vergleich zu TransEffekten eine große Expressionsdivergenz.
Der Parent-of-Origin-Effekt wurde für Gene mit statistisch signifikanter allelischer Verzerrung (cis-Effekte) durch Vergleich des Allelverhältnisses von reziproken Hybriden bewertet. Die Mehrheit der allelabhängigen Gene (79%) war zwischen Paaren reziproker
Hybride gemeinsam und zeigte eine ähnliche Größe und Richtung der allelischen Variation. Nur ∼9% und ∼12% der Gene spiegelten den elterlichen Effekt mit bevorzugten
väterlichen bzw. mütterlich exprimierten Allelen wider.
Darüber hinaus wurde die Gene expression von Hybriden und Eltern verglichen, um Heteroseereignisse zu finden, d. H. überdominanz, Dominanz und additive Effekte. Eine vorläufige Analyse der Expressionsvererbungsmuster ergab, dass überdominanz extrem seltene Ereignisse (∼1%) sind, von denen die meisten durch Trans-Effekte reguliert werden.
Primäres Metaboliten-Profiling unter Verwendung von GC/MS identifizierte und maß relative 37 Metaboliten über die sechs Akzessionen und zehn reziproken Hybriden. Prolinspiegel hatten die größten Unterschiede in den Samples. Prolin-Biosynthesegene wurden
auf ihre Assoziation mit der Variation des Prolinspiegels getestet. AtP5C1-Pyrrolin-5-
carboxylat (P5C) Reduktase, die eine entscheidende Rolle bei der Prolinsynthese spielt,
weist eine starke Korrelation zwischen Transkript- und Prolinspiegeln auf, wie von Verbruggen et al. 1993 experimentell bestätigt.
Zusammenfassend möchte ich die Auswirkungen von Parametern auf die Expressionsquantifizierung anhand von RNA-Seq-Daten diskutieren und einen Rahmen für die ASEAnalyse vorschlagen, der zur Quantifizierung der Auswirkungen von regulatorischen
Varianten, Vererbungsmustern, Eltern-Ursprungs-Effekten verwendet und für die Assoziation mit phänotypischen Merkmalen benutzt wurde. | German |
|
Creators: |
Creators | Email | ORCID | ORCID Put Code |
---|
Jeena, Ganga | ganga.jeena@gmail.com | UNSPECIFIED | UNSPECIFIED |
|
Contributors: |
Contribution | Name | Email |
---|
Author | Jeena, Ganga | ganga.jeena@gmail.com | Research team head | Jiménez-Gómez, Dr. José M | jose.jimenez-gomez@inra.fr | Reviewer | Schneeberger, Prof. Dr. Korbinian | k.schneeberger@lmu.de | Scientific advisor | Koornneef, Prof. Dr. ir. Maarten | koornneef@mpipz.mpg.de | Research team member | Srinivasan, Arunkumar | asrini@pm.me | Research team member | Ryngajłło, Małgorzata | malgorzata.ryngajllo@p.lodz.pl |
|
URN: |
urn:nbn:de:hbz:38-528329 |
Date: |
3 August 2021 |
Language: |
English |
Faculty: |
Faculty of Mathematics and Natural Sciences |
Divisions: |
Außeruniversitäre Forschungseinrichtungen > MPI for Plant Breeding Research Key Profile Areas > Key Profile Area V: CEPLAS/Plant Science Faculty of Mathematics and Natural Sciences > Department of Biology > Botanical Institute |
Subjects: |
Life sciences Agriculture |
Uncontrolled Keywords: |
Keywords | Language |
---|
RNA-Seq, ASE, SNP, genomics, transcriptomics, NGS, proline, Arabidopsis, gene expression | English |
|
Date of oral exam: |
3 August 2020 |
Referee: |
Name | Academic Title |
---|
Schneeberger, Korbinian | Prof. Dr. |
|
Funders: |
IMPRS |
Refereed: |
Yes |
URI: |
http://kups.ub.uni-koeln.de/id/eprint/52832 |
Downloads per month over past year
Export
Actions (login required)
|
View Item |