Jeena, Ganga (2021). A bioinformatics approach to quantify the effects of the underlying regulatory mechanisms on natural variation in gene expression by allele-specific expression analysis in Arabidopsis thaliana accessions using RNA-Seq Data. PhD thesis, Universität zu Köln.

[img]
Preview
PDF
Ganga_Jeena_PhDThesis.pdf

Download (21MB) | Preview

Abstract

Natural variation in gene expression plays a crucial role in evolution, natural selection and improved response to environmental cues. Expression divergence may be caused by localised polymorphisms within the gene or regulatory regions (cis) or induced by differences in regulatory factors (trans). The relative contribution of cis- and trans-regulatory variants can be quantified by genome-wide analysis of Allele-specific expression (ASE) with few F1 samples, unlike the conventional eQTL mapping methods. Differential allelic expression patterns between reciprocal crosses reflect the effect of parent-of-origin and genomic imprinting, while deviation in gene expression of hybrids from parentals reflects heterosis events. This project aims to define an optimal methodology for ASE analysis using RNA-seq data to quantify the effects of cis- and trans-regulatory variants on gene expression differences. To develop this protocol, we used simulated and sequenced RNA-Seq data from leaf tissue in three biological replicates of Arabidopsis thaliana accessions Cape Verde Island (Cvi), Landsberg erecta (Ler), and in their reciprocal hybrids (Cvi x Ler, Ler x Cvi). Factors like the genome of reference, gene region, frequency and location of SNPs, are crucial in expression quantification from mapped reads and were considered to determine a benchmarking criteria for the pipeline. The ASE pipeline was used to perform analysis of RNA-Seq from six accessions of Arabidopsis thaliana namely An-1, Bor-4, Bur-0, Knox-10, Sha and Ler from varying geographical locations and their reciprocal crosses with Ler. The allelic ratio within F1 hybrids was compared to the parental ratio to quantify the regulatory effects of cis, trans, cis x trans and compensatory. Approximately 46% of genes with atleast one diagnostic SNP could be analysed for expression profiles. Nearly 1200 genes showed significant differential expression in parentals. Only genes with similar expression measure over exons and SNPs were analysed for allelic divergence in hybrids. ASE analysis could determine nearly 575 genes with different patterns of regulated expression variation. Of these ∼55% were regulated by cis-, ∼39% by trans-effects, ∼5% by compensatory and over less than 1% show cis x trans effect. Relative levels of regulatory effects were similar across all hybrids. Interestingly, cis-regulated patterns were found to be prominent and conserved across multiple crosses. Most trans-effects were unique to crosses and thus explained more diversity. The cis-effects exhibit large expression divergence compared to trans-effects. Parent-of-origin effects was assessed for genes with statistically significant allelic bias (cis-effects) by comparing the allelic ratio of reciprocal hybrids. Majority of allele-biased genes (∼79%) were common between pairs of reciprocal hybrids and showed similar magnitude and direction of allelic variation. Only ∼9% and ∼12% genes reflected parental-effect with preferential paternal and maternal expressed alleles respectively. Furthermore, gene expression of hybrids and parentals were compared to find heterosis events like overdominance, dominance, and additive effects. Preliminary analysis of expression inheritance patterns revealed that Overdominance are extremely rare events (∼1% ), majority of which are regulated by trans-effects. Primary Metabolite profiling using GC/MS identified and measured relative levels of 37 metabolites across the six accessions and ten reciprocal hybrids. Proline levels were seen to exhibit maximum diversity. Proline biosynthesis genes were tested for association with proline levels variation. AtP5C1 Pyrroline-5-carboxylate (P5C) reductase, which plays a crucial role in proline synthesis, exhibit a strong correlation of transcript and proline levels, as experimentally validated by Verbruggen et al. in 1993. In conclusion, I provide evidence to discuss the effects of parameters on expression quantification from RNA-Seq data, and suggest a framework for ASE analysis. I further used the optimised strategy to quantify effects of regulatory variants, inheritance patterns, parent-of-origin effects and assess association with phenotypic traits.

Item Type: Thesis (PhD thesis)
Translated title:
TitleLanguage
Ein bioinformatischer Ansatz zur Quantifizierung der Auswirkungen der zugrunde liegenden Regulationsmechanismen auf die natürliche Variation der Genexpression durch allelspezifische Expressionsanalyse in Arabidopsis thaliana-Akzessionen unter Verwendung von RNA-Seq DataGerman
आरएनए-सेक डेटा का उपयोग करके अरबिडोप्सिस थालियाना परिग्रहणों में एलील-विशिष्ट अभिव्यक्ति विश्लेषण द्वारा जीन अभिव्यक्ति में प्राकृतिक भिन्नता पर अंतर्निहित नियामक तंत्र के प्रभावों को निर्धारित करने के लिए एक जैव सूचना विज्ञान दृष्टिकोणHindi
Translated abstract:
AbstractLanguage
Die natürliche Variation der Genexpression spielt eine entscheidende Rolle für die Evolution, die natürliche Selektion und die verbesserte Reaktion auf Umweltsignale. Eine Expressionsveränderung kann durch einzelne Polymorphismen innerhalb eines Gens oder der regulatorischen Regionen (cis) oder durch Unterschiede in den regulatorischen Faktoren (trans) verursacht werden. Der relative Beitrag von cis- und transregulatorischen Varianten kann im Gegensatz zu den herkömmlichen eQTL-Kartierungsmethoden durch genomweite Analyse der allelspezifischen Expression (ASE) mit wenigen F1-Proben quantifiziert werden. Differenzielle, allelische Expressionsmuster zwischen reziproken Kreuzungen spiegeln den Effekt des Ursprungselternteils und des genomischen Abdrucks wider, während Abweichungen in der Genexpression von Hybriden von Elternteilen Heterose-Ereignisse widerspiegeln. Diese Doktorarbeit zielte darauf ab, eine optimale Methodik für die ASE-Analyse unter Verwendung von RNA-seq-Daten zu definieren, um die Auswirkungen von cis- und transregulatorischen Varianten auf Unterschiede in der Genexpression zu quantifizieren. Um dieses Protokoll zu entwickeln, verwendeten wir simulierte und sequenzierte RNASeq-Daten aus Blattgewebe von drei biologischen Replikaten von Arabidopsis thalianaAkzessionen und von ihren reziproken Hybriden. Faktoren wie das Referenzgenom, die Genregion, die Häufigkeit und die Position von SNPs sind für die Expressionsquantifizierung anhand von alignierten Reads von entscheidender Bedeutung und wurden zur Bestimmung eines Benchmarking-Kriteriums für die Pipeline herangezogen. Die ASE-Pipeline wurde weiter verwendet, um die RNA-Seq von sechs Akzessionen von Arabidopsis thaliana, nämlich An-1, Bor-4, Bur-0, Knox-10, Sha und Ler, von verschiedenen geografischen Orten und deren wechselseitigen Kreuzungen mit Ler zu analysieren. Das Allelverhältnis innerhalb von F1-Hybriden wurde mit dem Elternverhältnis verglichen, um die regulatorischen Wirkungen von cis, trans, cis x trans und kompensatorisch zu quantifizieren. Ungefähr 46% der Gene mit mindestens einem diagnostischen SNP konnten auf Expressionsprofile analysiert werden. Nahezu 1200 Gene zeigten eine signifikante unterschiedliche Expression bei den Eltern. Nur Gene mit einem ähnlichen Expressionsmaß über Exons und SNPs wurden auf allelische Divergenz in Hybriden analysiert. Die ASE-Analyse konnte fast 575 Gene mit unterschiedlichen Mustern regulierter Expressionsvariation bestimmen. Davon entfielen 55% auf cis-, 39% auf transEffekte, 5% auf kompensatorische Effekte und mehr als 1% auf cis x trans. Das relative Ausmaß regulatorischer Effekte war bei allen Hybriden ähnlich. Interessanterweise wurde festgestellt, dass cis-regulierte Muster über mehrere Kreuze hinweg auffällig und konserviert sind. Die Mehrzahl der Trans-Effekte war für Kreuze einzigartig und erklärte somit mehr Vielfalt. Die cis-Effekte zeigen im Vergleich zu TransEffekten eine große Expressionsdivergenz. Der Parent-of-Origin-Effekt wurde für Gene mit statistisch signifikanter allelischer Verzerrung (cis-Effekte) durch Vergleich des Allelverhältnisses von reziproken Hybriden bewertet. Die Mehrheit der allelabhängigen Gene (79%) war zwischen Paaren reziproker Hybride gemeinsam und zeigte eine ähnliche Größe und Richtung der allelischen Variation. Nur ∼9% und ∼12% der Gene spiegelten den elterlichen Effekt mit bevorzugten väterlichen bzw. mütterlich exprimierten Allelen wider. Darüber hinaus wurde die Gene expression von Hybriden und Eltern verglichen, um Heteroseereignisse zu finden, d. H. überdominanz, Dominanz und additive Effekte. Eine vorläufige Analyse der Expressionsvererbungsmuster ergab, dass überdominanz extrem seltene Ereignisse (∼1%) sind, von denen die meisten durch Trans-Effekte reguliert werden. Primäres Metaboliten-Profiling unter Verwendung von GC/MS identifizierte und maß relative 37 Metaboliten über die sechs Akzessionen und zehn reziproken Hybriden. Prolinspiegel hatten die größten Unterschiede in den Samples. Prolin-Biosynthesegene wurden auf ihre Assoziation mit der Variation des Prolinspiegels getestet. AtP5C1-Pyrrolin-5- carboxylat (P5C) Reduktase, die eine entscheidende Rolle bei der Prolinsynthese spielt, weist eine starke Korrelation zwischen Transkript- und Prolinspiegeln auf, wie von Verbruggen et al. 1993 experimentell bestätigt. Zusammenfassend möchte ich die Auswirkungen von Parametern auf die Expressionsquantifizierung anhand von RNA-Seq-Daten diskutieren und einen Rahmen für die ASEAnalyse vorschlagen, der zur Quantifizierung der Auswirkungen von regulatorischen Varianten, Vererbungsmustern, Eltern-Ursprungs-Effekten verwendet und für die Assoziation mit phänotypischen Merkmalen benutzt wurde.German
Creators:
CreatorsEmailORCIDORCID Put Code
Jeena, Gangaganga.jeena@gmail.comUNSPECIFIEDUNSPECIFIED
Contributors:
ContributionNameEmail
AuthorJeena, Gangaganga.jeena@gmail.com
Research team headJiménez-Gómez, Dr. José Mjose.jimenez-gomez@inra.fr
ReviewerSchneeberger, Prof. Dr. Korbiniank.schneeberger@lmu.de
Scientific advisorKoornneef, Prof. Dr. ir. Maartenkoornneef@mpipz.mpg.de
Research team memberSrinivasan, Arunkumarasrini@pm.me
Research team memberRyngajłło, Małgorzatamalgorzata.ryngajllo@p.lodz.pl
URN: urn:nbn:de:hbz:38-528329
Date: 3 August 2021
Language: English
Faculty: Faculty of Mathematics and Natural Sciences
Divisions: Außeruniversitäre Forschungseinrichtungen > MPI for Plant Breeding Research
Key Profile Areas > Key Profile Area V: CEPLAS/Plant Science
Faculty of Mathematics and Natural Sciences > Department of Biology > Botanical Institute
Subjects: Life sciences
Agriculture
Uncontrolled Keywords:
KeywordsLanguage
RNA-Seq, ASE, SNP, genomics, transcriptomics, NGS, proline, Arabidopsis, gene expressionEnglish
Date of oral exam: 3 August 2020
Referee:
NameAcademic Title
Schneeberger, KorbinianProf. Dr.
Funders: IMPRS
Refereed: Yes
URI: http://kups.ub.uni-koeln.de/id/eprint/52832

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item