Universität zu Köln

Genome duplication and alternative splicing: Gateways to functional diversity

Richardson, Dale Newton (2010) Genome duplication and alternative splicing: Gateways to functional diversity. PhD thesis, Universität zu Köln.

[img]
Preview
PDF
Download (13Mb) | Preview

    Abstract

    One of the goals of this dissertation is to understand how two fundamen- tal biological processes, genome duplication and alternative splicing, factor into the regulation of gene expression. Genome duplication and alternative splicing have profound implications on gene regulation, as the controlled expression of duplicated genes affects the evolution of genomes, whereas alternative splicing of regulatory genes has enormous ramifications on the functionality of nearly all expressed genes. Whole genome duplication (WGD) has catalyzed the formation of new species, genes with novel functions, altered expression patterns, complexi- fied signaling pathways and has provided organisms a level of genetic ro- bustness. We studied the long-term evolution and interrelationships of 5� upstream regulatory sequences (URSs), protein coding sequences (CDSs) and expression correlations (EC) of duplicated gene pairs in the model or- ganism, Arabidopsis thaliana. Three distinct methods revealed significant evolutionary conservation between paralogous URSs and were highly cor- related with microarray-based expression correlation of the respective gene pairs. Positional information on exact matches between sequences unveiled the contribution of micro-chromosomal rearrangements on expression diver- gence. A three-way rank analysis of URS similarity, CDS divergence and EC uncovered specific gene functional biases. Transcription factor activity was associated with gene pairs exhibiting conserved URSs and divergent CDSs, whereas a broad array of metabolic enzymes was found to be associated with gene pairs showing diverged URSs but conserved CDSs. Strikingly, the majority of duplicate genes are differentially expressed in magnitude throughout various developmental stages in Arabidopsis, suggesting that often one of the two gene copies is preferred and may hint at a mechanism of sub-functionalization acting at the gene regulatory level. Along with WGD, alternative splicing (AS) of pre-mRNA is a funda- mental molecular process that generates diversity in the transcriptome and proteome of eukaryotic organisms. Multiple factors influence the splicing reaction, such as the length and sequence of exons, introns, the presence and levels of trans-factors and the rate of transcription. SR proteins, a family of splicing regulators with one or two RNA recognition motifs (RRMs) at the N-terminus and an arg/ser-rich at the C-terminus, function in both constitutive and alternative splicing. We performed database searches for SR proteins in 27 eukaryotic species, which included taxa from plants, animals, fungi and basal eukaryotes that lie outside of these lineages. Using RRMs as a phylogenetic marker, we ob- served at least 12 SR protein sub-families, four of which are vastly expanded in plants. Furthermore, RRMs are in highly conserved positions within SR proteins within sub-families, yet their predicted RNA binding residues are degenerate. In line with this finding is our observation that the majority of plant SR genes are under purifying selection. Moreover, the majority of paralogous SR genes in Arabidopsis and rice are divergently expressed in different developmental stages, suggesting that these gene pairs have sub- functionalized at the expression level, reminiscent of the patterns we ob- served in our duplicated genes study. We assessed the extent of SR gene AS by generating splice graphs based on multiple alignments of ESTs/cDNAs to SR genomic sequences. AS of SR genes is a widespread phenomenon throughout multiple lineages and is a common trait among eukaryotes. Fur- thermore, the types of AS vary by organism and by SR sub-family. Lastly, we suggest that there is a link between DNA methylation within coding regions of SR genes and their AS patterns.

    Item Type: Thesis (PhD thesis)
    Translated abstract:
    AbstractLanguage
    Eines der Ziele dieser Dissertation ist es die Rolle zweier fundamentaler bio- logischer Prozesse, die Genomduplikation und das alternative Spleißen, in der Regulation der Genexpression zu verstehen. Die Genomduplikation und das alternative Spleißen haben tiefgreifende Auswirkungen auf die Genregu- lation, wie zum Beispiel dass die kontrollierte Expression duplizierter Gene die Evolution von Genomen beeinflusst, w ̈ahrend das alternative Spleißen regulatorischer Gene enorme Auswirkungen auf die Funktionalit ̈at nahezu aller expressionierten Gene hat. Die Gesamtgenom-Duplikation (WGD) hat die Entstehung neuer Spezies, die Formation von Genen mit neuen Funk- tionen, oder auch die Modifizierung von Expressionsmustern beschleunigt und Organismen eine Form genetischer Robustheit verliehen. Wir haben die Langzeit-Evolution und das Zusammenspiel von 5� �up- stream� regulatorischen Sequenzen (URSs), Protein-kodierenden Sequen- zen (CDSs) und Expressionskorrelationen (EC) von duplizierten Gen- Paaren im Modellorganismus Arabidopsis thaliana untersucht. Drei ver- schiedene Methoden haben eine signifikante evolution ̈are Konservierung zwischen paralogen URSs verdeutlicht und waren mit Microarray-basierten Expressions-korrelationen der betreffenden Gen-Paare hoch korreliert. Die positionale Information von genauen zwischensequenzlichen U ̈bereinstim- mungen hat den Beitrag mikro-chromosomaler Neuordnungen fu ̈r die Expressionsdivergenz demonstriert. Eine Drei-Wege Ranganalyse der URS-Similarit ̈at, der CDS-Divergenz und der EC haben spezifische Gen- funktionale Ver-zerrungen aufgezeigt. Transkriptionsfaktoraktivit ̈at wurde mit Gen-Paaren, die konservierte URSs und divergente CDSs aufweisen, assoziiert, w ̈ahrend eine große Anzahl metabolischer Enzyme mit Gen- Paaren, die sich durch divergente URSs und konservierte CDSs auszeich- nen, in Verbindung gebracht werden konnten. Bemerkenswerterweise wird die Mehrheit an duplizierten Genen in den verschiedenen Entwicklungssta- dien von Arabidopsis thaliana unterschiedlich expressioniert, was darauf hindeutet, dass oft eine der beiden Genkopien bevorzugt wird, und dass der Mechansimus der Subfunktionalisierung fu ̈r die Genregulierung eine Rolle spielen k ̈onnte. Zusammen mit der WGD ist das alternative Spleißen (AS) der pre- mRNA ein fundamentaler molekularer Prozess, der genetische Diversit ̈at im Transkriptom und Proteom verursacht. Zahlreiche Komponenten, wie L ̈ange und Sequenz der Exons und Introns, Trans-Faktoren und Transkrip- tionsraten, beeinflussen die Spleißreaktion. SR-Proteine, eine Familie von Spleiß-Regulatoren mit einem oder zwei RNA-Erkennungsmotiven (RRMs) am N-Terminus und einem �arg/ser-rich� am C-Terminus, wirken sowohl beim konstitutiven als auch beim alternativen Spleißen. Wir haben Datenbanksuchen fu ̈r SR-Proteine 27 eukaryotischer Spezies durchgefu ̈hrt, die die Taxone der Pflanzen, Tiere, Fungis und basalen Eukaryonten, die außerhalb dieser Abstammungslinien liegen, umfasst. Mithilfe von RRMs als phylogenetische Marker haben wir mindestens 12 SR-Protein-Subfamilien feststellen k ̈onnen, von denen vier in Pflanzen weit verbreitet sind. Zudem befinden sich RRMs innerhalb der Subfamilien von SR-Proteinen an hoch konservierten Positionen, jedoch sind ihre vorherge- sagten RNA-Bindungsresiduen degeneriert. Damit einhergehend stellten wir fest, dass die Mehrheit pflanzlicher SR Gene unter purifizierender Se- lektion steht. Daru ̈berhinaus ist die Mehrheit an paralogen SR-Genen in Arabidopsis und Reis in den diversen Entwicklungsstadien unterschiedlich expressioniert, was mit unserer Beobachtung bezu ̈glich duplizierter Gene im Einklang steht. Wir haben das Ausmaß an SR-Gen betreffendes AS unter der Verwendung von Spleiß-Graphen, die auf multiple �alignments� von ESTs/cDNAs und SR-genomischen Sequenzen beruhen, abgesch ̈atzt. Das AS von SR-Genen ist ein weit verbreitetes Ph ̈anomen u ̈ber zahlreiche Abstammungslinien und ein h ̈aufiges Merkmal unter Eukaryonten. Zu- dem variiert die Art der Ausfu ̈hrung des AS unter Organismen und SR- Subfamilien. Abschließend suggerieren wir einen Zusammenhang zwischen der DNA-Methylation innerhalb kodierender Regionen von SR-Genen und deren Spleißmuster.German
    Creators:
    CreatorsEmail
    Richardson, Dale Newtondalesan@gmail.com
    URN: urn:nbn:de:hbz:38-32527
    Subjects: Life sciences
    Uncontrolled Keywords:
    KeywordsLanguage
    alternative splicing, genome duplication, evolutionEnglish
    Faculty: Mathematisch-Naturwissenschaftliche Fakultät
    Divisions: Mathematisch-Naturwissenschaftliche Fakultät > Institut für Genetik
    Language: English
    Date: 2010
    Date Type: Completion
    Date of oral exam: 28 November 2010
    Full Text Status: Public
    Date Deposited: 29 Dec 2010 14:22:38
    Referee
    NameAcademic Title
    Wiehe, ThomasProf. Dr.
    URI: http://kups.ub.uni-koeln.de/id/eprint/3252

    Actions (login required)

    View Item