Universität zu Köln

Evolution of regulatory complexes: a many-body system

Nour Mohammad, Armita (2012) Evolution of regulatory complexes: a many-body system. PhD thesis, Universität zu Köln.

This is the latest version of this item.

[img]
Preview
PDF - Published Version
Download (4Mb) | Preview

    Abstract

    The recent advent of large-scale genomic sequence data and improvement of sequencing technologies has enabled population genetics to advance from a mostly abstract theoretical basis to a quantitative molecular description. However, functional units in DNA are typically combinations of interacting nucleotide segments, and evolutionary forces acting on these segments can result in very complicated population dynamics. The goal is to formulate these interactions in such a way that the macroscopic features are independent of the microscopic details, as in statistical mechanics. In this thesis, I discuss the evolutionary dynamics of regulatory sequences, which control the production of protein in cells. One of the primary forms of regulation occurs through interactions of proteins called transcription factors, with binding sites in the DNA sequence, and the strength of these interactions influence the individual's fitness in the population. What makes this an ideal model system for quantitative analysis of genomic evolution, is the possibility of inferring this relationship. Compared to prokaryotes and yeast, gene regulation is much more complex in higher eukaryotes. Regulatory information is organized in modules with multiple binding sites that are linked to a common function. In Chapter. 2, we show that binding site complexes are commonly formed by local sequence duplications, as opposed to forming from scratch by single point mutations. We also show that the underlying regulatory grammar is in tune with this mechanism such that the duplication events confer an adaptive advantage. Regulatory complexes resemble a many-particle system whose function emerges from the collective dynamics of its elements. In Chapter. 3, we develop a thermodynamic framework to characterize the effective affinity of site complexes to multiple transcription factors with cooperative binding. These affinities are the phenotype, or trait of binding complexes on which selection acts, and we characterize their evolution. From the yeast genome polymorphism data, we infer a fitness landscape as a function of binding affinity by using the novel method developed in Chapter.~ 4. This method of quantitative trait analysis can deal with long-range correlations between sites which arise in asexual populations. Our fitness landscape quantitatively predicts the amount of conservation of the phenotype, as well as the amount of compensatory changes between sites. Our results open a new avenue to understand the regulatory "grammar" of eukaryotic genomes based on quantitative evolution models. They prove that a combination of theoretical models, high-throughput experimental measurements, and analysis of genomic variation is necessary for a proper quantitative understanding of biological systems.

    Item Type: Thesis (PhD thesis)
    Translated abstract:
    AbstractLanguage
    Die seit kurzem bestehende Verfügbarkeit riesiger genomischer Datenmengen und die Verbesserung von Technologien zur Sequenzierung eines Genoms ermöglichen es, dass die Populationsgenetik sich von zumeist abstrakt-theoretischen Grundlagen hin zu einer quantitativen Molekültheorie weiterentwickelt. Funktionseinheiten in der DNA sind jedoch normalerweise Kombinationen aus interagierenden Nukleotidsegmenten und die evolutionären Kräfte, die sich auf diese Segmente auswirken, können zu sehr komplizierten Populationsdynamiken führen. Es ist das Ziel, diese Interaktionen so zu beschreiben, dass die makroskopischen Eigenschaften unabhängig von den mikroskopischen Details dargestellt werden, wie in der statistischen Mechanik. In dieser Doktorarbeit beschäftige ich mich mit der Evolutionsdynamik von regulierenden Sequenzen, die die Produktion von Proteinen in den Zellen steuern. Eine der wichtigsten Regulationsarten tritt durch das Zusammenspiel von Proteinen, die Transkriptionsfaktoren genannt werden, mit Bindungsstellen in der DNA-Sequenz auf. Die Stärke dieser Interaktionen beeinflusst die Fitness des Individuums in der Population. Da man diesen Zusammenhang herleiten kann, ist dies ein ideales Modellsystem für die quantitative Analyse von genetischer Evolution. Verglichen mit Prokaryoten und Hefe ist die genetische Regulation bei höheren Eukaryoten viel komplexer. Die Informationen für die Regulation sind in Module mit mehreren Bindungsstellen aufgeteilt, die mit einer gemeinsamen Funktion in Zusammenhang stehen. In Kapitel. 2 zeigen wir, dass die Bildung von Bindungsstellenkomplexen üblicherweise durch lokale Sequenzduplikationen geschieht und nicht aus dem Nichts durch einzelne Punktmutationen entsteht. Weiterhin zeigen wir, dass die zugrunde liegende regulatorische "Grammatik" mit diesem Mechanismus in Einklang steht, sodass die Duplikationen einen Anpassungsvorteil bedeuten. Regulatorische Komplexe ähneln einem Vielteilchensystem, dessen Funktion sich aus den kollektiven Dynamiken seiner Elemente herausbildet. In Kapitel. 3 entwickeln wir ein thermodynamisches Modell um die tatsächliche Affinität von Bindungsstellenkomplexen zu mehreren Transkriptionsfaktoren mit zusammenwirkender Bindung zu charakterisieren. Diese Affinitäten sind der Phänotyp oder das Merkmal eines Bindungskomplexes, auf den Selektion einwirkt, und wir charakterisieren ihre Evolution. Aus den Polymorphismusdaten des Hefegens leiten wir eine "Fitness-Landschaft" anhand des Verhältnisses von Fitness zu Bindungswahrscheinlichkeit ab unter Verwendung der neuartigen Methode, die in Kapitel. 4 entwickelt wird. Durch diese Methode der quantitativen Merkmalsanalyse können langfristige Korrelationen zwischen Bindungsstellen, wie sie in asexuellen Populationen auftreten, verarbeitet werden. Mit unserer ``Fitness-Landschaft" treffen wir quantitative Voraussagen zur erhaltenen Phänotyp-Menge, sowie zur Menge der ausgleichenden Veränderungen zwischen den Bindungsstellen. Unsere Ergebnisse weisen einen neuen Weg hin zum Verständnis der regulatorischen "Grammatik" des eukaryotischen Genoms basierend auf quantitativen Evolutonsmodellen. Sie beweisen, dass eine Kombination von theoretischen Modellen, experimentellen Hochdurchsatzmessungen und die Analyse von genetischen Variationen für das richtige quantitative Verständnis von biologischen Systemen notwendig ist.German
    Creators:
    CreatorsEmail
    Nour Mohammad, Armitaarmita.nourmohammad@gmail.com
    URN: urn:nbn:de:hbz:38-48269
    Subjects: Natural sciences and mathematics
    Physics
    Uncontrolled Keywords:
    KeywordsLanguage
    Physics, Statistical physics, Population genetics, Biophysics, Evolutionary biology, Transcription factors, Quantitative traitsEnglish
    Faculty: Mathematisch-Naturwissenschaftliche Fakultät
    Divisions: Mathematisch-Naturwissenschaftliche Fakultät
    Language: English
    Date: 13 February 2012
    Date Type: Publication
    Date of oral exam: 12 April 2012
    Full Text Status: Public
    Date Deposited: 14 Aug 2012 10:26:43
    Referee
    NameAcademic Title
    Laessig, MichaelProf. Dr.
    Krug, JoachimProf. Dr.
    Kreitman, MartinProf. Dr.
    URI: http://kups.ub.uni-koeln.de/id/eprint/4826

    Available Versions of this Item

    • Evolution of regulatory complexes: a many-body system. (deposited 14 Aug 2012 10:26:43)[Currently Displayed]

    Actions (login required)

    View Item