Riedel, Nico (2016). Inference of natural selection on quantitative traits. PhD thesis, Universität zu Köln.

[img]
Preview
PDF
Dissertation_Druckversion_Doppelseitig.pdf - Published Version

Download (2MB)

Abstract

The concept of evolution, which was introduced by Charles Darwin in 1859, and also its mathematical description by the theory of population genetics are well-established. Population genetics describes the development of a population under the influence of mutations, creating new genetic variants, and natural selection, increasing the frequency of favorable phenotypes. Yet, the experimental verification of selective forces acting on species has proven difficult. With new experimental techniques that have been established in the field of quantitative genetics, like the sequencing of DNA or measurements of gene expression levels, it has become possible to find signs of natural selection on the level of the genome. In this thesis, I develop a statistical test based on population genetics theory that can infer lineage-specific differences in selection between multiple lines of a species. The test employs data from quantitative trait experiments and uses a log-likelihood scoring to quantify the evidence for different selective scenarios. I show that the use of multiple lines increases both the power and the scope of selection inference. Extensive numerical simulations demonstrate that the test can distinguish selection from neutral evolution as well as different scenarios of lineage-specific evolution. The principle of maximum entropy is used to derive a modified version of the selection test that accounts for the multiple testing problem arising when many traits are tested for selection at the same time. The developed test is applied to two published plant datasets and a published dataset of gene expression levels in three yeast lines. In all cases, I find signs of selection not seen with a two-line test. For the yeast dataset I find pervasive adaptation linked to stress resistance both on the level of individual genes as well as for larger gene modules consisting of several genes, like protein complexes and pathways. This adaptation signal is also reflected on the protein levels.

Item Type: Thesis (PhD thesis)
Translated abstract:
AbstractLanguage
Sowohl das Konzept der Evolution, welches 1859 von Charles Darwin eingeführt wurde, als auch die mathematische Beschreibung durch die Populationsgenetik sind seit langem etabliert. Die Populationsgenetik beschreibt die Entwicklung einer Population unter dem Einfluss von Mutationen, welche neue genetische Varianten erzeugen, und der natürlichen Selektion, welche die Häufigkeit der günstigen Phenotypen erhöht. Jedoch hat es sich als schwierig erwiesen, diese selektiven Kräfte experimentell nachzuweisen. Neue experimentelle Techniken die sich im Feld der quantitativen Genetik etabliert haben, wie das Sequenzieren der DNA oder der Messung von Genexpressionsleveln, haben es ermöglicht, Spuren der natürlichen Selektion auf dem Level des Genoms nachzuweisen. In dieser Dissertation entwickle ich einen statistischen Test welcher auf der Theorie der Populationsgenetik basiert und mit welchem man linienspezifische Unterschiede in der Selektion zwischen verschiedenen Linien einer Spezies nachweisen kann. Dieser Test verwendet Resultate von Experimenten über quantitative Merkmale und verwendet einen Log-Likelihood-Quotienten um die Evidenz für verschiedene selektive Szenarien zu quantifizieren. Ich weise nach, dass die Verwendung von mehreren Linien sowohl die Leistungsfähigkeit als auch den Anwendungsbereich des Selektionstests vergrößert. Umfangreiche numerische Simulationen zeigen, dass der Test zwischen Selektion und neutraler Evolution als auch zwischen verschiedenen linienspezifischen Evolutionsszenarien unterscheiden kann. Das Prinzip der maximalen Entropie wird verwendet um eine modifizierte Version des Selektionstests herzuleiten, welche das multiple Testproblem berücksichtigt, welches auftritt, wenn viele Merkmale gleichzeitig auf Selektion getestet werden. Der entwickelte Test wird auf zwei publizierte Pflanzendatensätze sowie einen publizierten Datensatz zu Genexpressionsleveln in drei Hefelinien angewandt. In allen Fällen finde ich Hinweise für Selektion, welche nicht durch einen Zwei-Linien-Test entdeckt werden. Für den Hefedatensatz finde ich weit verbreitete selektive Anpassung die mit Stressresistenz verbunden ist, sowohl auf dem Level einzelner Gene als auch für größere Genmodule, die aus mehreren Genen bestehen, wie zum Beispiel Proteinkomplexen. Diese Adaption kann auch für die Proteinlevel nachgewiesen werden.German
Creators:
CreatorsEmailORCIDORCID Put Code
Riedel, Niconriedel@thp.uni-koeln.deUNSPECIFIEDUNSPECIFIED
URN: urn:nbn:de:hbz:38-68637
Date: 9 May 2016
Language: English
Faculty: Faculty of Mathematics and Natural Sciences
Divisions: Faculty of Mathematics and Natural Sciences > Department of Physics > Institute for Theoretical Physics
Subjects: Physics
Life sciences
Uncontrolled Keywords:
KeywordsLanguage
statistical physics, evolution, population genetics, quantitative traits, inference, gene expressionEnglish
Date of oral exam: 28 June 2016
Referee:
NameAcademic Title
Berg, JohannesProf. Dr.
Lässig, MichaelProf. Dr.
Refereed: Yes
URI: http://kups.ub.uni-koeln.de/id/eprint/6863

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item