Parthiban, Vijayarangakannan
(2006).
Prediction of Factors Determining Changes in Stability in Protein Mutants.
PhD thesis, Universität zu Köln.
Abstract
Analysing the factors behind protein stability is a key research topic in molecular biology and has direct implications on protein structure prediction and protein-protein docking solutions. Protein stability upon point mutations were analysed using a distance dependant pair potential representing mainly through-space interactions and torsion angle potential representing neighbouring effects as a basic statistical mechanical setup for the analysis. The synergetic effect of accessible surface area and secondary structure preferences was used as a classifier for the potentials. Various principles underlying the protein structure description must also be studied carefully to efficiently understand the relationships between sequence, structure and function. Mean force potentials from atom interactions and main torsion angles were used by different investigators to evaluate the protein structure, stability and protein-protein interactions. In recent experiments, these were also used in the prediction of protein function and enzyme catalysis. Five different atom classification models with interactions in different distance ranges were selected to check their ability to effectively describe the protein environment. Furthermore, torsion angle potentials were also derived in addition to atom potentials so that orientational information of amino acids can be included to the model. The five atom classification models that are used for atom potentials include the following: a basic five (basic5) atom model (C aliphatic, C aromatic, H, O, N), amino acid C[alpha]atoms (C[alpha]20), Li-Nussinov atom model (LN24), SATIS model (SA28) and Melo and Feytmans atom model (MF40). Carbon atoms with aromatic and aliphatic nature exhibit significantly different chemical and functional behaviour and they were considered separately in the basic5 atom model with N, O and S. Li and Nussinov defined 24 different amino acid atom types using the polarity and hydrophobicity of atoms. Similarly, SATIS is also a protocol for the definition and automatic assignment of atom types and the classification of atoms. The free energy values (ddG and ddGH2O values from thermal and chemical denaturation) of unfolding from point mutation experiments were used as an experimental measure of protein stability. In future, this method can also be extended to evaluate other structure descriptors. It has already been reported that the measured free energy changes between wild type and mutant proteins can be predicted using statistical potentials. But, these models lack good prediction efficiency and reliability to predict protein mutant stability in future. A dataset of 4024 non-redundant structures was used to derive the atom interactions and torsion angles phi and psi, after running DSSP for the whole dataset. For torsion potentials, the bins were normalised with a standard procedure using the circular Gaussian function for phi and psi having the bivariate normal distribution. Results were validated based on the correlation observed between the experimental ddG and predicted ddG values. Prediction accuracy of being correctly predicted as stabilising or destabilising was also observed. Results show that the Melo and Feytmens atom model predicts the protein stability to a maximum extent, since it showed a correlation coefficient of 0.85 with 85.31% of 1536 mutations correctly predicted to be either stabilising or destabilising. SA28, LN24, C[alpha]20 and basic5 atom models showed a correlation coefficient of 0.82, 0.78, 0.76 and 0.55 respectively. Later, statistical stepwise regression methods were used to optimise the number of atoms used for the model. Effect of torsion angle potentials with and without the Gaussian apodisation was compared. This shows that the amino acids adapt perturbed torsion angle conformations in partially buried beta sheets than the other structural elements. For the final prediction model, two datasets of point mutations were taken for the comparison of theoretically predicted stabilising energy values with experimental ddG and ddGH2O from thermal and chemical denaturation experiments respectively. These include 1538 and 1581 mutations respectively and contain 101 proteins that share wide range of sequence identity. Results were carefully evaluated with a wide range of statistical tests. Results show a maximum correlation of 0.87 between predicted and experimental ddG values and a prediction accuracy of 85.3% (stabilising or destabilising) for all mutations together. A correlation of 0.77 each for the test dataset of split-sample validation and k-fold cross validation tests was obtained and a correlation of 0.70 was shown by the jack-knife test. A similar model was implemented and the results were analysed for mutations with ddGH2O. A correlation of 0.79 was observed with a prediction efficiency of 85.03%. A web tool has been developed to use this prediction model (www.biotool.uni-koeln.de).
Item Type: |
Thesis
(PhD thesis)
|
Translated title: |
Title | Language |
---|
Vorhersage von Einflussfaktoren auf die Änderung der Stabilität von Proteinmutanten | German | Prediction of Factors Determining Changes in Stability in Protein Mutants | English |
|
Translated abstract: |
Abstract | Language |
---|
Die Analyse der für die Stabilität von Proteinen zuständigen Faktoren stellt einen der Schlüsselbereiche der molekularbiologischen Forschung dar und bringt direkte Implikationen für die Strukturvorhersage von Proteinen und Protein-Protein Docking mit sich. Es wurde die Stabilität von Proteinen nach Punktmutationen mittels eines abstandsabhängigen paarweisen Potentials bestehend aus räumlichen Interaktionstermen sowie eines Torsionswinkelpotentials basierend auf Nachbareffekten als Grundlage der statistischen Mechanik analysiert. Der synergetische Effekt von lösungsmittelzugänglicher Oberfläche und präferierter Sekundärstruktur wurde verwendet, um die entstandenen Potentiale zu klassifizieren. Es wurden 5 verschiedene Atommodelle selektiert mit jeweils verschiedenen Abstandsmassen zur Berechnung der Interaktionen und diese hinsichtlich der Eignung zur Beschreibung der Proteinumgebung verglichen. Weiterhin wurden die Torsionspotentiale zusammen mit den Atom-Atom-Potentialen so optimiert, dass gerichtete Information über die einzelnen Aminosäuren in das Modell mit eingefügt werden können. Folgende 5 atomare Klassifikationssysteme wurden benutzt: Ein einfaches 5-Atom (basic-5) Modell (C aliphatisch, C aromatisch, H, O, N), Aminosäure C[alpha]-Atome (C[alpha]20), Li-Nussinov Atommodell (LN24), SATIS Modell (SA28) und das Atommodell von Melo und Feytmanns (MF40). Ursprünglich wurden die Werte der freien Energie (ddG) des Entfaltens von Punktmutionen als experimentelles Mass für eine energetische Beschreibung des Proteins verwendet. Dies kann jetzt durch eine Evaluierung gegen artifizielle konformationen erweitert werden. Bereits zuvor wurden die gemessenen Unterschiede der freien Energie zwischen Wildtyp und Mutanten benutzt, um die Vorhersagegenauigkeit von wissensbasierten Potentialen zu bewerten. Ein Datensatz von 4024 nicht-redundanten Strukturen wurde hier benutzt, um die atomaren Interaktionsabstände sowie die Torsionswinkel phi und psi abzuleiten. Zuvor wurde das Programm DSSP auf alle Strukturen des Datensatzes angewendet von die Zuordnung zu den Sekundärstrukturelementen zu ermöglichen. Bevor mit der Entwicklung des Torsionspotentials begonnen werden konnte, wurden gleichförmige sogenannte 'Bins' angelegt und diese mit einem konstanten Wert initialisiert, um Nullwerte bei der Berechnung von Boltzmann-Energien zu vermeiden. Danach wurden diese Bins normalisiert über eine zirkuläre Gaussfunktion für psi und eine bivariate Normalverteilung für psi. Die Ergebnisse wurden anhand der Korrelation zwischen den beobachteten experimentellen ddG und den vorhergesagten ddG validiert. Die Vorhersagegenauigkeit für korrekte Vorhersagen der Form 'stabilisierend' oder 'destabilisierend' wurde ebenfalls herangezogen. Die Resultate zeigen, dass das Atommodell von Melo und Feytmanns die strukturellen Parameter am besten wiedergibt, da ein Korrelationskoeffizient von 0,85 erreicht wird, wobei 85,31% von 1536 Mutanten korrekt vorhergesagt werden bezüglich ihrer stabilisierenden oder destabilisierenden Wirkung. SA28, LN24, C[alpha]20 und basic5 Atommodelle ziegen Korrelationen von 0,82, 0,78, 0,76, und 0,55. In einem späteren Schritt wurden statistische schrittweise Regressionsmethoden benutzt, um die Anzahl der innerhalb eines Modells verwerdeten Atomtypen zu optimieren. Für das finale Vorhersagemodell wurden zwei Datensätze von Punktmutationen zum Vergleich von theoretisch vorhergesagten stabilisierenden Energiewerten mit experimentell bestimmten ddG und ddGH2O aus thermalen und chemischen Denaturationsexperimenten herangezogen. Diese beinhalten 1538 und 1581 Mutationen und stammen von 101 Proteinen, die eine grosse Spanne von Sequenzidentitäten untereinander einnehmen. Die resultierenden Kraftfelder wurden genauestens evaluiert mittels einer grossen Anzahl von statistischen Tests. Die Resultate ergeben eine maximale Korrelation von 0,87 zwischen vorhergesagten und gemessenen ddG Werten und eine Vorhersagegenauigkeit von 85,3% bezüglich der Klassifizierung einer Mutation als stabilisierend oder destabilisierend für den gesamten Datensatz. Ein Korrelationswert von 0,77 wurde sowohl für die Testdatensätze einer split-sample Validierung als eine k-fachen Crossvalidierung erreicht, während ein Jack-Knife Test eine Korrelation von 0,70 ergab. Obige Prozedur wurde ebenfalls für den Vergelich der theoretisch vorhergesagten Werte mit den experimentell bestimmten Werten für ddGH2O durchgeführt. Es ergaben sich Korrelationswerte von 0.79 sowie eine Vorhersagegenauigkeit von 85.03%. Dieses Modell kann für die zukünftige Vorhersage von struktureller Stabilität in Proteinen in Ergänzung zu experimentellen Methoden verwendet werden. Ein neues Web-Tool befindet sich in der Entwicklung welches Teile des beschriebenen Algorithmus enthält. (unter www.biotool.uni-koeln.de). | German |
|
Creators: |
Creators | Email | ORCID | ORCID Put Code |
---|
Parthiban, Vijayarangakannan | parthi@uni-koeln.de | UNSPECIFIED | UNSPECIFIED |
|
URN: |
urn:nbn:de:hbz:38-16569 |
Date: |
2006 |
Language: |
English |
Faculty: |
Faculty of Mathematics and Natural Sciences |
Divisions: |
Faculty of Mathematics and Natural Sciences > Department of Chemistry > Institute of Biochemistry |
Subjects: |
Life sciences |
Uncontrolled Keywords: |
Keywords | Language |
---|
Proteinthermostabilitaet, Statistisches Potential, Torsionswinkelpotential, Punktmutation, Proteinstabilitaetsvorhersage | German | Protein thermostability, statistical potentials, torsion angle potential, point mutation, protein stability prediction | English |
|
Date of oral exam: |
12 January 2006 |
Referee: |
Name | Academic Title |
---|
Schomburg, Dietmar | Prof. Dr. |
|
Refereed: |
Yes |
URI: |
http://kups.ub.uni-koeln.de/id/eprint/1656 |
Downloads per month over past year
Export
Actions (login required)
|
View Item |