Leber, Markus (2008). Kodierung enzymatischer Reaktionen. PhD thesis, Universität zu Köln.

[img]
Preview
PDF
Kodierung_enzymatischer_Reaktionen_Dissertation_Markus_Leber_2008.pdf

Download (4MB)

Abstract

Die Einteilung enzymatischer Reaktionen erfolgt auf Basis des EC-Klassifikationssystems. Die Einordnung neuer Enzyme ist hochkomplex und erfordert die Absprache von verschiedenen Enzymkommissionen der Organisationen IUPAC und IUBMB. Dieses zeitaufwendige Verfahren war die Motivation für die vorliegende Arbeit, ein automatisiertes System für die Charakterisierung enzymatischer Reaktionen zu entwickeln, das auf dem Dugundji-Ugi-Modell basiert. Hierbei werden Reaktionen durch mathematische Operatoren beschrieben, die als Reaktionsmatrizen (R-Matrizen) bezeichnet werden und das Elektronentransfermuster einer Reaktion kodieren. R-Matrizen enthalten die Information, welche Bindungen gespalten werden oder entstehen und welche Atome an der Reaktion beteiligt sind. Das Errechnen der R-Matrizen erfordert allerdings eine Atomzuordnung der Eduktatome auf die Produktatome. Diese Zuordnung wurde in der Vergangenheit immer mit hohem manuellem Aufwand erstellt. Im Rahmen dieser Arbeit wurde ein Programm entwickelt, das die R-Matrizen nur anhand der Edukt- und Produktmoleküle errechnet und ohne manuelle Unterstützung auskommt. Kern des Verfahrens ist ein MCS-Algorithmus (Maximal Common Subgraph), der die maximalen gemeinsamen Substrukturen von 2 Molekülen errechnet. Dieser neu entwickelte Algorithmus ist sehr flexibel und kann daher auch komplexe Veränderungen in der Molekülstruktur nachvollziehen. Er wird dazu verwendet, die Eduktmoleküle mit den Produktmolekülen zu vergleichen. Die maximalen gemeinsamen Substrukturen aus den Molekülvergleichen werden kombiniert und durch ein Rankingsystem bewertet, das alle möglichen Atomzuordnungen errechnet. Bedingt durch die Komplexität vieler biochemischer Reaktionen, war es erforderlich, das Verfahren um weitere Algorithmen zu erweitern, um falsche Zuordnungen zu vermeiden und die Laufzeit zu verbessern. So wurden Verfahren zur Erkennung von lokalen Symmetrien, aromatischen Ringsystemen und Kofaktoren integriert und eine weitere Molekülvergleichsebene eingeführt. Mit Hilfe dieses Systems von verschiedenen Algorithmen wird eine vollständige Atomzuordnung generiert. Auf Grundlage einer vollständigen Atomzuordnung ist die Berechnung der R-Matrizen schließlich sehr einfach. Ein weiteres Problem stellte allerdings der Vergleich der R-Matrizen dar, weil von jeder R-Matrix n! mögliche Permutationen erzeugt werden können. Der Vergleich erfolgt mit Hilfe eines neuen Kanonisierungsalgorithmus, der aus der Vielzahl von Permutationen eine repräsentative R-Matrix selektiert. Die Überführung der R-Matrizen in R-Strings vereinfacht schließlich den Vergleich und die Gruppierung von enzymatischen Reaktionen anhand ihres Elektronentransfermusters. Auf der Grundlage eines Datensets, das 228 der 229 definierten Subsubklassen abdeckt, wurden die R-Matrizen von 3209 enzymatischen Reaktionen automatisch errechnet. Neben der Analyse der R-Matrizen selbst, standen bei der Auswertung die Beziehungen zwischen dem Dugundji-Ugi-Modell und dem EC-Klassifikationssystem im Vordergrund. Als Bezugspunkt wurden die Subsubklassen des EC-Klassifikationssystems gewählt, die bereits soweit spezifiziert sind, dass hier eine hohe Übereinstimmung beider Systeme zu erwarten war. So wurden die Subsubklassen auf ihre Homogenität in ihren Elektronentransfermustern untersucht. Die häufigsten R-Matrizen jeder Subsubklasse wurden verglichen und Subsubklassen mit identischen R-Matrizen gruppiert. Die Elektronentransfermuster innerhalb der Subsubklassen erwiesen sich in der Mehrzahl als homogen. Allerdings wurden auch Subsubklassen mit geringer Übereinstimmung in den Elektronentransfermustern gefunden, für die eine höhere Homogenität erwartet worden wäre. Der R-Matrixvergleich der verschiedenen Subsubklassen ergab, dass 121 Subsubklassen bereits ein spezifisches Elektronentransfermuster besitzen. 107 Subsubklassen bilden hingegen Gruppen verschiedener Größe. Einige Gruppen bestehen aus Subsubklassen von verschiedenen Hauptklassen, obwohl sie nach ihren Elektronentransfermustern einen identischen Reaktionskern besitzen. Die Ergebnisse machen die Eigenschaften des Dugundji-Ugi-Modells deutlich, das sehr rational und unvoreingenommen die wesentlichsten Eigenschaften einer Reaktion beschreibt. Ähnlich, wie das EC-Klassifikationssystem, betrachtet es aber die chemischen Eigenschaften der Gesamtreaktion. Es könnte daher die Enzymklassifikation unterstützen, indem es aufzeigt, welche Subsubklassen feiner untergliedert oder zu größeren Gruppen zusammengefasst werden könnten.

Item Type: Thesis (PhD thesis)
Translated title:
TitleLanguage
Coding of enzymatic ReactionsEnglish
Translated abstract:
AbstractLanguage
Classification of enzymes is performed by committees of the International Union of Pure and Applied Chemistry (IUPAC) and the International Union of Biochemistry and Molecular Biology (IUBMB). The assignment of EC-numbers is a complex procedure, which can not be performed by single individuals. False assignments and enzymes, which were grouped for historical reasons or physiological aspects, lead to steadily updates of the enzyme list. New enzymes are added and false classified enzymes are transferred or deleted completely. This extensive procedure was the motivation for the present work to investigate an automated system for the characterization of enzymatic reactions. The Dugundji-Ugi-model describes reactions by mathematical operators named transition or reaction matrices (R-matrices). R-matrices represent electron shift patterns occurring during reactions and allow an objective view on the reaction core. Nevertheless the model has not been used excessively within the last years, because it is difficult to handle without an assignment of the educt atoms to the product atoms. For this reason R-matrices have been generated manually in the past. In the present work a program has been developed, which calculates R-matrices automatically only on the basis of the educt and product molecules. The atom mapping problem is tackled by a MCS algorithm (Maximal Common Subgraph), which determines maximal common substructures of two input molecules. This newly developed algorithm is a flexible approach, which is able to reproduce complex changes of the structure and allows the comparison of large metabolites as well. The MCS algorithm is used to compare each educt molecule to each product molecule. In the next step the maximal common substructures of the different comparisons are combined and assessed by a ranking system, which calculates all possible atom-atom mappings. Due to the complexity of various biochemical reactions, it was necessary to extend the system. Procedures were integrated to find local symmetries, aromatic rings and cofactors. Small molecules and remaining structures are considered by further MCS methods. This system helps to avoid false assignments and to improve the run time. On the basis of a complete atom mapping it is comparatively simple to calculate the reaction matrix. More complex is the identification of identical R-matrices. The comparison of R-matrices is circumstantial according to the n! possible permutations. Due to the complex structure of biochemical electron shift patterns it was necessary to develop a new canonization algorithm, which constructs a representative R-matrix for each reaction. Finally the canonical matrices are converted to R-strings. R-strings can be easily compared and allow a new grouping of enzymatic reactions according to their electron shift patterns. The R-matrix calculator is tested for a set of 3209 enzymatic reactions, which covers 228 of 229 subsubclasses. A main objective of the analysis was the comparison of the Dugundji-Ugi-Model and the EC-classification system. The subsubclasses of the EC-classification system were used as a reference point. First the R-matrix identity within the subsubclasses was examined. In the most cases the R-matrices within a subsubclass are homogeneous. Nevertheless the system also reveals subsubclasses with inconsistent electron shift patterns. In another examination R-matrices of different subsubclasses were compared and grouped. For this purpose for each subsubclass the R-matrix with the highest occurrence was investigated and used for R-matrix comparisons. 121 subsubclasses have an unique R-matrix. This means enzymes of these subsubclasses can be recognized by the corresponding R-matrix with high probability. On the other hand 107 subsubclasses do not have an unique R-matrix. They form 26 groups, whereas each group share an identical R-matrix. The R-matrices of the largest groups show basic electron shift patterns. Although these subsubclasses have identical R-matrices, they sometimes belong to different main classes within the EC-classification system. Obviously the electron shift patterns differ in many aspects from the EC-classification system. The results demonstrate the properties of the Dugundji-Ugi-model as a rational system, which is not constricted by prejudices of our experience and allows an objective view on biochemical reactions. It could be used to support the EC-classification system, especially as it also considers the chemical properties of the overall reaction. On the basis of this model subsubclasses can be identified, which can be partitioned into smaller groups or can be joined to new groups of identical reaction cores.English
Creators:
CreatorsEmailORCIDORCID Put Code
Leber, Markusleber.markus@gmx.deUNSPECIFIEDUNSPECIFIED
URN: urn:nbn:de:hbz:38-23927
Date: 2008
Language: German
Faculty: Faculty of Mathematics and Natural Sciences
Divisions: Faculty of Mathematics and Natural Sciences > Department of Chemistry > Institute of Biochemistry
Subjects: Life sciences
Uncontrolled Keywords:
KeywordsLanguage
Enzymatische Reaktionen , EC-Klassifikationssystem , Dugundji-Ugi-Modell , MCS-Algorithmus , Reaktionsmatrix-BerechnungGerman
enzymatic reactions , EC-classification system , Dugundji-Ugi-model, MCS algorithm, reaction matrix calculationEnglish
Date of oral exam: 24 April 2008
Referee:
NameAcademic Title
Schomburg, DietmarProf. Dr.
Refereed: Yes
URI: http://kups.ub.uni-koeln.de/id/eprint/2392

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item