Universität zu Köln

Ein Alpha-Shape-basiertes Protein-Docking-Verfahren

Lange, Niels (2009) Ein Alpha-Shape-basiertes Protein-Docking-Verfahren. PhD thesis, Universität zu Köln.

[img]
Preview
PDF
Download (12Mb) | Preview

    Abstract

    Proteine sind die Bausteine des Lebens. Das Verständnis von Interaktionen zwischen Proteinen ist daher von großem Interesse. Da die experimentelle Untersuchung von Proteinkomplexen äußerst zeitintensiv ist, besteht der Wunsch nach rechnergestützten Verfahren zur Vorhersage solcher Anordnungen. Die Berechnung des Komplexes aus zwei Proteinen wird in der Bioinformatik als Protein-Protein-Docking bezeichnet. Eingabedaten sind die experimentell bestimmten Atomkoordinaten der Einzelstrukturen. Es existieren mehrere Docking-Verfahren, die bereits passable Vorhersagen für eine Reihe von Komplexen erzielen können. Abschließend gelöst ist die Aufgabenstellung aber noch nicht. Aus diesem Grund ist im Rahmen dieser Arbeit ein neuer Ansatz zur Lösung des Docking-Problems entwickelt worden. Im Gegensatz zu den meisten gängigen Verfahren wird dabei nicht auf eine Gitterdarstellung der Proteine zurückgegriffen. Diese erlaubt zwar eine mathematisch einfache Handhabung des Problems, fasst dieses aber gleichzeitig in ein starres Raster. Die Behandlung von Protein-Verformungen, die bei der Komplex-Bildung auftreten, wird dadurch erschwert. Die in dem neuen Verfahren verwendete Repräsentation der Protein-Strukturen basiert auf Alpha-Shapes. Diese erweitern den Begriff der konvexen Hülle und definieren eine Oberfläche, deren Auflösung mittels eines Skalenparameters Alpha eingestellt werden kann. Durch eine schrittweise Erhöhung des Detaillierungsgrades lassen sich Taschen auf der Proteinoberfläche detektieren. Dies wird in dem hier entwickelten Algorithmus dazu verwendet, um gezielt Proteinkomplexe zu generieren, die lokal geometrisch zueinander passen. Die Zahl der erzeugten Komplexe lässt sich dabei durch Alpha steuern. Des Weiteren wurde gezeigt, dass sich mit Hilfe der Alpha-Shape eine Bewertungsfunktion realisieren lässt, die eine zügige Beurteilung von künstlich erzeugten Komplexen bezüglich ihrer geometrischen Korrelation erlaubt. Die Flexibilität des Ansatzes wurde beispielhaft durch die Erweiterung der Bewertung um Aminosäuren-spezifische Gewichte unter Beweis gestellt. Zur Beurteilung der Qualität der produzierten Lösungen wurde der Algorithmus mit einem Testdatensatz überprüft. Die Ergebnisse liegen in der Größenordnung anderer Verfahren, lassen sich aber noch deutlich steigern, da die verwendeten Parameter noch nicht vollständig optimiert sind. Die Laufzeiten zur Generierung und Beurteilung von einigen hunderttausend Komplexen liegt im Bereich weniger Minuten.

    Item Type: Thesis (PhD thesis)
    Translated abstract:
    AbstractLanguage
    Proteins are the building block of life. Therefore the understanding of protein interactions is of great interest. Because experimental methods to examine protein complexes are often quiet time-consuming there is a desire for computer-aided methods for complex prediction. Calculating the complex that is formed by two structures is called protein-protein docking. Input data are the experimentally determined atom coordinates of the single structures. There are several docking methods that can predict acceptable complexes for some cases. But the problem is not finally solved. That is the reason for developing a new approach to protein-docking in this thesis. Contrary to most common methods no grid-based representation of the proteins is used. Grids provide easy mathematics, but also tie the problem to a rigid structure. That makes handling of protein flexibility, which occur upon complex formation, more difficult. The new method uses alpha shapes to represent the protein structures. They extend the concept of the convex hull and define a surface which resolution can be adjusted by a scale parameter alpha. By incrementally increasing the level-of-detail pockets on the protein surface can be detected. This is used in the algorithm to generate geometrically fitting complexes. How many are produced can be varied by choosing alpha. Furthermore it was shown that a scoring-function can be realized within the alpha shape, which allows a fast check of the geometric correlation of generated complexes. The extensibility of the approach was demonstrated by implementing an amino acid specific score. The quality of the generated complexes was tested by running the algorithm against a dataset of test cases. The results lie in the range of other methods. They can be improved by further optimizing the parameters of the algorithm. The runtime for generating and scoring a few hundred thousand complexes is less than five minutes.English
    Creators:
    CreatorsEmail
    Lange, Nielslg@uni-koeln.de
    URN: urn:nbn:de:hbz:38-30247
    Subjects: Data processing Computer science
    Uncontrolled Keywords:
    KeywordsLanguage
    Protein-Docking , Alpha-Shape , Bioinformatik , 3D , PuzzleGerman
    Protein Docking , Alpha Shape , Bioinformatics , 3D , PuzzleEnglish
    Faculty: Mathematisch-Naturwissenschaftliche Fakultät
    Divisions: Mathematisch-Naturwissenschaftliche Fakultät > Institut für Informatik
    Language: German
    Date: 2009
    Date Type: Completion
    Date of oral exam: 13 January 2010
    Full Text Status: Public
    Date Deposited: 15 Mar 2010 12:59:41
    Referee
    NameAcademic Title
    Schrader, RainerProf. Dr.
    URI: http://kups.ub.uni-koeln.de/id/eprint/3024

    Actions (login required)

    View Item