Universität zu Köln

Encoding, Storing and Searching of Analytical Properties and Assigned Metabolite Structures

Helmus, Tobias (2007) Encoding, Storing and Searching of Analytical Properties and Assigned Metabolite Structures. PhD thesis, Universität zu Köln.

[img]
Preview
PDF
Download (1431Kb) | Preview

    Abstract

    Informationen über Metabolite und andere kleine organische Moleküle sind von entscheidender Bedeutung in vielen verschiedenen Bereichen der Naturwissenschaften. Sie spielen z.B. eine entscheidende Rolle in metabolischen Netzwerken und das Wissen über ihre Eigenschaften, hilft komplexe biologische Prozesse und komplette biologische Systeme zu verstehen. Da in biologischen und chemischen Laboren täglich Daten anfallen, welche diese Moleküle beschreiben, existiert eine umfassende Datengrundlage, die sich kontinuierlich erweitert. Um Wissenschaftlern die Verarbeitung, den Austausch, die Archivierung und die Suche innerhalb dieser Informationen unter Erhaltung der semantischen Zusammenhänge zu ermöglichen, sind komplexe Softwaresysteme und Datenformate nötig. Das Ziel dieses Projektes bestand darin, Anwendungen und Algorithmen zu entwickeln, welche für die effiziente Kodierung, Sammlung, Normalisierung und Analyse molekularer Daten genutzt werden können. Diese sollen Wissenschaftler bei der Strukturaufklärung, der Dereplikation, der Analyse von molekularen Wechselwirkungen und bei der Veröffentlichung des so gewonnenen Wissens unterstützen. Da die direkte Beschreibung der Struktur und der Funktionsweise einer unbekannten Verbindung sehr schwierig und aufwändig ist, wird dies hauptsächlich indirekt, mit Hilfe beschreibender Eigenschaften erreicht. Diese werden dann zur Vorhersage struktureller und funktioneller Charakteristika genutzt. In diesem Zusammenhang wurden Programmmodule entwickelt, welche sowohl die Visualisierung von Struktur- und Spektroskopiedaten, die gegliederte Darstellung und Veränderung von Metadaten und Eigenschaften, als auch den Import und Export von verschiedenen Datenformaten erlauben. Diese wurden durch Methoden erweitert, welche es ermöglichen, die gewonnenen Informationen weitergehend zu analysieren und Struktur- und Spektroskopiedaten einander zuzuweisen. Außerdem wurde ein System zur strukturierten Archivierung und Verwaltung großer Mengen molekularer Daten und spektroskopischer Informationen, unter Beibehaltung der semantischen Zusammenhänge, sowohl im Dateisystem, als auch in Datenbanken, entwickelt. Um die verlustfreie Speicherung zu gewährleisten, wurde ein offenes und standardisiertes Datenformat definiert (CMLSpect). Dieses erweitert das existierende CML (Chemical Markup Language) Vokabular und erlaubt damit die einfache Handhabung von verknüpften Struktur- und Spektroskopiedaten. Die entwickelten Anwendungen wurden in das Bioclipse System für Bio- und Chemoinformatik eingebunden und bieten dem Nutzer damit eine hochqualitative Benutzeroberfläche und dem Entwickler eine leicht zu erweiternde modulare Programmarchitektur.

    Item Type: Thesis (PhD thesis)
    Translated abstract:
    AbstractLanguage
    Metabolites and other small organic molecules are of major importance in many different fields of natural sciences. They play crucial roles in metabolic networks, and knowledge about their properties and interactions helps to understand complex biological processes and whole biological systems. Thus, data describing small organic molecules on a structural level is recorded in a multitude of biological and chemical laboratories on a daily basis. Consequently, a large amount of highly interconnected data already exists and continuously is produced. This leads to a strong need for software systems and data formats supporting the scientists in exchanging, processing, storing and searching molecular data under preservation of its semantics. The aim of this project was to develop tools, applications and algorithms to be used for the efficient encoding, collection, normalisation and analysis of this data. These should be supportive in the process of dereplication, structure elucidation, analysis of molecular interactions and publication of the so gained knowledge. It frequently is impossible, or at least very difficult and time consuming, to determine the structure and functionality of an unknown compound directly. Therefore, this commonly is realised indirectly by describing a molecule via its properties. In a next step, these properties can be used to predict its structural and functional features. In this context, tools were developed, that allow the visualisation of structural and spectral data, the structured displaying and manipulation of extending meta data and properties as well as the import and export of a variety of spectroscopic and structural data formats. This functionality was extended by applications enabling the assignment of structural and spectroscopic features to each other and analysis methods. Additionally, a framework for the structured deposition and management of large amounts of molecular data in the file system and in various relational database systems was created. To ensure the lossless encoding of spectroscopic data under preservation of its semantics, an open, standardised and highly structured data specification was defined - CMLSpect. CMLSpect is extending the existing CML (Chemical Markup Language) vocabulary and therewith allows for easy handling of connected structural and spectroscopic information. The set of applications and methods developed in the course of this project was integrated into the Bioclipse platform for bio- and chemoinformatics, providing the user with a high quality interface and developers with an easy to extend plug-in architecture.English
    Creators:
    CreatorsEmail
    Helmus, Tobiastobias@helmus.name
    URN: urn:nbn:de:hbz:38-20801
    Subjects: Life sciences
    Uncontrolled Keywords:
    KeywordsLanguage
    Bioclipse , Chemical Markup Language (CML) , Spektroskopische Daten , kleine organische Moleküle , MetabolitenGerman
    Bioclipse , Chemical Markup Language (CML) , Spectrosopic Data , Small Organic Molecules , MetabolitesEnglish
    Faculty: Mathematisch-Naturwissenschaftliche Fakultät
    Divisions: Mathematisch-Naturwissenschaftliche Fakultät > Institut für Biochemie
    Language: German
    Date: 2007
    Date Type: Completion
    Date of oral exam: 10 June 2007
    Full Text Status: Public
    Date Deposited: 01 Aug 2007 15:46:45
    Referee
    NameAcademic Title
    Steinbeck, ChristophPD. Dr.
    URI: http://kups.ub.uni-koeln.de/id/eprint/2080

    Actions (login required)

    View Item