Heinen, Stephanie Eva
(2007).
Entwicklung einer Textminingmethode zur automatisierten Extraktion von kinetischen Informationen aus der Literatur.
PhD thesis, Universität zu Köln.
Preview |
|
PDF
Entwicklung_einer_Textminingmethode_zur_automatisierten_Extraktion_von_kinetischen_Informationen_aus_der_Literatur_Stephanie_Heinen.pdf
Download (3MB)
|
Abstract
Die Menge an verfügbaren biologischen Informationen ist über die letzten Jahre stetig angestiegen. Es ist daher essentiell, dass das enthaltene Wissen leicht zugänglich gemacht wird, wie z.B. in Datenbänken. Zum Erstellen solcher Datenbänke können Methoden zur automatischen Extraktion dieser Informationen verwendet werden. Eine pragmatische Methode zur Extraktion kinetischer Informationen aus ca. 17 Millionen Abstracts der PubMed unter Verwendung von Lexika wurde entwickelt. Es wurden Informationen zu KM, Ki, kcat, kcat/KM, Vmax, IC50, S0.5, Kd, Ka, t1/2, pI, Enzymnamen, EC Nummern, Liganden, Organismen, Lokalisationen, pH-Wert und Temperatur extrahiert. 509.153 kinetische Informationen konnten extrahiert werden, mit einer Precision von 55% bis zu 96% und einem Recall von 51% bis zu 84%. Die erhaltenen Informationen sind in der Datenbank "KID the KInetic Database" im Internet zugänglich.
Item Type: |
Thesis
(PhD thesis)
|
Translated title: |
Title | Language |
---|
Development of a textmining method for the automatic extraction of kinetic information from literature | English |
|
Translated abstract: |
Abstract | Language |
---|
The amount of available biological information is steadily increasing. It is therefore essential for this knowledge to be easily accessible. However much information is contained in the written literature and not in easy available ways, e.g. through databases, so that methods for the extraction of knowledge have to be applied. Text-mining is one way for the automatic accumulation of knowledge out of written text. A pragmatic approach for the extraction of kinetic information from about 17 million PubMed abstracts was developed. Information about KM, Ki, kcat, kcat/KM, Vmax, IC50, S0.5, Kd, Ka, t1/2, pI, enzyme-name, EC number, ligand, organism, localisation, pH and temperature was extracted. 509,153 kinetic parameters were found. A manual verification of the entries yielded to a precision from 55% up to 96% and a recall from 51% up to 84%. The attained information is stored in the database "KID the KInetic Database", which is available via the internet. | English |
|
Creators: |
Creators | Email | ORCID | ORCID Put Code |
---|
Heinen, Stephanie Eva | stephie_heinen@web.de | UNSPECIFIED | UNSPECIFIED |
|
URN: |
urn:nbn:de:hbz:38-22294 |
Date: |
2007 |
Language: |
German |
Faculty: |
Faculty of Mathematics and Natural Sciences |
Divisions: |
Faculty of Mathematics and Natural Sciences > Department of Chemistry > Institute of Biochemistry |
Subjects: |
Life sciences |
Uncontrolled Keywords: |
Keywords | Language |
---|
Textmining Kinetik | German | Textmining kinetics | English |
|
Date of oral exam: |
29 November 2007 |
Referee: |
Name | Academic Title |
---|
Schomburg, Dietmar | Prof. Dr. |
|
Refereed: |
Yes |
URI: |
http://kups.ub.uni-koeln.de/id/eprint/2229 |
Downloads per month over past year
Export
Actions (login required)
|
View Item |