Well designed information infrastructure improves the conduct of research, and can connect researchers and projects across disciplines to facilitate collaboration. The topic of this thesis is the design and development of an information infrastructure for a large interdisciplinary research project, the DFG-funded Collaborative Research Centre 806 (CRC 806). Under the name CRC806-Database the presented infrastructure was developed in the frame of the subproject "Z2: Data Management and Data Services", a so-called INF project, which is responsible for the research data management within a DFG funded CRC. During the design, development and implementation of the CRC806-Database, the complex requirements for sound data management in the context of a large interdisciplinary research project were considered theoretically, as well as practically during the implementation. The presented infrastructure design is mainly based on the requirements for research data management in CRC's, that is mainly the secure storage of primary research data for at least ten years, as well as on the further recommendations, that are about support and improvement of research and facilitation of Web-based collaboration, for information infrastructure by the DFG. The CRC806-Database semantic e-Science infrastructure consists of three main components, i.) the CRC806-RDM component that implements the research data management, including a data catalog and a publication database, ii.) the CRC806-SDI component that provides a Spatial Data Infrastructure (SDI) for Web-based management of spatial data, and additionally, iii.) the CRC806-KB component that implements a collaborative virtual research environment and knowledgebase. From a technical perspective, the infrastructure is based on the application of existing Open Source Software (OSS) solutions, that were customized to adapt to the specific requirements were necessary. The main OSS products that were applied for the development of the CRC806-Database are; Typo3, CKAN, GeoNode and Semantic MediaWiki. As integrative technical and theoretical basis of the infrastructure, the concept of Semantic e-Science was implemented. The term e-Science refers to a scientific paradigm that describes computationally intensive science carried out in networked environments. The prefix "Semantic" extends this concept with the application of Semantic Web technologies. A further applied conceptual basis for the development of CRC806-Database, is known under the name "Open Science", that includes the concepts of "Open Access", "Open Data" and "Open Methodology". These concepts have been implemented for the CRC806-Database semantic e-Science infrastructure, as described in the course of this thesis.

Die vorliegende Dissertation behandelt die Konzeption und Entwicklung einer Informationsinfrastruktur für ein großes interdisziplinäres Forschungsprojekt, den DFG geförderten Sonderforschungsbereich 806 (SFB 806). Unter dem Namen CRC806-Database wurde die vorgestellte Infrastruktur im Rahmen des Teilprojekt "Z2: Data Management and Data Services", einem so genannten INF Projekt entwickelt, das für dass Forschungsdatenmanagement innerhalb eines SFB zuständig ist. Während der Konzeption, Entwicklung und Umsetzung der Infrastruktur wurde auf die komplexen Anforderungen für das Datenmanagement im Rahmen eines interdisziplinären Forsch- ungsprojekt sowohl theoretisch, als dann auch mit der praktischen Umsetzung eingegangen. Ziel der Arbeit ist die Beschreibung und Dokumentation aller Komponenten der Infrastruktur, inklusive ihrer Entwicklung und den dieser Entwicklung zugrunde liegenden Forschungen. Die Konzeption der Infrastruktur basiert auf den Anforderungen der DFG für das Forschungsdatenmanagement in SFB's, sowie den erweiterten Empfehlungen zur Umsetzung der Forschungsinfrastruktur. Des Weiteren wurden die speziellen Anforderungen der im Projekt beteiligten wissenschaftlichen Disziplinen, als auch auf den Wünschen der am SFB beteiligten Teilprojekte und Wissenschaftler berücksichtigt. Die CRC806-Database besteht aus drei Hauptkomponenten, i.) der CRC806-RDM Komponente, die das Forschungsdatenmanagement, inklusive Datenkatalog und Publikationsdatenbank implementiert, ii.) der CRC806-SDI Komponente, die eine Spatial Data Infrastructure (SDI) zur Web-basierten Verwaltung von Geodaten zur Verfügung stellt, und schließlich iii.) die CRC806-KB Komponente, die eine kollaborative virtuelle Forschungsumgebung umsetzt. Aus technischer Perspektive, wurden für die Entwicklung der Anwendungen existierende Open Source Software Lösungen den spezifischen Anforderung, z.B. durch die Entwicklung von eigenen Komponenten angepasst und eingesetzt. Die wichtigsten eingesetzten Open Source Software Produkte sind, Typo3, CKAN, GeoNode und Semantic Mediawiki. Als integratives technisches und theoretisches Konzept der Infrastruktur wurde Semantic e-Science umgesetzt. Unter e-Science ("enhanced Science") versteht man ein Wissenschaftliches Paradigma, dass kollaborative Anwendungen auf der Basis von digitalen Infrastrukturen umfasst. Durch den Präfix "Semantic" wird dieses Konzept um die Anwendung von Semantic Web Technologien zur Umsetzung der digitalen Infrastruktur erweitert. Eine weitere wichtige konzeptionelle Grundlage für die Entwicklung der CRC806-Database, sind die unter dem Namen "Open Science" bekannten Konzepte zu "Open Access", "Open Data" und "Open Methodology". Diese Konzepte wurden, soweit möglich umgesetzt und angewendet, wie im Verlauf dieser Arbeit beschrieben.German
