Universität zu Köln

Semantic Technologies for Manuscript Descriptions — Concepts and Visions

Institut für Dokumentologie und Editorik (IDE) (2011) Semantic Technologies for Manuscript Descriptions — Concepts and Visions. In: Kodikologie und Paläographie im digitalen Zeitalter 2 - Codicology and Palaeography in the Digital Age 2. Schriften des Instituts für Dokumentologie und Editorik, 3. Books on Demand (BoD), Norderstedt, pp. 133-155. ISBN 978-3-8423-5032-8

[img]
Preview
PDF
Download (4Mb) | Preview

    Abstract

    The contribution at hand relates recent developments in the area of the World Wide Web to codicological research. In the last number of years, an informational extension of the internet has been discussed and extensively researched: the Semantic Web. It has already been applied in many areas, including digital information processing of cultural heritage data. The Semantic Web facilitates the organisation and linking of data across websites, according to a given semantic structure. Software can then process this structural and semantic information to extract further knowledge. In the area of codicological research, many institutions are making efforts to improve the online availability of handwritten codices. If these resources could also employ Semantic Web techniques, considerable research potential could be unleashed. However, data acquisition from less structured data sources will be problematic. In particular, data stemming from unstructured sources needs to be made accessible to SemanticWeb tools through information extraction techniques. In the area of museum research, the CIDOC Conceptual Reference Model (CRM) has been widely examined and is being adopted successfully. The CRM translates well to Semantic Web research, and its concentration on contextualization of objects could support approaches in codicological research. Further concepts for the creation and management of bibliographic coherences and structured vocabularies related to the CRM will be considered in this chapter. Finally, a user scenario showing all processing steps in their context will be elaborated on.

    Item Type: Book Section
    Translated abstract:
    AbstractLanguage
    Der Beitrag bezieht neue Entwicklungen im World Wide Web auf die kodikologische Forschung. Seit einiger Zeit wird eine informationelle Erweiterung des Internet diskutiert und in vielen Bereichen, auch der digitalen Informationsverarbeitung des kulturellen Erbes, ausführlich erforscht und getestet: das Semantic Web. Das Konzept beinhaltet, dass Daten auf der Ebene ihrer Bedeutung miteinander verknüpft werden, damit Computer diese verarbeiten und weitere Informationen daraus gewinnen können. Im Bereich der Kodikologie gibt es schon seit einigen Jahren Bemühungen, handschriftliche Kodizes online verfügbar zu machen. Wenn auch diese den Schritt in das Semantic Web vollziehen würden, könnten daraus nicht unerhebliche For- schungspotenziale abgeleitet werden. Die Datengewinnung aus wenig strukturierten Datenquellen ist dabei nicht unproblematisch. Insbesondere Daten aus unstrukturierten Quellen müssen zunächst mittels Verfahren der Informationsextraktion einer weiteren Verarbeitung im Sinne des Semantic Web zugänglich gemacht werden. Im Umfeld der Museumsforschung wird das CIDOC Conceptual Reference Model (CRM) ausführlich diskutiert und bereits gewinnbringend eingesetzt. Das CRM lässt sich gut auf die Forschung des Semantic Web beziehen und seine Konzentration auf Kontextualisierung von Objektzusammenhängen könnte der kodikologischen Forschung entgegenkommen. Weitere Konzepte und Standards im Umfeld des CRM zur Erstellung und Verwaltung bibliographischer Zusammenhänge und strukturierter Vokabulare werden in die Über- legungen einbezogen. Abgerundet wird die Betrachtung durch ein Benutzungsszenario, an dem verschiedene Verarbeitungsschritte in ihren Zusammenhang gestellt werden.German
    Creators:
    CreatorsEmail
    Kummer, Robert
    Editors:
    EditorsEmail
    Fischer, Franzfranz.fischer@uni-koeln.de
    Fritze, Christianechristiane.fritze@sub.uni-goettingen.de
    Vogeler, Georggeorg.vogeler@uni-graz.at
    Corporate Creators: Institut für Dokumentologie und Editorik (IDE)
    URN: urn:nbn:de:hbz:38-43472
    Series Name: Schriften des Instituts für Dokumentologie und Editorik
    Publisher: Books on Demand (BoD)
    ISBN: 978-3-8423-5032-8
    Volume: 3
    Subjects: Generalities, Science
    Data processing Computer science
    Library and information sciences
    Geography and history
    Uncontrolled Keywords:
    KeywordsLanguage
    Handschriftenkunde,Digitale Geisteswissenschaften, Historische Hilfswissenschaften, Digitalisierung, Katalogisierung, Online-Portale, Bibliothekswissenschaft, Semantic WebGerman
    Codicology, Manuscripts, Digitization, Cataloging, Character Recognition, Digital Humanities, Medieval Studies, LibrariesEnglish
    Divisions: Philosophische Fakultät > Historisch - Kulturwissenschaftliche Informationsverarbeitung
    Language: English
    Date: 2011
    Date Type: Publication
    Full Text Status: Public
    Date Deposited: 23 Sep 2011 12:06:33
    URI: http://kups.ub.uni-koeln.de/id/eprint/4347

    Actions (login required)

    View Item