Universität zu Köln

Automatable Annotations – Image Processing and Machine Learning for Script in 3D and 2D with GigaMesh

Bogacz, Bartosz and Mara, Hubert (2017) Automatable Annotations – Image Processing and Machine Learning for Script in 3D and 2D with GigaMesh. In: Kodikologie und Paläographie im Digitalen Zeitalter 4 – Codicology and Palaeography in the Digital Age 4. Schriften des Instituts für Dokumentologie und Editorik, 11. Books on Demand, Norderstedt, pp. 137-149.

[img]
Preview
PDF - Published Version
Download (8Mb) | Preview

    Abstract

    Libraries, archives and museums hold vast numbers of objects with script in 3D such as inscriptions, coins, and seals, which provide valuable insights into the history of humanity. Cuneiform tablets in particular provide access to information on more than three millennia BC. Since these clay tablets require an extensive examination for transcription, we developed the modular GigaMesh software framework to provide high-contrast visualization of tablets captured with 3D acquisiton techniques. This framework was extended to provide digital drawings exported as XML-based Scalable Vector Graphics (SVG), which are the fundamental input of our approach inspired by machine-learning techniques based on the principle of word spotting. This results in a versatile symbol-spotting algorithm to retrieve graphical elements from drawings enabling automated annotations. Through data homogenization, we achieve compatibility to digitally born manual drawings, as well as to retro-digitized drawings. The latter are found in large Open Access databases, e.g. provided by the Cuneiform Database Library Initiative (CDLI). Ongoing and future work concerns the adaptation of filtering and graphical query techniques for two-dimensional raster images widely used within Digital Humanities research.

    Item Type: Book Section
    Translated abstract:
    AbstractLanguage
    in 3D, wie z.B. Inschriften, Münzen und Siegelabdrücke. Diese erlauben wertvolle Einblicke in die Geschichte der Menschheit. Das gilt besonders für Keilschrifttafeln, die Informationen über dreieinhalb Jahrtausende vor der Geburt Christi übertragen. Weil diese Tontafeln eine gründliche Untersuchung, Umzeichung und Umschrift benötigen, haben wir das modulare GigaMesh Software Framework entwickelt, das eine kontrastreiche Darstellung von 3D-vermessenen Tafeln in hoher Auflösung ermöglicht. GigaMesh bietet dazu die Möglichkeit zum Export von Vektorzeichnungen im XML-basierten Scalable Vector Graphics (SVG) Dateiformat. Diese Dateien stellen die Datenbasis für Verfahren aus dem Bereich des Machine Learning dar, die wiederum auf dem Prinzip des Word Spotting beruhen. Daraus ist eine graphische Suchmöglichkeit von Symbolen bzw. Zeichen entstanden, mit der eine automatische Annotation möglich wird. Durch die Homogenisierung von Dateiformaten konnten wir eine Kompatibilität mit weiteren Quellen in Form von digital erstellten Handzeichnungen und Retro-Digitalisaten erreichen. Letztere stehen online per Open Access z.B. im Rahmen der Cuneiform Database Library Initiative (CDLI) zur Verfügung. Laufende und künftige Arbeiten sind die Adaption unserer graphischen Verfahren für zweidimensionale Rasterbilder, wie sie in den Digital Humanities häufig zu finden sind.German
    Creators:
    CreatorsEmail
    Bogacz, Bartosz
    Mara, Hubert
    Editors:
    EditorsEmail
    Busch, Hannah
    Fischer, Franzfranz.fischer@uni-koeln.de
    Sahle, Patricksahle@uni-koeln.de
    Corporate Creators: Institut für Dokumentologie und Editorik
    Corporate Contributors: Institut für Dokumentologie und Editorik
    URN: urn:nbn:de:hbz:38-77859
    Series Name: Schriften des Instituts für Dokumentologie und Editorik
    Publisher: Books on Demand
    Volume: 11
    Subjects: Data processing Computer science
    Library and information sciences
    Divisions: Philosophische Fakultät > Cologne Center for eHumanities
    Language: English
    Date: July 2017
    Date Type: Publication
    Full Text Status: Public
    Related URLs:
    Date Deposited: 08 Sep 2017 09:03:51
    URI: http://kups.ub.uni-koeln.de/id/eprint/7785

    Actions (login required)

    View Item