Bogacz, Bartosz and Mara, Hubert (2017). Automatable Annotations – Image Processing and Machine Learning for Script in 3D and 2D with GigaMesh. In: Kodikologie und Paläographie im Digitalen Zeitalter 4 – Codicology and Palaeography in the Digital Age 4, pp. 137-149. Norderstedt: Books on Demand.

[img]
Preview
PDF
09_mara.pdf - Published Version

Download (9MB)

Abstract

Libraries, archives and museums hold vast numbers of objects with script in 3D such as inscriptions, coins, and seals, which provide valuable insights into the history of humanity. Cuneiform tablets in particular provide access to information on more than three millennia BC. Since these clay tablets require an extensive examination for transcription, we developed the modular GigaMesh software framework to provide high-contrast visualization of tablets captured with 3D acquisiton techniques. This framework was extended to provide digital drawings exported as XML-based Scalable Vector Graphics (SVG), which are the fundamental input of our approach inspired by machine-learning techniques based on the principle of word spotting. This results in a versatile symbol-spotting algorithm to retrieve graphical elements from drawings enabling automated annotations. Through data homogenization, we achieve compatibility to digitally born manual drawings, as well as to retro-digitized drawings. The latter are found in large Open Access databases, e.g. provided by the Cuneiform Database Library Initiative (CDLI). Ongoing and future work concerns the adaptation of filtering and graphical query techniques for two-dimensional raster images widely used within Digital Humanities research.

Item Type: Book Section, Proceedings Item or annotation in a legal commentary
Translated abstract:
AbstractLanguage
in 3D, wie z.B. Inschriften, Münzen und Siegelabdrücke. Diese erlauben wertvolle Einblicke in die Geschichte der Menschheit. Das gilt besonders für Keilschrifttafeln, die Informationen über dreieinhalb Jahrtausende vor der Geburt Christi übertragen. Weil diese Tontafeln eine gründliche Untersuchung, Umzeichung und Umschrift benötigen, haben wir das modulare GigaMesh Software Framework entwickelt, das eine kontrastreiche Darstellung von 3D-vermessenen Tafeln in hoher Auflösung ermöglicht. GigaMesh bietet dazu die Möglichkeit zum Export von Vektorzeichnungen im XML-basierten Scalable Vector Graphics (SVG) Dateiformat. Diese Dateien stellen die Datenbasis für Verfahren aus dem Bereich des Machine Learning dar, die wiederum auf dem Prinzip des Word Spotting beruhen. Daraus ist eine graphische Suchmöglichkeit von Symbolen bzw. Zeichen entstanden, mit der eine automatische Annotation möglich wird. Durch die Homogenisierung von Dateiformaten konnten wir eine Kompatibilität mit weiteren Quellen in Form von digital erstellten Handzeichnungen und Retro-Digitalisaten erreichen. Letztere stehen online per Open Access z.B. im Rahmen der Cuneiform Database Library Initiative (CDLI) zur Verfügung. Laufende und künftige Arbeiten sind die Adaption unserer graphischen Verfahren für zweidimensionale Rasterbilder, wie sie in den Digital Humanities häufig zu finden sind.German
Creators:
CreatorsEmailORCIDORCID Put Code
Bogacz, BartoszUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Mara, HubertUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Editors:
EditorsEmailORCIDORCID Put Code
Busch, HannahUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Fischer, Franzfranz.fischer@uni-koeln.deUNSPECIFIEDUNSPECIFIED
Sahle, Patricksahle@uni-koeln.deUNSPECIFIEDUNSPECIFIED
Corporate Creators: Institut für Dokumentologie und Editorik
Corporate Contributors: Institut für Dokumentologie und Editorik
URN: urn:nbn:de:hbz:38-77859
Title of Book: Kodikologie und Paläographie im Digitalen Zeitalter 4 – Codicology and Palaeography in the Digital Age 4
Series Name at the University of Cologne: Schriften des Instituts für Dokumentologie und Editorik
Volume: 11
Page Range: pp. 137-149
Date: July 2017
Publisher: Books on Demand
Place of Publication: Norderstedt
Language: English
Divisions: Faculty of Arts and Humanities > Zentrale Forschungseinrichtungen > Cologne Center for eHumanities (CCeH)
Subjects: Data processing Computer science
Library and information sciences
Related URLs:
Funders: Bundesministerium für Bildung und Forschung (BMBF)
Projects: eCodicology
Refereed: Yes
URI: http://kups.ub.uni-koeln.de/id/eprint/7785

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item