Bogacz, Bartosz and Mara, Hubert Busch, Hannah and Fischer, Franz and Sahle, Patrick, eds (2017). Automatable Annotations – Image Processing and Machine Learning for Script in 3D and 2D with GigaMesh. In: Kodikologie und Paläographie im Digitalen Zeitalter 4 – Codicology and Palaeography in the Digital Age 4. Books on Demand , Norderstedt, pp. 137-149.

[img]
Preview
PDF
09_mara.pdf - Published Version

Download (9MB)

Abstract

Libraries, archives and museums hold vast numbers of objects with script in 3D such as inscriptions, coins, and seals, which provide valuable insights into the history of humanity. Cuneiform tablets in particular provide access to information on more than three millennia BC. Since these clay tablets require an extensive examination for transcription, we developed the modular GigaMesh software framework to provide high-contrast visualization of tablets captured with 3D acquisiton techniques. This framework was extended to provide digital drawings exported as XML-based Scalable Vector Graphics (SVG), which are the fundamental input of our approach inspired by machine-learning techniques based on the principle of word spotting. This results in a versatile symbol-spotting algorithm to retrieve graphical elements from drawings enabling automated annotations. Through data homogenization, we achieve compatibility to digitally born manual drawings, as well as to retro-digitized drawings. The latter are found in large Open Access databases, e.g. provided by the Cuneiform Database Library Initiative (CDLI). Ongoing and future work concerns the adaptation of filtering and graphical query techniques for two-dimensional raster images widely used within Digital Humanities research.

Item Type: Book Chapter or Proceedings Item
Translated abstract:
AbstractLanguage
in 3D, wie z.B. Inschriften, Münzen und Siegelabdrücke. Diese erlauben wertvolle Einblicke in die Geschichte der Menschheit. Das gilt besonders für Keilschrifttafeln, die Informationen über dreieinhalb Jahrtausende vor der Geburt Christi übertragen. Weil diese Tontafeln eine gründliche Untersuchung, Umzeichung und Umschrift benötigen, haben wir das modulare GigaMesh Software Framework entwickelt, das eine kontrastreiche Darstellung von 3D-vermessenen Tafeln in hoher Auflösung ermöglicht. GigaMesh bietet dazu die Möglichkeit zum Export von Vektorzeichnungen im XML-basierten Scalable Vector Graphics (SVG) Dateiformat. Diese Dateien stellen die Datenbasis für Verfahren aus dem Bereich des Machine Learning dar, die wiederum auf dem Prinzip des Word Spotting beruhen. Daraus ist eine graphische Suchmöglichkeit von Symbolen bzw. Zeichen entstanden, mit der eine automatische Annotation möglich wird. Durch die Homogenisierung von Dateiformaten konnten wir eine Kompatibilität mit weiteren Quellen in Form von digital erstellten Handzeichnungen und Retro-Digitalisaten erreichen. Letztere stehen online per Open Access z.B. im Rahmen der Cuneiform Database Library Initiative (CDLI) zur Verfügung. Laufende und künftige Arbeiten sind die Adaption unserer graphischen Verfahren für zweidimensionale Rasterbilder, wie sie in den Digital Humanities häufig zu finden sind.German
Creators:
CreatorsEmailORCID
Bogacz, BartoszUNSPECIFIEDUNSPECIFIED
Mara, HubertUNSPECIFIEDUNSPECIFIED
Editors:
EditorsEmailORCID
Busch, HannahUNSPECIFIEDUNSPECIFIED
Fischer, Franzfranz.fischer@uni-koeln.deUNSPECIFIED
Sahle, Patricksahle@uni-koeln.deUNSPECIFIED
Corporate Creators: Institut für Dokumentologie und Editorik
Corporate Contributors: Institut für Dokumentologie und Editorik
URN: urn:nbn:de:hbz:38-77859
Series Name at the University of Cologne: Schriften des Instituts für Dokumentologie und Editorik
Publisher: Books on Demand
Volume: 11
Subjects: Data processing Computer science
Library and information sciences
Divisions: Faculty of Arts and Humanities > Cologne Center for eHumanities (CCeH)
Language: English
Date: July 2017
Full Text Status: Public
Related URLs:
Date Deposited: 08 Sep 2017 07:03
Funders: Bundesministerium für Bildung und Forschung (BMBF)
Projects: eCodicology
Place of Publication: Norderstedt
Refereed: Yes
Status: Published
Page Range: pp. 137-149
Title of Book: Kodikologie und Paläographie im Digitalen Zeitalter 4 – Codicology and Palaeography in the Digital Age 4
URI: http://kups.ub.uni-koeln.de/id/eprint/7785

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item