Wolf, Lior, Dershowitz, Nachum, Potikha, Liza, German, Tanya, Shweka, Roni and Choueka, Yaakov (2011). Automatic Palaeographic Exploration of Genizah Manuscripts. In: Kodikologie und Paläographie im digitalen Zeitalter 2 - Codicology and Palaeography in the Digital Age 2, pp. 157-179. Norderstedt: Books on Demand (BoD). ISBN 978-3-8423-5032-8

[img]
Preview
PDF
10_dershowitz.pdf

Download (20MB)

Abstract

The Cairo Genizah is a collection of hand-written documents containing approximately 350,000 fragments of mainly Jewish texts discovered in the late 19th century. The fragments are today spread out in some 75 libraries and private collections worldwide, but there is an ongoing effort to document and catalogue all extant fragments. Palaeographic information plays a key role in the study of the Genizah collection. Script style, and–more specifically–handwriting, can be used to identify fragments that might originate from the same original work. Such matched fragments, commonly referred to as “joins”, are currently identified manually by experts, and presumably only a small fraction of existing joins have been discovered to date. In this work, we show that automatic handwriting matching functions, obtained from non-specific features using a corpus of writing samples, can perform this task quite reliably. In addition, we explore the problem of grouping various Genizah documents by script style, without being provided any prior information about the relevant styles. The automatically obtained grouping agrees, for the most part, with the palaeographic taxonomy. In cases where the method fails, it is due to apparent similarities between related scripts.

Item Type: Book Section, Proceedings Item or annotation in a legal commentary
Translated abstract:
AbstractLanguage
Die Geniza aus Kairo ist eine Sammlung von ca. 350.000 handschriftlichen Fragmenten jüdischer Texte, die im späten 19. Jahrhundert entdeckt wurde. Die Fragmente werden heute in 75 Bibliotheken und privaten Sammlungen auf der ganzen Welt aufbewahrt. Eine umfassende Dokumentation und Katalogisierung aller Fragmente ist in Arbeit. Paläographische Informationen spielen für die Erforschung der Geniza eine entscheidende Rolle. Schriftstil und Handidentifizierung können genutzt werden, um Fragmente der selben Quelle zu identifizieren. Solche zusammengehörigen Fragmente (sog. “joins”) müssen zur Zeit manuell von Experten gefunden werden. Es ist davon auszugehen, dass nur eine kleine Zahl solcher “joins” bis heute entdeckt werden konnte. In diesem Beitrag sollen zuverlässige Methoden zur automatischen Identifikation von Händen vorgestellt werden, die auf unspezifischen Merkmalen beruhen und einen Corpus von Schriftbeispielen benutzen. Zusätzlich untersucht der Beitrag Möglichkeiten, Geniza-Dokumente nach der Schriftart zu klassifizieren. Diese automatisch erschlossenen Gruppen stimmen größtenteils mit einer paläographischen Taxonomie überein. In einzelnen Fällen scheitert dieMethode auf Grund offensichtlicher Ähnlichkeiten zwischen den Schriftarten.German
Creators:
CreatorsEmailORCIDORCID Put Code
Wolf, LiorUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Dershowitz, NachumUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Potikha, LizaUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
German, TanyaUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Shweka, RoniUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Choueka, YaakovUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Editors:
EditorsEmailORCIDORCID Put Code
Fischer, Franzfranz.fischer@uni-koeln.deUNSPECIFIEDUNSPECIFIED
Fritze, Christianechristiane.fritze@sub.uni-goettingen.deUNSPECIFIEDUNSPECIFIED
Vogeler, Georggeorg.vogeler@uni-graz.atUNSPECIFIEDUNSPECIFIED
Corporate Creators: Institut für Dokumentologie und Editorik (IDE)
URN: urn:nbn:de:hbz:38-43481
Title of Book: Kodikologie und Paläographie im digitalen Zeitalter 2 - Codicology and Palaeography in the Digital Age 2
Series Name at the University of Cologne: Schriften des Instituts für Dokumentologie und Editorik
Volume: 3
Page Range: pp. 157-179
Number of Pages: 0
Date: 2011
Publisher: Books on Demand (BoD)
Place of Publication: Norderstedt
ISBN: 978-3-8423-5032-8
Language: English
Divisions: Faculty of Arts and Humanities > Fächergruppe 2: Archäologie, Altertumskunde und Kulturen des Mittelmeerraums > Archäologisches Institut > Abteilung für Historisch-kulturwissenschaftliche Informationsverarbeitung
Subjects: Data processing Computer science
Library and information sciences
Christian theology
Other languages
Geography and history
History of ancient world
Uncontrolled Keywords:
KeywordsLanguage
Handschriftenkunde, Paläographie, Kodikologie, Digitale Geisteswissenschaften, Historische Hilfswissenschaften, Digitalisierung, Schriftbeschreibung, TexterkennungGerman
Codicology, Palaeography, Manuscripts, Scripts, Digitization, Character Recognition, Digital Humanities, Medieval StudiesEnglish
References: http://www.i-d-e.de [IDE-Homepage] http://www.i-d-e.de/schriften/2-kpdz1 [Presentation of volume 1] http://www.i-d-e.de/schriften/3-kpdz2 [Presentation of volume 2] http://kups.ub.uni-koeln.de/2939/ [KPDZ1 online]
Refereed: Yes
URI: http://kups.ub.uni-koeln.de/id/eprint/4348

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item