Wolf, Lior and Dershowitz, Nachum and Potikha, Liza and German, Tanya and Shweka, Roni and Choueka, Yaakov (2011) Automatic Palaeographic Exploration of Genizah Manuscripts. In: Kodikologie und Paläographie im digitalen Zeitalter 2 - Codicology and Palaeography in the Digital Age 2. Schriften des Instituts für Dokumentologie und Editorik, 3 . Books on Demand (BoD), Norderstedt, pp. 157-179. ISBN 978-3-8423-5032-8

[img]
Preview
PDF
10_dershowitz.pdf

Download (20MB)

Abstract

The Cairo Genizah is a collection of hand-written documents containing approximately 350,000 fragments of mainly Jewish texts discovered in the late 19th century. The fragments are today spread out in some 75 libraries and private collections worldwide, but there is an ongoing effort to document and catalogue all extant fragments. Palaeographic information plays a key role in the study of the Genizah collection. Script style, and–more specifically–handwriting, can be used to identify fragments that might originate from the same original work. Such matched fragments, commonly referred to as “joins”, are currently identified manually by experts, and presumably only a small fraction of existing joins have been discovered to date. In this work, we show that automatic handwriting matching functions, obtained from non-specific features using a corpus of writing samples, can perform this task quite reliably. In addition, we explore the problem of grouping various Genizah documents by script style, without being provided any prior information about the relevant styles. The automatically obtained grouping agrees, for the most part, with the palaeographic taxonomy. In cases where the method fails, it is due to apparent similarities between related scripts.

Item Type: Book Section
Translated abstract:
AbstractLanguage
Die Geniza aus Kairo ist eine Sammlung von ca. 350.000 handschriftlichen Fragmenten jüdischer Texte, die im späten 19. Jahrhundert entdeckt wurde. Die Fragmente werden heute in 75 Bibliotheken und privaten Sammlungen auf der ganzen Welt aufbewahrt. Eine umfassende Dokumentation und Katalogisierung aller Fragmente ist in Arbeit. Paläographische Informationen spielen für die Erforschung der Geniza eine entscheidende Rolle. Schriftstil und Handidentifizierung können genutzt werden, um Fragmente der selben Quelle zu identifizieren. Solche zusammengehörigen Fragmente (sog. “joins”) müssen zur Zeit manuell von Experten gefunden werden. Es ist davon auszugehen, dass nur eine kleine Zahl solcher “joins” bis heute entdeckt werden konnte. In diesem Beitrag sollen zuverlässige Methoden zur automatischen Identifikation von Händen vorgestellt werden, die auf unspezifischen Merkmalen beruhen und einen Corpus von Schriftbeispielen benutzen. Zusätzlich untersucht der Beitrag Möglichkeiten, Geniza-Dokumente nach der Schriftart zu klassifizieren. Diese automatisch erschlossenen Gruppen stimmen größtenteils mit einer paläographischen Taxonomie überein. In einzelnen Fällen scheitert dieMethode auf Grund offensichtlicher Ähnlichkeiten zwischen den Schriftarten.German
Creators:
CreatorsEmailORCID
Wolf, LiorUNSPECIFIEDUNSPECIFIED
Dershowitz, NachumUNSPECIFIEDUNSPECIFIED
Potikha, LizaUNSPECIFIEDUNSPECIFIED
German, TanyaUNSPECIFIEDUNSPECIFIED
Shweka, RoniUNSPECIFIEDUNSPECIFIED
Choueka, YaakovUNSPECIFIEDUNSPECIFIED
Editors:
EditorsEmailORCID
Fischer, Franzfranz.fischer@uni-koeln.deUNSPECIFIED
Fritze, Christianechristiane.fritze@sub.uni-goettingen.deUNSPECIFIED
Vogeler, Georggeorg.vogeler@uni-graz.atUNSPECIFIED
Corporate Creators: Institut für Dokumentologie und Editorik (IDE)
URN: urn:nbn:de:hbz:38-43481
Series Name: Schriften des Instituts für Dokumentologie und Editorik
Publisher: Books on Demand (BoD)
ISBN: 978-3-8423-5032-8
Volume: 3
Subjects: Data processing Computer science
Library and information sciences
Christian theology
Other languages
Geography and history
History of ancient world
Uncontrolled Keywords:
KeywordsLanguage
Handschriftenkunde, Paläographie, Kodikologie, Digitale Geisteswissenschaften, Historische Hilfswissenschaften, Digitalisierung, Schriftbeschreibung, Texterkennung German
Codicology, Palaeography, Manuscripts, Scripts, Digitization, Character Recognition, Digital Humanities, Medieval StudiesEnglish
Divisions: Faculty of Arts and Humanities > Historisch - Kulturwissenschaftliche Informationsverarbeitung
Language: English
Date: 2011
Full Text Status: Public
Date Deposited: 23 Sep 2011 10:05
References: http://www.i-d-e.de [IDE-Homepage] http://www.i-d-e.de/schriften/2-kpdz1 [Presentation of volume 1] http://www.i-d-e.de/schriften/3-kpdz2 [Presentation of volume 2] http://kups.ub.uni-koeln.de/2939/ [KPDZ1 online]
URI: http://kups.ub.uni-koeln.de/id/eprint/4348

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item