Universität zu Köln

Automatic Palaeographic Exploration of Genizah Manuscripts

Institut für Dokumentologie und Editorik (IDE) (2011) Automatic Palaeographic Exploration of Genizah Manuscripts. In: Kodikologie und Paläographie im digitalen Zeitalter 2 - Codicology and Palaeography in the Digital Age 2. Schriften des Instituts für Dokumentologie und Editorik, 3. Books on Demand (BoD), Norderstedt, pp. 157-179. ISBN 978-3-8423-5032-8

[img]
Preview
PDF
Download (19Mb) | Preview

    Abstract

    The Cairo Genizah is a collection of hand-written documents containing approximately 350,000 fragments of mainly Jewish texts discovered in the late 19th century. The fragments are today spread out in some 75 libraries and private collections worldwide, but there is an ongoing effort to document and catalogue all extant fragments. Palaeographic information plays a key role in the study of the Genizah collection. Script style, and–more specifically–handwriting, can be used to identify fragments that might originate from the same original work. Such matched fragments, commonly referred to as “joins”, are currently identified manually by experts, and presumably only a small fraction of existing joins have been discovered to date. In this work, we show that automatic handwriting matching functions, obtained from non-specific features using a corpus of writing samples, can perform this task quite reliably. In addition, we explore the problem of grouping various Genizah documents by script style, without being provided any prior information about the relevant styles. The automatically obtained grouping agrees, for the most part, with the palaeographic taxonomy. In cases where the method fails, it is due to apparent similarities between related scripts.

    Item Type: Book Section
    Translated abstract:
    AbstractLanguage
    Die Geniza aus Kairo ist eine Sammlung von ca. 350.000 handschriftlichen Fragmenten jüdischer Texte, die im späten 19. Jahrhundert entdeckt wurde. Die Fragmente werden heute in 75 Bibliotheken und privaten Sammlungen auf der ganzen Welt aufbewahrt. Eine umfassende Dokumentation und Katalogisierung aller Fragmente ist in Arbeit. Paläographische Informationen spielen für die Erforschung der Geniza eine entscheidende Rolle. Schriftstil und Handidentifizierung können genutzt werden, um Fragmente der selben Quelle zu identifizieren. Solche zusammengehörigen Fragmente (sog. “joins”) müssen zur Zeit manuell von Experten gefunden werden. Es ist davon auszugehen, dass nur eine kleine Zahl solcher “joins” bis heute entdeckt werden konnte. In diesem Beitrag sollen zuverlässige Methoden zur automatischen Identifikation von Händen vorgestellt werden, die auf unspezifischen Merkmalen beruhen und einen Corpus von Schriftbeispielen benutzen. Zusätzlich untersucht der Beitrag Möglichkeiten, Geniza-Dokumente nach der Schriftart zu klassifizieren. Diese automatisch erschlossenen Gruppen stimmen größtenteils mit einer paläographischen Taxonomie überein. In einzelnen Fällen scheitert dieMethode auf Grund offensichtlicher Ähnlichkeiten zwischen den Schriftarten.German
    Creators:
    CreatorsEmail
    Wolf, Lior
    Dershowitz, Nachum
    Potikha, Liza
    German, Tanya
    Shweka, Roni
    Choueka, Yaakov
    Editors:
    EditorsEmail
    Fischer, Franzfranz.fischer@uni-koeln.de
    Fritze, Christianechristiane.fritze@sub.uni-goettingen.de
    Vogeler, Georggeorg.vogeler@uni-graz.at
    Corporate Creators: Institut für Dokumentologie und Editorik (IDE)
    URN: urn:nbn:de:hbz:38-43481
    Series Name: Schriften des Instituts für Dokumentologie und Editorik
    Publisher: Books on Demand (BoD)
    ISBN: 978-3-8423-5032-8
    Volume: 3
    Subjects: Data processing Computer science
    Library and information sciences
    Christian theology
    Other languages
    Geography and history
    History of ancient world
    Uncontrolled Keywords:
    KeywordsLanguage
    Handschriftenkunde, Paläographie, Kodikologie, Digitale Geisteswissenschaften, Historische Hilfswissenschaften, Digitalisierung, Schriftbeschreibung, TexterkennungGerman
    Codicology, Palaeography, Manuscripts, Scripts, Digitization, Character Recognition, Digital Humanities, Medieval StudiesEnglish
    Divisions: Philosophische Fakultät > Historisch - Kulturwissenschaftliche Informationsverarbeitung
    Language: English
    Date: 2011
    Date Type: Publication
    Full Text Status: Public
    Date Deposited: 23 Sep 2011 12:05:27
    URI: http://kups.ub.uni-koeln.de/id/eprint/4348

    Actions (login required)

    View Item