Universität zu Köln

Approche informatique du document manuscrit

Tomasi, Gilbert and Tomasi, Roland (2009) Approche informatique du document manuscrit. In: Kodikologie und Paläographie im digitalen Zeitalter - Codicology and Palaeography in the Digital Age. Schriften des Instituts für Dokumentologie und Editorik, 2. BoD, Norderstedt, pp. 197-218. ISBN 978-3-8370-9842-6

[img]
Preview
PDF
Download (3404Kb) | Preview

    Abstract

    Les technologies mises en oeuvre avec le logiciel BIT-Alpha, sont la base d'un outil informatique d'aide à l'analyse de l'écriture manuscrite naturelle, pour transcription et identification, pour une utilisation en paléographie. Dans l'image numérique, la capture du contenu du document en permet une analyse, puis une interprétation et une valorisation. La binarisation, la capture des lignes et la segmentation de l'image sont exposées et commentées. L'identification des mots, puis des lettres permet une première reconnaissance de l'écriture, basée sur l'analyse du graphisme. La transcription du texte s'appuie en complément sur des considérations linguistiques. Les critères d'analyse du graphisme permettent aussi une aide à l'identification du scribe. Une idée de mesure et de normalisation de la différentiation entre écritures est envisagée. Les éléments graphiques peuvent être édités. En exemple, le traitement d'un texte manuscrit est détaillé.

    Item Type: Book Section
    Translated abstract:
    AbstractLanguage
    The technologies used by the software BIT-Alpha are the basis as well for computeraided analysis, identification, and transcription of writings as for their interpretation and evaluation for palaeographical research. The present article presents methods for binarisation, line detection and image segmentation. During the graphical analysis of script which is used as initial approach to script recognition words will be recognised first and after them single characters. The transcription of text then has to be assisted by linguistic methods. The criteria which are drawn on for the analysis of script will help to identify individual scribes. The recognition of a medieval written text is presented in detail. Ideas of how differences between writing styles can be measured and normalized will present future prospects.English
    Creators:
    CreatorsEmail
    Tomasi, Gilbert
    Tomasi, Roland
    Editors:
    EditorsEmail
    Rehbein, Malte
    Schaßan, Torsten
    Sahle, Patricksahle@uni-koeln.de
    Corporate Contributors: Institute for Documentology and Scholarly Editing
    URN: urn:nbn:de:hbz:38-29708
    Series Name: Schriften des Instituts für Dokumentologie und Editorik
    Publisher: BoD
    ISBN: 978-3-8370-9842-6
    Volume: 2
    Subjects: Library and information sciences
    Uncontrolled Keywords:
    KeywordsLanguage
    Paläographie , Optische Zeichenerkennung , OCR , BIT-Alpha , Mittelalter , HandidentifikationGerman
    palaeography , optical character recognition , OCR , BIT-Alpha , Middle Ages , identification of scribal handsEnglish
    Faculty: Philosophische Fakultät
    Divisions: Philosophische Fakultät > Keine Angabe
    Language: French
    Date: 2009
    Date Type: Completion
    Full Text Status: Public
    Date Deposited: 15 Dec 2009 12:31:19
    URI: http://kups.ub.uni-koeln.de/id/eprint/2970

    Actions (login required)

    View Item