Tomasi, Gilbert and Tomasi, Roland (2009). Approche informatique du document manuscrit. In: Kodikologie und Paläographie im digitalen Zeitalter - Codicology and Palaeography in the Digital Age, pp. 197-218. Norderstedt: BoD. ISBN 978-3-8370-9842-6

[img]
Preview
PDF
KPDZ_I_Tomasi.pdf

Download (3MB)

Abstract

Les technologies mises en oeuvre avec le logiciel BIT-Alpha, sont la base d'un outil informatique d'aide à l'analyse de l'écriture manuscrite naturelle, pour transcription et identification, pour une utilisation en paléographie. Dans l'image numérique, la capture du contenu du document en permet une analyse, puis une interprétation et une valorisation. La binarisation, la capture des lignes et la segmentation de l'image sont exposées et commentées. L'identification des mots, puis des lettres permet une première reconnaissance de l'écriture, basée sur l'analyse du graphisme. La transcription du texte s'appuie en complément sur des considérations linguistiques. Les critères d'analyse du graphisme permettent aussi une aide à l'identification du scribe. Une idée de mesure et de normalisation de la différentiation entre écritures est envisagée. Les éléments graphiques peuvent être édités. En exemple, le traitement d'un texte manuscrit est détaillé.

Item Type: Book Section, Proceedings Item or annotation in a legal commentary
Translated title:
TitleLanguage
Computer Science Approaches Towards Handwritten DocumentsEnglish
Translated abstract:
AbstractLanguage
The technologies used by the software BIT-Alpha are the basis as well for computeraided analysis, identification, and transcription of writings as for their interpretation and evaluation for palaeographical research. The present article presents methods for binarisation, line detection and image segmentation. During the graphical analysis of script which is used as initial approach to script recognition words will be recognised first and after them single characters. The transcription of text then has to be assisted by linguistic methods. The criteria which are drawn on for the analysis of script will help to identify individual scribes. The recognition of a medieval written text is presented in detail. Ideas of how differences between writing styles can be measured and normalized will present future prospects.English
Creators:
CreatorsEmailORCIDORCID Put Code
Tomasi, GilbertUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Tomasi, RolandUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Editors:
EditorsEmailORCIDORCID Put Code
Rehbein, MalteUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Schaßan, TorstenUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Sahle, Patricksahle@uni-koeln.deUNSPECIFIEDUNSPECIFIED
Corporate Contributors: Institute for Documentology and Scholarly Editing
URN: urn:nbn:de:hbz:38-29708
Title of Book: Kodikologie und Paläographie im digitalen Zeitalter - Codicology and Palaeography in the Digital Age
Series Name at the University of Cologne: Schriften des Instituts für Dokumentologie und Editorik
Volume: 2
Page Range: pp. 197-218
Date: 2009
Publisher: BoD
Place of Publication: Norderstedt
ISBN: 978-3-8370-9842-6
Language: French
Faculty: Faculty of Arts and Humanities
Divisions: Ehemalige Fakultäten, Institute, Seminare > Faculty of Arts and Humanities > no entry
Subjects: Library and information sciences
Uncontrolled Keywords:
KeywordsLanguage
Paläographie , Optische Zeichenerkennung , OCR , BIT-Alpha , Mittelalter , HandidentifikationGerman
palaeography , optical character recognition , OCR , BIT-Alpha , Middle Ages , identification of scribal handsEnglish
URI: http://kups.ub.uni-koeln.de/id/eprint/2970

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item