Tomasi, Gilbert and Tomasi, Roland (2009). Approche informatique du document manuscrit. In: Kodikologie und Paläographie im digitalen Zeitalter - Codicology and Palaeography in the Digital Age. BoD, Norderstedt, pp. 197-218. ISBN 978-3-8370-9842-6

[img]
Preview
PDF
KPDZ_I_Tomasi.pdf

Download (3MB)

Abstract

Les technologies mises en oeuvre avec le logiciel BIT-Alpha, sont la base d'un outil informatique d'aide à l'analyse de l'écriture manuscrite naturelle, pour transcription et identification, pour une utilisation en paléographie. Dans l'image numérique, la capture du contenu du document en permet une analyse, puis une interprétation et une valorisation. La binarisation, la capture des lignes et la segmentation de l'image sont exposées et commentées. L'identification des mots, puis des lettres permet une première reconnaissance de l'écriture, basée sur l'analyse du graphisme. La transcription du texte s'appuie en complément sur des considérations linguistiques. Les critères d'analyse du graphisme permettent aussi une aide à l'identification du scribe. Une idée de mesure et de normalisation de la différentiation entre écritures est envisagée. Les éléments graphiques peuvent être édités. En exemple, le traitement d'un texte manuscrit est détaillé.

Item Type: Book Chapter or Proceedings Item
Translated title:
TitleLanguage
Computer Science Approaches Towards Handwritten DocumentsEnglish
Translated abstract:
AbstractLanguage
The technologies used by the software BIT-Alpha are the basis as well for computeraided analysis, identification, and transcription of writings as for their interpretation and evaluation for palaeographical research. The present article presents methods for binarisation, line detection and image segmentation. During the graphical analysis of script which is used as initial approach to script recognition words will be recognised first and after them single characters. The transcription of text then has to be assisted by linguistic methods. The criteria which are drawn on for the analysis of script will help to identify individual scribes. The recognition of a medieval written text is presented in detail. Ideas of how differences between writing styles can be measured and normalized will present future prospects.English
Creators:
CreatorsEmailORCID
Tomasi, GilbertUNSPECIFIEDUNSPECIFIED
Tomasi, RolandUNSPECIFIEDUNSPECIFIED
Editors:
EditorsEmailORCID
Rehbein, MalteUNSPECIFIEDUNSPECIFIED
Schaßan, TorstenUNSPECIFIEDUNSPECIFIED
Sahle, Patricksahle@uni-koeln.deUNSPECIFIED
Corporate Contributors: Institute for Documentology and Scholarly Editing
URN: urn:nbn:de:hbz:38-29708
["eprint_fieldname_local_series" not defined]: Schriften des Instituts für Dokumentologie und Editorik
Publisher: BoD
ISBN: 978-3-8370-9842-6
Volume: 2
Subjects: Library and information sciences
Uncontrolled Keywords:
KeywordsLanguage
Paläographie , Optische Zeichenerkennung , OCR , BIT-Alpha , Mittelalter , HandidentifikationGerman
palaeography , optical character recognition , OCR , BIT-Alpha , Middle Ages , identification of scribal handsEnglish
Faculty: Faculty of Arts and Humanities
Divisions: Faculty of Arts and Humanities > no entry
Language: French
Date: 2009
Full Text Status: Public
Date Deposited: 15 Dec 2009 11:31
Place of Publication: Norderstedt
Status: Published
Page Range: pp. 197-218
Title of Book: Kodikologie und Paläographie im digitalen Zeitalter - Codicology and Palaeography in the Digital Age
URI: http://kups.ub.uni-koeln.de/id/eprint/2970

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item