Fusi, Daniele (2009). Aspects of Application of Neural Recognition to Digital Editions. In: Kodikologie und Paläographie im digitalen Zeitalter - Codicology and Palaeography in the Digital Age, pp. 175-195. Norderstedt: BoD. ISBN 978-3-8370-9842-6

[img]
Preview
PDF
KPDZ_I_Fusi.pdf

Download (697kB)

Abstract

Artificial neuronal networks (ANN) are widely used in software systems which require solutions to problems without a traditional algorithmic approach, like in character recognition: ANN learn by example, so that they require a consistent and well-chosen set of samples to be trained to recognize their patterns. The network is taught to react with high activity in some of its output neurons whenever an input sample belonging to a specified class (e.g. a letter shape) is presented, and has the ability to assess the similarity of samples never encountered before by any of these models. Typical OCR applications thus require a significant amount of preprocessing for such samples, like resizing images and removing all the "noise" data, letting the letter contours emerge clearly from the background. Furthermore, usually a huge number of samples is required to effectively train a network to recognize a character against all the others. This may represent an issue for palaeographical applications because of the relatively low quantity and high complexity of digital samples available, and poses even more problems when our aim is detecting subtle differences (e.g. the special shape of a specific letter from a well-defined period and scriptorium). It would be probably wiser for scholars to define some guidelines for extracting from samples the features defined as most relevant according to their purposes, and let the network deal with just a subset of the overwhelming amount of detailed nuances available. ANN are no magic, and it is always the careful judgement of scholars to provide a theoretical foundation for any computer-based tool they might want to use to help them solve their problems: we can easily illustrate this point with samples drawn from any other application of IT to humanities. Just as we can expect no magic in detecting alliterations in a text if we simply feed a system with a collection of letters, we can no more claim that a neural recognition system might be able to perform well with a relatively small sample where each shape is fed as it is, without instructing the system about the features scholars define as relevant. Even before ANN implementations, it is exactly this theoretical background which must be put to the test when planning such systems.

Item Type: Book Section, Proceedings Item or annotation in a legal commentary
Translated abstract:
AbstractLanguage
Künstliche neuronale Netze (Artificial Neural Networks, ANN) sind in solchen Softwaresystemen weit verbreitet, die Probleme wie Zeichenerkennung zu lösen suchen, ohne einen traditionellen algorithmischen Ansatz zu verfolgen. Weil ANN am Beispiel lernen, brauchen sie einen konsistenten und gut ausgewählten Satz an Proben um die Mustererkennung zu trainieren. Das Netz reagiert mit einer hohen Aktivität in seinen Output-Neuronen, wenn ihm ein Input-Muster präsentiert wird, das zu einer bestimmten Klasse (z.B. einer Zeichenform) gehört. Es kann die Ähnlichkeit von Beispielen berechnen, die mit einem solchen Modell noch nicht verglichen worden sind. Typische OCR-Anwendungen erfordern eine erhebliche Vorverarbeitung der Beispiele, bei der die Größen der Abbildungen verändert und das »Rauschen« (d.h. störende Daten) entfernt werden, so dass sich die Buchstabenformen klar vom Hintergrund abheben. Darüber hinaus braucht man normalerweise eine sehr große Zahl von Beispielen, um das Netz darauf zu trainieren, ein Zeichen von allen anderen zu unterscheiden. Dies stellt wegen der relativ niedrigen Qualität und der hohen Komplexität der verfügbaren digitalen Beispiele eine Herausforderung für paläographische Anwendungen dar. Es wirft noch mehr Probleme auf, wenn es darum geht, feine Unterschiede, z.B. die besondere Form eines einzelnen Buchstabens aus einer bestimmten Phase eines Scriptoriums, zu entdecken. Dabei scheint es ratsam, einige Regeln zu bestimmen, nach denen die für bestimmte Fragestellungen wichtigsten Merkmale aus den Proben extrahiert würden, und das Netz dann nur noch mit einer Teilmenge der andernfalls überwältigenden Menge an feinen Unterschieden arbeiten zu lassen. ANN sind keine Zauberei, und es bedarf immer des sorgfältigen Urteils der Forschenden, um eine theoretische Grundlage für ein computergestütztes Werkzeug zu schaffen, das bei der Lösung ihrer Probleme helfen soll: Dies lässt sich leicht an anderen Beispielen zu IT-Anwendungen in den Geistes-und Kulturwissenschaften belegen. So wie wir kein Hexenwerk bei der Erkennung von Alliterationen erwarten können, wenn wir ein System nur mit einer Reihe von Buchstaben füttern, so können wir auch von keinem neuronalen Erkennungssystem verlangen, dass es mit einem relativ kleinen Satz an Beispielen zurecht kommt, wenn jedes Zeichen unbearbeitet eingegeben wird, ohne das System darüber zu informieren, welche Merkmale von den Forschenden als besonders wichtig definiert werden. Ein solches theoretisches Fundament muss jedoch noch vor der Planung und Umsetzung künstlicher neuronaler Netzwerke entwickelt und geprüft werden.German
Creators:
CreatorsEmailORCIDORCID Put Code
Fusi, DanieleUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Editors:
EditorsEmailORCIDORCID Put Code
Rehbein, MalteUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Schaßan, TorstenUNSPECIFIEDUNSPECIFIEDUNSPECIFIED
Sahle, Patricksahle@uni-koeln.deUNSPECIFIEDUNSPECIFIED
Corporate Contributors: Institute for Documentology and Scholarly Editing
URN: urn:nbn:de:hbz:38-29697
Title of Book: Kodikologie und Paläographie im digitalen Zeitalter - Codicology and Palaeography in the Digital Age
Series Name at the University of Cologne: Schriften des Instituts für Dokumentologie und Editorik
Volume: 2
Page Range: pp. 175-195
Date: 2009
Publisher: BoD
Place of Publication: Norderstedt
ISBN: 978-3-8370-9842-6
Language: English
Faculty: Faculty of Arts and Humanities
Divisions: Ehemalige Fakultäten, Institute, Seminare > Faculty of Arts and Humanities > no entry
Subjects: Library and information sciences
Uncontrolled Keywords:
KeywordsLanguage
Optische Zeichenerkennung , OCR , Artificial Neural Networks , ANNGerman
optical character recognition , OCR , artificial neural networks , ANNEnglish
URI: http://kups.ub.uni-koeln.de/id/eprint/2969

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item