Universität zu Köln

Aspects of Application of Neural Recognition to Digital Editions

Fusi, Daniele (2009) Aspects of Application of Neural Recognition to Digital Editions. In: Kodikologie und Paläographie im digitalen Zeitalter - Codicology and Palaeography in the Digital Age. Schriften des Instituts für Dokumentologie und Editorik, 2. BoD, Norderstedt, pp. 175-195. ISBN 978-3-8370-9842-6

[img]
Preview
PDF
Download (681Kb) | Preview

    Abstract

    Artificial neuronal networks (ANN) are widely used in software systems which require solutions to problems without a traditional algorithmic approach, like in character recognition: ANN learn by example, so that they require a consistent and well-chosen set of samples to be trained to recognize their patterns. The network is taught to react with high activity in some of its output neurons whenever an input sample belonging to a specified class (e.g. a letter shape) is presented, and has the ability to assess the similarity of samples never encountered before by any of these models. Typical OCR applications thus require a significant amount of preprocessing for such samples, like resizing images and removing all the "noise" data, letting the letter contours emerge clearly from the background. Furthermore, usually a huge number of samples is required to effectively train a network to recognize a character against all the others. This may represent an issue for palaeographical applications because of the relatively low quantity and high complexity of digital samples available, and poses even more problems when our aim is detecting subtle differences (e.g. the special shape of a specific letter from a well-defined period and scriptorium). It would be probably wiser for scholars to define some guidelines for extracting from samples the features defined as most relevant according to their purposes, and let the network deal with just a subset of the overwhelming amount of detailed nuances available. ANN are no magic, and it is always the careful judgement of scholars to provide a theoretical foundation for any computer-based tool they might want to use to help them solve their problems: we can easily illustrate this point with samples drawn from any other application of IT to humanities. Just as we can expect no magic in detecting alliterations in a text if we simply feed a system with a collection of letters, we can no more claim that a neural recognition system might be able to perform well with a relatively small sample where each shape is fed as it is, without instructing the system about the features scholars define as relevant. Even before ANN implementations, it is exactly this theoretical background which must be put to the test when planning such systems.

    Item Type: Book Section
    Translated abstract:
    AbstractLanguage
    Künstliche neuronale Netze (Artificial Neural Networks, ANN) sind in solchen Softwaresystemen weit verbreitet, die Probleme wie Zeichenerkennung zu lösen suchen, ohne einen traditionellen algorithmischen Ansatz zu verfolgen. Weil ANN am Beispiel lernen, brauchen sie einen konsistenten und gut ausgewählten Satz an Proben um die Mustererkennung zu trainieren. Das Netz reagiert mit einer hohen Aktivität in seinen Output-Neuronen, wenn ihm ein Input-Muster präsentiert wird, das zu einer bestimmten Klasse (z.B. einer Zeichenform) gehört. Es kann die Ähnlichkeit von Beispielen berechnen, die mit einem solchen Modell noch nicht verglichen worden sind. Typische OCR-Anwendungen erfordern eine erhebliche Vorverarbeitung der Beispiele, bei der die Größen der Abbildungen verändert und das »Rauschen« (d.h. störende Daten) entfernt werden, so dass sich die Buchstabenformen klar vom Hintergrund abheben. Darüber hinaus braucht man normalerweise eine sehr große Zahl von Beispielen, um das Netz darauf zu trainieren, ein Zeichen von allen anderen zu unterscheiden. Dies stellt wegen der relativ niedrigen Qualität und der hohen Komplexität der verfügbaren digitalen Beispiele eine Herausforderung für paläographische Anwendungen dar. Es wirft noch mehr Probleme auf, wenn es darum geht, feine Unterschiede, z.B. die besondere Form eines einzelnen Buchstabens aus einer bestimmten Phase eines Scriptoriums, zu entdecken. Dabei scheint es ratsam, einige Regeln zu bestimmen, nach denen die für bestimmte Fragestellungen wichtigsten Merkmale aus den Proben extrahiert würden, und das Netz dann nur noch mit einer Teilmenge der andernfalls überwältigenden Menge an feinen Unterschieden arbeiten zu lassen. ANN sind keine Zauberei, und es bedarf immer des sorgfältigen Urteils der Forschenden, um eine theoretische Grundlage für ein computergestütztes Werkzeug zu schaffen, das bei der Lösung ihrer Probleme helfen soll: Dies lässt sich leicht an anderen Beispielen zu IT-Anwendungen in den Geistes-und Kulturwissenschaften belegen. So wie wir kein Hexenwerk bei der Erkennung von Alliterationen erwarten können, wenn wir ein System nur mit einer Reihe von Buchstaben füttern, so können wir auch von keinem neuronalen Erkennungssystem verlangen, dass es mit einem relativ kleinen Satz an Beispielen zurecht kommt, wenn jedes Zeichen unbearbeitet eingegeben wird, ohne das System darüber zu informieren, welche Merkmale von den Forschenden als besonders wichtig definiert werden. Ein solches theoretisches Fundament muss jedoch noch vor der Planung und Umsetzung künstlicher neuronaler Netzwerke entwickelt und geprüft werden.German
    Creators:
    CreatorsEmail
    Fusi, Daniele
    Editors:
    EditorsEmail
    Rehbein, Malte
    Schaßan, Torsten
    Sahle, Patricksahle@uni-koeln.de
    Corporate Contributors: Institute for Documentology and Scholarly Editing
    URN: urn:nbn:de:hbz:38-29697
    Series Name: Schriften des Instituts für Dokumentologie und Editorik
    Publisher: BoD
    ISBN: 978-3-8370-9842-6
    Volume: 2
    Subjects: Library and information sciences
    Uncontrolled Keywords:
    KeywordsLanguage
    Optische Zeichenerkennung , OCR , Artificial Neural Networks , ANNGerman
    optical character recognition , OCR , artificial neural networks , ANNEnglish
    Faculty: Philosophische Fakultät
    Divisions: Philosophische Fakultät > Keine Angabe
    Language: English
    Date: 2009
    Date Type: Completion
    Full Text Status: Public
    Date Deposited: 15 Dec 2009 12:30:00
    URI: http://kups.ub.uni-koeln.de/id/eprint/2969

    Actions (login required)

    View Item