Universität zu Köln

Image and Text in Numbers: Layout Analysis for Hispanic and Spanish Modern Magazines

Rißler-Pipka, Nanette (2017) Image and Text in Numbers: Layout Analysis for Hispanic and Spanish Modern Magazines. In: Kodikologie und Paläographie im Digitalen Zeitalter 4 – Codicology and Palaeography in the Digital Age 4. Schriften des Instituts für Dokumentologie und Editorik, 11. Books on Demand, Norderstedt, pp. 25-42. ISBN 978-3-7448-3877-1

[img]
Preview
PDF - Published Version
Download (13Mb) | Preview

    Abstract

    Hispanic and Spanish modern magazines were long time a neglected field of research. Even if the magazines are regarded as a valuable source for information about contemporary cultural, social and political life for various disciplines like cultural, literary, media or social studies or linguistics. But stored in libraries as sensitive material and threated soon by decay most of the magazines were not accessible for researchers. Since digitization this has changed. The project Revistas culturales 2.0 (University of Augsburg) tries to work on the digital collection of the IAI (Ibero-American Institute, Preußischer Kulturbesitz, Berlin) by annotating the magazine pages and analysing the metadata using digital tools. But as we are experienced in cultural, media and romance studies, the complex field of automatic document analysis stayed hidden for us, without the cooperation with experts in computer science (where in context of digitizing projects and OCR important research is already achieved).1 Also, in the DH this field is not as advanced as for example text mining, therefore it proved difficult to find tools for quantitative analysis (for example relation of textual and image parts in the magazines). In cooperation with the project eCodicology and reusing their tool SWATI we found now a way how layout analysis for Hispanic and Spanish modern magazines might be done in future by measuring each page automatically. In consequence the paper can only present a concept of how useful the tool and quantitative analysis of the layout might be for analysing the Hispanic and Spanish modern magazines from the perspective of Humanities.

    Item Type: Book Section
    Translated abstract:
    AbstractLanguage
    Lateinamerikanische und spanische Kulturzeitschriften der Moderne konnten lange nicht für Forschungszwecke im Original herangezogen werden. Dabei sind sie als wertvolle Quellen als Zeitzeugen des kulturellen, sozialen und politischen Lebens anerkannt und könnten in verschiedenen Disziplinen wie Kultur-, Literatur-, Medien- oder Sozialwissenschaften sowie in der Linguistik genutzt werden. Jedoch waren sie als empfindliches und leicht vergängliches Material in den Bibliotheken unter Verschluss und auch aufgrund geographischer Entfernung für viele Forscher unerreichbar. Seit der Digitalisierung hat sich dies geändert. Das Projekt Revistas culturales 2.0 (Universität Augsburg) versucht nun mit der digitalen Sammlung des IAI (Ibero-Amerikanisches Institut, Preußischer Kulturbesitz, Berlin) zu arbeiten. Dazu werden Metadaten angereichert und vorhandene Metadaten mithilfe digitaler Tools analysiert. Als Geisteswissenschaftler musste uns bisher das Gebiet der automatischen Bildanalyse verschlossen bleiben, da dies vor allem auf technischer Seite in der Informatik (im Kontext von Digitalisierung und OCR) weiterentwickelt wurde.2 Auch in den DH ist dieses Gebiet weit weniger bearbeitet worden als z.B. Text Mining und es erwies sich als schwierig, Tools für quantitative Analysen (um z.B. die Bild-Text-Relation in den Zeitschriften zu beziffern) zu finden. Nun konnten wir in Kooperation mit dem Projekt eCodicology und durch Nachnutzung ihres Tools SWATI ausprobieren, wie das Layout der lateinamerikanischen und spanischen Kulturzeitschriften der Moderne durch automatisches Vermessen jeder einzelnen Seite in Zukunft analysiert werden könnte. Der vorliegende Beitrag entwickelt aus einem ersten Experiment mit einer kleinen Anzahl von Zeitschriftenseiten ein theoretisches Konzept, um den Nutzen von quantitativen Methoden und im konkreten Fall vom angewendeten Tool aus Sicht der Geisteswissenschaften abzuschätzen.German
    Creators:
    CreatorsEmail
    Rißler-Pipka, Nanette
    Editors:
    EditorsEmail
    Busch, Hannah
    Fischer, Franzfranz.fischer@uni-koeln.de
    Sahle, Patricksahle@uni-koeln.de
    Corporate Creators: Institut für Dokumentologie und Editorik
    Corporate Contributors: Institut für Dokumentologie und Editorik
    URN: urn:nbn:de:hbz:38-77808
    Series Name: Schriften des Instituts für Dokumentologie und Editorik
    Publisher: Books on Demand
    ISBN: 978-3-7448-3877-1
    Volume: 11
    Subjects: Data processing Computer science
    Library and information sciences
    Romance languages French
    Divisions: Philosophische Fakultät > Cologne Center for eHumanities
    Language: English
    Date: July 2017
    Date Type: Publication
    Full Text Status: Public
    Related URLs:
    Date Deposited: 08 Sep 2017 10:06:17
    URI: http://kups.ub.uni-koeln.de/id/eprint/7780

    Actions (login required)

    View Item