SemKoS − Semantische Konzepte in Schulbüchern

Im Projekt Semantische Konzepte in Schulbüchern (SemKoS) wurde 2017 auf Basis einer umfassenden Bedarfs- und Anforderungsanalyse der Prototyp eines digitalen Annotationswerkzeuges realisiert. Das Werkzeug ermöglichte es, Texte kollaborativ und direkt auf dem Digitalisat auszuzeichnen und zu klassifizieren, Wörter und Phrasen mit deren Repräsentation in der Gemeinsamen Normdatei (GND) zu verknüpfen und diese Verknüpfungen zu vergleichen, zu exportieren und zu visualisieren.

  • Ziele

    Das Projekt SemKoS entstand aus dem Bedürfnis heraus, ein Werkzeug für die Digital Humanities zu entwickeln, das sich an den konkreten Bedarfen der mit Bildungsmedien forschenden Wissenschaftler*innen orientiert, um effektiv Anwendung in der Praxis finden zu können. Dafür wurde bei der Realisierung des Werkzeugs großer Wert auf eine enge Zusammenarbeit zwischen Geisteswissenschaftler*innen und Informatiker*innen gelegt.


  • Vorgehensweise

    Im geisteswissenschaftlichen Part des Projekts wurde die Forschungspraxis auf den Digitalisaten mit dem Ziel untersucht, ein Werkzeug zu entwerfen, welches diese Praxis optimal unterstützt. Die informatische Umsetzung konzentrierte sich entsprechend darauf den Forschungsprozess detailgetreu digital abzubilden, um Vorbehalte und Bedenken beim Umstieg auf die digitale Arbeit zu verringern. Eine institutsweite Umfrage belegte und konkretisierte den Bedarf an einem digitalen Annotationswerkzeug. So war z.B. eine zentrale Anforderung bei der Arbeit mit digitalisierten Quellen die Vorteile des Digitalen (wie etwa durchsuchbare Volltexte) nutzen zu können, ohne dabei die visuellen Informationen wie beispielsweise Seitenlayouts und hervorgehobene Schriftarten der Quelle (aus den Augen) zu verlieren.

    Gleichzeitig sollten im Projekt neben den Potentialen der geisteswissenschaftlichen Forschung auch Forschungsmöglichkeiten innerhalb der Informatik und Informationswissenschaft realisiert werden. Die vom Werkzeug unterstützte digitale Verknüpfung der Informationen in den Digitalisaten mit externen, von Expert*innen gepflegten Wissensdatenbanken, ist beiden Wissenschaften dienlich. Während die geisteswissenschaftliche Forschung durch das Werkzeug selbst unterstützt wurde, profitierte die Informatik- und Informationswissenschaftliche Forschung von den Auszeichnungen, um mit ihnen zum Beispiel an vollautomatischen Entity Linking Ansätzen sowie im Bereich Word Sense Disambiguation zu forschen.


  • Ergebnisse

    Am Ende der Projektlaufzeit konnte mit dem Prototyp von SemKoS ein vielfältig einsetzbares digitales Annotationswerkzeug bereitgestellt werden. Ziel der inhaltlichen Auszeichnung mit SemKoS war überwiegend die statistische Auswertung auf Grundlage der Bedeutung von Begriffen. Beim traditionellen Forschungsprozess würden Forscher*innen Worte und Wortgruppen im Text markieren, verschlagworten oder das Blatt mit Notizen versehen. Analog hierzu arbeiteten die Nutzer*innen von SemKoS direkt auf dem digitalen Abbild der Quelle, dem Digitalisat. Durch die Verknüpfung von Begriffen in den Texten mit der Linked Open Data Cloud konnte implizites Wissen explizit gemacht werden. Die so entstandenen Forschungsdaten, wie etwa Anmerkungen, Verknüpfungen und Kategorisierungen, wurden auf dem Digitalisat sichtbar, aber auch – zusammen mit dem digitalen Volltext – in digitaler Form gespeichert. Sie konnten folglich z.B. auch durchsucht, aggregiert oder für Visualisierungen genutzt werden. Zudem wurden über transitive Verknüpfungen innerhalb der Linked Open Data Cloud (z.B. Vater-Sohn, Geburtsort von x ist y, ist-Teil-von, etc.) komplexe Analysen ermöglicht, die auch Beziehungen und Sachinformationen offenbaren und visualisieren konnten, die über die Informationen innerhalb der einzelnen Quelle selbst hinausgingen.

    SemKoS ermöglichte es, Begriffe im Text mit entsprechenden Schlagworten aus der Gemeinsamen Normdatei zu verknüpfen. Dass auch fremdsprachige Begriffe, abweichende Schreibweisen, sowie Deklinationen immer mit demselben bedeutungsrepräsentierenden Schlagwort verknüpft werden, ermöglichte spätere Analysen unabhängig von einzelnen Sprachen oder Schreibweisen. Die verknüpfbaren Schlagworte umfassten dabei nicht nur Personen, Orte, Institutionen oder Ereignisse, sondern auch generelle Schlagworte, wie zum Beispiel das Verknüpfen religiöser Fachbegriffe, bekannter Berufe oder Tierarten.
    Bei Interesse am Werkzeug und/oder dem Entwicklungsprozess, kontaktieren Sie gerne das Projektteam.


Projektteam

sroll-to-top