„Leistung“ im historischen Schulbuch – DiaCollo für GEI-Digital
Das Projekt „Das Konzept ‚Leistung‘ in historischen deutschsprachigen Schulbüchern – eine quantitativ-qualitative Analyse mit digitalen Werkzeugen“ wurde durch den Seedfunds „GEI-Innovation 2020“ gefördert. Dem Begriff der „Leistung“ kommt eine Schlüsselrolle in modernen Konzeptionen von Individuen und Gesellschaft, aber auch von Pädagogik zu. Das Projekt erprobt Methoden der digitalen Korpuserstellung und -analyse, um die Formierung und die Vermittlung von Konzepten von „Leistung“ in deutschsprachigen Schulbüchern vor 1920 mit Methoden der Digital Humanities untersuchbar zu machen.
Erprobt werden soll die Korpusmanagement-Umgebung dstar/D* und die darin verfügbaren Werkzeuge. Diese ermöglichen einfache und komplexe Suchanfragen, Frequenzanalysen und die Extraktion typischer Wortverbindungen (Kollokationen) zu einem gewählten Suchbegriff (wie „Leistung“) mit DiaCollo, das die interaktive Auswahl und Visualisierung in frei wählbaren Zeiträumen erlaubt und so Hinweise auf Veränderungen in Sprachgebrauch und Semantik über die Zeit geben kann.
Für volle Funktionalität dieser Analysewerkzeuge wird eine hohe Qualität und intensive Vorverarbeitung der zu analysierenden Texte empfohlen. Die Volltexte der Werke in GEI-Digital -Daten sind jedoch automatisch, und deshalb aufgrund historischer Schrifttypen, fremdsprachlicher Einschübe, Tabellen usw. nicht fehlerfrei erfasst. Im Projekt wird deshalb auch die „Leistungsfähigkeit“ von Werkzeugen wie DiaCollo zur diachronen Kollokationsanalyse im Zusammenhang mit Daten aus der digitalen Schulbuchbibliothek GEI-Digital untersucht und dokumentiert. Arbeitshypothese ist hierbei, dass auch eine basale und rein maschinelle Vorverarbeitung ausreicht, um mit DiaCollo Analysen zu erstellen, die zumindest die Generierung von historischen Forschungsfragen unterstützen. Eine solche Minimallösung mit hoher Fehlerrate wäre dann einem gänzlichen Verzicht auf die Analysetechnik vorzuziehen.
-
Ziele
Das Projekt erkundet und reflektiert, inwieweit die Funktionen digitaler Analysewerkzeuge geeignet sind, die (historische) Bildungsmedienforschung zu unterstützen und ihre Fragestellungen zu erweitern. Es umfasst drei Teilziele:
- Korpuserstellung: Die Daten des GEI werden mit Werkzeugen des Zentrums Sprache der Berlin Brandenburgischen Akademie der Wissenschaften (BBAW) zusammengebracht, um die computergestützte Analyse und Visualisierung der Volltexte zu ermöglichen, bzw. zu evaluieren, inwieweit dies mit der derzeitigen Datenqualität möglich ist.
- Bearbeitung einer kulturwissenschaftlich-begriffsgeschichtlichen Forschungsfrage: Untersucht werden Vorkommen, Verteilung und Kontexte des Begriffs „Leistung“ und weiterer in diesem Zusammenhang relevanter sprachlicher Phänomene im digitalen Schulbuchkorpus sowie Referenzkorpora: Seit wann und in welchen Diskurszusammenhängen finden sich neue Bedeutungsdimensionen von „Leistung“ in den historischen Lehrwerken?
- Usability: Um die Nachnutzung von Korpus und Analysewerkzeugen Korpus auch für potentielle neue Nutzer*innen ohne computerlinguistische Expertise zu erleichtern sollen entsprechende Lehrmaterialien erstellt werden. Für einen schnellen Überblick in Zusammensetzung und Besonderheiten des Datenbestandes sollen Visualisierungen und Filterfunktionen der Metadaten nachgenutzt werden, die erstmals 2017 in einer Kooperation des GEI mit der Fachhochschule Potsdam im Urban Complexity Lab entwickelt worden waren.
-
Vorgehensweise
Im Rahmen des Projektes wurden Ende 2020 die zu diesem Zeitpunkt in der digitalen Schulbuchbibliothek GEI-Digital verfügbaren Metadaten und automatisch generierten Volltexte zunächst nach TEI konvertiert und dann in Kooperation mit dem Zentrum Sprache der BBAW mit den dort für historische Texte genutzten und entwickelten NLP-Werkzeugen vorverarbeitet, angereichert und indexiert. Dieses Projektkorpus GEI-Digital-2020 wurde für die Analyse mit einer hierfür einrichteten Instanz der dstar-Korpusmanagement-Umgebung und des DiaCollo-Werkzeugs bereitgestellt.
Die Daten werden auch über das Zentrum Sprache zugänglich gemacht, wo sie z.B. von der Community der Sprachwissenschaft und Germanistik nachgenutzt werden. Als Teil der Historischen Korpora des DWDS können sie dort vergleichend oder gemeinsam mit weiteren historischen Quellensammlungen der Jahre 1465–1969 mit der Weboberfläche des DWDS und auch mit einer dstar-Instanz genutzt werden.
-
Ergebnisse
Die Werkzeuge zur Analyse des „GEI-Digital-2020“ Korpus stehen, ebenso wie Visualisierungen der Metadaten, ein Tutorial, Publikationen und Hinweise zu weiteren Ressourcen, auf der Projektwebseite zur Nachnutzung unter diacollo.gei.de zur Verfügung.
-
Publikationen (Auswahl)
- Nieländer, Maret (2022): „DiaCollo für GEI-Digital. Computerlinguistische Werkzeuge für die Analyse von mehr als 5000 historischen deutschsprachigen Schulbüchern“, DOI: 10.35468/5952-03, in: Oberdorf, Andreas (Hg.): Digital Turn und Historische Bildungsforschung. Bestandsaufnahme – Forschungsperspektiven, Bad Heilbrunn: Julius Klinkhardt 2022, S. 33–48. DOI: 10.35468/5952
- Nieländer, Maret; Scheel, Christian; Jurish, Bryan (2022): „DiaCollo für GEI-Digital – Ein experimentelles Projekt zur weiteren Erschließung digitalisierter historischer Schulbuchbestände“. Eine Posterpräsentation auf der 8. Tagung des Verbands „Digital Humanities im deutschsprachigen Raum“ – DHd 2022 Kulturen des digitalen Gedächtnisses. 07.–11.02.2022. Poster: DOI 10.5281/zenodo.6322544, Abstract: DOI 10.5281/zenodo.6328118
- Nieländer, Maret; Jurish, Bryan (2021): „D* für Anfänger:innen: Ein Tutorial. Einfache und komplexe Suchanfragen, Frequenzanalysen und diachrone Kollokationsanalysen in der D*-Korpusmanagement-Umgebung“. urn:nbn:de:0220-2021-0088.
- Nieländer, Maret: „Die Vermessung des Schulbuchs Computerlinguistische Zugänge zum Begriff der ‚Leistung‘ in der historischen Schulbuchsammlung GEI Digital“, Vortrag bei der Jahrestagung des Georg-Eckert-Instituts „Was leisten wir (uns) in der Schule?“, 02.–03.09.2021, Braunschweig. PDF, Video (Youtube)