8.6.2022

Digitales Suchen, Sammeln und Analysieren von Texten?

Dieser Text wurde automatisch übersetzt und kann daher vom Original abweichen. Aus dieser Übersetzung können keine Rechte abgeleitet werden.

💬 Click here to read this page in English.

Die KB, die nationale Bibliothek der Niederlande, bietet über ihre Online-Dienste Zugang zu historischen Textsammlungen wie digitalisierten Zeitungen und Büchern. Die KB stellte fest, dass es eine Lücke gibt zwischen benutzerfreundlichen Suchdiensten wie Delpher und DBNL einerseits und dem Dienst Dataservices für fortgeschrittene digitale Forschung andererseits. Dataservices sind für viele Benutzer nicht zugänglich, da sie erfordern, die abgerufenen Daten selbst zu speichern und Algorithmen dafür zu programmieren. Gleichzeitig sieht die KB immer mehr Möglichkeiten für digitale Forschung in ihren Textsammlungen. Vor diesem Hintergrund hat die KB Dialogic beauftragt zu erkunden, ob unter ihren Benutzern Bedarf an einer Analyseplattform besteht, in der mehrere Sammlungen (von der KB und darüber hinaus) in einer sogenannten "Textsuite" integriert und analysiert werden können. Um zu untersuchen, wie eine Textsuite Benutzer bei ihrer Forschung in (historischen) Textsammlungen unterstützen kann, haben wir auf der Grundlage von Literaturrecherche ein Schema der verschiedenen Forschungsphasen und Bedürfnisse erstellt, die in jeder Phase entstehen können. Dieses Schema ist in der untenstehenden Abbildung dargestellt. Durch Interviews und eine Umfrage unter 873 Benutzern der KB-Dienste wurden verschiedene mögliche funktionale Bedürfnisse überprüft, um zu bestimmen, wie eine Textsuite Mehrwert generieren kann. Wir kommen zu dem Schluss, dass es keinen klaren Bedarf an fortgeschrittenen Möglichkeiten für die Analysephase gibt. Obwohl dies den Ausgangspunkt der Untersuchung bildete, geben Gesprächspartner und Umfrageteilnehmer an, hier weniger Bedarf zu haben und dies auch seltener zu nutzen, wenn es angeboten würde. Dabei spielen drei Argumente eine zentrale Rolle. Erstens ziehen Forscher aufgrund der großen Heterogenität von Quellenmaterial der KB und anderer Quellen es vor, alles auf ihrem eigenen Computer für die Analyse zusammenzuführen. Das Alternativangebot, mit einer Textsuite Quellen zu importieren, wirft Fragen zur nachhaltigen Bewahrung zusammengestellter Sammlungen auf. Zweitens betrachten Gesprächspartner die schnelle Entwicklung insbesondere quantitativer Analysetools als Risiko, dass die KB Tools anbieten wird, die schnell veralten, insbesondere wenn sie zu wenig genutzt werden, um erhebliche Anstrengungen für kontinuierliche Weiterentwicklung zu rechtfertigen. Schließlich stellen wir fest, dass die Bereitstellung von Analysefunktionalitäten in bestehenden Plattformen (z. B. der n-gram-Viewer in DBNL oder die Frequenzanalyse in Nederlab) nicht in hohem Maße zu deren Anerkennung und breiter Anwendung für neue Forschungsfragen zu führen scheint. Der latente Bedarf an solchen Funktionen scheint daher begrenzt zu sein. Wir stellen jedoch fest, dass es einen klaren Bedarf an fortgeschrittenen Möglichkeiten für die Phasen Entdecken und Auswählen gibt. Unsere Empfehlung an die KB ist daher, eine Textsuite als benutzerfreundliches Tool zu positionieren, mit dem Benutzer und Forscher eine Auswahl von Daten treffen können, die sie für die Analyse mit ihren eigenen Tools exportieren können. Das vollständige Bericht können Sie unter folgendem Link herunterladen: https://doi.org/10.5281/zenodo.6591571. Basierend auf unseren Erkenntnissen hat die KB inzwischen beschlossen, einen Dienst zur Unterstützung von erweiterten Funktionen für Entdecken und Auswählen zu entwickeln. Mehr darüber erfahren Sie in dieser Studie? Dann kontaktieren Sie Max Kemman.