Ce texte a été traduit automatiquement et peut donc différer de l'original. Aucun droit ne peut être dérivé de cette traduction.
La KB, la bibliothèque nationale des Pays-Bas, propose via ses services en ligne l'accès à des collections de textes historiques telles que des journaux et des livres numérisés. La KB a constaté qu'il existe un fossé entre les services de recherche conviviaux tels que Delpher et DBNL, d'une part, et le service Dataservices pour la recherche numérique avancée, d'autre part. Dataservices ne sont pas accessibles à de nombreux utilisateurs car cela nécessite de sauvegarder les données demandées et de programmer des algorithmes. Parallèlement, la KB voit de plus en plus de possibilités pour la recherche numérique sur ses collections de textes. Dans ce contexte, la KB a chargé Dialogic d'explorer si les utilisateurs avaient besoin d'une plateforme d'analyse dans laquelle plusieurs collections (de la KB ainsi que d'ailleurs) pourraient être analysées de manière intégrée dans une "suite de textes".
Pour comprendre comment une suite de textes pourrait aider les utilisateurs dans leurs recherches sur les collections de textes (historiques), nous avons établi un schéma des différentes phases de recherche et des besoins qui peuvent survenir à chaque phase, sur la base d'une recherche bibliographique. Ce schéma est représenté dans la figure ci-dessous. Par le biais d'entretiens et d'une enquête auprès de 873 utilisateurs des services de la KB, différentes fonctionnalités potentielles ont été testées afin de déterminer comment une suite de textes pourrait ajouter de la valeur.

Nous concluons qu'il n'y a pas de besoin clair de fonctionnalités avancées pour la phase Analyser. Bien que cela ait été le point de départ de l'exploration, les interlocuteurs et répondants de l'enquête en ligne indiquent qu'ils en ont moins besoin et l'utiliseraient également moins s'il était proposé. Trois arguments principaux sont avancés. Premièrement, en raison de la grande hétérogénéité du matériel source de la KB et d'ailleurs, les chercheurs préfèrent regrouper tout sur leur propre ordinateur pour l'analyse. L'alternative serait qu'une suite de textes permette d'importer des sources, ce qui soulève des questions sur la conservation durable des collections constituées. Deuxièmement, en raison des développements rapides, en particulier des outils d'analyse quantitatifs, les interlocuteurs voient comme un risque que la KB propose des outils rapidement obsolètes, surtout s'ils ne sont pas suffisamment utilisés pour justifier des efforts importants de développement continu. Enfin, nous constatons que lorsque des fonctionnalités d'analyse sont proposées dans des plates-formes existantes (par exemple, le visualiseur n-gram dans DBNL ou l'analyse de fréquence dans Nederlab), cela ne semble pas entraîner une reconnaissance et une application généralisée pour de nouvelles questions de recherche. Par conséquent, le besoin latent de telles fonctionnalités semble limité.
En revanche, nous constatons qu'il existe un besoin clair de fonctionnalités plus avancées pour les phases Découvrir et Sélectionner. Notre recommandation à la KB est donc de positionner une suite de textes comme un outil convivial pour que les utilisateurs et chercheurs puissent faire leur propre sélection de données à exporter pour analyse avec leurs propres outils.
Vous pouvez télécharger le rapport complet via https://doi.org/10.5281/zenodo.6591571. Sur la base de nos conclusions, la KB a déjà décidé de développer un service pour soutenir des fonctionnalités avancées de découverte et de sélection.
Vous souhaitez en savoir plus sur cette recherche ? Contactez Max Kemman.