08/06/2022

Recherche, collecte et analyse numériques de textes ?

Ce texte a été traduit automatiquement et peut donc différer de l'original. Aucun droit ne peut être dérivé de cette traduction.

💬 Click here to read this page in English.

La KB, la bibliothèque nationale des Pays-Bas, offre via ses services en ligne l'accès à des collections de textes historiques tels que des journaux et des livres numérisés. La KB a constaté l'existence d'un fossé entre des services de recherche conviviaux tels que Delpher et DBNL d'une part, et le service Dataservices pour la recherche numérique avancée d'autre part. Dataservices ne sont pas accessibles pour de nombreux utilisateurs, car cela implique de stocker les données demandées et de programmer des algorithmes. En même temps, la KB voit de plus en plus de possibilités pour la recherche numérique sur ses collections de textes. Dans ce contexte, la KB a confié à Dialogic la mission d'explorer si les utilisateurs ont besoin d'une plateforme d'analyse dans laquelle plusieurs collections (de la KB ainsi que d'autres institutions) pourraient être intégrées et analysées dans une « suite textuelle ».

Pour déterminer comment une suite textuelle peut aider les utilisateurs dans leurs recherches sur des collections de textes (historiques), nous avons élaboré un schéma des différentes phases de recherche et des besoins qui peuvent survenir à chaque phase, sur la base d'une revue de la littérature. Ce schéma est présenté dans la figure ci-dessous. À l'aide d'entretiens et d'une enquête menée auprès de 873 utilisateurs des services de la KB, différents besoins fonctionnels potentiels ont été évalués pour déterminer comment une suite textuelle pourrait ajouter de la valeur.

Nous concluons qu'il n'y a pas de besoin clair pour des fonctionnalités avancées dans la phase d'analyse. Bien que cela ait été le point de départ de l'exploration, les interlocuteurs et les répondants de l'enquête en ligne indiquent qu'ils en ont moins besoin et l'utilisent également moins s'il était proposé. Trois arguments principaux sont avancés. Premièrement, en raison de la grande hétérogénéité des sources de la KB et d'ailleurs, les chercheurs préfèrent tout regrouper sur leur propre ordinateur pour l'analyse. L'alternative serait qu'une suite textuelle permette l'importation de sources, soulevant des questions sur la conservation durable des collections composées. Deuxièmement, en raison du rapide développement des outils d'analyse quantitative en particulier, les interlocuteurs considèrent comme un risque le fait que la KB propose des outils qui deviennent rapidement obsolètes, surtout s'ils sont peu utilisés pour justifier des efforts considérables de développement continu. Enfin, nous constatons que là où la fonctionnalité d'analyse est proposée dans des plates-formes existantes (par exemple, la visionneuse n-gramme dans DBNL ou l'analyse de fréquence dans Nederlab), cela ne semble pas conduire de manière significative à la reconnaissance et à une large application pour de nouvelles questions de recherche. La demande latente de telles fonctionnalités semble donc limitée.

En revanche, nous constatons qu'il existe un besoin clair pour des fonctionnalités plus avancées dans les phases de Découverte et de Sélection. Notre recommandation à la KB est donc de positionner une suite textuelle comme un outil convivial pour permettre aux utilisateurs et chercheurs de sélectionner eux-mêmes des données à exporter pour analyse avec leurs propres outils.

Le rapport complet est disponible en téléchargement à partir de https://doi.org/10.5281/zenodo.6591571. Sur la base de nos conclusions, la KB a déjà décidé de développer un service pour soutenir des fonctionnalités avancées de découverte et de sélection.

Vous souhaitez en savoir plus sur cette étude ? Veuillez contacter Max Kemman.