6/8/2022

Digitalt søgning, indsamling og analyse af tekster?

Denne tekst er automatisk oversat og kan derfor afvige fra originalen. Der kan ikke drages rettigheder på baggrund af denne oversættelse.

💬 Click here to read this page in English.

KB, det nationale bibliotek i Nederlandene, giver via sine online tjenester adgang til historiske tekstsamlinger såsom digitaliserede aviser og bøger. KB har konstateret, at der er en kløft mellem brugervenlige søgetjenester som Delpher og DBNL på den ene side, og tjenesten Dataservices til avanceret digital forskning på den anden side. Dataservices er ikke tilgængelig for mange brugere, da det kræver, at man selv gemmer de oprettede data og programmerer algoritmer til dette. Samtidig ser KB flere muligheder for digital forskning i sine tekstsamlinger. På baggrund heraf har KB givet Dialogic i opgave at undersøge, om der er behov blandt deres brugere for en analyseplatform, hvor flere samlinger (fra KB samt andre steder) kan integreres og analyseres i en såkaldt "tekst suite".

For at kortlægge, hvordan en tekst suite kan støtte brugere i deres forskning på (historiske) tekstsamlinger, har vi udarbejdet et skema over de forskellige forskningsfaser og behov, der kan opstå per fase, baseret på litteraturundersøgelser. Dette skema er vist i figuren nedenfor. Gennem interviews og en undersøgelse blandt 873 brugere af KB-tjenester er forskellige potentielle funktionelle behov blevet afprøvet for at fastslå, hvordan en tekst suite kan skabe merværdi.

Vi konkluderer, at der ikke er noget klart behov for avancerede muligheder til Analysenfasen. Selvom dette var udgangspunktet for udforskningen, indikerer samtalepartnere og respondenter i den online undersøgelse, at der er mindre behov for dette og at det i mindre grad ville blive anvendt, hvis det blev tilbudt. Tre centrale argumenter står heri. For det første foretrækker forskere at samle alt på deres egen computer til analyse på grund af den store heterogenitet af kildemateriale fra både KB og andre steder. Alternativt kan en tekst suite muliggøre import af kilder, hvilket rejser spørgsmål om bæredygtig opbevaring af sammensatte samlinger. For det andet ser samtalepartnere det som en risiko, når KB tilbyder værktøjer til analyse, der hurtigt bliver forældede på grund af hurtige udviklinger, især inden for kvantitative analyseværktøjer. Endelig observerer vi, at hvor analysefunktionalitet tilbydes i eksisterende platforme (f.eks. n-gram visning i DBNL eller frekvensanalyse i Nederlab), synes dette ikke i høj grad at føre til anerkendelse og bred anvendelse af nye forskningsspørgsmål. Den latente efterspørgsel efter sådanne funktionaliteter synes derfor begrænset.

På den anden side konstaterer vi, at der er et klart behov for mere avancerede muligheder inden for Faserne Opdagelse og Valg. Vores anbefaling til KB er derfor at positionere en tekst suite som et brugervenligt værktøj for brugere og forskere til selv at foretage et udvalg af data, som de kan eksportere til analyse med deres egne værktøjer.

Du kan downloade den fulde rapport via https://doi.org/10.5281/zenodo.6591571. På baggrund af vores fund har KB allerede besluttet at udvikle en tjeneste til understøttelse af avancerede muligheder for opdagelse og valg.

Ønsker du at vide mere om denne undersøgelse? Så kontakt Max Kemman.