8.6.2022

Digitalt søk, innsamling og analyse av tekster?

Denne teksten er automatisk oversatt og kan derfor avvike fra originalen. Ingen rettigheter kan utledes fra denne oversettelsen.

💬 Click here to read this page in English.

Det nasjonale biblioteket i Nederland, KB, tilbyr gjennom sine nettjenester tilgang til historiske tekstsamlinger som digitaliserte aviser og bøker. KB har konstatert at det er et gap mellom brukervennlige søketjenester som Delpher og DBNL, og tjenesten Dataservices for avansert digital forskning. Dataservices er for mange brukere utilgjengelig, da det krever at de selv lagrer dataene de forespør og programmerer algoritmer for dette. Samtidig ser KB stadig flere muligheter for digital forskning i sine tekstsamlinger. Mot denne bakgrunnen har KB gitt Dialogic i oppdrag å undersøke om det er behov blant brukerne for en analyseplattform hvor flere samlinger (fra KB og andre steder) kan integreres og analyseres i en såkalt "tekst suite".

For å kartlegge hvordan en tekst suite kan støtte brukere i forskningen på (historiske) tekstsamlinger, har vi basert på litteraturstudier utarbeidet et skjema over de ulike forskningsfasene og behovene som kan oppstå i hver fase. Dette skjemaet vises i figuren nedenfor. Ved å gjennomføre intervjuer og en undersøkelse blant 873 brukere av KB-tjenester, har vi testet ulike mulige funksjonelle behov for å fastslå hvordan en tekst suite kan skape merverdi.

Vi konkluderer med at det ikke er et klart behov for avanserte muligheter i fasen Analysering. Selv om dette var utgangspunktet for undersøkelsen, sier samtalepartnere og deltakere i den nettbaserte undersøkelsen at de har mindre behov for dette og i mindre grad ville bruke det hvis det ble tilbudt. Tre hovedargumenter blir trukket frem. For det første foretrekker forskere å samle alt heterogent kildemateriale fra KB og andre kilder på sin egen datamaskin for analyse. Alternativet, at en tekst suite tillater import av kilder, reiser spørsmål om bærekraftig bevaring av sammensatte samlinger. For det andre, på grunn av raske utviklinger innen spesielt kvantitative analyseverktøy, ser samtalepartnere det som en risiko at KB tilbyr verktøy som raskt blir utdaterte, spesielt hvis de ikke brukes mye og krever mye innsats for kontinuerlig utvikling. Til slutt konstaterer vi at der analysefunksjonalitet tilbys i eksisterende plattformer (f.eks. n-gram-visning i DBNL eller frekvensanalyse i Nederlab) virker det ikke i stor grad å føre til gjenkjenning og bred anvendelse for nye forskningsspørsmål. Den latente etterspørselen etter slike funksjoner virker derfor begrenset.

På den annen side finner vi et klart behov for mer avanserte muligheter i fasene Oppdage og Velge. Vår anbefaling til KB er derfor å posisjonere en tekst suite som et brukervennlig verktøy for brukere og forskere til å selv velge data som de kan eksportere for analyse med sine egne verktøy.

Du kan laste ned den fulle rapporten via https://doi.org/10.5281/zenodo.6591571. Basert på våre funn har KB allerede besluttet å utvikle en tjeneste som støtter avanserte muligheter for oppdagelse og valg.

Ønsker du å vite mer om denne undersøkelsen? Ta kontakt med Max Kemman.