8.6.2022

Digitalt søk, innsamling og analyse av tekster?

Denne teksten er automatisk oversatt og kan derfor avvike fra originalen. Ingen rettigheter kan utledes fra denne oversettelsen.

💬 Click here to read this page in English.

Det nasjonale biblioteket i Nederland, KB, tilbyr gjennom sine online tjenester tilgang til historiske tekstsamlinger som digitaliserte aviser og bøker. KB har konstatert at det er et gap mellom brukervennlige søketjenester som Delpher og DBNL på den ene siden, og tjenesten Dataservices for avansert digital forskning på den andre siden. Dataservices er ikke tilgjengelig for mange brukere, da det krever at de lagrer de forespurte data selv og programmerer algoritmer for dette. Samtidig ser KB stadig flere muligheter for digital forskning på tekstsamlingene sine. Mot denne bakgrunnen har KB gitt Dialogic i oppdrag å undersøke om det er et behov blant brukerne for en analyseplattform der flere samlinger (både fra KB og eksternt) kan integreres og analyseres i en såkalt "tekst suite". For å kartlegge hvordan en tekst suite kan støtte brukerne i deres forskning på (historiske) tekstsamlinger, har vi utarbeidet et skjema basert på litteraturstudier som viser de ulike forskningsfasene og behovene som kan oppstå per fase. Dette skjemaet er gjengitt i figuren nedenfor. Gjennom intervjuer og en undersøkelse blant 873 brukere av KB-tjenester har vi vurdert ulike mulige funksjonelle behov for å avgjøre hvordan en tekst suite kan skape merverdi. Vi konkluderer med at det ikke er et tydelig behov for avanserte muligheter i fasen Analysering. Selv om dette var utgangspunktet for undersøkelsen, indikerer samtalepartnere og respondenter fra den elektroniske undersøkelsen at de har mindre behov for dette og ville bruke det i mindre grad hvis det ble tilbudt. Tre hovedargumenter står sentralt her. For det første, på grunn av den store heterogeniteten av kildeinformasjon fra KB og eksternt, foretrekker forskere å samle alt på sin egen datamaskin for analyse. Alternativet, der en tekst suite gjør det mulig å importere kilder, reiser spørsmål om bærekraftig bevaring av sammensatte samlinger. For det andre ser samtalepartnere det som en risiko at KB tilbyr verktøy som blir fort utdaterte, spesielt når de ikke brukes tilstrekkelig til å rettferdiggjøre innsatsen for kontinuerlig videreutvikling. Til slutt konstaterer vi at der analysenfunksjonalitet tilbys i eksisterende plattformer (f.eks. n-gram viewer i DBNL eller frekvensanalyse i Nederlab), ser det ikke ut til å føre sterkt til gjenkjenning og bred anvendelse for nye forskningsspørsmål. Den latente etterspørselen etter slike funksjoner ser dermed begrenset ut. Vi finner imidlertid et klart behov for mer avanserte muligheter i fasene Oppdage og Velge. Vår anbefaling til KB er derfor å plassere en tekst suite som et brukervennlig verktøy for brukere og forskere til selv å velge data de kan eksportere for analyse med egne verktøy. Du kan laste ned hele rapporten via https://doi.org/10.5281/zenodo.6591571. Basert på våre funn har KB allerede besluttet å utvikle en tjeneste for å støtte avanserte muligheter for oppdage og velge.