2022-06-08

Digital sökning, insamling och analys av texter?

Denna text är automatiskt översatt och kan därför avvika från originalet. Ingen rätt kan härledas av denna översättning.

💬 Click here to read this page in English.

KB, den nationella biblioteket i Nederländerna, ger genom sina onlinetjänster tillgång till historiska textsamlingar såsom digitaliserade tidningar och böcker. KB upptäckte att det finns en klyfta mellan användarvänliga söktjänster som Delpher och DBNL å ena sidan, och tjänsten Dataservices för avancerad digital forskning å andra sidan. Dataservices är för många användare inte tillgängligt eftersom det kräver att man själv lagrar begärda data och programmerar algoritmer för detta. Samtidigt ser KB alltfler möjligheter för digital forskning på sina textsamlingar. Mot denna bakgrund gav KB Dialogic i uppdrag att undersöka om det finns ett behov bland dess användare för en analysplattform där flera samlingar (både från KB och andra ställen) kan integreras och analyseras i en s.k. "text suite".

För att kartlägga hur en text suite kan stödja användare i deras forskning på (historiska) textsamlingar, har vi baserat på litteraturstudier utarbetat ett schema över olika forskningsfaser och behov som kan uppstå per fas. Detta schema visas i figuren nedan. Genom intervjuer och en enkät bland 873 användare av KB-tjänster har olika möjliga funktionella behov testats för att avgöra hur en text suite kan skapa mervärde.

Vi drar slutsatsen att det inte finns något tydligt behov av avancerade möjligheter för fasen Analys. Även om detta var utgångspunkten för undersökningen, anger samtalspartners och respondenter från den online undersökningen att de har mindre behov av detta och skulle använda det i lägre grad om det erbjöds. Tre huvudargument står i centrum. För det första, på grund av den stora heterogeniteten i källmaterialet från KB och andra ställen, föredrar forskare att samla allt på sin egen dator för analys. Alternativet, att en text suite möjliggör import av källor, väcker frågor om hållbarhet för bevarande av sammansatta samlingar. För det andra, med snabba framsteg särskilt inom kvantitativa analysverktyg, ser samtalspartners det som en risk att KB erbjuder verktyg som snabbt blir föråldrade, särskilt om de inte används tillräckligt för att motivera stora insatser för kontinuerlig utveckling. Slutligen konstaterar vi att där analysfunktionalitet erbjuds i befintliga plattformar (t.ex. n-gram viewer i DBNL eller frekvensanalys i Nederlab), verkar inte detta i hög grad leda till erkännande och bred tillämpning för nya forskningsfrågor. Den latent behovet för sådana funktioner verkar därmed vara begränsad.

Å andra sidan konstaterar vi att det finns ett tydligt behov av mer avancerade möjligheter för faserna Upptäcka och Välja. Vår rekommendation till KB är därför att positionera en text suite som ett användarvänligt verktyg för användare och forskare att själva välja data som de kan exportera för analys med sina egna verktyg.

Du kan ladda ner den fullständiga rapporten via https://doi.org/10.5281/zenodo.6591571. Baserat på våra fynd har KB redan beslutat att utveckla en tjänst för att stödja avancerade möjligheter för upptäckt och val.

Vill du veta mer om denna undersökning? Kontakta Max Kemman.