2022-06-08

Digital sökning, insamling och analys av texter?

Denna text är automatiskt översatt och kan därför avvika från originalet. Ingen rätt kan härledas av denna översättning.

💬 Click here to read this page in English.

KB, Sveriges nationella bibliotek, erbjuder genom sina online-tjänster tillgång till historiska textsamlingar såsom digitaliserade tidningar och böcker. KB observerade att det finns en klyfta mellan användarvänliga söktjänster såsom Delpher och DBNL å ena sidan, och tjänsten Dataservices för avancerad digital forskning å andra sidan. Dataservices är för många användare inte tillgängligt eftersom det kräver att man själv lagrar den begärda datan och programmerar algoritmer för detta. Samtidigt ser KB allt fler möjligheter för digital forskning i sina textsamlingar. Mot denna bakgrund gav KB Dialogic i uppdrag att undersöka om det finns ett behov bland dess användare för en analysplattform där flera samlingar (från KB såväl som utanför) kan integreras och analyseras i en så kallad "text suite". För att kartlägga hur en text suite kan stödja användare i deras forskning på (historiska) textsamlingar har vi baserat på litteraturstudier utarbetat ett schema för de olika forskningsfaserna och de behov som kan uppstå per fas. Detta schema visas i figuren nedan. Genom intervjuer och en enkät bland 873 användare av KB-tjänster testades olika potentiella funktionella behov för att avgöra hur en text suite kan skapa mervärde. Vi drar slutsatsen att det inte finns något tydligt behov av avancerade möjligheter för fasen Analysera. Trots att detta var startpunkten för undersökningen, anger samtalspartnerna och respondenterna i den online-enkäten att de har mindre behov av detta och skulle använda det i mindre utsträckning om det erbjöds. Tre huvudargument framhävs. För det första, på grund av den stora heterogeniteten hos källmaterial från KB såväl som utanför föredrar forskare att samla allt på sin egen dator för analys. Alternativet är att en text suite möjliggör import av källor och då uppstår frågor kring långsiktig bevaring av sammansatta samlingar. För det andra, på grund av snabba framsteg inom främst kvantitativa analysverktyg ser samtalspartnerna det som en risk att KB erbjuder verktyg som snabbt blir föråldrade, särskilt om de används för lite för att motivera betydande ansträngningar för kontinuerlig utveckling. Slutligen konstaterar vi att när analysfunktionalitet erbjuds på befintliga plattformar (t.ex. n-gram-visaren i DBNL eller frekvensanalysen i Nederlab) verkar detta inte leda till en stark igenkänning och bred tillämpning för nya forskningsfrågor. Det latent skenande behovet för sådana funktioner verkar därmed vara begränsat. Däremot konstaterar vi att det finns ett tydligt behov av mer avancerade möjligheter för faserna Upptäcka och Välja. Vår rekommendation till KB är därför att positionera en text suite som ett användarvänligt verktyg för användare och forskare att själva göra en selektion av data som de kan exportera för analys med sina egna verktyg. Den fullständiga rapporten kan laddas ner via https://doi.org/10.5281/zenodo.6591571. Baserat på våra fynd har KB redan beslutat att utveckla en tjänst för att stödja avancerade möjligheter för upptäckt och urval.