08/06/2022

Ricerca, raccolta e analisi digitale di testi?

Questo testo è stato tradotto automaticamente e quindi può differire dall'originale. Nessun diritto può derivare da questa traduzione.

💬 Click here to read this page in English.

La KB, la biblioteca nazionale dei Paesi Bassi, offre attraverso i suoi servizi online l'accesso a collezioni di testi storici come giornali e libri digitalizzati. La KB ha identificato un divario tra i servizi di ricerca user-friendly come Delpher e DBNL da una parte, e il servizio Dataservices per la ricerca digitale avanzata dall'altra. Dataservices non è accessibile per molti utenti poiché richiede di memorizzare i dati richiesti e programmare algoritmi. Nel contempo, la KB vede sempre più opportunità per la ricerca digitale sulle sue collezioni di testi. Pertanto, la KB ha incaricato Dialogic di esplorare se esiste una domanda tra i suoi utenti per una piattaforma di analisi in cui diverse collezioni (della KB e oltre) possano essere integrate e analizzate in una "suite di testi".

Per comprendere come una suite di testi può supportare gli utenti nella loro ricerca su collezioni di testo (storiche), abbiamo redatto uno schema basato sulla revisione della letteratura delle diverse fasi di ricerca e sui bisogni che possono emergere in ciascuna fase. Lo schema è mostrato nella figura qui sotto. Abbiamo esaminato varie possibili esigenze funzionali attraverso interviste e un sondaggio condotto su 873 utenti dei servizi della KB per capire come una suite di testi può apportare valore aggiunto.

Concludiamo che non c'è una chiara richiesta di funzionalità avanzate per la fase di Analisi. Sebbene questo fosse il punto di partenza dell'esplorazione, i partecipanti alle conversazioni e i sondaggi online indicano che ci sia una minore richiesta e una minore utilizzo se offerto. Tre argomenti principali emergono: in primo luogo, a causa dell'elevata eterogeneità delle fonti di materiale della KB e oltre, i ricercatori preferiscono riunire tutto sul proprio computer per l'analisi. In alternativa, una suite di testi potrebbe consentire l'importazione di risorse, sollevando interrogativi sul mantenimento a lungo termine delle collezioni composte. In secondo luogo, a causa delle rapida evoluzione degli strumenti di analisi quantitativa, in particolare, i partecipanti alle conversazioni vedono come un rischio che la KB offra strumenti che diventano rapidamente obsoleti, specialmente se non vengono utilizzati abbastanza per giustificare sforzi significativi per lo sviluppo continuo. Infine, riscontriamo che quando la funzionalità di analisi è offerta su piattaforme esistenti (ad es. il n-gram viewer in DBNL o l'analisi della frequenza in Nederlab), questo non sembra portare a un riconoscimento e a un'applicazione diffusa per nuove domande di ricerca. La necessità latente di tali funzionalità sembra quindi limitata.

Tuttavia, rileviamo una chiara richiesta di funzionalità più avanzate per le fasi di Scoperta e Selezione. Di conseguenza, raccomandiamo alla KB di posizionare una suite di testi come uno strumento user-friendly per consentire agli utenti e ai ricercatori di effettuare una selezione di dati da esportare per l'analisi con i propri strumenti.

Il rapporto completo è disponibile per il download su https://doi.org/10.5281/zenodo.6591571. Sulla base delle nostre conclusioni, la KB ha già deciso di sviluppare un servizio per supportare funzionalità avanzate di scoperta e selezione.

Vuoi saperne di più su questa ricerca? Contatta Max Kemman.