08/06/2022

Ricerca, raccolta e analisi digitale di testi?

Questo testo è stato tradotto automaticamente e quindi può differire dall'originale. Nessun diritto può derivare da questa traduzione.

💬 Click here to read this page in English.

La KB, la biblioteca nazionale dei Paesi Bassi, offre attraverso i suoi servizi online l'accesso a collezioni di testi storici come giornali e libri digitalizzati. La KB ha constatato che esiste un divario tra servizi di ricerca user-friendly come Delpher e DBNL da un lato, e il servizio Dataservices per la ricerca digitale avanzata dall'altro. Dataservices non è accessibile per molti utenti, poiché richiede di salvare i dati richiesti e programmare gli algoritmi. Tuttavia, la KB vede sempre più opportunità per la ricerca digitale sulle sue collezioni di testi. Pertanto, la KB ha incaricato Dialogic di esplorare se c'è una domanda da parte dei suoi utenti per una piattaforma di analisi in cui più collezioni (della KB e al di fuori) possano essere integrate e analizzate in una "suite di testi". Per comprendere come una suite di testi può supportare gli utenti nella ricerca sulle collezioni di testi (storici), abbiamo elaborato uno schema delle varie fasi di ricerca e dei bisogni che possono emergere in ciascuna fase, basandoci su una ricerca bibliografica. Lo schema è rappresentato nella figura qui sotto. Attraverso interviste e un sondaggio tra 873 utenti dei servizi della KB, sono stati valutati vari bisogni funzionali possibili per determinare come una suite di testi possa aggiungere valore. Concludiamo che non vi è una chiara richiesta di funzionalità avanzate per la fase di Analisi. Anche se questo era il punto di partenza dell'esplorazione, i colloqui e i partecipanti al sondaggio online indicano di avere meno interesse e di utilizzare meno questa funzionalità se fosse offerta. Tre argomenti principali emergono. Innanzitutto, a causa della grande eterogeneità di materiali di origine della KB e altrove, i ricercatori preferiscono riunire tutto sul proprio computer per l'analisi. L'alternativa è che una suite di testi consenta l'importazione di fonti, suscitando interrogativi sul mantenimento sostenibile delle collezioni composte. In secondo luogo, a causa dei rapidi sviluppi degli strumenti di analisi, in particolare quelli quantitativi, i partecipanti ai colloqui ritengono un rischio che la KB offra strumenti che diventino rapidamente obsoleti, soprattutto se non vengono utilizzati abbastanza per giustificare sforzi significativi per continuare lo sviluppo. Infine, osserviamo che dove vengono offerte funzionalità di analisi in piattaforme esistenti (ad es. il visualizzatore di n-grammi in DBNL o l'analisi di frequenza in Nederlab) sembra che ciò non porti in misura significativa al riconoscimento e all'ampia applicazione per nuove domande di ricerca. La richiesta latente di tali funzionalità sembra quindi essere limitata. Invece, rileviamo che vi è una chiara domanda di funzionalità più avanzate per le fasi di Scoperta e Selezione. Pertanto, raccomandiamo alla KB di posizionare una suite di testi come uno strumento user-friendly per gli utenti e i ricercatori per selezionare autonomamente i dati che possono esportare per l'analisi con i propri strumenti. Il rapporto completo è disponibile per il download su https://doi.org/10.5281/zenodo.6591571. Sulla base delle nostre conclusioni, la KB ha già deciso di sviluppare un servizio per supportare le funzionalità avanzate di scoperta e selezione.