Este texto ha sido traducido automáticamente y por lo tanto puede diferir del original. No se pueden derivar derechos de esta traducción.
La KB, la biblioteca nacional de los Países Bajos, ofrece acceso a través de sus servicios en línea a colecciones de texto históricas como periódicos y libros digitalizados. La KB ha identificado una brecha entre servicios de búsqueda amigables para el usuario como Delpher y DBNL, por un lado, y el servicio Dataservices para investigaciones digitales avanzadas, por el otro. Dataservices no es accesible para muchos usuarios, ya que requiere que se almacenen los datos solicitados y se programen algoritmos. Al mismo tiempo, la KB ve cada vez más posibilidades para la investigación digital en sus colecciones de texto. En este contexto, la KB ha encargado a Dialogic explorar si hay necesidad entre sus usuarios de una plataforma de análisis que permita analizar varias colecciones (tanto de la KB como externas) integradas en una "suite de texto".
Para comprender cómo una suite de texto puede apoyar a los usuarios en su investigación en colecciones de texto (históricas), hemos elaborado un esquema de las diferentes fases de investigación y las necesidades que pueden surgir en cada fase a través de una revisión de literatura. Este esquema se muestra en la figura a continuación. Se han evaluado diferentes posibles necesidades funcionales mediante entrevistas y una encuesta a 873 usuarios de los servicios de la KB para determinar cómo una suite de texto puede generar valor añadido.

Concluimos que no hay una clara necesidad de funcionalidades avanzadas para la fase de Análisis. Aunque esta fue la base de la exploración, los interlocutores y encuestados de la encuesta en línea indican que tienen menos necesidad de esto y también lo usarían en menor medida si se ofreciera. Tres argumentos principales sustentan esta conclusión. En primer lugar, debido a la gran heterogeneidad del material fuente de la KB y otros lugares, los investigadores prefieren reunir todo en su propia computadora para su análisis. La otra opción sería que una suite de texto permita importar fuentes, lo que plantea preguntas sobre la conservación sostenible de colecciones compiladas. En segundo lugar, debido a los rápidos avances en herramientas de análisis cuantitativas, en particular, los interlocutores ven como un riesgo que la KB ofrezca herramientas que rápidamente queden obsoletas, especialmente cuando se usan poco, lo que requiere mucho esfuerzo para su continua mejora. Por último, observamos que cuando se ofrecen funcionalidades de análisis en plataformas existentes (por ejemplo, el visor n-gram en DBNL o análisis de frecuencia en Nederlab), no parece conducir en gran medida a la identificación y aplicación generalizada para nuevas preguntas de investigación. Así, la necesidad latente de tales funcionalidades parece ser limitada.
Por otro lado, encontramos una clara necesidad de mayores funcionalidades avanzadas para las fases de Descubrimiento y Selección. Por lo tanto, nuestra recomendación a la KB es posicionar una suite de texto como una herramienta fácil de usar para que los usuarios e investigadores seleccionen datos para exportarlos y analizarlos con sus propias herramientas.
El informe completo se puede descargar en https://doi.org/10.5281/zenodo.6591571. Basándose en nuestros hallazgos, la KB ha decidido desarrollar un servicio para apoyar funcionalidades avanzadas de descubrimiento y selección.
¿Quieres más información sobre esta investigación? Ponte en contacto con Max Kemman.