Este texto ha sido traducido automáticamente y por lo tanto puede diferir del original. No se pueden derivar derechos de esta traducción.
La Biblioteca Nacional de los Países Bajos, la KB, ofrece a través de sus servicios en línea acceso a colecciones de textos históricos como periódicos y libros digitalizados. La KB ha identificado un vacío entre los servicios de búsqueda amigables para el usuario como Delpher y DBNL, por un lado, y el servicio Dataservices para investigaciones digitales avanzadas, por otro lado. Dataservices no es accesible para muchos usuarios, ya que requiere que los usuarios almacenen los datos solicitados y programen algoritmos. Al mismo tiempo, la KB ve cada vez más posibilidades para la investigación digital en sus colecciones de textos. En este contexto, la KB encargó a Dialogic explorar si existe una necesidad entre sus usuarios de una plataforma de análisis donde se puedan analizar integradas múltiples colecciones (tanto de la KB como externas) en una "suite de textos".
Para comprender cómo una suite de textos puede ayudar a los usuarios en su investigación en colecciones de texto (históricas), hemos desarrollado un esquema de las diferentes fases de investigación y las necesidades que pueden surgir en cada fase basándonos en una revisión de la literatura. Este esquema se muestra en la figura a continuación. A través de entrevistas y una encuesta a 873 usuarios de los servicios de la KB, se evaluaron diversas necesidades funcionales posibles para determinar cómo una suite de textos puede agregar valor.

Concluimos que no hay una clara necesidad de funciones avanzadas para la fase de Análisis. Aunque esto fue el punto de partida de la exploración, los interlocutores y encuestados indican tener menos necesidad y usarlo en menor medida si se les ofreciera. Tres argumentos principales respaldan esta conclusión. En primer lugar, dada la gran heterogeneidad del material de origen de la KB y externo, los investigadores prefieren reunir todo en su propio ordenador para el análisis. La alternativa de permitir la importación de fuentes en una suite de textos plantea preguntas sobre la preservación sostenible de las colecciones compiladas. En segundo lugar, debido a los rápidos avances, especialmente en herramientas de análisis cuantitativo, los interlocutores ven como un riesgo que la KB ofrezca herramientas que queden rápidamente obsoletas, especialmente si no se utilizan lo suficiente para justificar esfuerzos significativos en el desarrollo continuo. Finalmente, observamos que cuando se ofrecen funcionalidades de análisis en plataformas existentes (por ejemplo, el visualizador de n-gramas en DBNL o análisis de frecuencias en Nederlab), esto no parece conducir en gran medida al reconocimiento y aplicación generalizada para nuevas preguntas de investigación. Por lo tanto, la necesidad latente de tales funcionalidades parece ser limitada.
Por otro lado, encontramos una clara necesidad de capacidades más avanzadas para las fases de Descubrimiento y Selección. Nuestra recomendación a la KB es, por lo tanto, posicionar una suite de textos como una herramienta fácil de usar para que los usuarios e investigadores puedan realizar ellos mismos una selección de datos que pueden exportar para analizar con sus propias herramientas.
Se puede descargar el informe completo en https://doi.org/10.5281/zenodo.6591571. Basándose en nuestros hallazgos, la KB ha decidido desarrollar un servicio para apoyar capacidades avanzadas de descubrimiento y selección.
¿Quieres saber más sobre esta investigación? Ponte en contacto con Max Kemman.