Este texto ha sido traducido automáticamente y por lo tanto puede diferir del original. No se pueden derivar derechos de esta traducción.
La KB, la biblioteca nacional de los Países Bajos, a través de sus servicios en línea, proporciona acceso a colecciones de texto históricas como periódicos y libros digitalizados. La KB ha identificado una brecha entre los servicios de búsqueda amigables para el usuario como Delpher y DBNL, por un lado, y el servicio de Dataservices para investigación digital avanzada, por otro. Dataservices no es accesible para muchos usuarios, ya que requiere que estos guarden los datos solicitados y programen algoritmos. Al mismo tiempo, la KB ve cada vez más posibilidades para la investigación digital en sus colecciones de texto. En este contexto, la KB encargó a Dialogic explorar si hay demanda entre sus usuarios de una plataforma de análisis donde múltiples colecciones (de la KB y otras fuentes) puedan ser analizadas de forma integrada en una "suite de texto".
Para comprender cómo una suite de texto puede apoyar a los usuarios en su investigación de colecciones de texto (históricas), hemos desarrollado, basándonos en investigación literaria, un esquema de las diferentes fases de investigación y las necesidades que pueden surgir en cada fase. Este esquema se muestra en la figura a continuación. A través de entrevistas y una encuesta a 873 usuarios de los servicios de la KB, se evaluaron varias posibles necesidades funcionales para determinar cómo una suite de texto puede agregar valor.
Concluimos que no hay una clara necesidad de capacidades avanzadas para la fase de Análisis. Aunque esto fue el punto de partida de la exploración, los interlocutores y encuestados indican tener menos interés en esto y utilizarlo en menor medida si se ofreciera. Tres argumentos clave respaldan esta posición. En primer lugar, debido a la gran heterogeneidad del material fuente de la KB y de otras fuentes, los investigadores prefieren reunir todo en su propia computadora para el análisis. El hecho de que una suite de texto pueda permitir la importación de fuentes plantea interrogantes sobre la conservación sostenible de las colecciones compuestas. En segundo lugar, debido a los rápidos avances, especialmente en herramientas de análisis cuantitativo, los interlocutores ven como un riesgo que la KB ofrezca herramientas que se vuelvan obsoletas rápidamente, especialmente si no se utilizan lo suficiente para justificar esfuerzos de desarrollo continuo. Finalmente, observamos que, cuando la funcionalidad de análisis se ofrece en plataformas existentes (por ejemplo, el visor de n-gramas en DBNL o el análisis de frecuencias en Nederlab), esto no parece resultar en un reconocimiento y aplicación generalizada para nuevas preguntas de investigación. Por lo tanto, la necesidad latente de tales funcionalidades parece ser limitada.
Por otro lado, observamos una clara necesidad de capacidades más avanzadas para las fases de Descubrimiento y Selección. Por lo tanto, nuestra recomendación a la KB es posicionar una suite de texto como una herramienta amigable para que los usuarios y los investigadores puedan hacer una selección de datos que puedan exportar para análisis con sus propias herramientas.
El informe completo se puede descargar en https://doi.org/10.5281/zenodo.6591571. En base a nuestros hallazgos, la KB ha decidido desarrollar un servicio para apoyar capacidades avanzadas de descubrimiento y selección.


