2022-06-08

Digiotaal soek, versamel en analiseer van teks?

Hierdie teks is outomaties vertaal en kan dus verskil van die oorspronklike. Geen regte kan aan hierdie vertaling ontleen word nie.

💬 Click here to read this page in English.

Die KB, die nasionale biblioteek van Nederland, bied toegang tot historiese teksversamelings via hul aanlyn dienste soos gedigitaliseerde koerante en boeke. Die KB het vasgestel dat daar 'n gaping bestaan tussen gebruikersvriendelike soekdienste soos Delpher en DBNL aan die een kant, en die diens Dataservices vir gevorderde digitale navorsing aan die ander kant. Dataservices is vir baie gebruikers nie toeganklik nie, omdat dit vereis dat gebruikers die opgevraagde data self moet stoor en algoritmes moet programmeer. Terselfdertyd sien die KB steeds meer moontlikhede vir digitale navorsing op hul teksversamelings. Teen hierdie agtergrond het die KB Dialogic die opdrag gegee om te ondersoek of daar 'n behoefte onder hul gebruikers bestaan vir 'n analiseplatform waarin verskeie versamelings (van die KB en elders) geïntegreer kan word vir analise in 'n sogenaamde "teks suite".

Om vas te stel hoe 'n teks suite gebruikers kan ondersteun in hul navorsing op (historiese) teksversamelings, het ons op grond van literatuurstudie 'n skema opgestel van die verskillende navorsingsfases en behoeftes wat in elke fase kan ontstaan. Hierdie skema word weergegee in die onderstaande figuur. Deur onderhoude en 'n opname onder 873 gebruikers van KB-dienste is verskeie moontlike funksionele behoeftes getoets om vas te stel hoe 'n teks suite waarde kan toevoeg.

Ons bevind dat daar geen duidelike behoefte is aan gevorderde moontlikhede vir die Analise-fase nie. Alhoewel dit die vertrekpunt vir die verkenning was, wys onderhoudsvennote en respondente van die aanlyn opname aan dat daar minder behoefte is en dit ook minder gebruik word as dit wel sou word aangebied. Drie argumente word hierby beklemtoon. Eerstens gee navorsers die voorkeur daaraan om as gevolg van die groot heterogeniteit van bronmateriaal van die KB en elders alles saam te bring na hul eie rekenaar vir analise. Die alternatief is dat 'n teks suite dit moontlik maak om bronne te importeer, wat die kwessie van volhoubare bewaring van saamgestelde versamelings na vore bring. Tweedens, weens die vinnige ontwikkelinge van veral kwantitatiewe analisehulpmiddels, sien onderhoudsvennote dit as 'n risiko dat die KB hulpmiddels gaan aanbied wat vinnig verouder, veral as dit min gebruik word om groot inisiatiewe te onderneem vir voortdurende ontwikkeling. Laastens bevind ons dat waar analisefunksionaliteit wel aangebied word in bestaande platforms (bv. die n-gram-sigwerker in DBNL of frekwensieanalise in Nederlab), dit nie tot 'n sterk mate van erkenning en breë toepassing vir nuwe navorsingsvrae lyk te lei nie. Die latente behoefte aan sulke funksionaliteite blyk dus beperk te wees.

Aan die ander kant bevind ons wel 'n duidelike behoefte aan meer gevorderde moontlikhede vir die Ontdek-en-Selekteer-fase. Ons aanbeveling aan die KB is dus om 'n teks suite te bemark as 'n gebruikersvriendelike hulpmiddel vir gebruikers en navorsers om self data te selekteer wat hulle kan eksporteer vir analise met hul eie hulpmiddels.

Die volledige verslag kan afgelaai word by https://doi.org/10.5281/zenodo.6591571. Op grond van ons bevindinge het die KB reeds besluit om 'n diens te ontwikkel wat gevorderde moontlikhede vir ontdek en selekteer ondersteun.

Wil jy meer weet oor hierdie navorsing? Kontak dan Max Kemman.