Studiedag "Interviews uit de kast" 14 maart 2008
Studiedag "Interviews uit de kast" 14 maart 2008
Deze studiedag werd georganiseerd door DANS bij NWO in Den Haag en bestond uit een keynote en zeven lezingen. Het onderwerp van deze studiedag was het hergebruik van interviewdata.
De eerste lezing van de dag had als titel “Issues in archiving and re-using qualitative data” en werd gegeven door - Dr. Louise Corti, UKDA (http://www.data-archive.ac.uk/).
Het UK Data Archive (UKDA) is curator van een grote collectie digital dataset afkomstig uit de sociale wetenschap en humaniora in het verenigd koninkrijk. Via de data catalogus die meer dan 5000 verschillende datasets bevat kan gezocht worden naar datasets voor onderzoek of onderwijs doeleinden. Zoeken in de catalogus is vrij, om toegang te krijgen tot de ruwe data moet je je registreren. De catalogus bevat verschillende type data:
1. Kwantitatieve data (gecodeerde numerieke response op surveys met een apart record voor elke individuele respondent). Data formaten zijn SPSS, Stata en tab gescheiden formaten.
2. kwalitatieve data (diepte interviews, dagboeken, antropologische veld notities en complete antwoorden op vragenlijsten). Data formaten zijn bijvoorbeeld Excel, Word en RTF
3. multimedia een klein aantal van de datasets bevatten image files, zoals bijvoorbeeld foto’s en audioclips.
4. niet-digitaal materiaal
Papieren media zoals foto’s, rapporten, vragenlijsten en transcripties.
Analoge audio of audiovisuele opnames
Kwalitatieve data kunnen voor verschillende doeleinden hergebruikt worden:
· voor het beschrijven van een context
· vergelijken van onderzoeken, follow up studies
· voor het opnieuw analyseren, secundaire analyse
· bestuderen van onderzoeksmethodologie
· replicatie/verificatie van een publicatie
· onderwijs
Kwalitatieve data bevindt zich bij:
· onderzoekers, bij onderzoekgroepen.
· universitaire archieven
· bibliotheken, musea
· data archieven, digitale bibliotheken.
Er zijn verschillende redenen om onderzoeksdata niet te delen: ·culturele redenen (wetenschappers zijn het niet gewend te doen), er is geen gestandaardiseerde databeschrijving, geen goed gedocumenteerde onderzoeksmethode, speciale relatie tussen wetenschapper en deelnemer (geheimhouding, privacy).
Ook zijn er veel redenen om onderzoeksdata niet her te gebruikenconstraint of information, eigenaarschap van de data, onzekerheid over vrijgeven van de eigen onderzoekspraktijk, mogelijkheid tot misinterpretatie, “no data suits my needs”, het kost meer tijd om andermans data te gebruiken.
Consentformulier: vaak doen wetenschappers hier moeilijker over dan de deelnemers aan het onderzoek.Are these data yours? De geïnterviewde behoud het copyright over zijn eigen woorden.Een probleem bij het hergebruiken van kwalitatieve data is dat de wetenschapper die de data wil hergebruiken niet bij het interview aanwezig is geweest daardoor mist hij/zij essentiële informatie (non verbale communicatie). Dit kan opgelost worden door gebruik te maken van video, het annoteren van data, context aan data toevoegen op alle niveaus en het toevoegen van een interview met de interviewer.
ESDS heeft veel inspanning verricht om geldschieters te overtuigen dat ze de voorwaarde moeten stellen dat de data van het onderzoek dat door hun gefinancierd wordt aan het data-archief aangeboden moet worden. Momenteel is de stand van zaken zo dat alle data aangeleverd moet worden aan het archief maar het archief neemt niet alle data op. Er zijn acquisitiecriteria opgesteld.
Voor opname in het archief worden o.a. de volgende criteria gehanteerd:
· het relatieve belang van de studie
· of het materiaal dat aangeleverd wordt complementair is aan al eerder opgenomen studies
· het onderwerp
· rijke diepte-interviews
Ook niet-digitaal geboren materiaal wordt opgenomen (papieren archief). Materiaal dat niet opgenomen wordt wordt doorgestuurd naar UKDA. UKDA heeft met behulp van Fedora een self archiving systeem ontworpen. De data wordt na het insturen verwerkt er vindt error-checking plaats, formatering en de access condities worden toegepast.
De ervaringen die opgedaan zijn met het verkrijgen van data: zit een lange tijd tussen het lokaliseren van data en het daadwerkelijk verkrijgen van de data. Het is een pijnvol proces voor de wetenschapper om zijn/haar data los te laten.
Als je eenmaal grote namen opgenomen hebt in het archief komen andere wetenschappers toch ook wel over de brug met hun data (“Don’t you want mine?”). Het is eenvoudig om de data te krijgen als de wetenschapper eenmaal met pensioen gaat.
Hergebruik van kwalitatieve interviews: mogelijkheden en beperkingen - Prof Dr. Aafke Komter, Universiteit Utrecht
Aafke komter ging in aan de hand van een studie die bij het NKFS gedaan werd naar familierelaties in op een aantal vragen rondom hergebruik van kwalitatieve interviews:
In hoeverre is het hergebruik van kwalitatieve data zinvol en mogelijk? Een van de punten die bij deze vraag naar voren kwam was dat de opzet van het onderzoek consequenties heeft voor de mogelijkheden van hergebruik. Een onderzoe met een specifieke vraagstelling gericht op diepgang levert slechts beperkte informatie in de breedte. Het gebruik van een kleine en vaak bewust selectieve steekproef beperkt de (her)bruikbaarheid. Bovendien is de analyse vaak tijdrovend.
Het aanbieden van kwalitatieve data biedt de volgende mogelijkheden:
· Valideren resultaten van een onderzoek
· Illustratie bij onderzoek over hetzelfde of soortgelijk thema
· Verkrijgen complementaire informatie (verdieping)
· Genereren van hypotheses voor nieuw onderzoek
Waar moet je bij de dataverzameling op letten met het oog op hergebruik van de data, (zoals privacy, kwaliteitscontrole en responseverantwoording?). De meeste respondenten vinden het privacy issue echter niet zo’n groot probleem.
Case study: hergebruik van de collectie van de Stichting Mondelinge Geschiedenis Indonesië - Drs Eveline Buchheim, NIOD
Drs Eveline Buchheim vertelde in haar lezing haar ervaringen met het hergebruik van de collectie van de Stichting Mondelinge Geschiedenis Indonesië voor haar onderzoek naar koloniale huwelijken. Het gebruik van mondelinge geschiedenis als bron voor haar onderzoek biedt haar boeiende mogelijkheden , maar kent ook beperkingen: Een van de problemen waar ze tegenaan liep was dat van de interviews geen transcripties beschikbaar waren waardoor het zoeken in het archief niet goed mogelijk was. Omdat het om een collectie van 3000 uur persoonlijke verhalen ging was het beluisteren van al het materiaal onmogelijk en moest een eerste selectie op basis van de samenvattingen gemaakt worden.
Dit bleek meteen een groot probleem: hoe kun je uit zo’n omvangrijke collectie het waardevolle materiaal halen als je niet kunt zoeken in transcripties? Verder moet je wel vertrouwen hebben in de interviewer en de beheerder van de collectie om zo’n collectie voor je onderzoek te gebruiken.
Voordeel het gebruik van deze collectie is dat je toegang hebt tot informatie vaak op een andere manier niet te verkrijgen is: het is dit of niets.
Secondaire data-analyse van kwalitatieve data - Dr Harry van den Berg, VU Amsterdam
In kwantitatief surveyonderzoek is secondaire data-analyse een algemeen erkende praktijk. Het nut is onomstreden: Secondaire analyse biedt de mogelijkheid om 1) de geldigheid van aanvankelijk getrokken conclusies te toetsen door het gebruik van andere analysemethoden, 2) de eerder getrokken conclusies nader te verdiepen en aan te vullen door andere kenmerken van de verzamelde data in de analyse te betrekken en 3) de data te gebruiken ten behoeve van (geheel) andere onderzoeksdoelen dan het doel waarvoor ze aanvankelijk verzameld werden. Dezelfde mogelijkheden gelden in principe ook voor secondaire analyse van kwalitatieve interviewdata. Desondanks is secondaire data-analyse niet erg gebruikelijk bij kwalitatief onderzoek. Naast voor de hand liggende redenen – zoals de moeilijkheden bij het waarborgen van anonimiteit van geïnterviewden – is er ook sprake van een wijd verbreide methodologische scepsis jegens de mogelijkheden van secondaire analyse van kwalitatief onderzoek. Die scepsis heeft vooral betrekking op het veronderstelde risico van decontextualisering: Is secondaire analyse van eerder verzamelde data mogelijk zonder diepgaande kennis van de context waarin die data ‘verzameld’ werden? Die vraag wordt niet eenduidig beantwoord. Over de rol van contextualisering bij kwalitatieve data-analyse bestaan grote meningsverschillen. In deze bijdrage zal nader ingegaan worden op het veronderstelde risico van decontextualisering en de verschillende theoretisch-methodologische opvattingen over de rol van de context bij de interpretatie en analyse van kwalitatieve data. Op basis daarvan worden uitgangspunten geformuleerd ten behoeve van secondaire analyse van kwalitatieve interviews. Die uitgangspunten impliceren ook richtlijnen voor het archiveren en toegankelijk maken van kwalitatieve interviewdata t.b.v. secondaire analyse.
Het Interviewproject Nederlandse Veteranen: van beslotenheid naar relatieve openheid - Dr Stef Scagliola, Veteranen Instituut
De werkterreinen van de muze van de geschiedenis Clio en van de mythische god van de oorlog Mars mogen zich om uiteenlopende redenen verheugen in een grote belangstelling van het algemene publiek. Geschiedenis is booming en militaire operaties halen dagelijks het avondnieuws. Maar terwijl in het ene domein alles, soms tot vervelens toe, persoonlijk en openbaar is, blijft de wereld van de krijgsmacht een relatief gesloten bolwerk. Een lastige sociale context voor de honderden ex-militairen die jaarlijks terugkeren naar de burgersamenleving. Om hier verandering in te brengen heeft het Veteraneninstituut in Doorn besloten een archief samen te stellen met 1000 interviews gehouden met een representatieve groep veteranen van alle conflicten en militaire missies waar Nederland in de afgelopen zestig jaar bij betrokken is geweest. Dit met de bedoeling kennis over en onderzoek naar het thema ‘veteranen’ te stimuleren. Maar een interview-archief samenstellen met de pretentie relevant onderzoeksmateriaal te verzamelen voor verschillende disciplines is een lastige klus. Dat begint al bij de keuze voor kandidaten en topiclijst en wordt nog ingewikkelder als het gaat om de ontsluiting van de informatie. Welke lagen kun je inbouwen en welke voorzorgsmaatregelen kun je nemen om te voorkomen dat ‘gevoelige’ informatie op straat komt te liggen? Aan de hand van de opzet en website van het project – voorlopig alleen voor intern gebruik – zal deze bijdrage ingaan op het thema van de studiedag: de verbetering van de onderzoeksinfrastructuur voor interviews als bron van onderzoek.
Interviews digitaal. En wat dan? - Prof Dr Franciska de Jong, TU Twente
Interviewcollecties kunnen als ze goed toegankelijk zijn voor derden een rijke basis voor wetenschappelijk onderzoek vormen. Daarbij is het wel van belang dat de toegankelijkheid van dit materiaal voor derden goed geregeld is. Dit is vaak niet het geval zelfs niet als het materiaal digitaal beschikbaar is: vaak ontbreken de transcripties van de interviews waardoor het niet goed mogelijk is te zoeken in de interview collecties. Franciska de Jong ging in haar lezing in op een aantal recente technologische ontwikkelingen die het mogelijk maken om de manier waarop interviews toegankelijk worden gemaakt te verbeteren. Met behulp van technieken uit de spraak-, taal- en zoektechnologie kunnen collecties automatisch getranscribeerd worden en zo op woordniveau doorzoekbaar gemaakt worden via Web-interfaces. Deze techniek is gebaseerd op statistische modellen en levert bij algemene teksten een redelijke word error rate. Ervaring leert dat zelfs bij een word error rate van 50% de transcriptie nog goed bruikbaar is. Een tweetal projecten waarbij deze technieken zijn toegepast zijn:
1. Radio oranje: (http://hmi.ewi.utwente.nl/choral/radiooranje.html) . Bij dit project werden 32 toespraken van koningin Wilhelmina doorzoekbaar gemaakt. Naast het audiomateriaal van de toespraken waren de transcripten al aanwezig. In het zoekinterface wordt gezocht in de transcripties en als resultaat wordt het relevante gedeelte van de transcripties en de bijbehorende audiofragmenten getoond. De transciptie werd hierbij aan de tijdcode van de automatisch gegeneerde transcriptie gekoppeld.
2. Een tweede project betreft het online beschikbaar stellen van een aantal interviews van de schrijver W.F. Hermans. Het ging hier om materiaal zonder metadata waarvan via automatische spraakherkenning een index gemaakt is.Alhoewel het nog niet foutloos is is het wel al heel erg bruikbaar. De resultaten van het project zijn te bekijken op de website
Op de website: http://hmi.ewi.utwente.nl/choral/demo vind je meer informatie over de toepassing van deze techniek.
Momenteel wordt gewerkt aan de collectie van de Radio Rijmond en Buchenwald collectie.
0 Comments:
Een reactie posten
<< Home