woensdag, april 11, 2007

Verslag NVB studiedag: Onderwerpsontsluiting II: Vinden en verbinden; van content naar contextdag

Zoekmachines kunnen het wel alleen - Theo Huibers
Theo Huibers begon zijn verhaal met een metafoor: toen Columbus Amerika had ontdekt besloot iedereen zijn geld in boten te stoppen. Toen Lindbergh in 1927 per vliegtuig van Europa naar Amerika vloog was de algemene reactie was: "dat wordt niets". Toch vond er een toename van het vliegverkeer plaats en brokkelde de macht en financiele positie van de bootmaatschappijen verder af. De slimste maatschappijen verkochte de boot en investeerde het geld. Wat doen wij als bibliotheken als wij een aantal lindberghs langs zien komen? Blijven wij als bibliotheken veilig in de boot zitten of maken we de overstap?

Ontwikkelingen die gaande zijn in de informatiemaatschappij:
- Digitalisering
- User generated content
- Itunisering: tendens van boek naar fragment
- Cross media (wat is nog de volkskrant? Is dat de krant, is dat het informatieportaal, zijn het de diensten of is het het geheel?)
- Commodity v.d. technologie

Momenteel zijn er veel nieuwe intiatieven (Lindberghs) op het gebied van informatieretrieval. Een aantal voorbeelden:

Zoeksystemen voor kinderen waarin met de nieuwe taal kunnen zoeken (dus in plaats van "Ik wacht bij de vijver" het MSN geschrevenen: "Ik W8 bij de5er")

Question Answer retrieval
In plaats van een document kan met deze zoekmachine een antwoord gevonden worden.

Automatische vertalen
Automatische samenvatting genereren is in de informatica al opgelost. Standaar is deze functionaliteit in Word beschikbaar. Voor automatische samenvattingen zijn 2 verschillende algoritmes beschikbaar: topdown en bottomup

Blogretrieval.
Zijn we al bezig met het archiveren van blogs? Het wetenschappelijk bloggen zal gaan toenemen: moeten we dat soort blogs niet selecteren en archiveren?

Muziekretrieval
Ipv zoeken met een woord of woordgroep zoeken met een notenbalk of gezongen deuntje. Een voorbeeld van zo’n project is Muugle.

Spraakherkenning
Automatisch zoeken in gesproken teksten. De volledige teksten worden via spraakherkenning geindexeerd en zo doorzoekbaar gemaakt. Door het invullen van een zoekterm vind je een gesproken tekst terug. Zo kun je al zoeken in een groot aantal fragmenten van W.F. Hermans.

Imageretrieval
Ook op het gebied van imageretrieval is veel voortuitgang gemaakt. Het is nu al mogelijk om op basis van patroonherkenning uit een hele stapel rontgenfoto’s alle rontgenfoto’s van een hand te halen. De applicatie waarmee dit kan moet wel eerst getraind worden met behulp van een set trainingsdocumenten. Handmatige metadatering door artsen is op deze manier niet meer nodig.

Cross media
Bij de universiteit in Twente is een tool ontwikkeld waarbij automatisch het 8 uur journaal wordt geindexeerd. Met een zoekmachine kun je naar fragmenten zoeken maar wordt je zoekvraag ook cross mediaal over andere bronnen uitgezet (bijv. Landelijke dagbladen). Zo vind je in 1 keer alles over een bepaald onderwerp.

Emotiedetectie
Er is software ontwikkeld waarmee de webcam emoties kan detecteren. Dit zou door een zoeksysteem gebruikt kunnen worden om de emoties van de zoekers tijdens het zoeken te kunnen bekijken. Hoe reageert een zoeker op de diverse zoekresultaten? En dat zou je natuurlijk weer kunnen laten meewegen in de relevantie.

Expert Finder (University Glasgow)
De Universiteit van Glasgow is betrokken bij een project dat de Expert Finder heet. Dit project lijkt veel op het Advanced Network Self Healing Materials maar gaat nog net een stap verder. In het Advanced Network worden experts gevonden op basis van hun artikelen. Bij de Expert Finder wordt ook gekeken naar referenties, presentaties en aanwezigheid op conferenties.

Effectmeting van onderwerpsontsluiting – Henk Voorbij
Hoe effectief is onderwerpsontsluiting? Henk heeft een aantal onderzoeken bekeken die op deze vraag ingaan. Er zijn verschillende manieren om dit soort effectiviteitsmetingen te doen. Vaak verschilt de effectiviteit per vakgebied. Over het algemeen echter valt de effectiviteit van het extra toekennen van trefwoorden tegen.
Garrett, Jeffrey. (2007) Subject headings in full-text environments: The ECCO experiment." College & Research Libraries 68 (1) January 2007: 69-77.
Thomas Mann http://www.libraryjournal.com/article/CA623006.html

Verrijking door toegevoegde functionaliteit – Jeroen Bosman
Jeroen Bosman ging in zijn presentatie in op het verrijken van de catalogus met extra functionaliteit. De catalogus heeft verschillende doelen:
1) Identificteren publicaties
2) Verleiden
3) Beoordelen
4) Beschikken over
5) Citeren
6) Ontdekken
Om zijn verhaal kracht bij te zetten heeft Jeroen een klein onderzoek gedaan waarbij gekeken werd naar een aantal catalogi (Amazon, Bol, Google Books, NCSU, OBA, Univ. bibliotheken) en hoe die scoren op de volgende punten: Identificeren, Verleiden, Selectie, Citeren, Ontdekken.

Identificeren
Niet veel verschil in kwantiteit, wel verschil in het gemak waarmee plaatsingsgegevens op te vragen zijn.


Verleiden
Vooral opnemen omslagen van boeken.Bij UB’s en OB’s is dit in opkomst maar vaak nog zeer onvolledig


Selectie/beoordeling
Vraagt om inhoudsopgaves, reviews, auteursinformatie, ratings. Mogelijk deels user-generated. Zeer groot kwantitatief verschil tussen OB’s en UB’s en bedrijven zoals Amazon, Bol. Hier valt winst te behalen voor de universiteitsbibliotheken

Citeren
Geen grote verschillen. Universiteitsbibliotheken scoren hier vaak hoger dan de sites van boekhandels. Opslaan in bibliografische sofware vanuit de catalogus vaak omslachtig. Permalink ontbreekt vaak

Ontdekken
Zeer grote verschillen tussen de catalogi. Vooral de commerciele spelers (Amazon, Bol, Google Books) zijn hierin veel sterker dan de universiteitsbibliotheken. Het biedt ons wel grote mogelijkheden voor vergroting van het gebruik van de collectie.
Universiteitsbibliotheken onderling.
Ook de catalogi van universiteitsbibliotheken onderling werden vergeleken. Hierbij kwam de catalogus van de BTUD niet als de meetst verrijkte catalogus uit de bus.
Het volledige onderzoek is te vinden via de blog van Jeroen.
Voor de universiteistbibliotheken zijn een aantal quickwins te behalen die zullen bijdragen aan verbetering van de catalogus:
- aanleggen permalinks
- goede aanwinsten indicatie
- mogelijkheden link resolvers benutten
- spullen inkopen Syndetics, meer over media
- links naar fulltext search by Google, Amazon, live, internet archive
- simpeler exporteren reference works, endnote


Op langere termijn kan de universiteitsbibliotheek de catalogus verbeteren door:
- Doorzoekbaar maken inhoudsopgaven
- Parametrische zoekresultaten
- Relevantie ranking
- Gebruik leengegevens
- Links naar citaties


Catalogi zijn redelijk voor het vinden van ‘Known Items’ maar leveren vaak te weinig tools voor ontdekken en beoordelen van zoekresultaten.

Labels: ,