Aduna Seminair
Verslag Aduna Seminair “Exploring Enterprise Information”, Delft 14 december 2006
Aduna is een bedrijf dat zich sinds 1997 bezig houdt met het ontwikkelen van software voor metadatasearch en retrieval. De producten van Aduna zijn open-source en gratis: het bedrijf verdient door de verkoop van support.
Eén van de producten die Aduna aanbiedt is AutoFocus. AutoFocus is een visuele desktop zoekapplicatie waarmee je snel en eenvoudig je persoonlijke informatiebronnen (zoals bestanden, e-mails en favoriete websites) kunt doorzoeken.
Zoekmachines als Google hebben de beperking dat ze alle resultaten in één resultaatlijst tonen. Met Autofocus wordt een clustering van zoekresultaten gemaakt (de resultaten worden bijvoorbeeld geclusterd naar filetype). Daarnaast wordt van de resultaten ook nog een cluster map visualisatie van de gemaakt.
Andere producten van Aduna zijn:
· Spectacle
· Metadata Server
· Sesame RDF database
Spectacle is een product dat gebaseerd is op facet navigatie. Facet navigatie is een multi-dimensionaal navigatiesysteem waarbij ieder metadataveld een dimensie is.
Creating a search infrastructure
In deze presentatie ging Peter Valkenburg (CTO van Everett) in op hoe je een enterprise search architectuur kunt opzetten. Gewone zoekmachines geven vaak teveel hits en teveel externe informatie terug. Enterprise search technologieën zorgen ervoor dat organisaties, medewerkers en klanten efficiënter informatie kunnen vinden. Een van de lastige punten hierbij is wel dat je te maken hebt met verschillende soorten gebruikers met verschillende behoeftes die je allemaal moet ondersteunen (dwz de gewone gebruikers (meerderdeel) willen gewoon snel en simpel zoeken, de expert die typisch jargon zal willen gebruiken maar die de kennis van geavanceerd zoeken zal ontberen, de bibliotheek medewerker bij wie de domeinkennis zal ontbreken maar die wel veel verstand heeft van zoektechnieken).
Bij het opzetten van een zoekarchitectuur moet je van te voren definiëren:
- over welke bronnen je wilt zoeken
- voor welke gebruikers je het doet
- welke processen je wilt ondersteunen
- welke zoekcapaciteiten aangeboden zullen worden.
Tot slot gaf Peter een roadmap voor het implementeren van enterprise search. Invoer daarvan is namelijk een programma dat uit meerdere projecten bestaat:
- Invoer simple search: tekstueel zoeken in enkele bronnen
- Basic enterprise search: tekstueel zoeken in meerdere bronnen
- Metadata enhanced Enterprise search: zoeken in tekst en metadata meerdere bronnen
- Guided enterprise search: guided zoeken in meerdere bronnen evt afkomstig uit diverse organisaties
RNA: reference network architecture
http://www.rnaproject.org/
In het RNA-project zijn allerlei soorten organisaties betrokken bij het toegankelijk maken van het Nederlandse culturele erfgoed. In het project worden door diverse soorten organisaties (bibliotheken, musea en beheerders van het culturele erfgoed) digitale informatie gedeeld en dit leidt tot een aantal leuke initiatieven:
http://www.rnaproject.org/rna.gron/rna.gron/i000512.html
http://www.rnaproject.org/asp/page.asp?alias=rna.naturalis
Het Nederlands soortenregister
Het Nederlands Soortenregister is een project waarbij informatie van diverse organisaties aan elkaar gekoppeld worden. Omdat ieder van deze organisaties zijn eigen referentiestructuur gebruikt worden bij deze projecten de verschillende referentiestructuren aan elkaar gekoppeld. Hierdoor kan informatie uit diverse sites met elkaar gelink. In het Nederlands soortenregister worden de gegevens van een in Nederland voorkomend soort gekoppeld aan de beeldbibliotheek van Naturalis, informatie van het ministerie van LVN en informatie over waarnemingen van de soort (afkomstig van de website: http://www.waarneming.nl/)
Borgen in Groningen
De casus RNA-G(roningen) houdt zich binnen het RNA-project bezig met het ontwikkelen van een referentie- en beschrijvingssystematiek die het mogelijk maakt zowel objecten (de borgen en de in de borgen aanwezige objecten) als documentatie over die objecten en hun achtergronden efficiënt en doeltreffend toegankelijk te maken. Hiertoe worden educatieve en toeristische informatie gekoppeld aan objectbeschrijvingen van borgen in Groningen.
Sprinkhanen in Nederland en België
Deze website geeft een overzicht van de in Nederland en België voorkomende sprinkhanen.
Een veel gebruikte vorm van determinatie is dichotoom. Bij deze manier van determineren wordt steeds een pad van telkens twee keuzes gevolgd: een insect heeft vleugels of geen vleugels. De volgorde van de vragen ligt van te voren vast. Vaak is deze manier van determineren moeilijk. In het RNA project is een website gebouwd waarmee door middel van facetdeterminatie insecten kunt determineren. Je hoeft nu niet meer eerst die ene vraag te beantwoorden voor je een andere krijgt: je kiest zelf welke vraag je het eerst wilt beantwoorden om de gevonden insect te determineren.
Metadata binnen de overheid – Hans Overbeek
Een ander project waarbij gebruik gemaakt wordt van Aduna software is het project Advies overheid.nl.Dit project heeft tot doel om te realiseren is dat burgers overheidsproducten, -diensten en -documenten eenvoudig en goed geordend op het internet kunnen vinden.
De grootste knelpunten bij aanvang van het project in 2003 waren:
- het grote verschil in kwaliteit van de diverse websites
- het gebruik van Google: veel hits maar onderling geen samenhang
- de kwaliteit van de zoekmachines op de diverse sites.
De volgende resultaten zijn anno 2006 behaald:
- er zijn webrichtlijnen gedefinieerd voor overheidswebsites
- er is een goede zoekdienst opgezet
- er zijn gemeenschappelijke zoeksleutels (metadata)
Een van de grote problemen waar men in dit project tegen aan liep was dat de aanbieders van informatie en de gebruikers van deze informatie niet dezelfde “taal” spreken. Voor de aanbod kant wordt gebruikt gemaakt van de webmetadatastandaard. Door mapping vindt een vertaling naar de vraagkant plaats.
Bij dit project wordt voor de metadata gebruik gemaakt van DublinCore. Omdat DublinCore alleen niet voldoende is wordt deze standaard uitgebreid met een aantal eigen velden. (overheid web metadata standaard).
De presentaties zullen tzt beschikbaar komen via de website van Aduna
Labels: workshops/conferenties, zoeksoftware
0 Comments:
Een reactie posten
<< Home