donderdag, juni 12, 2008

Supercrunchers

Een collega tipte mij over het boek Supercrunchers (how anything can be predicted) van Ian Ayres. Omdat bij Bol de levertijd na het plaatsen van mijn bestelling werd verdubbeld heb ik de bestelling geannuleerd. Helaas hadden ze het boek ook niet op voorraad in Delft. Vandaag liep ik bij toeval tegen de luisterversie van het boek aan dat ook nog eens veel en veel goedkoper was dan de gedrukte uitgave.... ik ben benieuwd.

woensdag, juni 11, 2008

Bezoek KNMI

Verleden week ben ik op bezoek geweest bij het KNMI in de Bilt. Het KNMI heeft het datacentrum Kodac dat een aantal metreologische datasets bevat. Omdat we in 3TU verband ook bezig zijn met het opzetten van een datacentrum leek het me een goed idee eens met het KNMI te praten.

Omdat de buschauffeurs staakte heb ik mijn vouwfiets maar meegenomen en ben ik van Utrecht naar De Bilt gereden. Het KNMI zit daar in een geweldig mooi pand, een beetje verscholen in het groen. De oprit op het terrein is beschilderd met isobaren, het geeft meteen aan bij welke organisatie je binnenkomt.



Kodac is het dataportaal van het KNMI. Het is de bedoeling dat Kodac zich de komende tijd meer datasets gaat bevatten en dat de functionaliteit uitgebreid wordt. De meeste datasets in Kodac zijn vrij toegankelijk. Om van het datacentrum gebruik te kunnen maken is wel een registratie noodzakelijk omdat onderzoeksgroepen vaak willen weten wie er aan de data zitten. Er vindt echter geen check op de ingevoerde gegevens plaats. Als je je naam, e-mail adres en organistie gegevens achterlaat krijg je een inlog waarmee je toegang krijgt tot de gegevens. Voor de authorisatie wordt A-Select gebruikt.

In Kodac kun je via browsen de datasets bereiken, een zoekfunctionaliteit ontbreekt in het dataportaal.



Een van de problemen waar men bij het KNMI tegenaan loopt en wij bij het datacentrum ook is dat het moeilijk is om datasets aangeleverd te krijgen. Voor het aanleveren van datasets aan een data-archief is een flinke inspanning van de onderzoeker noodzakelijk en hij is vaak niet degene die vruchten van dit werk plukt: het voordeel van opslag in het data-archief is voor degene die de dataset wil hergebruiken.



In het najaar van 2008 zal het KNMI een tweede datasite opleveren. Via deze site worden de onderzoeksgegevens die in Cabauw gemeten worden toegankelijk gemaakt. In Cabauw (een plaats vlak bij Lopik) doen een 8 tal instituten waaronder TUD, ECN, ESA, Wageningen, RIVM onderzoek naar de atmosfeer.

Naar ik begrepen heb zijn de plannen om een zoekinterface te ontwikkelen voor de Cabauw datasets waarmee gezocht kan worden op o.a. trefwoorden, onderwerp, categorieen en tijd. Per dag wordt aan de datasets automatisch metadata toegevoegd waarin de dagkarakteristieken zijn opgeslagen. Hierdoor kun je eenvoudig zoeken naar datasets gemeten op bijvoorbeeld een stormachtige dag. Ook zijn er metadatavelden voor de constraints (access, use, other). De datasets worden opgeslagen in netcdf formaat.



Wat betreft het hergebruik van de door het KNMI aangeboden datasets: doordat de eindgebruiker een inlogaccount moet aanvragen is er enig inzicht in wie de datasets gebruikt. Echte regels met betrekking tot het gebruik en het citeren van datasets zijn er nog niet.