maandag, november 05, 2007

kantoor hobby's

Bij toeval kwam ik afgelopen vrijdag in de boekwinkel het boekje: Kantoor hobby's van Marcus Weeks (isbn 9789043910187) tegen. Het boekje draagt als ondertitel: Leuke bezigheden in de baas zijn tijd en staat vol met allerlei bezigheden die zich bij uitstek voor een melige vrijdagmiddag lenen (helaas is vrijdag mijn vrije dag :-)). Enkele voorbeelden: "waterkoeler flash mobben" "free running op kantoor" bureaustoelregatta, morsesignalen met bureaulampen, online protocollen of een jamsessie met ringtones. Alle bezigheden staan duidelijk uitgelegd en de benodigdheden staan apart vermeld. Ik denk dat ik volgend jaar ook maar op vrijdag ga werken...(alhoewel dat meer te maken heeft met de nieuwe CAO waarin we de komende jaren twee vakantiedagen gaan inleveren dan met dit boekje)

Labels:

Datasharing en re-use at CERN

Tijdens de conferentie Tools & Trends bij de KB gaf Salvatore Mele (CERN) een lezing over: Preservation and reuse of high-energy Physics data


De presentatie van Salvatore richt zich op een drietal onderdelen: HEP en de data, wat is nou precies het probleem en welke stappen kunnen we nemen om het probleem op te lossen.
CERN is een groot onderzoeksinstituut met 2500 stafleden en zo’n 8000 gebruikers. CERN heeft een zeer grote digitale bibliotheek (miljoen objecten). Groot aantal innovaties zijn bij CERN begonnen (internet). De experimentele faciliteit waar het allemaal om draait is een accellerator met een diameter van 27 km. Het is een zeer grote hadron collider met een 100 miljoen sensoren (1 sensor is een digitale camera) die 40 miljoen events vastleggen per seconde. Daarvan worden er 200 per seconde geselecteerd en die worden bewaard.
De verhouding is ongeveer als volgt:
Ruwe data 3200 TB
Reconstructed data 2000 TB
Physics data 200 TB


Preservatie en open access van de HEP data
Er bestaat niet echt een long term archiverings strategie. Bedenk hoe dit zich verhoudt tegen de biljoenen die via fondsen geinvesteerd wordt in het onderzoek. Moeten die data dan niet net zoals de publicaties vrij toegankelijk zijn?

Waarom is archiveren van data uberhaubt van belang? De data waren van belang om te meten, waarom zouden ze dan niet belangrijk genoeg zijn om op te slaan? Daarnaast is het erg kostbaar om metingen te reproduceren. Misschien dat later blijkt dat je terug moet in de geschiedenis en dan heb je de data nog.
Voor wie zijn de data van belang?
- voor de onderzoekers die de metingen hebben verricht (soms jaren na dato)
- voor onderzoekers die op dezelfde tijd experimenten verrichtte
- onderzoekers van toekomstige experimenten
- theoretische fysici die de data opnieuw willen interpreteren
- onderwijs


Datapublicatie anno 2004: een artikel met aan het eind van het artikel een reeks meetgetallen
Waarom is er niet meer aandacht voor datapublicatie. HEP heeft alles mee: is Open Access minded (denk aan preprint server ArchiveX). De plaats van de dataopslag is ook niet het probleem: er is ruimte genoeg. Hardware migratie: geen probleem, Software migratie Idem: dat gebeurd bij HEP al zeer regelmatig. Het probleem ligt in de data zelf. Het datamodel is zeer complex.

De oplossing is om parallel te denken. Tegelijkertijd met een experimenteel datamodel moet er geinvesteerd worden om parallel een format te onwikkelen voor het hergebruik. Dit format zal uiteindelijk begrijpelijk moeten zijn voor en hergebruikt moeten kunnen worden door andere experimentele wetenschappers en theoretici. Dit is een moeilijk probleem: de wetenschapper die de orginele dataset meet interesseert het kleine wiggeltje op het signaal en niet de langdurige opslag van de dataset maar je hebt de kennis van deze wetenschapper wel nodig om de data te kunnen opslaan. Dit probleem los je alleen op de culturele verschuiving te bewerkstelligen door iedereen bewust te maken van deze problematiek en te proberen dit punt zo veel mogelijk op de agenda te krijgen.
www.scoap3.org
salvatore.mele@cern.ch

Drukke week....

Afgelopen week een drukke week gehad waarin ik veel op pad ben geweest:

Zaterdag 27 oktober naar de conferentie 'Wiki's en Educatie' van Wikimedia Nederland. Mijn collega Moqub deed hiervan al uitvoerig verslag. Ter aanvulling nog een verslag van een aantal sessies die ik volgde:

Inge Habix gaf een lezing over een ander project van Wikimedia: Wikibooks. Dit project richt zich op het integraal online zetten van informatieve boeken en cursussen. Het grote verschil met Wikipedia dat uit losse elementen bestaat is dat het bij Wikibooks gaat om gestructureerd opgebouwde kennispakketten op verschillende niveaus (hobbyist, wikijunior, middelbare school, universitair).
Wikibooks biedt boeken aan voor onderricht in de breedste vorm: van klassikaal onderwijs tot naslagwerken. De grote voordelen van wikibooks voor het onderwijs zijn: vrije en gratis beschikbaarheid, recentste ontwikkelingen beschreven in boeken, les materiaal duidelijk en goed gestructureerd, meer didactische hulpmiddelen en interactiever. Momenteel zijn er 150 boeken in verschillende stadia van compleetheid en wordt er gewerkt aan meer dan 2000 hoofdstukken.

In de lezing met de titel: “De elektronische werkplaats” vertelde Dirk van der Linden hoe Wiki’s bij de Radboud universiteit Nijmegen gebruikt worden. Sinds 2005 wordt er bij de Faculteit Natuurwetenschappen, Wiskunde en Informatica gebruik gemaakt van MediaWiki’s. Dit worden elektronische werkplaatsen genoemd en hierin werken meesters (lees docenten) gezellen (lees: studentassistenten) en leerlingen (lees: studenten) samen, net als in de tijd van de ambachtsgilden gebeurde. Iedereen werkt op zijn eigen nivo en zo leert men van elkaar. De opdrachten die studenten krijgen zijn taakgeoriënteerd en de uitwerking binnen de Wiki moet uniek zijn. De ervaringen zijn positief: samenwerking en kennisdelen wordt zo gestimuleerd.

Yolanda Spoelder besprak de ervaringen van met Wiki’s in het onderwijs aan de VU. Derdejaars archeologie studenten gebruiken het om een beeld van vroegere samenlevingen te krijgen. In een Wiki worden de opgravinggegevens besproken en wordt een beeld geschetst van hoe het vroeger geweest moet zijn. Bij deze proef kwam naar voren dat de studenten een terughoudendheid betrachten om ideeën en gegevens uit te wisselen en dat ze elkaars werk in progress ook niet echt volgen.Een tweede toepassing is het gebruik van een Wiki voor eerstejaars studenten. De ervaringen bij die toepassing waren dat studenten niet echt optimaal gebruik maken van de mogelijkheid tot samenwerking en dat de studenten nog erg traditioneel werken: ze schrijven de tekst in word en copieren en plakken die vervolgens in de Wiki. Positief was dat de studenten door het gebruik van de Wiki wel veel gemotiveerder leken. Bij de VU wordt nu gewerkt aan een didactische handreiking aan de docent over hoe en wanneer Wiki’s het beste ingezet kunnen worden.

Woensdag 31 oktober naar de middag van Collegerama geweest en donderdag 1 en vrijdag 2 november was ik in Den Haag in verband met het bijwonen van de Internationale conferentie "Tools & Trends" (over digitale duurzaamheid) (dit ter gelegenheid van het afscheid van Johan Steenbakkers). Ik loop dus wat achter met de verslaggeving :-)