donderdag 29 juli 2010

TICER 2010: tweede dag

Tweede dag Ticer. Gelukkig beginnen we de dag met mooi weer en een eekhoorn.
Vandaag gaat het over de bibliotheek en de onderzoekspraktijk, voor mij het onderwerp waar ik met minst in thuis ben. Het is druk vandaag, zeker 50 man.

Tony Hey verricht de aftrap. Hij is een Engelse onderzoeker (ooit Dean in Southampton), die sinds een aantal jaren voor Microsoft Research werkt. Microsoft Research? Inderdaad, dat vroeg ik me ook af. Na afloop vertelde hij me dat de uitgaven aan zijn afdeling niet als liefdadigheid moesten worden beschouwd, maar vooral om Microsoft meer salonfaehig te maken op universiteiten. In 2005 heeft Bill Gates de organisatie opgericht en hen marsorders gegeven.
Opvallend was dat elke sheet van zijn Powerpoint de opmerking bevatte dat het viel onder een Creative Commons license, dat had ik nog nooit meegemaakt bij een presentatie van een Microsoft-medewerker.
Rode draad in zijn  presentatie was dat we een 'data zondvloed' ondergaan. Wetenschappelijke apparatuur zorgt voor enorme hoeveelheden data. In Medline worden 2 artikelen per minuut gestopt. Voor de mens is dit niet bij te houden, die taak kunnen alleen machines aan.
We zijn beland in een nieuwe fase, het vierde paradigma.
1. experimentele wetenschap (Galileo)
2.  theoretische wetenschap (Newton)
3. computational wetenschap (klimaatmodellen)
4. data-intensieve wetenschap
Dit speelt niet alleen in de exacte wetenschappen en de geneeskunde, zie bijvoorbeeld de tijdreeksen van Chronozoom op www.chronozoomtimescale.org
Een andere belangrijke ontwikkeling is dat het business model van wetenschappelijk publiceren kraakt in zijn voegen. De prijzen van tijdschriften stijgen sneller dan de budgetten, voorzover die nog omhoog gaan. Hey ziet een analogie met het in het ongerede raken van het verdienmodel in de muziekindustrie. Terloops ventileerde Hey kritiek op Google Scholar en vertelde hij dat MS werkt aan iets beters.
Hey had nog een mooi citaat van Paul Gnsparg over deze kwestie: " Ironically, the new technology may allow the traditional players from a century ago, namely the professional societies and institutional libraries, to return to their dominant role in support of the research enterprise."  P. Ginsparg, "Winners and Losers in the Global Research", Electronic Publishing in Science, at UNESCO HQ, Paris, 1996 (eds. Dennis Shaw and Howard Moore).
Bibliothecarissen kunnen de rol spelen van hoeders van de research output van een wetenschappelijk instituut. Als ze daar echt werk van willen maken moeten ze stoppen met andere dingen: minder print / schapruimte, geen aankopen meer doen voor bijzondere collecties (heel weinig onderzoekers doen hier iets mee) en hij maakte ook tamelijk onaardige opmerkingen over IBL.
Daarentegen moet er veel meer geld worden gestoken in repositories. Goed gevulde repositories (de toppers eerst!) zijn essentieel voor de reputatie van een universiteit.
Voor de UB's betekent dit dat nieuwe competenties belangrijk worden. Organiseren, classificeren, ontsluitbaar bewaren van datasets. En dat allemaal op een veel geringere afstand van de onderzoekers dan nu. De veel gehoorde kreet van "embedded librarian" kwam ook bij Hey op.

De tweede presentatie kwam van Andrew Treloar, Australie, director of technology ANDS. Data, Librarians and services. ANDS is een soort kruising tussen SURF en DANS.
Hardware wordt snel beter, software wordt langzaam beter, ‘wetware’ (wat tussen onze oren zit) verbetert niet, mensen met data management competenties blijven kostbaar. De enige remedie is een combinatie van standaardisatie en automatische tools.
Liaison met research is essentieel, weer kwamen de 'embedded librarians' langs.

Na de lunch kwam het klapstuk. Carole Goble, hoogleraar uit Manchester (zelf informaticus, leider van een groot bioinformatica-project), leider van een soort Gideonsbende. Vijf turven hoog, een kruising tussen een bulldozer en een wervelstorm die tussen neus en lippen door ook nog even liet weten dat ze in 1993 voor het laatst in een bibliotheek was geweest! Haar groep was continu bezig te werken aan de grenzen van wat bekend was.
Kenmerkend was bijvoorbeeld haar beschrijving van de software die volstrekt onontbeerlijk is voor de onderzoekers: 'permanent beta'. Een schrikbeeld voor mij. Zou jij een medicijn willen slikken dat voortkomt uit onderzoek dat gebaseerd is op niet-gevalideerde software, waar gisteren nog aan gesleuteld is? Ikke niet!. In de wereld van de bioinformatica denken ze er blijkbaar anders over.
Sleutelwoorden:
- knowledge turn: door methodisch werken binnen internationale onderzoeksgroepen sneller patronen ontdekken.
- data curation: belangrijke datasets verrijken door analyse toe te voegen, metadata, etc. Hiervoor is minstens PhD niveau nodig, zij ziet hierbij geen rol voor bibliotheken. Data curation gebeurt door experts die geen baan kunnen vinden of door 'crowds' (vgl. open source gemeenschap). Bibliotheekmedewerkers inschakelen zou een '√≠nsult' zijn voor de onderzoekers.
- Standard Operation Procedures (SOP): fenomeen uit de medische wereld, later overgenomen door de ICT-wereld. Een formele standaardisatie van bepaalde routines.
Een dag uit het Web2.0 leven van Paul, 1 van haar onderzoekers:   
"Prior to leaving home Paul, a Manchester graduate student, syncs his IPhone with the latest papers, delivered overnight by the library via a news syndication feed. On the bus he reviews the stream, selecting a paper close to his interest in HIV-1 proteases.
    The data shows apparent anomalies with his own work, and the method, an automated script, looks suspect. Being on-line he notices that a colleague in Madrid has also discovered the same paper through a blog discussion and they Instant Message, annotating the results together.
    By the time the bus stops he has recomputed the results, proven the anomaly, made a rebuttal in the form of a pubcast to the Journal Editor, sent it to the journal and annotated the article with a comment and the pubcast".
De enige rol zie Carol zag voor de bibliotheek is het vastleggen en bewaren van methodes en data.
Haar boodschap was duidelijk. De onderzoekers van tegenwoordig zijn "ICT-savvy", hebben overal in de wereld hun research-maatjes zitten en zijn qua informatievoorziening prima in staat hun eigen broek op te houden (althans, dat vinden ze zelf). Who needs libraries?
Nadat de Carol-storm uitgeraasd was, hingen de toehoorders als boksers in de touwen.
Toen we in de koffiepauze weer bijkwamen, merkte Kurt de Belder op dat we voor een keus we staan: hetzij we gaan een inhaalactie doen om alsnog van betekenis te zijn voor dit soort onderzoeksgroepen hetzij we concentreren ons op vakgebieden die zich nog niet geheel verlaten op hun eigen Web2.0 gemeenschap, maar dan moeten we het heel wel goed aanpakken.

Jennifer Schaffner van OCLC Research sloot de dag af, ook haar lezing gaf veel stof tot nadenken.
Haar organisatie had het management van een hoop universiteiten gevraagd waar de toponderzoekers (allemaal jonger dan 50) zaten in de USA en UK om deze te interviewen.
Conclusies van deze interviews:
- gemak gaat boven kwaliteit. Als voorbeeld: zij constateerden bij veel onderzoekers een opvallend groot vertrouwen in Google, Google Scholar en bepaalde blogs als wetenschappelijke bronnen ten opzichte van gevalideerde wetenschappelijke databases.
- ze grijpen naar middelen, methoden en bronnen die gebruikelijk zijn in hun vakgebied. De invloed van 'de rest van hun universiteit' is gering.
- de organisatie van documenten en gegevensverzamelingen (data sets) is vaak zorgelijk. Ook Andrew Treloar had een aantal voorbeelden van knullige, zelfbedachte back-up oplossingen.
- persoonlijke relaties zijn dominant in keuze van 'collaborators'
- institutional repositories op hun vakgebied lopen stroef

Conclusie was dat het als bibliotheek heel lastig is de wetenschappers te helpen. De conclusie lijkt dat bibliotheken vooral moeten mikken op het ontwikkelen van persoonlijke relaties (en dus dienstverlening) of zich moeten terugtrekken op hun rollen als licentieboer en dienstverlener voor onderwijs.
Er liggen nog wel kansen. Data management, institutional repositories, wellicht liggen er ook nog mogelijkheden bij data curation.

Dit was een heel interessante dag, de sprekers zijn er goed in geslaagd om het publiek duidelijk te maken wat de bibliotheken te wachten staat als ze niet met hun tijd meegaan.

Geen opmerkingen:

Een reactie plaatsen