CLARIAH Techdag

Vrijdag 7 september was er de eerste CLARIAH-techdag: een bijeenkomst op verzoek van verschillende "techneuten" binnen de werkpakketten die de behoefte voelde om nu eens echt met elkaar van gedachten te wisselen over meer technische zaken. En dit zonder zich beperkt te voelen door een gehoor dat de gebruikte "techspeech" niet zou kunnen volgen.

Zo gezegd, zo gedaan maar uiteindelijk werd besloten om ook echte gebruikers uit te nodigen om te horen wat zij precies van CLARIAH verwachten.

Aanwezigen

Zo'n 40 mensen waren naar Utrecht gekomen: een mooie dwarsdoorsnede van de verschillende werkpakketten. Desalniettemin waren de "techneuten" oververtegenwoordigd en waren er nauwelijks de meer "klassieke" onderzoekers uit de Geesteswetenschappen. Wellicht was het niet realistisch om te verwachten dat zij naar zo'n techdag zouden komen. Julia Noordegraaf (WP5) had haar twijfels al geuit: "ik weet niet of ik als onderzoeker met zo'n programma zelf naar deze middag zou zijn gekomen".
Een goede les voor de volgende techdag.

Conclusie

Maar...... de bijeenkomst was wel zeer geslaagd omdat het goed liet zien dat we de afgelopen tijd enorm veel bereikt hebben. Veel verschillende software-initiatieven beginnen show-rijp te worden zoals in het gebruikersgedeelte duidelijk werd. Veel presentaties waren fascinerend om te volgen (hoog wow-effect) maar gingen soms zo snel dat niet duidelijk werd hoe je dat nu zelf kunt doen. Het is daarom nu zaak snel een aantal mooie showcases en demo's te maken om te laten zien wat er allemaal kan en vooral hoe je er zelf mee aan de slag kan gaan.

Hieronder verschillende presentaties met links naar de presentatie, de spreker(s) en de achtergrondinformatie

 

Tech-sessies User-sessies
Presentatie Slides Spreker(s) Info Presentatie Slides Spreker(s) Info
Timbuctoo / ANANSI Gertjan Filarski Entity typing en event extractie Marieke van Erp
CMDI2RDF Daan Broeder/
Menzo Windhouwer
Qber Ashkan Ashkpour 
LOD Laundromat Wouter Beek OpenSONAR Martin Reynaert
grlc Albert Meroño Peñuela ANANSI Gertjan Filarski 
Identificatie / Authenticatie / Autorisatie Themistoklis Karavellas Meertens Depositieservice (TLA/FLAT) Marc Kemp-Snijders / Menzo Windhouwer
Software Quality Guidelines Maarten van Gompel Dataset registratieservice Willem Melder, Eva Baaren, Liliana Melgar

AVresearcherXL

Hoe zoeken radioredacties online naar bronmateriaal voor hergebruik? Bepaalt de maker het zoekplatform, of bepaalt het platform de keuze van de maker? En wat als mediaprofessionals de gelegenheid krijgen om te werken met (big) data-onderzoekstoolsvoor mediawetenschappers? Met deze vragen in het achterhoofd organiseerden Beeld en Geluid, de UvA en Vondel CS afgelopen maand de workshop “Research Tools voor Radiomakers”, waarin zij samen met radiomakers op zoek gingen naar het ideale digitale zoekplatform.

Het volledige verslag staat op de website van de Beeld&Geluid Labs.

Op vrijdag 22 januari 2016 was er de eerste CLARIAH-dag: een bijeenkomst voor iedereen die in CLARIAH geïnteresseerd is.
De bijeenkomst werd van 13:00 tot 18:00 gehouden bij de Rijksdienst voor het Cultureel Erfgoed (RCE) in Amersfoort.


IAP

IAP meeting’s Morgens was er de eerste vergadering van het International Advisory Panel (IAP). Het IAP bestaat uit 5 experts op het gebied van Digital Humanities en Infrastructuur. Christine Borgman (UCLA) kon er helaas niet bij zijn en Helen Katsiadakis deed mee via Skype (hetgeen goed werkte).

Het IAP was tevreden over de opzet van het CLARIAH-project maar benadrukte wel dat:

  1. de disseminatie uiterst belangrijk is
  2. dat de verschillende WorkPackages meer zouden moeten samenwerken omdat dat
    1. nuttig is en
    2. silo-vorming kan voorkomen.

Bijeenkomst

Na de lunch druppelden de ± 80 mensen die zich hadden opgegeven, langzaam binnen. De 10 monitoren stonden al klaar en de eerste (van de 14) demo’s werden al uitgeprobeerd.

http://cultureelerfgoed.nl/sites/default/files/styles/rce_pasfoto_large/public/images/pasfotos/dirk_houtgraaf.jpg?itok=sQ5QRu6AOm 14:00 heette Dirk Houtgraaf, programmadirecteur Erfgoed Digitaal van de RCE, ons van harte welkom en gaf hij aan dat de RCE eigenlijk veel intensiever met CLARIAH zou willen samenwerken: dat gaan we dus verkennen!
De voorzitter van CLARIAH, Lex Heerma van Voss, opende daarna de bijeenkomst met een kort overzicht van de activiteiten van afgelopen jaar sinds de start in januari 2015.

Keynote I

Joris van EijnattenJoris van Eijnatten, hoogleraar cultuurgeschiedenisaan de Universiteit Utrechthield de eerste keynote: "Tracing conceptual change in messy data: finding stuff in bags of words"
Joris ging daarbij in op technieken die hij als “eenvoudig historicus” graag zou willen gebruiken in zijn onderzoek. Van Eijnatten gaf aan dat voor hem, als redelijk goed ingevoerd in Excel, er nog wel mogelijkheden zijn om een en ander uit te rekenen maar dat ook hij verstek moet laten gaan als er bv de factor tijd bij komt. Zijn ideaal is een soort slider waarmee je door de tijd kunt scrollen en de veranderingen (bv het aantal keren dat het woord “ik” in een preek voorkomt) direct op het scherm terugziet.

WP’s

Na Joris z’n inspirerende keynote kwamen de 5 werkpakketten van CLARIAH aan de beurt. Ze gaven elk in een korte presentatie een overzicht van de status van de WP’s en de voor de komende maanden geplande activiteiten. WP1 gaf alvast een voorproefje van de nieuwe website met bijbehorend nieuwe logo (dat al op de huidige site te zien is).
De 5 presentaties zijn hier (op Slideshare) terug te vinden.

Thee en demo’s

Na de 5 WP-presentaties was er een gecombineerde theepauze/demosessie van een uur waarin 14 verschillende demo’s / projecten getoond werden. Het betrof hier resultaten van nieuwe CLARIAH-projecten, van oude “CLARIAH-zaaigeld” projecten, en van de allerlaatste CLARIN-NL projecten die pas net afgerond waren.
Al met al een mooi overzicht van hetgeen er in en rond CLARIAH gebeurt zoals de foto's duidelijk maken.

Wat jammer was, was dat het uur eigenlijk te kort was. Veel mensen vroegen of het nog wat langer kon duren maar de schermverhuurders stonden al klaar om de boel op te ruimen en Karlheinz Mörth (Charly) van CLARIAH-Austria, moest beginnen met zijn afsluitende keynote omdat hij uiterlijk om 16:45 richting Schiphol moest vertrekken.

Keynote II

Karlheinz MorthCharly gaf een mooi overzicht over de wijze waarop CLARIAH-Austria tot stand gekomen is en wie in Oostenrijk de belangrijke spelers zijn op het gebied van infrastructuur en DH.

Borrel

Na de dag-afsluiting door Jan Odijk, ging de biertap open en kon de succesvolle bijeenkomst worden afgesloten met enkele versnaperingen.
Na deze meer algemene dag gaan we in het najaar van 2016 een meer technische CLARIAH dag organiseren die wederom openstaat voor iedereen die geïnteresseerd is.

Andreas BlatteVan 15-17 oktober werd de CLARIN-conferentie gehouden in Wrocław, Polen. De goed bezochte conferentie (ca. 140 personen) was inhoudelijk erg goed en uitstekend georganiseerd.
De keynote speech werd gehouden door Andreas Blätte (Universiteit van Duisburg Essen). Hij gebruikte onderzoek naar parlementaire speeches over migranten als voorbeeld om het belang van de CLARIN-infrastructuur te onderstrepen.

Nederland was op de conferentie vertegenwoordigd door een grote groep deelnemers met veel presentaties, posters en demo’s (o.a. door Ton van der Wouden, Frank Landsbergen et al., Martin Reynaert, Ineke Schuurman, en Jan Odijk).

Dag Een

Op de eerste dag waren er veel bijeenkomsten van commissies, en van het National Coordinators Forum. Ik was heel blij te zien dat er veel gedaan was (vooral door de Oostenrijkers) aan metadata curatie en (vooral door de Duitsers) aan een verbeterde Virtual Language Observatory, maar het was ook duidelijk dat hier nog steeds veel werk verzet moet worden.

Dag Twee

VoorzitterOp de conferentie zelf waren er verschillende presentaties waarin vanuit een use case beschreven werd hoe CLARIN bijdraagt aan het aanpakken van onderzoeksvragen uit de geestes- en sociale wetenschappen. Metadatacuratie, de Virtual Language Observatory en semantische interoperabiliteit (CLARIN Concept Registry) waren de belangrijkste thema’s in verband met het design, de constructie en de exploitatie van de infrastructuur.

Nieuw op de CLARIN Conferentie was de CLARIN Bazaar, een informele gelegenheid om mensen van andere landen en centra te ontmoeten, meer te weten te komen over hun lopende werk, ideeën uit te wisselen en met mensen te praten over toekomstige samenwerking. Het was een groot succes! Zo intensief bezocht, druk en  warm dat er werkelijk van een soek gesproken kon worden. Jan Odijk presenteerde er een idee vers van de pers om PaQu te gebruiken bij onderzoek naar uitbreidingen van Alpino, en Dirk Roorda presenteerde er SHEBANQ.

Dag Drie

Op de jaarlijkse CLARIN Conferentie wordt sinds vorig jaar de CLARIN Young Scientist Award uitgereikt. En dit jaar heeft Maarten van Gompel (RUN) hem gewonnen! Zie hier voor meer informatie hierover.

Steven Krauwer hield er zijn afscheidsspeech als CLARIN ERIC Executive Director, en het was de eerste CLARIN conferentie voor de nieuwe directeur Franciska de Jong. Steven Krauwer vertelde over verjaardagspartijtjes die hij recentelijk kon bezoeken omdat hij CLARIN directeur af was, maar dat waren geen verjaardagspartijtjes van zijn familieleden (zoals zijn vrouw gehoopt had) maar van aan CLARIN gerelateerde organisaties, waar CLARIN volgens Steven in de toekomst goed mee moet samenwerken. Bente Maegaard gaf als afscheidsgeschenk kaartjes voor de opera in Kopenhagen, want Steven klaagde dat ie weliswaar heel vaak in Kopenhagen was geweest maar door het vele werk voor CLARIN daar nooit naar de opera had kunnen gaan.
Dat zal de nieuwe directeur, Franciska de Jong niet overkomen, want die had voor de zaterdagavond een bezoek aan de opera van Wrocław georganiseerd voor de Board of Directors en de Scientific Advisory Board (La Traviata)!

Uit de presentatie van het Scientific Advisory  Board lid Milena Žic Fuchs bleek dat Steven niet alleen de CLARIN boodschap wijd verspreid had in Europa, maar ook Nederlandse tulpen (we zagen zelfs bloeiende tulpen op het eiland Krk in Kroatië!).

Na de conferentie gaf Maciej Piasecki, de lokale organisator en nationale coördinator van CLARIN Polen nog een rondleiding door de stad, zodat we nog iets meer te zien kregen dan alleen maar de binnenkant van het conferentiehotel!

Al met al een zeer geslaagde conferentie. Voor meer informatie over de conferentie en het programma kan je hier  terecht.

Volgend jaar wordt de CLARIN Conferentie weer gehouden in oktober (dus zet het alvast in je agenda!) en zodra de locatie bekend is zullen we dat laten weten.

Jan Odijk

 

Amsterdam Arena

Op 8 oktober 2015 werd alweer het derde eScience symposium in de Amsterdamse Arena gehouden. Ondanks de soms wel erg nadrukkelijk aanwezige voetbalplaatjes aan de muren, een prettige en goede plek voor het symposium dat van start ging onder de naam “Accelerating Scientific Discovery

Anders dan vorige jaren waren er nu behalve een aantal plenaire sessies ook 5 aparte tracks die zich richtten op de verschillende wetenschappelijke disciplines:

  • Life Sciences & eHealth
  • Environment & Sustainability
  • Humanities & Social Sciences
  • Physics & Beyond
  • Computer & Data Sciences

Na twee, in mijn oren, ietwat obligate openingsverhalen (dat hoort er nu eenmaal bij) kwam de ijzersterke openingsspeech van “onze” José van Dijck: Big data, grand challenges: On digitization and humanities research

José sprak over CLARIAH (15 min) en gerelateerde CLARIAH-Digital Humanity projecten (15 min) en deed datop de  haar bekende enthousiasmerende wijze. De keynote is opgenomen en we krijgen de video die we dan op de site zullen plaatsen.

https://vimeo.com/143128653


Na de koffie begonnen de verschillende tracks. Onder leiding van Sally Wyatt (eHumanities) waren er tot de lunch 3 presentaties.

Keynote:
Evelyn Ruppert-Goldsmiths,
London (SS)

Talk:
A Social Framework for Big Data

Piek Vossen
VU University Amsterdam (Hum)

Talk:
Modelling uncertainties and perspectives in the news

Anja Volk
Utrecht University (Hum & SS)

Talk:
Pattern search in music: digital methods for researching, classifying and accessing music

deic

Lunch

Tijdens de lunch uitgebreid gesproken met 2 Deense dames (die expres naar de bijeenkomst gekomen waren om meer te horen over tools, data, (super)computing en CLARIAH). Ze wilden vooral weten hoe wij omgingen met het samenbrengen van Geesteswetenschappers en ICT-onderzoekers en vroegen of wij te zijner tijd daar iets over zouden willen komen vertellen. CLARIN-EU kenden ze, net als DARIAH maar de Nederlandse insteek om die twee samen te brengen sprak hen erg aan. Wordt (hopelijk) vervolgd.

Na de lunch (nog meer bezoekers) ging de Humanity and Social Science track verder met nog 4 boeiende presentaties.

Kees Aarts
University of Twente (SS)

Talk:
Scaling up social science

Els Stronks
Utrecht University (Hum)

Talk:
Digging into Time. Digital Research into the Textual Culture of the Dutch Republic

Sonja de Leeuw &
Jasmijn van Gorp
Utrecht University (Hum)

Talk:
A media-archaeological approach to digital humanities or using digital tools for humanities research (Case study: AVResearcherXL)

Oana Inel & Lora Aroyo
VU University Amsterdam (CS & Hum)

Talk:
Open, Connected & Smart Heritage: Towards New Cultural Commons

 Het waren stuk voor stuk inspirerende verhalen van (bijna allemaal vrouwelijke) onderzoekers die daadwerkelijk ICT-tools gebruiken om hun onderzoek te doen. Goed om te zien dat bijna iedereen ook actief is in de CLARIAH-community!

Wat verder opviel was dat de "Humanity sessie" steeds drukker werd. Dat kwam eerlijk gezegd niet doordat “onze” verhalen steeds beter werden (ze waren allemaal goed) maar wel omdat, zoals links en rechts te horen viel, het gebruik van tools en data door geesteswetenschappers tot ieders verbeelding sprak. Veel bezoekers van het symposium waren zich daar in eerste instantie waarschijnlijk niet van bewust maar kwamen, ongetwijfeld aangestoken door het verhaal van José en door de mond-op-mond reclame van andere bezoekers tijdens de lunch, toch een kijkje nemen en bleven vervolgens zitten. Vaak hoorde je: “ik moest even naar die andere sessie toe, maar ben direct weer teruggekomen: dit is echt boeiend” en dat werd dan gezegd door (voorzover dat na te gaan was) niet-geesteswetenschappers.

En daar hadden ze ook wel gelijk in. Veel van de overige verhalen concentreerden zich op storage, dataverkeer, access en andere technische zaken en waren meer gericht op een kleine, gespecialiseerde doelgroep. Echter, het verhaal vertellen is blijkbaar iets dat sociale- en geesteswetenschappers goed kunnen en ditmaal ook deden!
Zeker als CLARIAH dit jaar goed op stoom gaat komen, moet het lukken volgend jaar een nog grotere aanwezigheid te realiseren met misschien nog meer succesverhalen.

Afsluitende keynotes

Leonard SmithTony HeyDe afsluitende 2 keynotes van Leonard Smith (Oxford) en Tony Hey (ex-Microsoft, nu University of Washington) waren boeiend om naar te luisteren (en kijken). Smith (Science in the Dark) ging op aanstekelijke wijze in op het probleem van modelering: je doet 50x een experiment met een ronde bal en hebt alles statistisch op orde, en dan komt de werkelijkheid waarin je het moet doen met een experiment met een badeendje (die had ie ook bij zich). Tja en dan blijkt het model niet helemaal goed te werken. Maar gaf hij toe: je kunt dikwijls niet anders maar je moet je altijd realiseren dat het perfecte model en de rauwe wekelijkheid niet een-op-een op elkaar te mappen zijn.

Hey tenslotte verhaalde over zijn tijd bij Microsoft en het onderzoek dat daar gedaan werd met als kernbegrip: The Fourth Paradigm: Data-Intensive Scientific Discovery.

Fourth ParadigmeHey onderscheidt vier paradigma:

  1. Experimental Science
  2. Theoretical (Newton's Laws etc)
  3. Computational (simulation)
  4. Data-Intensive Sciece (Big data)

Bovendien adresseerde hij opnieuw het probleem hoe data-scientists en software-engineers een carrière te bieden in een (academische) omgeving die vooralsnog gericht is op onderzoek.

Na afloop een gezellige borrel met heerlijke hapjes en een mooie plek om te netwerken.

Al met al een zeer geslaagd symposium.