Amsterdam Arena

Op 8 oktober 2015 werd alweer het derde eScience symposium in de Amsterdamse Arena gehouden. Ondanks de soms wel erg nadrukkelijk aanwezige voetbalplaatjes aan de muren, een prettige en goede plek voor het symposium dat van start ging onder de naam “Accelerating Scientific Discovery

Anders dan vorige jaren waren er nu behalve een aantal plenaire sessies ook 5 aparte tracks die zich richtten op de verschillende wetenschappelijke disciplines:

  • Life Sciences & eHealth
  • Environment & Sustainability
  • Humanities & Social Sciences
  • Physics & Beyond
  • Computer & Data Sciences

Na twee, in mijn oren, ietwat obligate openingsverhalen (dat hoort er nu eenmaal bij) kwam de ijzersterke openingsspeech van “onze” José van Dijck: Big data, grand challenges: On digitization and humanities research

José sprak over CLARIAH (15 min) en gerelateerde CLARIAH-Digital Humanity projecten (15 min) en deed datop de  haar bekende enthousiasmerende wijze. De keynote is opgenomen en we krijgen de video die we dan op de site zullen plaatsen.

https://vimeo.com/143128653


Na de koffie begonnen de verschillende tracks. Onder leiding van Sally Wyatt (eHumanities) waren er tot de lunch 3 presentaties.

Keynote:
Evelyn Ruppert-Goldsmiths,
London (SS)

Talk:
A Social Framework for Big Data

Piek Vossen
VU University Amsterdam (Hum)

Talk:
Modelling uncertainties and perspectives in the news

Anja Volk
Utrecht University (Hum & SS)

Talk:
Pattern search in music: digital methods for researching, classifying and accessing music

deic

Lunch

Tijdens de lunch uitgebreid gesproken met 2 Deense dames (die expres naar de bijeenkomst gekomen waren om meer te horen over tools, data, (super)computing en CLARIAH). Ze wilden vooral weten hoe wij omgingen met het samenbrengen van Geesteswetenschappers en ICT-onderzoekers en vroegen of wij te zijner tijd daar iets over zouden willen komen vertellen. CLARIN-EU kenden ze, net als DARIAH maar de Nederlandse insteek om die twee samen te brengen sprak hen erg aan. Wordt (hopelijk) vervolgd.

Na de lunch (nog meer bezoekers) ging de Humanity and Social Science track verder met nog 4 boeiende presentaties.

Kees Aarts
University of Twente (SS)

Talk:
Scaling up social science

Els Stronks
Utrecht University (Hum)

Talk:
Digging into Time. Digital Research into the Textual Culture of the Dutch Republic

Sonja de Leeuw &
Jasmijn van Gorp
Utrecht University (Hum)

Talk:
A media-archaeological approach to digital humanities or using digital tools for humanities research (Case study: AVResearcherXL)

Oana Inel & Lora Aroyo
VU University Amsterdam (CS & Hum)

Talk:
Open, Connected & Smart Heritage: Towards New Cultural Commons

 Het waren stuk voor stuk inspirerende verhalen van (bijna allemaal vrouwelijke) onderzoekers die daadwerkelijk ICT-tools gebruiken om hun onderzoek te doen. Goed om te zien dat bijna iedereen ook actief is in de CLARIAH-community!

Wat verder opviel was dat de "Humanity sessie" steeds drukker werd. Dat kwam eerlijk gezegd niet doordat “onze” verhalen steeds beter werden (ze waren allemaal goed) maar wel omdat, zoals links en rechts te horen viel, het gebruik van tools en data door geesteswetenschappers tot ieders verbeelding sprak. Veel bezoekers van het symposium waren zich daar in eerste instantie waarschijnlijk niet van bewust maar kwamen, ongetwijfeld aangestoken door het verhaal van José en door de mond-op-mond reclame van andere bezoekers tijdens de lunch, toch een kijkje nemen en bleven vervolgens zitten. Vaak hoorde je: “ik moest even naar die andere sessie toe, maar ben direct weer teruggekomen: dit is echt boeiend” en dat werd dan gezegd door (voorzover dat na te gaan was) niet-geesteswetenschappers.

En daar hadden ze ook wel gelijk in. Veel van de overige verhalen concentreerden zich op storage, dataverkeer, access en andere technische zaken en waren meer gericht op een kleine, gespecialiseerde doelgroep. Echter, het verhaal vertellen is blijkbaar iets dat sociale- en geesteswetenschappers goed kunnen en ditmaal ook deden!
Zeker als CLARIAH dit jaar goed op stoom gaat komen, moet het lukken volgend jaar een nog grotere aanwezigheid te realiseren met misschien nog meer succesverhalen.

Afsluitende keynotes

Leonard SmithTony HeyDe afsluitende 2 keynotes van Leonard Smith (Oxford) en Tony Hey (ex-Microsoft, nu University of Washington) waren boeiend om naar te luisteren (en kijken). Smith (Science in the Dark) ging op aanstekelijke wijze in op het probleem van modelering: je doet 50x een experiment met een ronde bal en hebt alles statistisch op orde, en dan komt de werkelijkheid waarin je het moet doen met een experiment met een badeendje (die had ie ook bij zich). Tja en dan blijkt het model niet helemaal goed te werken. Maar gaf hij toe: je kunt dikwijls niet anders maar je moet je altijd realiseren dat het perfecte model en de rauwe wekelijkheid niet een-op-een op elkaar te mappen zijn.

Hey tenslotte verhaalde over zijn tijd bij Microsoft en het onderzoek dat daar gedaan werd met als kernbegrip: The Fourth Paradigm: Data-Intensive Scientific Discovery.

Fourth ParadigmeHey onderscheidt vier paradigma:

  1. Experimental Science
  2. Theoretical (Newton's Laws etc)
  3. Computational (simulation)
  4. Data-Intensive Sciece (Big data)

Bovendien adresseerde hij opnieuw het probleem hoe data-scientists en software-engineers een carrière te bieden in een (academische) omgeving die vooralsnog gericht is op onderzoek.

Na afloop een gezellige borrel met heerlijke hapjes en een mooie plek om te netwerken.

Al met al een zeer geslaagd symposium.

 

 

Wat is DRONGO eigenlijk?

DRONGO is het grootste talenfestival van Nederland!

Met zo’n zestig exposanten en duizenden bezoekers is het DRONGO talenfestival binnen drie jaar het belangrijkste talenfestival van Nederland en Vlaanderen geworden. Op Drongo kun je het plezier en de schoonheid van taal ontdekken en zien wat jouw kansen zijn als je meerdere talen spreekt!

Na het succes van 2013 en 2014 was het dit jaar uitgebreid tot een festival van maar liefst 2 dagen. Op het festival was een keur aan demonstratieprojecten, taalapps en taal-leermiddelen aanwezig: dikwijls in combinatie met de onderzoekers die deze producten gemaakt cq ontwikkeld hadden.

CLARIN op Drongo

Ook CLARIN-NL was ditmaal goed vertegenwoordigd. Zo hadden Hugo Quené en Arjan van Hessen een lab-stand op vrijdagmiddag waar het D-LUCEA-project en de resultaten ervan gepresenteerd werden.

D-LUCEA

Het University College Utrecht verzorgt een uitsluitend Engelstalige opleiding. De studenten, die uit verschillende delen van de wereld naar Utrecht komen, hebben een zeer gevarieerde achtergrond. Niet alleen hebben ze vele verschillende talen als “moedertaal”, maar velen zijn ook opgegroeid in een meertalig gezin of in een meertalige omgeving. Sommige studenten zijn thuis opgegroeid met de ene taal (of met meerdere talen), en met weer andere talen op school en/of in hun buurt.

Eenmaal gearriveerd in Utrecht ontstaat er dus een heel interessante situatie waarin studenten van verschillende achtergronden allemaal Engels moeten gebruiken als hun eerste of tweede of zoveelste taal. Een fantastische kans om te onderzoeken hoe het Engels van de ene student door het Engels van andere studenten beïnvloed wordt, en hoe het Engels van de studenten zich door de tijd ontwikkelt.

Hoe spreekt een student vlak na aankomst in Utrecht, hoe halverwege de opleiding en hoe bij het afstuderen na drie jaar? Om hier iets over te kunnen zeggen zijn spraakdata nodig. In het D-LUCEA-project worden daarom regelmatig spraakopnames gemaakt van deze studenten. Op de lab-stand lieten Hugo en Arjan bezoekers een 5 minuten durend experiment uitvoeren waarin bezoekers moesten bepalen welk van 2 vergelijkbare spraakopnames uit het begin van het eerste studiejaar was (als de student net was aangekomen) en welke uit het einde van het eerste jaar wanneer ze al 9 maanden waren ondergedompeld in de Engelstalige opleiding.

Engels als Lingua Franca

Je verwacht dat dit een simpele taak zou zijn: pas aangekomen studenten spreken natuurlijk een soort steenkool-Engels met een zwaar accent, dat na 9 maanden vervangen was door een soort Oxbridge accent. Maar het bleek nog lastig om twee identieke zinnen van dezelfde spreker goed te ordenen. Hoewel er meestal duidelijke verschillen te horen waren, was het zelfs voor native-English luisteraars lastig om de test goed te doen. Ten eerste omdat het niveau van het Engels van de eerstejaars al hoog was (anders word je niet aangenomen), en ten tweede omdat de studenten elkaar beïnvloeden, waardoor het Engels na 9 maanden wellicht vloeiender maar niet altijd Engelser is geworden: studenten hebben als het ware hun eigen UCU-English accent ontwikkeld.

De presentatie (met de 2x 6 geluidsopnamen) zijn te vinden op de website van het D-LUCEA-project.

PaQu

Op zaterdag liet Jan Odijk zien hoe CLARIN het mogelijk gemaakt heeft makkelijk en snel naar grammaticale eigenschappen, grammaticale verbanden en zelfs hele constructies te zoeken. Hij illustreerde dat aan de hand van een achttal constructies in het Nederlands die een ‘goede’ (normatieve) variant en een ‘foute’ (niet-normatieve) variant hebben. Bijvoorbeeld: je moet (volgens de norm) groter dan zeggen en je mag niet groter als zeggen. Maar wat doen mensen echt? Daarop gaf Jans presentatie een antwoord; zowel voor de geschreven taal (door te zoeken in LASSY-klein) als voor de gesproken taal (door te zoeken in het Corpus Gesproken Nederlands). Je kan ook zelf de resultaten zien in de presentaties door te klikken op de frequentiegetallen ga je vanzelf naar de zoekinterface en krijg je de gevonden voorbeelden zelf te zien! De bijbehorende poster geeft nog wat meer context en wat achtergrondinformatie. De achterliggende applicatie is PaQU, ontwikkeld door de Rijksuniversiteit Groningen, gedeeltelijk in het kader van CLARIN-NL. 

Opkomst

Zowel op vrijdag als op zaterdag was een grote opkomst, en de CLARIN-NL stand had veel aanloop van allerlei mensen die een interesse in taal hadden. En dat ondanks de zware concurrentie die we hadden van de Kamasutra beurs in de hal ernaast!

Jan Odijk, Hugo Quené, Arjan van Hessen

 

 

Op 30 juni j.l. werd de kick-off van work package 3 (WP3, taalkunde) van CLARIAH-CORE gehouden op het Meertens-instituut. Er waren zo’n 30 personen aanwezig die betrokken zijn bij de uitvoering van WP3.

De organisaties die meedoen aan WP3 zijn Meertens, INL, Vrije Universiteit, Radboud Universiteit, Universiteit Utrecht en Universiteit Groningen.

De bijeenkomst werd geopend door Sjef Barbiers, de leider van WP3. Gertjan Filarski gaf een presentatie over WP2, het technische werkpakket binnen CLARIAH-CORE, en de relatie ervan met WP3. Het algemene plan voor WP3 beschrijft wat er nodig is aan infrastructurele voorzieningen voor een taalkundig onderzoeker, in ieder stadium van het onderzoek. Het schetst wat er al is (bijv. gemaakt door eerdere projecten zoals CLARIN-NL en CLARIAH-SEED), en wat er nog bijgemaakt of verbeterd moet worden.

Voor iedere betrokken organisatie was er een presentatie over wat er gedaan gaat worden in CLARIAH-CORE. Grofweg kunnen de taken ook ingedeeld worden per thema.
De voornaamste thema’s zijn:

  • data en metadata
  • interoperabiliteit
  • zoeken en analyse
  • verrijking van data.

Na de presentaties werd er een algemene discussie gehouden en werden verschillende concrete afspraken gemaakt. Mijn indruk was dat het een zeer nuttige bijeenkomst was, die iedere betrokkenen een globaal overzicht van heel WP3 gaf, en die ook een aantal potentiële problemen of divergerende richtingen blootlegde, zodat die in een vroeg stadium expliciet gemaakt worden en besproken kunnen worden. De bijeenkomst werd afgesloten met een borrel.

 

Jan Odijk

Dag I

Dit jaar werd de tweede Digital Humanities Benelux gehouden op 8 en 9 juni in Antwerpen (de eerste was vorig jaar in Den Haag). Ik beschrijf (ontzettend subjectief natuurlijk) hier enkele hoogtepunten hiervan.

William NoelDe keynote spreker William Noel had een inspirerende en overtuigende voordracht waarin hij liet zien hoe het delen van data kan leiden tot onverwacht nieuwe gebruik en nieuwe verrijkingen van de data. Make your data promiscuous  was zijn slogan.

De andere keynote spreker, Elena Pierazzo, kon mij minder bekoren. In het reguliere programma waren bijdragen uit vele hoeken van de geesteswetenschappen, zo breed dat ik mij enigszins ontheemd voelde op deze conferentie (zoals trouwens ook op  andere Digital Humanities conferenties). Het volledige programma is hier te vinden.

Zeker vermeldenswaard is de presentatie over het initiatief van Stef Scagliola et al. om een overzicht te maken van Digital Humanities projecten in Nederland (hopelijk later uitgebreid naar heel Europa), een project dat nu ook door CLARIAH financieel ondersteund wordt. Ik vond de  sessie over Linked Open Data ook bijzonder interessant, en wijs met name op het door CLARIN geïnitieerde Traveling CLARIN Campus project Talk of Europe (Hollink et al.).

De postersessie werd gehouden op het terras van de Antwerp Zoo, samen met een borrel, wat een zeer aangename ervaring was. Helaas was ik vergeten me in te schrijven voor het diner, waarvan ik weet dat het erg goed is (wat mij de volgende dag ook bevestigd werd) en de erbij behorende avondwandeling door de Antwerp Zoo. Hierover kan ik dan ook niets berichten. 

Dag II

De volgende dag waren er opnieuw presentaties en posters over allerlei onderwerpen, o.a. over resultaten van CLARIN-NL en CLARIN Vlaanderen (MIMORE en GrETEL, Augustinus et al.). Heel bijzonder vond ik de presentatie van Ben Verhoeven et al. over de Riddlerbot: A Next Step on the Ladder Towards Computational Creativity waarin hij een twitter bot (@TheRiddlerBot) beschreef die zelfs raadsels opstelt en formuleert.

De afsluitende panelsessie moest ik helaas voortijdig verlaten: er werden in de inleidende praatjes wat dingen gezegd die hopelijk zouden provoceren (bijv.  Antal van den Bosch: iedere geesteswetenschapper moet leren programmeren), maar ik weet niet of en hoe die in de verdere discussie aan bod zijn gekomen. 

De volgende DH Benelux wordt gehouden in 2017, in Luxemburg.

 

Jan Odijk

sparqlRDFOp 13 april kwamen in de Koninklijke Bibliotheek circa 40 onderzoekers en bibliotheekmedewerkers samen om te leren werken met het SPARQL interface dat in het najaar van 2014 voor de Short Title Catalogue Netherlands (STCN) ontwikkeld is.

Met dat interface en de onderliggende RDF graph die tegelijk met dat interface gemaakt werd, kunnen veel complexere zoekacties worden uitgevoerd in de 204.000 titels die de STCN omvat. Van die titels zijn tal van aanvullende gegevens in de STCN opgenomen: plaats van uitgave, auteur, taal, aanwezigheid van illustratie etc. etc. Er kan met het nieuwe interface gezocht worden op pieken in de productie, op regionale spreiding van bepaalde literaire genres, op omvang van de uitgegeven boeken, etc. etc.

Na een korte introductie over de omzetting van de STCN naar RDF, begon de SPARQL uitleg. Aan de hand  van een voor deze workshop gemaakte handleiding, werden stap voor stap de belangrijkste commando’s doorgenomen. Na een uur of twee had iedereen de beginselen onder de knie. Ter plekke probeerden sommigen ook al uit wat de nieuwe zoektool voor hun eigen onderzoek op zal leveren.

De workshop werd afgesloten met een korte presentatie door INVENiT: een VU-project dat gegevens uit de STCN beoogt te koppelen aan prentenmateriaal zoals dat aanwezig is in de catalogus van het Rijksprentenkabinet (Rijksmuseum). In de aanloop naar de workshop heeft het INVENiT team de RDF graph van de KB overgenomen, om verder samenwerken in de toekomst mogelijk te maken. 

Peter Boot (Huygens Instituut voor Nederlandse Geschiedenis), Marieke van Delft, Juliette Lonij (KB) en Els Stronks (UU) bedanken CLARIN voor de financiële steun voor deze workshop.

De handleiding van de workshop vindt u hier
en een andere blog over de bijeenkomst op de website van Literatuur & Samenleving (VU).