Krantencollecties kunnen een belangrijke historische bron zijn voor onderzoek naar planten en dieren. Ze geven met name informatie over mens-natuur interacties. Het doorzoeken van grote krantencollecties brengt echter ook problemen met zich mee. Een simpele zoekopdracht op soortnaam levert vaak een enorme hoeveelheid niet-relevante resultaten op. Het gaat hierbij vaak om persoonsnamen, bijvoorbeeld ‘meneer Wolf’, of spreekwoorden, zoals ‘een addertje onder het gras’. Het CLARIAH Serpens-project zoekt naar computationele oplossingen voor deze problemen. Als casus kijken we naar vermeldingen van “ongedierte” en “hinderijke” soorten in de krantencollectie (1800 – 1940) van de Koninklijke Bibliotheek. Het doel is deze collectie contextueel doorzoekbaar te maken, zodat niet-relevante resultaten weggefilterd kunnen worden. Het combineren van technieken uit de computationele taalkunde met historisch-ecologische vragen maakt dit project uniek. 

Met de workshop willen we de mogelijkheden in kaart brengen die ontstaan wanneer historische krantencollecties gebruikt worden voor onderzoek naar exoten. Ook hopen we zicht te krijgen op de knelpunten bij deze vorm van onderzoek.

Welke vragen kunnen er beantwoord worden met behulp van historische kranten? Hoe willen gebruikers krantencollecties doorzoeken? Welke informatie kan er uit de kranten gehaald worden? Om deze en meer vragen te beantwoorden, brengen we experts uit de beleids- en onderzoekswereld op het gebied van exoten, historisch ecologen, collectiebeheerders van de KB en wetenschappers uit de computationele taalkunde bijeen.

U bent van harte uitgenodigd om de workshop bij te wonen, opgeven kan door een email te sturen naar . Aan deelname zijn geen kosten verbonden. De workshop zal plaatsvinden op donderdag 25 januari in Nijmegen. 

Programma:

12.30-13.00 Welkom met koffie en thee
13.00-13.10 Openingswoord door Rob Lenders
13.10-13.30 ‘Computationele oplossingen voor het doorzoeken van grote collecties historische kranten’ door Marieke van Erp
13.30-13.50 ‘Op jacht naar de bunzing en de lynx: twee voorbeelden uit de KB-krantencollectie’ door Thomas van Goethem
13.50-14.00 Koffiepauze
14.00-14.45 Workshop: In tweetallen aan de slag met geannoteerde datasets van bijvoorbeeld de muskusrat, zonnebaars en Japanse duizendknoop  (deelnemers kunnen ook zelf soorten inbrengen om mee aan de slag te gaan)
14.45-15.30 Plenaire discussie
15.30 Borrel

hucicoonpdf  Dutch and English PDF version of this job.

 

Het Meertens Instituut is een onderzoeksinstituut van de Koninklijke Nederlandse Academie van Wetenschappen dat zich bezighoudt met het bestuderen en documenteren van de Nederlandse taal en cultuur. Door het Meertens Instituut worden sinds lange tijd gegevens verzameld en beschikbaar gesteld voor zowel wetenschappelijk onderzoek als het algemeen publiek. Het instituut vormt samen met het Huygens Instituut voor Nederlandse Geschiedenis (Huygens ING) en het Internationaal Instituut voor Sociale Geschiedenis (IISG) het KNAW Humanities Cluster.

Het Meertens Instituut is partner in een aantal Europese en Nederlandse projecten waaronder het CLARIAH project (www.clariah.nl) dat infrastructuur bouwt voor het geesteswetenschappelijk onderzoek met, voor het Meertens, een focus op taalkunde.

Voor het CLARIAH project zoeken we op korte termijn uitbreiding van het ontwikkelteam met een

Wetenschappelijk programmeur (m/v)

(0,8 fte – 1fte)

Binnen het CLARIAH project zijn verschillende taken gedefinieerd die moeten zorgen voor een betere infrastructuur voor het taalkundig onderzoek, zoals het ontwikkelen van een Virtuele Research Environment (VRE) voor het taalkundig onderzoek, de ontwikkeling van geavanceerde systemen voor zoeken in taal data en een aantal specifieke linguïstische kennissystemen.

Werkzaamheden

De wetenschappelijk programmeur gaat deel uitmaken van de afdeling Meertens Technische Ontwikkeling (TO) bestaande uit 10 ICT ontwikkelaars die het onderzoek ondersteunen van individuele onderzoekers op het Meertens Instituut en tevens betrokken zijn bij een aantal Nederlandse en Europese onderzoeksprojecten.

Profiel

Wij zoeken iemand met een relevante afgeronde HBO- of WO-opleiding (bij voorkeur Masteropleiding) ofwel aantoonbaar  HBO/WO werk- of denk niveau:

  • die affiniteit heeft met het taalkundig onderzoek en de daarvoor relevante tools en services;
  • die vaardig is in één of meer moderne programmeertalen (Python, Java, PHP) en ervaring heeft met databases, text zoekmachines (Lucene/Solr) en uitwisselingsformaten als XML of JSON;
  • die ervaring heeft of minstens bekend is met Kennissystemen, Linked Data en formaten als RDF;
  • die een communicatieve en toegankelijke houding heeft en goed in een team kan functioneren;
  • die flexibel is en zelfstandig kan werken;
  • die sterk gemotiveerd is om een bruikbaar en onderhoudbaar product af te leveren;
  • met een goede beheersing van het Nederlands en het Engels.

Aanstelling en salaris

Er wordt een aanstelling voor bepaalde tijd tot en met december 2018 aangeboden, bij voorkeur niet later te beginnen dan 1 oktober 2017. Een eventuele verlenging van de aanstelling na december 2018 behoort tot de mogelijkheden. Het salaris bedraagt, afhankelijk van opleiding en ervaring minimaal € 3.475,-- bruto per maand en maximaal € 4.757,-- bruto per maand (schaal 11 CAO-NU) bij een fulltime aanstelling, exclusief 8% vakantiegeld en 8,3% eindejaarsuitkering.

Reactie

Je kunt je sollicitatiebrief met curriculum vitae tot en met 15 augustus 2017 sturen naar Bedrijfsbureau Humanities Cluster KNAW, t.a.v. Pamela Langerak (P&O Adviseur) per e-mail naar ., met als subject “wetenschappelijk programmeur Meertens”.

Voor meer informatie over deze functie kun je contact opnemen met Daan Broeder, projectleider Meertens CLARIAH, , telnr. 020-4628625.

Digitalisering Surinaams slavenregister van start

 
Het digitaliseren is een samenwerking tussen de Radboud Universiteit Nijmegen en de Anton de Kom Universiteit NOS

In Nederland is het heel gemakkelijk: de archieven induiken om uit te zoeken wie je voorouders zijn. Maar dat geldt niet voor mensen van Surinaamse afkomst. Hun register ligt in Suriname en is niet digitaal toegankelijk. Voor Surinaamse Nederlanders is het de enige bron om inzicht te krijgen in het slavernijverleden van hun familie. Een groep vrijwilligers begint woensdag met het digitaliseren van het register.

Volledige NOS-artikel staat hier.

Dit is onderdeel van het Research Pilot Project CoDoSis.

logo KB

Sinds de lancering van het KB Lab in 2013 is de website dé plek voor alle digitale experimentele tools en datasets van de KB.

Het KB Lab is steeds aangevuld met nieuwe tools en datasets die zijn gemaakt in samenwerking met KB-researchers-in-residence en de KB-fellows, tot we het punt bereikten dat we een nieuwe website nodig hadden om (nieuwe) inhoud makkelijker te kunnen vinden, te gebruiken en te integreren in onderzoek.

Met veel plezier kunnen we nu de vernieuwde KB Lab-website presenteren. We nodigen u hiervoor van harte uit op dinsdag 11 april 2017 van 14.00 – 18.00 uur in de KB in Den Haag.

Meer informatie over het programma en de workshops, staat hier op de website van de KB.

Deadline aanvraag maandag 19 juni 2017 logo uuT
Datum workshop 7-8 november, 2017
Locatie Utrecht
Taal NL De workshop in principe in het Nederlands (want gebaseerd op Nederlandstalige bronnen). Als een deelnemer alleen Nederlands leest en niet spreekt, is dat geen enkel probleem: een goede leesvaardigheid in het Nederlands is echter een must!

Achtergrond

De afgelopen jaren is via de applicatie Delpher van de Koninklijke Bibliotheek (KB) in Den Haag een grote hoeveelheid gedigitaliseerde Nederlandstalige kranten beschikbaar gekomen. Een van de manieren om deze grote hoeveelheid data toepasbaar te maken voor onderzoek is textmining. Met deze digitale onderzoekstechniek isoleer je met behulp van algoritmes patronen, trends of specifieke categorieën tekst uit de data. Zo kunnen allerlei onderzoeksvragen worden beantwoord.

Om onderzoekers te helpen de gedigitaliseerde kranten van de KB zinvol te doorzoeken en om hen handreikingen te doen om de zoekresultaten te analyseren, werd binnen het onderzoeksproject Translantis de textmining-tool Texcavator ontwikkeld. Met deze tool kunnen gebruikers bijvoorbeeld grote hoeveelheden bronnenmateriaal met onder meer word clouds, timelines en concept mining contextualiseren, artikelen bijeen brengen voor close reading en verder analyseren met behulp van andere tools uit de digitale geesteswetenschappen. In deze workshop leer je hoe je textmining en Texcavator kunt gebruiken in je eigen onderzoek.

Opzet

Tijdens deze workshop wordt een korte introductie gegeven van digital humanities in het algemeen en textmining in het bijzonder. Daarna krijg je uitgebreid uitleg over Texcavator en andere instrumenten voor textmining. Vervolgens kun je met behulp van deze tool aan de slag met je eigen onderzoeksvraag.

De workshop staat open voor allerlei type onderzoeksvragen die betrekking hebben op (een deel van) de periode 1850-1990 en die de gedigitaliseerde kranten van de KB als bron gebruiken. De onderzoeksvraag moet zich richten op een specifieke casus, waarbij het gebruik van textmining bijdraagt aan de analyse. Geschikte onderzoeksvragen hebben bijvoorbeeld betrekking op:

  • de veranderende inhoud van een bepaald genre krantenartikel
  • de receptie van films
  • de handel in bepaalde goederen
  • het veranderen van een intellectueel concept door de tijd heen

 Geselecteerde deelnemers(groepjes) worden na afloop van de workshop uitgenodigd om hun onderzoek uit te werken tot een artikel.

Deelname

Onderzoekers kunnen individueel of in groepjes van maximaal drie personen deelnemen. Eerdere ervaring met digitale onderzoekstechnieken is niet nodig; er zal tijdens de gehele workshop begeleiding zijn vanuit het Translantis-team. We moedigen specifiek RMA-studenten aan om te deel te nemen. Aan deelname zijn geen kosten verbonden.

Deelnemers worden geselecteerd op basis van een ingestuurd abstract (max. 500 woorden), waarin wordt toegelicht hoe het gebruik van textmining kan helpen een antwoord te vinden op hun concrete onderzoeksvraag. Tevens wordt deelnemers gevraagd een korte biografie mee te sturen (ca. 100 woorden). De deadline is maandag 19 juni 2017.

Stuur inzendingen naar Peter van den Hooff ().