Rechtsonzekerheid bij Tekst & Data Mining

De wetenschap en technologie van Tekst & Data Mining (TDM) zijn, door gebruik van information retrieval (IR), optische karakterherkenning (OCR) en natuurlijke taalverwerking (NLP) al complex genoeg, maar de juridische complicaties spannen helaas de kroon. De juridische status van TDM is op zijn best onduidelijk; zowel omdat er in TDM een veelheid aan technieken wordt gebruikt, als omdat de implicaties van verschillende technieken variëren van rechtsgebied tot rechtsgebied. Dit maakt grensoverschrijdende samenwerking, een elementair onderdeel van de wetenschap, op zijn best erg lastig. Over het algemeen wordt TDM niet als conflicterend gezien met het (Amerikaanse) auteursrecht. Er zijn verschillende theorieën over het waarom hiervan, maar de meest voor de hand liggende is dat TDM gebruik maakt van auteursrechtelijk beschermd materiaal voor een transformatief doel hetgeen, opnieuw in de VS, onder het "fair use" principe valt.

Dit is de een korte samenvatting van het boeiende verhaal dat Puneet Kishor onder de titel Verlos de Hooiberg van de Naalden op 2 juni 2014 postte op CreativeCommons.org.