Waarde open data groeit door het gebruik ervan

Het Nationaal Archief behoort tot de instellingen die open data propageren: vrije beschikbaarheid van data (waaronder uiteraard ook fotografie) als voorwaarde voor vooruitgang en waardecreatie. Medewerker Tim de Haan van het Nationaal Archief schrijft onder meer: ‘Experimenten met betrekkelijk kleine datasets op bekende open podia als Flickr en Wikipedia toonden aan dat er een verbluffend effect is op het publieksbereik en de verspreiding van het materiaal.’
Open Data
Data krijgt waarde als het wordt gebruikt. De stroom aan gegevens die dagelijks wordt toegevoegd aan het digitale universum is gigantisch. Dat geldt ook voor archieven: binnen projecten als Beelden voor de Toekomst wordt een schat aan beelden gedigitaliseerd en dagelijks wordt het virtuele archief groter. Steeds sterker dringt het besef door dat de waarde van dit archief niet schuilt in de data zelf, maar in het (her)gebruik van de data.

Die data blijkt vaak op heel andere manieren, en door andere partijen, te kunnen worden ingezet, buiten de denkkaders en de missies van de overheidsinstellingen om. Bijvoorbeeld om apps te maken, die een bezoek aan een tentoonstelling interessanter maken. Steeds vaker klinkt dan ook de boodschap dat de meest waardevolle manieren om data te gebruiken, bedacht worden door andere mensen dan de data-beheerders van bijvoorbeeld archieven zelf. Kijk naar competities als Apps voor Nederland, waarbij overheidsdata beschikbaar worden gesteld aan geïnteresseerde ontwikkelaars. Dat is waar open data over gaat: de vrije beschikbaarheid van data als impuls (en zelfs voorwaarde) voor maatschappelijke en economische innovatie en waardecreatie.

Kansen
Op dit moment wordt onder aanvoering van de Europese Commissie gewerkt aan de herziening van de richtlijn voor hergebruik van overheidsinformatie. Wanneer deze richtlijn ook door de Nederlandse overheid gehanteerd wordt, zal open data een prominentere rol gaan innemen in het beleid van publieke instellingen. Open wordt dan de standaard en niet de uitzondering. Daar ligt een aantal ideeën aan ten grondslag: Data gefinancierd met publieke middelen, zoals archieven, dienen vrijelijk beschikbaar te komen. Open data vergroot de transparantie- en draagt bij aan de legitimiteit van de overheid. Tot slot is de verwachting dat het innovatie aanjaagt door de nieuwe (commerciële) toepassingen die ermee bedacht worden.

Zo’n model biedt kansen voor de samenleving als geheel. Tegelijkertijd lijkt daarmee de basis om opbrengsten gemeten in geld, voor de instellingen zelf af te nemen. Terwijl de binnen Beelden voor de Toekomst ontwikkelde ‘betaalde’ businessmodellen zich nog niet ten volle hebben ontwikkeld lijkt de focus deels te verschuiven van een terugverdienmodel naar een hergebruikmodel. Experimenten met betrekkelijk kleine datasets op bekende open podia als Flickr en Wikipedia toonden aan dat er een verbluffend effect is op het publieksbereik en de verspreiding van het materiaal. Zo’n 1700 foto’s van het Nationaal Archief die in de afgelopen vier jaar op Flickr zijn geplaatst genereren jaarlijks evenveel views als de gehele publiekswebsite www.gahetna.nl. Zulke views werden ook met de 1000 gedoneerde afbeeldingen aan Wikipedia gerealiseerd (Kennisland).

Het Nationaal Archief en Open Cultuur Data
Het bereiken van een groot en breed publiek is een belangrijk onderdeel van de missie van het Nationaal Archief. Door gebruik te maken van andere online platforms dan de eigen website wordt duidelijk dat daar een enorme potentie ligt in het bereiken van het grote en brede publiek. De spelregels voor dit hergebruik van data vereisen dan wel het letterlijk ‘open maken’ van die data. Bij het Nationaal Archief staat open data inmiddels dan ook hoog op de agenda.

De eerste definitieve stappen op het gebied van het openen van data werden door het Nationaal Archief gezet tijdens een Open Cultuur Data-hackathon eind november 2011. Open cultuurdata zijn digitale of gedigitaliseerde gegevens die door een culturele instelling (rechten)technisch vrijgegeven zijn en die vrij gebruikt en gedeeld mogen worden. Deze gegevens zijn de neerslag van vaak jarenlang opgebouwde informatie en kennis die een instelling beheert en creëert.

Op deze bijeenkomst werd ook met datasets van het Nationaal Archief gehackt. Programmeurs bouwden ter plekke een prototype van een app waarmee met een tablet intuïtief door 477 kaarten geswiped kan worden. Het enthousiasme en de creativiteit die op deze hackathon vrijkwamen sterkten, het Nationaal Archief in zijn voornemen om open data zichtbaarheid en prioriteit te geven.

Aan het massadigitaliseringsproject Beelden voor de Toekomst is de afgelopen jaren een aantal Open Cultuur Data-initiatieven ontsproten. Het Nationaal Archief heeft als partner vanaf het begin van het project mede onderzocht hoe gebruikers meer en beter bij gedigitaliseerde, historische bronnen betrokken kunnen worden. Dit heeft via de hierboven genoemde kleinschalige initiatieven met Flickr en Wikimedia uiteindelijk geleid tot het project Nationaal Archief Opent Cultuurdata. In de zomer van 2012 zijn ruim 140 duizend gedigitaliseerde negatieven (kleinbeeldstroken, 1959-1989) uit het archief van fotopersbureau ANEFO vrijgegeven (Ga het na). De foto’s van ANEFO zijn vrijgegeven onder de Creative Commons Naamsvermelding-GelijkDelen-licentie en zijn via een open search API beschikbaar. De totstandkoming van de uiteindelijke dataset was de uitkomst van een uitgebreid selectietraject.

Licentiekeuze
Belangrijk onderdeel en voorwaarde voor open data is de aanwezigheid van een open Creative Commons-licentie. Deze geeft aan dat er zo min mogelijk barrières zijn die hergebruik beperken. Wanneer de verschillende rechten die op het werk kunnen rusten dit bestrijden is er immers ook geen sprake van open data.

De auteursrechten op het gehele fotoarchief van ANEFO zijn aan het Nationaal Archief overgedragen, maar het is de vraag of de rechten op alle individuele foto’s altijd overdraagbaar waren. Daarnaast is het zeker bij beeldmateriaal de vraag in hoeverre persoonsrechten en persoonlijkheidsrechten nog zouden kunnen gelden. De licentie waarvoor is gekozen, de CC-BY-SA, betekent niet dat, omdat het een Creative Commons-licentie betreft alle rechten zomaar vervallen en alles met het materiaal kan worden gedaan. Bij de licentie wordt een duidelijke met inachtneming vermeld. Hierbij wordt uitdrukkelijk vermeld dat de open licentie die voor het werk wordt gekozen, niet betekent dat morele rechten, privacy rechten of intellectuele rechten niet meer gelden.

Het selectieproces bestond uit drie stappen:
1. Bepalen van de inhoudelijke criteria;
2. Bepalen van de auteursrechtelijke status, en
3. Onderzoek naar overige relevante rechten.

1. Bepalen van de inhoudelijke criteria
De inhoudelijk afbakening was in dit geval snel gemaakt. De betekenis van het fotoarchief ANEFO ligt mede in het geheel. Het archief geeft een compleet beeld van de naoorlogse Nederlandse actualiteit tot de Val van de Muur. Hieruit volgt dat het hele archief vrijgegeven zou moeten worden en dat de selectie alleen op basis van auteursrechten nog ingeperkt zou kunnen worden.

2. Bepalen van de auteursrechtelijke status
Van de initiële selectie ANEFO kleinbeeldstroken, zo’n 152.000, bleek de informatie over de rechtenstatus niet 100% compleet, en waren er kanttekeningen bij de informatie (metadata) die dit moet onderbouwen: afbeeldingen waarvan de maker onbekend is, of die een reproductie van een foto van een buitenlandse fotograaf kunnen zijn, zijn uit de set gefilterd. Ook afbeeldingen die als portret-in-opdracht gemaakt waren, zijn eruit gefilterd. Deze laatste groep komt te dicht in de buurt van de persoons- en persoonlijkheidsrechten. Als gevolg hiervan hebben een kleine 10.000 afbeeldingen de uiteindelijke open data set niet gehaald. Tegelijkertijd hebben we wel een duidelijke lijn getrokken rond persoonsrechten in het algemeen.

3. Onderzoek naar overige rechten
De set bevat een flinke hoeveelheid afbeeldingen van bekende Nederlanders, zoals sporters. Aangezien het een nieuwsarchief betreft, zijn deze foto’s gemaakt in het kader van de vrije nieuwsgaring. Hierdoor kan de geportretteerde persoon volgens ons een beperkt beroep doen op de schending van het persoonsrecht. Als archiefinstelling is het de plicht om zo zorgvuldig mogelijk om te gaan met het materiaal dat wordt beheerd. Je draagt zorg voor het materiaal en je zorgt ervoor dat het materiaal toegankelijk is voor gebruikers. Hierbij moeten verschillende rechten en belangen afgewogen worden. Door delen van de digitale collectie vrij te geven, worden gebruikers van passieve, actieve mede-eigenaar. Een zorgvuldige en verantwoorde omgang met werk, gemaakt door anderen wordt een gedeelde verantwoordelijkheid.

De licentie CC-BY-SA wordt gezien als de meest restrictieve binnen de open data. Omdat bij hergebruik van delen van de afbeelding, de nieuwe afbeelding ook onder diezelfde licentie dient te worden aangeboden. Dat maakt het voor bijvoorbeeld commercieel afgeleid werk wat minder interessant om te gebruiken: een belangrijk ‘unique selling point’ bij commercieel materiaal is immers exclusiviteit.

Beeldkwaliteit
Naast een keuze voor de licentie moest ook een keuze gemaakt worden voor de resolutie waaronder de gedigitaliseerde foto’s vrijgegeven zouden worden. Met name de resolutie heeft intern tot debat geleid. Staat ‘weggeven’ niet haaks op bestaande (terug)verdienmodellen? Geef je als instelling daarom een afbeelding ‘weg’ in de hoogste beeldkwaliteit, of is het aanleiding te kiezen voor een lagere kwaliteit?

Er is op dit moment gekozen voor de combinatie met een resolutie van maximaal 1280×1280 pixels / 72DPI. Dit is natuurlijk niet de hoogste resolutie die het Nationaal Archief in huis heeft. Omdat er op dit moment meer vragen dan antwoorden zijn rondom de uitkomsten en meerwaarde van open dataprojecten, is voor deze gemiddelde resolutie gekozen. Het belangrijkste doel is materiaal vrij te geven waar gebruikers online alle kanten mee op kunnen en dat een rol in educatieve projecten kan spelen. Gebruik van het vrijgegeven materiaal zal moeten aantonen of de kwaliteit voldoende is of dat er signalen van gebruikers(groepen) komen die beredeneerde behoefte hebben aan een hogere beeldkwaliteit.

Vragen
Voor erfgoedinstellingen is open data – en concreet het openen van omvangrijke datasets – een zoektocht. Ook de markt voor fotografie is enorm in beweging. De prijzen van foto’s en voor foto-opdrachten staan onder druk. Het ANEFO-fotoarchief is de grootste en meest contemporaine fotocollectie, met het meest algemene karakter, die tot nu toe in Nederland is vrijgegeven. Het is niet alleen de vraag of en hoe dit initiatief de positie van het Nationaal Archief verandert binnen de erfgoedsector, maar ook of en hoe de relatie met aangrenzende markten wordt beïnvloed. Wat gebeurt er bijvoorbeeld met de markt voor fotografie, die toch al stevig onder druk staat? Want hoewel de waardecreatie meer op maatschappelijk dan financieel vlak plaatsvindt, zou dat de impact op aangrenzende markten niet per se minder groot maken.

Op tal van vragen valt op dit moment nog geen pasklaar antwoord te geven. De verwachtingen en aannames die wij nu maken en die als nieuw beleid worden gevormd dienen kritisch gemonitord te worden. Zie het openstellen van bijvoorbeeld de ANEFO set als een nulmeting. Eén die we de komende jaren nauwgezet zullen volgen zodat we deze dan op de juiste maatschappelijke en financiële waarde kunnen schatten!


Tim de Haan is werkaam bij het Nationaal Archief – Webteam nl.linkedin.com/in/timdehaan
Dit artikel is in het kader van Beelden voor de Toekomst geschreven in samenwerking met Thijs van Exel, adviseur nieuwe media, Kennisland nl.linkedin.com/in/thijsvanexel
en Josefien Schuurman, freelance adviseur en projectleider digitaal erfgoed nl.linkedin.com/pub/josefien-schuurman/16/289/910