Scrapen: Mag Je Eigenlijk Wel Data van het Internet Halen?

apr. 16, 2020

Nu je bekend bent met de term scraping, kunnen we een stapje verder gaan en onszelf een belangrijke vraag stellen. Mogen we zomaar automatisch data van het internet 'schrapen' en ligt data allemaal voor het rapen of zijn er wetgevingen waar we rekening mee moeten houden? Heb je toch nood aan wat opfrissing over de basics van scraping? Lees dan “Wat is scraping? Automatisch data verzamelen van het internet”.


Automatisatie: een trucje om sneller te werken

Scraping is een achterpoortje om sneller data binnen te kunnen halen. Met scrapen doe je niets anders dan manuele acties, of een persoon, vervangen door een geautomatiseerde (ro)bot.

We kunnen de vraag dus ook anders stellen. Mag je manueel informatie van een website halen en kopiëren? Of mag je 'met de hand' een lijst van leads aanleggen? Ja, in principe hadden we diezelfde informatie ook handmatig kunnen verkrijgen en dat is cruciaal bij scrapen: we vervangen manuele acties door een bot die automatisch manuele handelingen uitvoert. Het gros van de informatie die op het internet staat, is openbaar.

Toch moeten we hierbij een belangrijke kanttekening maken, de intentie bij scraping is heel belangrijk. Wat je achteraf van plan bent met die data die je binnenhaalde, is bepalend. Een recept kopiëren van een website om door te sturen naar een vriend is geen probleem, maar het op je eigen website plaatsen en er geld voor vragen is niet oké! Hierop is de copyright wet of het auteursrecht van toepassing en die geldt ook op databases.

Feitelijk moeten we rekening houden met twee verschillende wetgevingen: het auteursrecht en de GDPR-wetgeving. We halen een voorbeeld aan om dit te verduidelijken. We scrapen LinkedIn met als doel: leads genereren. Deze leads sturen we door naar ons eigen CRM-systeem. In dit geval kunnen we zeggen dat de wetgeving rond copyright al niet meer van toepassing is, want we verkopen deze data niet.


Let wel op! Deze mensen zomaar een bericht sturen mag in principe niet volgens de GDPR-wetgeving. Je mag door de General Data Protection Regulation niet zomaar gescrapte data gebruiken. Als het gaat over persoonlijke data of gegevens mag je die in principe ook niet zomaar bezitten.

Zelfs als het gaat over publiceerde gegevens zoals op een Facebook profiel bijvoorbeeld, wil dit niet zeggen dat je die gegevens losweg mag kopiëren. Ze kunnen namelijk geplaatst zijn onder bepaalde permissions, waarbij niet iedereen toegang heeft tot die gegevens. Kortom, er zijn wetgevingen van kracht die maken dat je gewoon voorzichtig moet zijn.

Case study: start-up wint scraping rechtszaak tegen LinkedIn

Scraping is en blijft een grijze zone.

In sommige gevallen kan je zelfs een rechtszaak winnen tegen een gigant, zoals LinkedIn. Tenminste dat is waar de Amerikaanse start-up hiQ in slaagde. De bedoeling van het sociale medium was om de start-up aan banden te leggen met een verbod op het verzamelen van openbare informatie van LinkedIn en het analyseren ervan.

Maar die bal sloegen ze lelijk mis. De rechter in San Francisco oordeelde namelijk dat LinkedIn gewoon een concurrent probeerde te boycotten. Ze legden LinkedIn dan ook op om alle beperkingen die het hiQ had gegeven op te heffen.

De start-up daarentegen mocht alle openbare informatie verder blijven scrapen en analyseren. “Op basis van verfraaiingen van profielen waarschuwt het bedrijf werkgevers dat ze op korte termijn weleens een leegloop zouden kunnen verwachten. Het bedrijf zegt werkgevers niet te tippen naar aanleiding van wijzigingen van individuele profielen, maar naar de grote lijn te kijken.” (bron: De Morgen (Staalduine, 2017))

Het juridisch systeem dreigt achterop te raken

Of je wel of niet mag scrapen is moeilijk te beoordelen door een rechter, meestal hebben ze geen technische achtergrond en begrijpen ze niet helemaal wat indexeren of crawlen van data inhoudt. Ze kunnen wel een oordeel vellen over inbreuken tegen de copyright wetgeving.

Er bestaat tot op de dag van vandaag geen expliciete wetgeving rond scraping. De GDPR beschermt wel de verwerking van persoonlijke data, maar legt in principe geen bepalingen op voor scraping. En dat, terwijl scraping of crawling praktisch gezien even oud is als de eerste zoekmachine. Justitie huppelt hier weer achterop, maar dat zijn we al gewend. Zelfs de GDPR-wetgeving werd door sommigen al verouderd genoemd nog voor ze in werking trad.

De werkelijke invloed van de GDPR

De GDPR-wetgeving beperkt heel veel scraping mogelijkheden om datasets binnen te halen. Oorspronkelijk is deze regelgeving in het leven geroepen om bedrijven zoals Google en Facebook te beperken. Het tegendeel gebeurde in de werkelijkheid. Het resultaat is dat giganten zoals Facebook hun “terms & conditions” enkele lijntjes hebben aangepast en daarmee is de kous af. Lokale bedrijven daarentegen denk maar aan MediaMarkt, Krëfel en VRT bijvoorbeeld zijn de echte dupe van deze wetgeving. GDPR heeft er eigenlijk voor gezorgd dat monsterbedrijven nog meer macht in handen hebben gekregen.  


Laura Verbeke - Marketing Expert

Our youngest team member full of ambition is responsible for all our marketing activities. She’s also the sympathetic and thoughtful contact person for some of our fantastic brands!

Top! je hebt je succesvol ingeschreven.
Top! Nu nog de checkout afronden voor volledige toegang.
Welkom terug! Je bent succesvol ingelogd.
Yes! je account is volledig geactiveerd, je hebt nu toegang to alle inhoud.