Wat Is Scraping? Automatisch Data Verzamelen van het Internet

jun. 05, 2020

Scraping is een term die hoe langer hoe meer opduikt. We geven je niet alleen een begrijpbare definitie van scraping, we hebben het ook over de werking deze browser automatisatie en over zijn zogenaamde graaicultuur. Daarbij zal het grootste scraping bedrijf ooit je verrassen, want we hebben het hier namelijk over Google. Lees verder en ontdek meer hieronder.  


Scraping is haast zo oud als het internet. Het is een methode om automatisch data te verzamelen van het internet, door menselijk gedrag na te bootsen. Scraping is gewoon een vorm van automatisatie, meer precies browserautomatisatie.

Scraping, indexering, crawling of browser automatisatie...

Of men nu spreekt van scraping, indexering of crawling, het is allemaal hetzelfde. Deze techniek kent veel toepassingen. Neem als voorbeeld Dux-Soup. Dit is een Chrome plug-in waarmee je automatisch LinkedIn profielen kan bezoeken. Ook dat is scraping, alleen wordt er niet echt data verzamelt, maar het is wel browser automatisatie en als dat nu net niet is waar scraping op neerkomt.

Steeds meer bedrijven zijn vragende partij voor scraping software. Waarom?

Alles is voorhanden op het internet. Het zijn diegenen die het beste data kunnen extracten, die in de toekomst winnaars zullen zijn!
- Timothy Verhaeghe

Aan de slag met je data

Eens je de data hebt binnengehaald van het internet, sla je het op in een aparte database of in een handig formaat zoals Excel, Google Drive of in een API... Vervolgens kan je aan de slag met de verzamelde insights en gegevens. Als je LinkedIn profielen bijvoorbeeld scrapte, kan je ze nu (automatisch) beginnen te volgen of een persoonlijk (geautomatiseerd) berichtje sturen. Kortom, scraping is de toekomst.

Scraping: een graaicultuur

Scrapen is een overkoepelde term met een negatieve connotatie die niet helemaal correct is. Het klinkt alsof een boer één keer over zijn veld rijdt en alles oogst, maar zo werkt het duidelijk niet.

Browserautomatisatie werkt als volgt: de bot opent een browser, navigeert naar een site en voert daar acties uit, zoals knoppen aanklikken, scrollen en formulieren invullen. Tot slot zal deze webbrowserautomatisatietool de site sluiten. Net zoals jij dat als persoon zou kunnen doen.

Google, het grootste scrapingbedrijf

Google zal spreken over indexeren en website crawlers, nooit van scrapers.

“Zoekmachines zijn geen brute boeren, nee ze extracten data van je website om jou te doen groeien”

Dat is toch hoe ze zichzelf zouden omschrijven. Au fond zijn scrapers en crawler bots één pot nat.

Zoekmachines zijn een van de grootste technologie-ontwikkelaars binnen scraping. Giganten zoals zij investeren enorm veel geld in het ontwikkelen van “scrapingprogramma's” of beter gezegd browserautomatisatie of crawlerbots om websites te kunnen scrapen.

Google en andere zoekmachines noemen zichzelf crawlers. Met andere woorden indexeren ze websitepagina’s om ze te vertonen in hun zoekresultaten. Crawlen, indexeren of dataminen zijn mooiere woorden voor scrapen.


In snackformaat

  • Scraping is een methode om automatisch data te verzamelen van het internet, door menselijk gedrag na te bootsen. De bekendste toepassing ervan is browserautomatisatie.
  • De term scraping heeft een negatieve connotatie, maar dat is helemaal nergens voor nodig.
  • Crawlen, indexeren en dataminen zijn synoniemen voor scraping.
  • Google en zijn varianten zijn gigantische scrapers.

Laura Verbeke - Marketing Expert

Our youngest team member full of ambition is responsible for all our marketing activities. She’s also the sympathetic and thoughtful contact person for some of our fantastic brands!

Top! je hebt je succesvol ingeschreven.
Top! Nu nog de checkout afronden voor volledige toegang.
Welkom terug! Je bent succesvol ingelogd.
Yes! je account is volledig geactiveerd, je hebt nu toegang to alle inhoud.