Web crawling

Home META META Nummer 2017/4 Web crawling

META Nummer 2017/4

Web crawling

Geschreven door Emanuel Lorrain

Gepubliceerd op 01.05.2017

In de context van digitale archivering verstaat men onder web crawling, web harvesting en web scrapping technieken waarbij een internetbot, een computerprogramma dat op een autonome manier taken kan uitvoeren, delen van het world wide web doorzoekt om kopieën te maken van de webpagina’s die men wil bewaren. Web crawlers zijn oorspronkelijk ontwikkeld om inhoud te indexeren (bv. door zoekmachines). Ze zijn nadien aangepast om websites te archiveren zonder medewerking van hun eigenaar of directe toegang tot de server. Vandaag is web crawling de meest gangbare techniek voor de automatisering van het verzamelen van grote hoeveelheden informatie op het web. Web crawlers zijn in staat om data sneller en met groter detail te verzamelen dan mensen die het web manueel doorzoeken. De resultaten van web crawls worden vaak snapshots genoemd; de websites worden immers op een bepaald moment en in een bepaalde toestand gearchiveerd.

meta-magazine-article-pdf-META 201704_Uitgepakt.pdf

Waarom lid van de VVBAD worden?

Deel zijn van het netwerk van experten en collega's
Mee de belangen van de informatiesector behartigen
Korting krijgen op de activiteiten van de VVBAD
Toegang krijgen tot vakinformatie
Participeren in de verenigingsbesturen

Word lid

Web crawling

Web crawling

Waarom lid van de VVBAD worden?

Blijf op de hoogte