Referer spam (of referrer spam): wat is dat? Hoe stop je het?

Spread the love

Referer spam (spreek uit riefúrrer spem) is iets waar vrijwel iedereen met een website last van heeft. Wat is referer spam precies? En hoe ga je het tegen?

Referer spam

Je kent het vast, een bezoeker op jouw website afkomstig van een bepaalde site, maar na onderzoek vind je op die externe site geen link. Referer – referrer of referral – spam dus. Dit zorgt helaas voor een vertekend beeld van je statistieken en moet worden gefilterd uit je statistieken en Google Analytics data. Maar kan dat ook altijd?

Je kunt vrij eenvoudig zélf referral spam “maken”, simpelweg door het vervalsen van de Referer: header. En daar schuilt ook deels het probleem.

Ter illustratie – om in één keer technisch te worden:

$ GET -sSeduU -H 'Referer: https://www.myspeedy-website.example.com' https://www.itfaq.nl/
GET https://www.itfaq.nl/
Referer: https://www.myspeedy-website.example.com
User-Agent: lwp-request/6.15 libwww-perl/6.15

200 OK
Cache-Control: public, max-age=86400
Date: Wed, 24 Feb 2017 15:14:59 GMT
Server:
Vary: Accept-Encoding, User-Agent, Accept-Encoding
Content-Length: 90850
Content-Type: text/html; charset=utf-8
Client-Date: Wed, 24 Feb 2017 15:14:59
Client-Peer: 77.94.250.144:443
Client-Response-Num: 1
Strict-Transport-Security: max-age=31536000; includeSubdomains; preload
Title: ITFAQ.nl - Internet en computers uitgelegd in eenvoudig Nederlands!
[..]

Hier heb ik een command-line browser lwp-request gebruikt om www.itfaq.nl aan te roepen, en daarbij gedaan alsof de referer https://www.myspeedy-website.example.com is. Zoals je kunt nagaan bestaat https://www.myspeedy-website.example.com niet eens!

In de server HTTP logbestanden ziet dat er zo uit:

2017-02-24 15:14:59 77.94.250.144 GET / - 443 - 94.214.254.140 lwp-request/6.15+libwww-perl/6.15 https://www.myspeedy-website.example.com www.itfaq.nl 200 0 0 92192 183 62

Referer spam tegengaan?

Wat kun je hiertegen doen? Voor zover ik weet en kan bedenken, niets. Helaas.

Ja, je kunt bepaalde User-Agents blokkeren, of IP-adressen blokkeren ([2], [3]), maar het probleem hiermee is dat de lijsten om te blokkeren oneindig lang zijn.

Ik dacht dat je dit wel interessant zou vinden:   WordPress optimaliseren

“Gewoon” accepteren dat het fenomeen bestaat, en er rekening mee houden is mijns inziens het beste advies. Let wel: Dit is anders dan Google Analytics ghost spam (referral)! MOZ.com heeft een uitgebreid artikel over het instellen van Google Analytics filters.

Jan Reilink

My name is Jan. I am not a hacker, coder, developer, programmer or guru. I am merely a system administrator, doing my daily thing at Vevida in the Netherlands. With over 15 years of experience, my specialties include Windows Server, IIS, Linux (CentOS, Debian), security, PHP, websites & optimization.

Leave a Reply

Laat als eerste een reactie achter.

Hoi! Praat mee en laat een reactie achter!

wpDiscuz