Dubbele content (duplicate content) is het verschijnsel waarbij identieke of sterk gelijkende tekst verschijnt op meerdere URL's, hetzij binnen dezelfde website, hetzij verspreid over verschillende websites. Het is een van de meest frequente technische SEO-problemen en een van de meest onderschatte.
Google heeft een beperkt budget per site om te crawlen en te indexeren. Wanneer het dezelfde content op meerdere URL's aantreft, moet het kiezen welke versie te indexeren en te ranken. Dit leidt vaak tot een foutieve keuze: de "verkeerde" URL wordt gerankt, of de ranking wordt verdeeld over meerdere URL's en verzwakt.
In de context van AI-zichtbaarheid voegt dubbele content een extra probleem toe: RAG-systemen die meerdere identieke pagina's ophalen, besteden kostbare crawlresources aan duplicaten in plaats van aan rijkere, unieke content. Dit ondermijnt de doeltreffendheid van uw zichtbaarheidsstrategie. Zie ook hoe AI-zichtbaarheid verschilt van klassieke SEO.
De meest voorkomende bronnen van dubbele content
Dubbele content ontstaat zelden met opzet. De meest frequente oorzaken zijn technisch van aard. HTTP versus HTTPS-varianten: als uw site toegankelijk is via zowel http://uw-site.be als https://uw-site.be en u geen 301-redirect heeft geconfigureerd, heeft Google twee versies van elke pagina.
WWW versus niet-WWW: vergelijkbaar probleem als www.uw-site.be en uw-site.be beide toegankelijk zijn. Trailingslash-varianten: /diensten en /diensten/ zijn technisch verschillende URL's maar bevatten vaak dezelfde content. Paginering: /blog, /blog?page=1 en /blog/page/1 kunnen identieke of sterk gelijkende content bevatten. Filtervarianten in e-commerce: /schoenen?kleur=rood&maat=42 versus /schoenen?maat=42&kleur=rood zijn technisch verschillende URL's met identieke content.
Elk van deze scenario's is een potentiele bron van dubbele content die uw crawl budget verspilt en uw rankings verzwakt.
Canonicalisatie: de primaire oplossing
De rel=canonical-tag is de standaardoplossing voor dubbele content. U plaatst deze tag in de head van elke pagina om Google aan te geven welke URL de "officiële" versie is. Google volgt in de overgrote meerderheid van de gevallen de canonicale URL en consolideert de rankings naar die versie.
Implementeer rel=canonical op alle pagina's, inclusief de canonicale URL zelf (self-referencing canonical). Dit voorkomt dat Google onduidelijkheid heeft over welke URL de referentie is. Zorg dat uw canonicale URL's consistent zijn: als /diensten de officiële versie is, moet /diensten?utm_source=newsletter de canonical /diensten bevatten.
Voor gefilterde e-commercepagina's kunt u niet-canonicale varianten ook noindexen of de facettering configureren via robots.txt om te voorkomen dat Google tientallen gefilterde varianten crawlt. Dit bespaart crawlbudget voor uw waardevolle categorie- en productpagina's.
Dubbele content over verschillende domeinen
Wanneer dezelfde content op meerdere domeinen verschijnt, is het probleem complexer. Dit treedt op bij: syndication van uw artikelen naar andere publicaties zonder correct gebruik van canonical-tags, kopieen van uw site op subdomeinen (fr.uw-site.be met een vertaling is geen dubbele content, maar een subdomain-spiegel is dat wel) en contentdiefstal (andere sites kopiëren uw content zonder toestemming).
Voor legitieme syndicatie geldt: geef de partner de instructie om rel=canonical naar uw oorspronkelijke URL te plaatsen. Google geeft in dat geval de rankingkracht aan uw versie. Voor contentdiefstal kunt u een DMCA-klacht indienen via Google's Search Console om de gestolen content uit de index te verwijderen.
Meertalige sites zijn geen dubbele content als de vertalingen authentiek zijn. Gebruik hreflang-tags om Google te vertellen welke taalversie relevant is voor welk publiek. Dit is cruciaal voor Belgische sites die in het Frans, Nederlands en soms Engels opereren. Meer via onze aanpak of gratis audit.
Dubbele content detecteren en monitoren
Om dubbele content op uw site te identificeren, crawlt u uw site met een tool zoals Screaming Frog of Sitebulb en analyseert u de lijst van URL's op content-overlap. Screaming Frog berekent automatisch een hash van de pagina-content en flagged identieke of quasi-identieke pagina's.
Google Search Console geeft u een ander perspectief: controleer het rapport "Dekkingsstatus" op pagina's met canonicale conflicten (Google kiest een andere canonical dan de door u opgegeven). Dit wijst op een canonicalisatieprobleem dat moet worden opgelost.
Gerelateerd: thin content, crawl budget, technische SEO. Wilt u een volledige technische audit? Vraag een gratis audit aan.