Duplicate content ontstaat doordat verschillende url's van een website dezelfde content bevatten en dit is niet goed voor zoekmachines. Dit kan ontstaan doordat er bijvoorbeeld een extra variabele aan een url wordt toegevoegd. Bijvoorbeeld:
http://www.webwinkel.nl/index.php?product=12
http://www.webwinkel.nl/index.php?product=12&kleur=groen
Ook tracking codes van Analytics of dynamische keywords vanuit Adwords kunnen hiervoor zorgen.
Zoekmachines kunnen deze url's dubbel gaan indexeren en dat kan resulteren in lagere rankings en pagerank kan verdeeld worden onder deze pagina's.
Met het nieuwe canonical attribuut kan dit relatief eenvoudig voorkomen worden. Zowel Google, Yahoo als Microsoft hebben inmiddels aangegeven dit attribuut te ondersteunen.
Het canonical attribuut werkt met de volgende syntax binnen de <head> tags van de website:
<link rel="canonical" href="http://www.webwinkel.nl/index.php?product=12">
Zoekmachines zullen nu begrijpen dat de pagina verwijst naar http://www.webwinkel.nl/index.php?product=12.
Uiteraard blijft het in de eerste plaats belangrijjk om duplicate content zoveel mogelijk te voorkomen en bovenstaande alleen toe te passen als het niet anders kan.
De canonical link is volgens Google overigens een 'hint' en geen directive. Dat houdt in dat Google dus niet garandeert de link te zullen volgen en dit in geval van twijfel ook niet kan doen.