URL i søgesmaskinen
Som begreb er en URL en sammensat affære - en URL omhandler både sidenavnet og stien i browserens adressefelt, og også hvorvidt domænenavnet skrives med eller uden "www".
I søgemaskinen er URL'en den del der vises i linie nummer 2 (den grønne) i forslagene på resultatsiderne:
Sidenavn
Sidenavnet kan have betydning for både den besøgende og for søgemaskinernes indexering afhængigt af, hvor beskrivende det er for sidens indhold.
Se dette eksempel, hvor en side omhandlende mishandling af dyr i dansk svineproduktion er navngivet "på normal vis" ved hjælp af et enkelt ord:
dyremishandling.php
Hentes den samme side fra en database, vil det ofte resultere i en "dynamisk" eller "messy" URL bestående af parametre af tal og bogstaver for eksempel:
artikel.php?emneid=1382&sort=dato
I det sidste eksempel er siden navngivet ved hjælp af ord som er repræsentative for indholdet på siden (keywords). Dette giver et sidenavn, som er beskrivende og kan læses og kategoriseres hurtigt af både besøgende og søgemaskiner, hvilket kan medvirke til en bedre 'pagerank'.
dyremishandling-i-dansk-svineproduktion.php
Pretty URL
Udover sidenavnet kan også navnet på domænet og på undermapperne siderne ligger placeret i, have betydning for forståelsen af typen af indhold - kan mapperne ligesom sidenavnet navngives beskrivende, er det naturligvis en fordel:
Man kan gå et lille ekstra skridt og fjerne side-endelserne - for eksempel '.php'. Side-endelser virker distraherende, så kan de fjernes fra URL'en, bliver den endnu lettere at oveskue - læs en beskrivelse af, hvordan side-endelser kan fjernes i artiklen "Pretty URLs og links uden endelser".
Hele fremgangsmåden - altså beskrivende navngivning af af domænenavn, undermapper og sidenavne og fjernelse af side-endelser - har flere navne som "pretty URL", "clean URL" og "friendly URL".
http://www.landbrug.dk/konventionelt-landbrug/dyremishandling-i-dansk-svineproduktion
Retningslinier for URL:
- sammenfat hele sidens indhold i sidenavnet
- overvej at fjerne side-endelser
- navngiv stiens undermapper med ord som er beskrivende for indholdet
- brug flere ord i URL
- indsæt bindestreger mellem ordene - ikke 'underscore' og aldrig tomme mellemrum
- undgå gerne tal og danske vokaler
Canonical URL
Et andet aspekt i forhold til begrebet URL er spørgsmålet om, hvorvidt domænenavnet skal navngives med eller uden "www":
- domaene_navn.dk
- www.domaene_navn.dk
Valget har normalt ingen betydning for funktionaliteten - som oftest vil udbydere af webhoteller via DNS automatisk give mulighed for, at begge versioner kan bruges til at få adgang til hjemmesiden - så hvorvidt man foretrækker den ene version fren for den anden, er mest af skønsmæssig karakter.
Men for søgemaskinerne kan det være vigtigt, at man tilkendegiver hvilken version man foretrækker som den primære - hvilket også kaldes "canonical URL".
Duplicate content
Grunden til at det er nødvendigt at træffe et valg i forhold til brugen af domænenavn enten med eller uden "wwww." er, at søgemaskinerne i visse situationer opfatter de to versioner som 2 "forskellige" hjemmesider, hvilket kan have en negativ effekt i forhold til 'pagerank'.
Begrebet kaldes "duplicate content", og kan udover brugen af domænenavn med og uden "www.", også ses i en række andre sitiuationer:
Duplicate content:
- hjemmesiden findes i to versioner - med og uden www
- en side er kopieret som en print-venlig version - husk tag'et 'no-index'
- en artikel eller dele af den er kopieret, og kan findes flere steder på internettet
- webshoppen har flere links til samme vare eller varianter af den
Canonical link tag
Problemet kan dog løses relativt let - denne løsning laver en "redirect" til den "rigtige version" af hjemmesiden, når det indsættes i head af hver enkelt side i websitet. Er websitet en SPA (Single Page Application), kan man nøjes med at indsætte linket på siden der fungerer som "vært" for hjemmesidens øvrige sider:
<link rel="canonical" href="http://www.landbrug.dk/" />
Redirect 301
En mere stabil og langt mindre tidskrævende løsning er imidlertid at oprette et dokument ".htaccess" i root af serveren, og placere en kommando i dette.
Denne løsning kræver dog, at serveren er af mærket Apache - læs meget mere om indstillinger for Apache-serveren i artiklen "Redirect med 301";
Redirect til version "www."
Options +FollowSymLinks
RewriteEngine On
rewriteCond %{HTTP_HOST} ^domaene_navn.dk [NC]
rewriteRule ^(.*)$ http://www.domaene_navn.dk/$1 [R=301,L]