Per comprendere al meglio questa lezione è essenziale qualche nozione di base sul formato XML.
Se siete completamente a digiuno consiglio la lettura di una guida all'XML prima di proseguire.
Sul sito ufficiale è disponibile una dettagliata panoramica della struttura XML del formato Sitemap.
Vediamo comunque alcuni dettagli essenziali.
Esempio di una Sitemap XML
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
L'esempio sopra riportato rappresenta una sitemap contenente una sola URL.
Vediamo gli elementi che la compongono. I tag opzionali sono formattati in italico.
Elementi di una sitemap
Dichiarazione XML
La stringa iniziale dichiara che si tratta di un documento XML con codifica dei caratteri UTF-8.
<urlset>
L'<urlset>
è il nodo root della sitemap e rappresenta un tag obbligatorio. Al suo interno è incluso l'intero contenuto della sitemap.
<url>
Il tag <url>
raggruppa le informazioni appartenenti ad una singola URL del sito. L'URL può rappresentare l'indirizzo di una pagina web, di un feed, di un video o una risorsa multimediale. Per ciascun indirizzo che si vuole segnalare ai motori di ricerca è necessario inserire un tag URL all'interno della sitemap, contenente un tag <loc>
.
Di norma è consuetudine indicare le pagine web, i feed XML, eventualmente documenti e risorse multimediali.
<loc>
Il vero indirizzo della risorsa è indicato dal tag <loc>
, figlio del nodo <url>
.
Si tratta di un tag obbligatorio e punta all'indirizzo completo della risorsa. Deve includere il protocollo e la sua lunghezza non può superare i 2048 caratteri.
Il tag <url>
ammette, oltre a <loc>
, tre tag opzionali.
<lastmod>
Rappresenta la data di ultima modifica della pagina, se conosciuta. Il formato è YYYY-MM-DD.
<changefreq>
Rappresenta la frequenza di modifica della pagina. I valori sono:
- always
- hourly
- daily
- weekly
- monthly
- yearly
- never
<priority>
Rappresenta la priorità, ovvero l'importanza, di questa pagina rispetto al resto delle pagine all'interno del sito.
Il valore è contenuto in un range tra 0.0 (importanza nulla) e 1.0 (importanza massima).
Se non è specificato, di default, il valore assegnato è 0.5.
Esempio reale di una sitemap
Ora che conosciamo gli elementi essenziali di una sitemap, proviamo a costruirne una.
Il nostro sito è molto semplice, offre essenzialmente 3 pagine:
- http://www.example.org/ - la homepage
- http://www.example.org/about - una pagina informativa
- http://www.example.org/subscribe - una pagina di iscrizione ad una newsletter
Tralasciamo per ora l'utilità che una sitemap può avere su un sito di questo genere.
Considerando quanto appena indicato, la nostra sitemap si presenterà più o meno così:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.org/</loc>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.example.org/subscribe</loc>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.org/about</loc>
</url>
</urlset>
Il nostro è un sito di poche pretese, quindi la sitemap è molto semplice.
Tuttavia, è sufficiente per fornirvi una indicazione basilare sulla sua struttura. Poiché non mi piace reinventare l'acqua calda, vi invito ad approfondire la lettura delle specifiche del formato sitemap direttamente sul sito ufficiale.
Sitemap = Consiglio
È importante ricordare che lo scopo della Sitemap è quello di suggerire le URL del vostro sito al motore di ricerca.
Il crawler, comunque, agirà secondo propria iniziativa. Dunque, falsare un valore, ad esempio inserire un aggiornamento orario per una pagina statica, non produrrà alcun vantaggio.