Introduzione a RDFa

16 settembre 2010

Questa è la traduzione dell’articolo Introduction to RDFa di Mark Birbek, pubblicato originariamente su A List Apart il 23 Giugno 2010. La traduzione viene qui presentata con il consenso dell’editore (A List Apart Magazine) e dell’autore.

RDFa (“Resource Description Framework in attributes”) sta vivendo da un po’ il suo momento di celebrità. Google sta iniziando a processare RDFa e i Microformati nella sua opera di indicizzazione del web, usando i dati raccolti per migliorare la visualizzazione dei risultati di ricerca con i cosiddetti “rich snippets”. Yahoo!, nel frattempo, aveva iniziato a processare RDFa già da un anno. Con questi due giganti della ricerca che operano sulla stessa traiettoria, un nuovo tipo di web è più vicino che mai.

Il web è stato progettato per essere fruito da esseri umani, gran parte delle informazioni ricche e utili che contiene sono inaccessibili alle macchine. Le persone sono in grado di adeguarsi a tutte le varianti possibili in fatto di layout, ortografia, colore, posizione, etc. continuando ad estrarre il giusto significato dalla pagina. Le macchine, dal canto loro, hanno bisogno di un po’ di aiuto.

Un nuovo tipo di web, un web semantico, dovrebbe essere fatto di informazioni marcate in modo tale che un software possa facilmente comprenderle. Prima di considerare il modo in cui poter realizzare un web siffatto, vediamo cosa potremmo essere in grado di fare con esso.

Una ricerca migliorata

Aggiungendo dati adatti ad essere consumati da una macchina in una pagina web possiamo migliorare la nostra capacità di fare ricerche. Immaginate una news che dice più o meno “oggi il primo ministro è partito alla volta dell’Australia”, con riferimento al primo ministro della Gran Bretagna, Gordon Brown. L’articolo potrebbe non citare per nome il primo ministro, ma è molto facile supporre che questa notizia comparirà quando qualcuno fa un ricerca per la chiave “Gordon Brown”.

Se l’articolo in questione risale al 1940, tuttavia, non vorremmo che questo documento apparisse quando un utente cerca “Gordon Brown”, ma quando cerca “Winston Churchill”.

Per raggiungere questo obiettivo usando la stessa tecnica vista nell’esempio di Gordon Brown (ovvero mappando un set di parole su un altro), il nostro motore di ricerca dovrebbe conoscere le date di inizio e fine delle presidenze di tutti i primi ministri inglesi, per poi fare dei riferimenti incrociati tra queste e la data di pubblicazione dell’articolo di giornale. Ciò non sarebbe del tutto impossibile, ma cosa avverrebbe se l’articolo fosse un brano di narrativa o se facesse riferimento al primo ministro australiano? In questi casi una semplice lista di date non ci aiuterebbe.

Gli algoritmi di indicizzazione che provano a dedurre il contesto necessario dal testo miglioreranno di certo negli anni a venire, ma un markup aggiuntivo che renda l’informazione non ambigua può solo rendere la ricerca più accurata.

Interfacce utente migliorate

Yahoo! e Google hanno iniziato a usare RDFa per migliorare l’esperienza dell’utente ottimizzando la modalità di visualizzazione dei singoli risultati di una ricerca. Ecco l’approccio di Google:

Figura 1 – Rich snippet su Google

screenshot

Ed ecco quello di Yahoo!:

Figura 2 – Un risultato di ricerca migliorato visivamente su Yahoo!

screenshot

C’è un vantaggio commerciale nell’avere una maggiore “comprensione” da parte del motore di ricerca dei contenuti della pagina indicizzati: annunci pubblicitari più rilevanti possono essere inseriti a fianco dei risultati della ricerca.

Ora che sappiamo perché sarebbe auspicabile inserire dati adatti alle macchine nelle nostre pagine, possiamo chiederci in che modo farlo.

Se vuoi aggiornamenti su Introduzione a RDFa inserisci la tua e-mail nel box qui sotto:
 
X
Se vuoi aggiornamenti su Introduzione a RDFa

inserisci la tua e-mail nel box qui sotto:

Ho letto e acconsento l'informativa sulla privacy

Acconsento al trattamento di cui al punto 3 dell'informativa sulla privacy