Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

Definire metadati con Dublin Core

L'iniziativa Dublin Core punta alla definizione di standard per la descrizione delle risorse sul Web attraverso i metadati
L'iniziativa Dublin Core punta alla definizione di standard per la descrizione delle risorse sul Web attraverso i metadati
Link copiato negli appunti

Nonostante il nome altisonante, i metadati sono tra le cose con cui bene o male tutti abbiamo a che fare nelle nostre attività, anche le più comuni. Se, ad esempio, descriviamo una persona indichiamo caratteristiche fisiche come l'altezza, il colore degli occhi e dei capelli, o caratteristiche psicologiche, come la simpatia, la cordialità, ecc. Queste informazioni rappresentano metadati sulla persona. In altre parole, i metadati sono dati per descrivere risorse, siano esse persone, libri, frutta, computer, pagine Web.

Concentrandoci sul Web, il lavoro quotidiano degli spider dei motori di ricerca consiste nel dedurre metadati sulle pagine Web che visitano. Il nostro uso dei comuni motori di ricerca consiste nel fornire metadati in modo da individuare delle risorse costituite da pagine Web.

Purtroppo i metadati gestiti dai motori di ricerca sono poco o per nulla strutturati e per questo motivo spesso troviamo tra i risultati tanti riferimenti che non hanno nulla a che vedere con la nostra ricerca.

Nelle prospettive del Web semantico c'è la possibilità di classificare le informazioni pubblicate sul Web in maniera strutturata in modo che la ricerca sia più efficace.

In questo ambito lo standard definito dalla Dublin Core Metadata Initiative può venire in aiuto.

La Dublin Core Metadata Initiative

La Dublin Core Metadata Initiative (DCMI) è un'organizzazione che ha lo scopo di definire e promuovere l'adozione di standard per la definizione di metadati per la descrizione di risorse.

In particolare, ha definito un vocabolario standard per indicare le principali proprietà delle più diffuse risorse online. Nato inizialmente per la descrizione di riferimenti bibliografici, questo vocabolario è stato generalizzato e si presta alla descrizione di un ampio insieme di risorse. E' inoltre possibile estenderlo seguendo opportuni accorgimenti.

Elementi di grammatica

Come abbiamo detto, lo standard Dublin Core definisce un insieme di elementi per la descrizione di proprietà relative a risorse. Questo insieme è suddiviso in due livelli: Simple e Qualified. Il livello Simple Dublin Core prevede i quindici elementi fondamentali:

Elemento Descrizione
title Indica il nome attribuito alla risorsa, come ad esempio il titolo di un articolo, di un libro, etc.
creator Indica chi ha creato la risorsa
subject Indica l'argomento trattato dalla risorsa o il contesto nella quale la risorsa si inserisce
description Una descrizione della risorsa, come ad esempio un abstract, un sommario, etc.
publisher Indica chi pubblica la risorsa o comunque la rende accessibile
contributor Indica chi ha contribuito in qualche modo alla realizzazione della risorsa
date Una data associata alla risorsa; può indicare la data di creazione, di pubblicazione, etc.
type Indica il tipo di risorsa, il tipo di contenuto
format Indica il formato fisico o digitale della risorsa
identifier Identificatore della risorsa può essere un URL, un numero ISBN, etc.
source Indica l'eventuale risorsa da cui la risorsa corrente è derivata
language Indica il contesto linguistico in cui si inserisce la risorsa
relation Eventuali risorse collegate
coverage Indica lo scopo della risorsa o l'eventuale periodo di validità o l'eventuale area geografica all'interno della quale la risorsa è valida, etc.
rights Indica i diritti sull'utilizzo della risorsa

Tramite questi elementi possiamo descrivere una risorsa come insieme di coppie elemento/valore. Ad esempio, per descrivere il presente articolo potremmo utilizzare la seguente sequenza di coppie elemento/valore:

title="Definire metadati con Dublin Core"
creator="Andrea Chiarelli"
subject="Metadati"
publisher="HTML.it"
type="testo"
format="html"
language="italiano"

Tutti gli elementi del linguaggio sono opzionali e possono essere eventualmente ripetuti liberamente. Ad esempio, nel caso di più autori è possibile ripetere l'elemento creator.

Il livello Qualified Dublin Core aggiunge altri elementi ed introduce un insieme di qualificatori che consentono di affinare la semantica degli elementi di base. In particolare vengono aggiunti i seguenti elementi:

Elemento Descrizione
audience Insieme di entità per cui la risorsa risulta utile
provenance Informazioni su eventuali modifiche dalla creazione della risorsa
rightsHolder Indica chi detiene i diritti di utilizzo della risorsa
instructionalMethod Indica il processo di apprendimento per il quale la risorsa è indicata
accrualMethod Indica il metodo con cui la risorsa è aggiunta ad un insieme
accrualPeriodicity Indica la periodicità di aggiunta di una risorsa ad un insieme
accrualPolicy Indica la politica che regola l'aggiunta della risorsa ad un insieme

I qualificatori consentono di descrivere con maggior dettaglio le informazioni fornite tramite gli elementi di base. Essi sono rappresentati dagli "Element Refinement", cioè elementi che specificano meglio determinate caratteristiche, e dagli "Encoding Scheme", cioè insiemi di riferimento per l'interpretazione standard dei valori degli elementi. Ad esempio, possiamo riscrivere con maggior precisione la descrizione di questo articolo nel seguente modo:

title="Definire metadati con Dublin Core"
creator="Andrea Chiarelli"
subject="Metadati"
publisher="HTML.it"
type="Text"
format="text/html"
extent="62kb"
language="it"

Rispetto alla descrizione precedente abbiamo indicato il tipo come Text, facendo riferimento all' Encoding Scheme standard DCMI Type Vocabulary, il formato come text/html, facendo riferimento allo standard MIME Type e la lingua come it, facendo riferimento allo standard ISO 639-1.

Abbiamo inoltre utilizzato l'elemento extent che consente di definire le dimensioni della risorsa.

L'indentazione dell'elemento extent indica che si tratta di una indicazione supplementare (refinement) dell'elemento format.

Esistono numerosi altri elementi che consentono di puntualizzare le caratteristiche di ciascun elemento del linguaggio, come ad esempio tableOfContents e abstract per l'elemento description.

Questione di sintassi

La sintassi utilizzata negli esempi che abbiamo visto è una sintassi puramente indicativa, anche se perfettamente plausibile. Il linguaggio definito dallo standard Dublin Core è indipendente da una particolare implementazione e possiamo scegliere la modalità di realizzazione che ci fa più comodo. Potremmo, ad esempio, far corrispondere gli elementi del linguaggio ai campi di una tabella in un database o alle proprietà di un oggetto in un linguaggio di programmazione.

Stabilita la nostra libertà di implementazione di Dublin Core, la DCMI fornisce alcune indicazioni per l'utilizzo di una sintassi comune per la descrizione di risorse online, come ad esempio una pagina Web. Questa può essere descritta tramite gli elementi Dublin Core espressi con i tag <meta> nel documento XHTML della risorsa stessa. Ad esempio, questo articolo può essere descritto con il seguente codice XHTML:

<head>
...

<link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" />
<link rel="schema.DCTERMS" href="http://purl.org/dc/terms/" />

<meta name="DC.title" lang="it" content="Definire metadati con Dublin Core" />
<meta name="DC.creator" content="Andrea Chiarelli" />
<meta name="DC.subject" content="Metadati" />
<meta name="DC.publisher" content="Html.it" />
<meta name="DC.type" scheme="DCTERMS.DCMIType" content="Text" />
<meta name="DC.format" scheme="DCTERMS.IMT" content="text/html" />
<meta name="DCTERMS.extent" content="62kb" />
<meta name="DC.language" scheme="DCTERMS. ISO639-2" content="it" />

...
</head>

In questo esempio, gli elementi <link> indicano gli schemi utilizzati per gli elementi del Simple Dublin Core (DC) e per il Qualified Dublin Core (DCTERMS), mentre ciascun elemento <meta> corrisponde alle coppie elemento/valore utilizzate nei primi esempi.

Esistono delle alternative alla soluzione appena illustrata che prevedono la separazione tra la risorsa (nel nostro caso l'articolo) e la sua descrizione. Secondo queste alternative la descrizione della risorsa viene espressa in XML o RDF/XML in un file esterno e nella risorsa sarà presente un riferimento a tale descrizione tramite il tag <link>. Lasciamo al lettore l'approfondimento di queste alternative facendo riferimento alla bibliografia.

Conclusioni

Il Dublin Core è uno standard flessibile ed ormai consolidato al quale poter fare riferimento nella definizione di una struttura per la descrizione di risorse. Il suo utilizzo non è limitato alle risorse online, anche se la sua adozione sul Web fornirebbe sicuramente dati più facilmente utilizzabili da parte dei motori di ricerca per poter consentire ricerche più accurate.

Bibliografia


Ti consigliamo anche