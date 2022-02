La sfida della gestione di dati e informazioni digitali con relativa trasformazione è in continua evoluzione e le grandi aziende sono sempre più alla ricerca di soluzioni innovative. Google ha annunciato la disponibilità di Dataplex, un data fabric intelligente finalizzato alla gestione e al monitoraggio centralizzato di dati provenienti da diverse sorgenti per renderli fruibili in modo sicuro con l’ausilio di vari strumenti scientifici e analitici.

A livello tecnico di analisi e gestione dati, un data frabric può essere considerato come una sorta di ambiente unificato nel quale vengono racchiuse l’esecuzione e l’applicazione di tecnologie e servizi specifici. La loro finalità primaria è assistere le aziende nella fase di ottimizzazione di dati e informazioni di diversa natura e provenienza.

Tra le caratteristiche principali di un data fabric vi sono l’interfacciamento e l’integrazione tra due o più applicazioni o sorgenti e la gestione di ambienti multipli (sia locali che nel cloud) non solo per quanto concerne l’origine dei dati, ma anche per i fruitori degli stessi.

Possono inoltre essere rese disponibili librerie specifiche (API) allo scopo di agevolare lo scambio e la condivisione delle informazioni con strutture interne o esterne. Per limitare la scrittura di nuovo codice sono previsti dei componenti predefiniti, pensati per rendere agevole il collegamento a diverse tipologie di sorgenti. Dataplex di Google è stato realizzato per l’unificazione di collezioni e aggregazioni di dati strutturati presenti ini sistemi informativi di vario genere sia interni che esterni alle aziende.

Sono previste funzionalità concepite per rendere omogenei e standard elementi quali politiche di sicurezza, metadati e dati distribuiti in genere. Tutti i metadati, strutturati e non, vengono raccolti, verificati, unificati e registrati in uno specifico metastore. L’accesso a questo insieme di informazioni può avvenire anche attraverso diversi servizi cloud di Google (ad esempio BigQuery) o open source, come Apache Spark.