Hive: guida al framework di datawarehousing
Hive è framework di datawarehousing sviluppato da Apache e basato su Hadoop, per l’elaborazione distribuita di grandi quantità di dati (Big Data). Hive fornisce strumenti pensati per il riepilogo, l’interrogazione e l’eventuale analisi dei dati, sfruttando la sintassi SQL-like di HiveQL. In questa guida partiremo dall’installazione fino a coprire i principali aspetti di interesse per chi lavora con questo framework.
-
15
-
-
1 Introduzione a Hive
-
2 Console per Hive
-
3 Tipi di dato
-
4 Formati di file
-
5 Database
-
6 Tabelle
-
7 Importazione ed esportazione di dati
-
8 Query
-
9 Operatori e funzioni di built-in
-
10 Raggruppamento e ordinamento
-
11 Partizioni e bucket
-
12 Join
-
13 View e subquery
-
14 Window function
-
15 Ottimizzare le prestazioni

-
15 Lezioni
Cloud Hosting è un servizio di Aruba Business, che permette ai suoi fruitori di gestire uno o più domini. In questa guida impareremo a conoscerne le principali caratteristiche, con esempi pratici di utilizzo, ed esplorando tutte le funzionalità offerte.
-
13 lezioni
R è un linguaggio di programmazione che trova larga applicazione negli ambiti scientifici e statistici, in particolar modo quando è necessario analizzare grandi moli di dati. In questa guida completa e ricca di esempi pratici, vedremo tutte le caratteristiche di questo linguaggio, partendo dalla sintassi fino ad arrivare ad esplorare tutte le sue caratteristiche più avanzate.
-
10 lezioni
Hadoop è un framework Open Source di Apache, concepito per offrire supporto ad applicazioni distribuite e semplificare le operazioni di storage e gestione di dataset di grandi dimensioni (Big Data).
-
9 lezioni
Guida a Storm Project, un sistema Open Source per la computazione in real-time che semplifica il lavoro con flussi di dati illimitati.
E’ possibile conciliare GDPR e contenimento delle pandemie? Il progetto “Innova per l’Italia” è alla ricerca di soluzioni innovative per il Data tracing
Con Blockchain ETL e BigQuery di Google è possibile ottenere analisi precise sfruttando ricerche approfondite di dati e transazioni su rete Blockchain.
Il mondo dell’IoT è strettamente interconnesso con quello dei Big Data. In passato abbiamo parlato spesso dei due argomenti in […]