Impariamo ad utilizzare le view e le subquery per interagire con i database anche mediante il framework di datawarehouse Hive.

Impariamo come possiamo realizzare le operazioni di JOIN utilizzando al meglio le funzionalità offerte dal framework Hive.

Per analizzare grandi moli di dati, è facile penalizzare le prestazioni. Per risolvere questo problema, Hive permette l’uso di partizioni e bucket.

Impariamo come si effettuano le query utilizzando Hive, e come possiamo sfruttare un linguaggio di interrogazione molto simile ad SQL.

Impariamo ad utilizzare Hive ed il relativo linguaggio HiveQL per gestire i database: dalla creazione alla modifica, fino all’eliminazione.

Esistono numerosi formati di file specificamente pensati per l’ambito dei Big Data: ecco quali sono, e quali caratteristiche li rendono più adatti ad Hive.

Imparare ad interagire ed utilizzare Hive sfruttando le due console principali supportate: Hive CLI (oggi deprecata) e Beeline.

Introduzione ad Apache Hive, framework di datawarehousing per l’elaborazione distribuita di grandi quantità di dati, basato su Hadoop.