Hive è framework di datawarehousing sviluppato da Apache e basato su Hadoop, per l’elaborazione distribuita di grandi quantità di dati (Big Data). Hive fornisce strumenti pensati per il riepilogo, l’interrogazione e l’eventuale analisi dei dati, sfruttando la sintassi SQL-like di HiveQL. In questa guida partiremo dall’installazione fino a coprire i principali aspetti di interesse per chi lavora con questo framework.

Impariamo a sfruttare gli strumenti messi a disposizione da Hive per la creazione e gestione delle tabelle tra i database.