Esistono numerosi formati di file specificamente pensati per l’ambito dei Big Data: ecco quali sono, e quali caratteristiche li rendono più adatti ad Hive.

Hive è framework di datawarehousing sviluppato da Apache e basato su Hadoop, per l’elaborazione distribuita di grandi quantità di dati (Big Data). Hive fornisce strumenti pensati per il riepilogo, l’interrogazione e l’eventuale analisi dei dati, sfruttando la sintassi SQL-like di HiveQL. In questa guida partiremo dall’installazione fino a coprire i principali aspetti di interesse per chi lavora con questo framework.

Una panoramica sui tipi di dato supportati da Hive: quali sono, le differenze tra ognuno di essi, ed in che modo possono essere utilizzati.

Imparare ad interagire ed utilizzare Hive sfruttando le due console principali supportate: Hive CLI (oggi deprecata) e Beeline.

Introduzione ad Apache Hive, framework di datawarehousing per l’elaborazione distribuita di grandi quantità di dati, basato su Hadoop.

Guida R
  • 13 lezioni
  • Facile

R è un linguaggio di programmazione che trova larga applicazione negli ambiti scientifici e statistici, in particolar modo quando è necessario analizzare grandi moli di dati. In questa guida completa e ricca di esempi pratici, vedremo tutte le caratteristiche di questo linguaggio, partendo dalla sintassi fino ad arrivare ad esplorare tutte le sue caratteristiche più avanzate.

Un esempio pratico per interagire, tramite uno script R, con un qualsiasi servizio REST basato sullo scambio di dati in JSON.

In questa lezione vedremo come sviluppare in PHP due chiamate REST per l’aggiornamento e l’eliminazione dei dai da un database MySQL.

Sviluppare API REST per l’interfacciamento con un database è molto comodo ed utile in vari contesti. Questa guida pratica descrive in breve come sviluppare una serie di servizi REST che permettano di interagire con un database MySQL mediante il protocollo HTTP, usando il linguaggio PHP per la business logic lato server.

Realizziamo le API REST per l’accesso ad un database MySQL con PHP, focalizzandoci su due aspetti: la creazione e la lettura dei dati.