Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

Pentaho Kettle: estrazione e trasformazione dati semplice e "open"

Link copiato negli appunti

Pentaho Kettle è un progetto open source che distribuisce un potente tool ETL (Extract, Transform, Load), un applicativo che facilita la gestione dei processi di estrazione, trasformazione e caricamento in un sistema informatico.

La prima parte di un processo ETL è appunto l'estrazione di dati che grazie a potenti tool come Kettle possiamo fare anche da diverse sorgenti di dati: per questo motivo tra gli scopi principali di questa fase è presente la conversione dei dati in un unico formato, caratteristica necessaria per passare alla seconda fase, quella di trasformazione.

Durante la fase di trasformazione i dati vengono manipolati in modo da risultare compatibili per il sistema di destinazione. In alcuni casi le regole di trasformazione necessarie sono banali, ma in altre situazioni possono essere necessari ordinamenti, unioni, aggregazione di dati, e così via.

La terza e ultima fase del processo ETL carica i dati nella destinazione, nella maggior parte dei casi un data warehouse.

Questo tool è molto utile ad esempio quando dobbiamo gestire migrazioni da DBMS diversi, come quella da un database MySQL ad un database PostgreSQL. Pentaho Kettle fornisce un wizard che ci guida nel processo di migrazione, definendo il database server sorgente, quello di destinazione, il mapping dei tipi di dati, e molto altro ancora, in modo che la migrazione non porti a perdite di dati.

Sul sito ufficiale è disponibile il pacchetto open source oppure la versione di prova di 30 giorni di Pentaho Enterprise Edition. La documentazione invece è disponibile al seguente indirizzo.

Ti consigliamo anche