Comenzando con Kettle aka Pentaho data integration

Pentaho es uno de los mas grandes lideres en el mercado de BI , en open source, es un proyecto desarrollado hace algunos años y actualmente se encuentra en la versión 4.
La dirección de su página oficial es: http://www.pentaho.com/
Dentro de las herramientas que lo hacen interesante al usuario, interesado en adentrarse al mundo del BI se encuentra Kettle o ahora conocido como Pentaho Data Integration. Pero que es kettle o PDI ?
Kettle es un sistema para realizar ETL (Extracción, transformación y carga)  por sus siglas en inglés, y que nos permite mover datos desde diferentes datos para depurarlos y cargarlos a otra base de datos. 
Si requieren mas información pueden acceder a este link de wikipedia:
Una vez revisado los antecedentes, vamos a proceder a lo que nos concierne. Vamos a ver los pasos para descargar e intalar pentaho en ambiente Linux 
1)Acceder a la dirección de pentaho data integration: http://kettle.pentaho.com/
2)seleccionamos la opción de Recent News and releases  y seleccionamos la  versión estable
3)Seleccionamos la version en punto tar.gz y la descargamos
 

4) Una vez descargado lo descomprimos desde la consola o dando doble clic. Desde la consola nos dirigimos a la ubicación del archivo y decomprimimos con  tar -zxvf pdi-ce-4.2.0-stable.tar.gz  .Esto va a generar una carpeta llamada data-integration
5)Ahora accedemos desde la consola a este directorio con el comando cd data-integration .
6)Ahora dentro de este ejecutamos el comando ./spoon.sh   lo que nos va a mostrar el programa en ejecución.

Espero que esta información les sea de ayuda y se puedan adentrar en el mundo de las ETL. En el próximo post, les enseñare un poco mas del manejo de esta herramienta.


Comentarios

Entradas populares