Pentaho Data integrator 4/5

Primera Transformación.

por @hellfish2 el 2015-03-03

Creando nuestra primera Transformación

Supongamos que tenemos una tabla en PostgreSQL, la cual queremos exportar una columna especifica hacia un archivo de texto, entonces partiendo de esa premisa hariamos algo como esto:

Seleccionamos en la carpeta input la opción, Table input y la arrastramos hacia la pantalla vacia para empezar a trabajar, ese icono al darle doble click o editar hay que configurarlo para que lea una Tabla especifica de nuestra BD en mi caso leera la tabla noticias, luego de haber cargado las opciones de conexion procedemos a testear la conexion haciendo un preview del mismo y el nos traera todo lo que contenga la tabla, es como si hicieramos un SELECT * FROM noticias.

Pentaho tutorial Conectando a BD.

Al haber hecho lo anterior procedemos a seleccionar el step anterior y boton derecho encima de el, seleccionamos la opción preview

Pentaho tutorial Preview de step input table.

Ahora al ver nuestro resultado sin problemas, procedemos a realizar unas modificaciones de la columna descripcion, para colocar el cotenido de este campo en mayuscula, para esto usamos un paso en la seccion transformacion > Operaciones de String, y luego unimos el paso anterior con este paso (recordemos la aplicacion PDI en su mayoria es DRAG AND DROP por lo cual es muy intuitivo su uso)

Pentaho tutorial Preview de step Operaciones de String.

Como podemos observar en la seccion preview de las metricas de el contenido observamos que nuestra columna ahora muestra informacion en mayuscula, ahora debemos escoger un output (salida) de esta columna, y como nuestro cometido inicial seria exportar nuestra columna a un archivo de texto usamos el paso ubicado en la carpeta output > text file (archivo de texto), lo configuramos y colocamos la ruta donde enviara nuestro archivo.

Pentaho tutorial Preview de step output textfile.

Luego veremos que la ruta que colocamos como el output estara con el archivo y la columna en mi caso descripcion con el texto en mayuscula.

En conclusion podemos observar como Pentaho Data Integrator, influye en el flujo de datos de nuestro esquema, podemos conectarnos a multiples origenes, hacer transformaciones y mejoras del flujo de datos e inyectarlos o insertarlos a multiples salidas, dependiendo de como lo requeramos.