Pentaho Data integrator 1/5

Inteligencia de negocios con PDI.

por @hellfish2 el 2015-02-27

Desde hace buen tiempo, la información ha pasado a ser uno de los principales activos empresariales, sin embargo; recopilar, integrar, transformar, analizar y presentar los datos que genera dicha información para muchas empresas es un proceso que causa muchos problemas, conllevando a toma de decisiones lentas y a veces con poco acierto.

Esta realidad ha impulsado el Business Intelligence (BI) o Inteligencia de Negocios, concepto que está cobrando protagonismo en todo tipo de organizaciones. BI trata de englobar todos los sistemas de información de una organización para obtener información, conocimiento y más aún, la inteligencia que le permita obtener una ventaja competitiva.

Existen diversas aplicaciones, suites y herramientas para aplicar BI. Desde las herramientas propietarias de Microsoft, Oracle, hasta herramientas de sotware libre como Openi, BizGres, JasperSoft, SpagoBI y Pentaho.

Pentaho

Es una suite que incluye herramientas que abarcan todas las capacidades que se requieren en BI, que incluye consultas, reportes, análisis, dashboards, integración de datos (ETL - extraction, load and transformation) y minería de datos.

Cada una de estas capacidades son proyectos BI, de las cuales Pentaho es el propietario y patrocinador, estos proyetos son:

  • Mondrian. Servidor OLAP.
  • Petaho Report Engine. Reporteador.
  • Kettle. Integración de Datos (ETL).
  • Pentaho. Suite BI.
  • Weka. Data Mining.

En los posts que escribiré a partir de ahora seguiremos de una manera ordenada cómo trabajar con Pentaho, si bien existe diversidad de información al respecto, ésta se halla de un modo un tanto desordenada, y en mi caso particular todo lo necesario no lo he encontrado en un solo lugar. Entonces basado en búsquedas y averiguaciones trataré de que en este blog, uno pueda aprender lo mínimo necesario para utilizar esta “suite open source”.