viernes, 25 de junio de 2010

Pentaho 3.2 Data Integration: Reseñas

Buenas.
Hace unos días terminé de leer (y hacer los ejercicios!) el libro Pentaho 3.2 Data Integration - Beginner's Guide, escrito por María Carina Roldan.

Tal como lo vengo haciendo, realizaré una serie de reseñas desde diferentes perspectivas:

1) Reseña general: es un libro muy ameno y fácil de leer. Cada tema es abordado con muchísima dedicación apuntando a que la comprensión de lo que se quiere transmitir sea lo más alta posible.
Cabe destacar la cantidad y la calidad de los ejemplos presentes en el libro, como así también el énfasis en detallar qué se hizo y para qué.

Algo principal a remarcar para que quede bien claro, es que María Carina en su libro habla de la Integración de Datos y no solo de "procesos ETL para cargar un DW", lo cual hace que su lectura nos pueda ayudar en muchísimos ámbitos.


2) Reseña detallada: Pentaho 3.2 Data Integration es un paseo por la integración de datos a través de los ejemplos, prácticas, consejos y recomendaciones que nos plantea María Carina, utilizando por supuesto PDI.

A lo largo del libro se tratan temas complejos tales como: expresiones regulares, pasaje de parámetros, ejecución de transformación y trabajos por línea de comandos, xml, manejo de variables, etc, etc.

Se utilizan pasos no convencionales: Fórmula, Búsqueda en flujo de datos, Append streams, Des-Normalización de Fila, If field value is null, Normalización de Fila, Number range, Regex Evaluation, Búsqueda en Base de Datos, Mapeo, etc, etc.

Hay todo un capítulo dedicado a la utilización de código javascript y del paso "Valor Java Script Modificado".
Oto dedicado al manejo de errores y a los pasos "Write to log", "Abort" y "Data Validator".
Y uno más dedicado al armado de un Data Mart: dimensiones degeneradas, dimensiones junk, claves subrogadas, dimensiones lentamente cambiantes, dimensión tiempo.

Finalmente, se introduce y ejemplifica cómo instalar diferentes plugins en PDI, se habla de cómo aumentar la performance en trabajos y transformaciones y de cómo integrar PDI con Pentaho BI Server.

Pentaho 3.2 Data Integration es un material totalmente recomendable tanto para quienes nos dedicamos al BI, como para quienes tengan que implementar técnicas de Integración de Datos.


3) Reseña final: existen muchas tareas en el mundo del IT y del BI que se hacen manualmente casi sin darle la menor importancia y otras tantas que no son siquiera tenidas en cuenta. A través de este libro María Carina nos muestra una serie de ejemplos que nos hace pensar en todos estos casos y cómo sería la transformación o trabajo que deberíamos utilizar.

Sin lugar a duda, este es otro libro de indispensable lectura.



Salud!

lunes, 21 de junio de 2010

Test de Drivers JDBC

Buenas, adjunto a continuación un pequeño programa que utilizamos en eGluBI y sirve para testear un Driver JDBC y su correspondiente URL.

Este programita es bastante simple y se ejecuta por líneas de comandos. Los pasos a seguir son:
  1. Se debe tener instalado JRE 1.4 o posterior y el accesible al SGBD al que pertenece el Driver en cuestión.
  2. Descomprimir el archivo en, digamos [HOME].
  3. Copiar el Driver JDBC a testear en [HOME]\drivers.
  4. Modificar el archivo c.properties colocando la url, driver, usuario y contraseña a testear.
  5. Ejecutar el programa:
    • Si se trata de Window$: entrar en la consola "CMD" o "COMMAND", cambiar al directorio [HOME] y ejecutar el comando: ejecutar.bat
    • Si se trata de GNU/Linux o Unix: entrar en la consola, cambiarse a la carpeta [HOME], asegurarse que los archivos .sh tengan permisos de ejecución con "chmod +x *.sh" y luego ejecutar el comando: sh ejecutar.sh
Si la ejecución de este programita devuelve un error, por ejemplo "java.lang.ClassNotFoundException" verificar si copiamos el Driver correcto en [HOME]\drivers o bien si colocamos mal el nombre del Driver. Pueden ocurrir otros errores pero son bastante autoexplicativos.


Para DESCARGAR el archivo hacer clic aquí...

Salud!

martes, 8 de junio de 2010

Mini videos tutoriales: Eclipse, JBoss Tools / Struts, IReports / Struts

Buenas, a continuación les presento una serie de videos-tutoriales que ha realizado mi colega Mariano Mattío (miembro de eGlu BI) y que ha decidido compartir con la comunidad.

Gracias Mariano.


Esperamos que les sean útiles, y ya saben, cualquier comentario, feedback, agradecimiento, etc, son bienvenidos.


Eclipse:

  1. Introducción y Descarga: link...
  2. Instalación: link...
  3. Layout y nuevo proyecto: link...
  4. Paquetes y primera clase: link..
  5. Clase hija, clase de prueba, ejecución y reescritura de toSting(): link...
  6. Perfiles de ejecución, paso de argumentos, exportación a JAR y ejecución desde consola: link...
  7. Creación y descripción de la BD que se utilizará en adelante mediante un "poblador" automático: link...
  8. Descarga del conector (driver) JDBC de MySQL: link...
  9. Introducción teórica a JDBC: link...
  10. Carga de un driver y conexión a una BD desde Eclipse: link...
  11. Uso de la Metadata de la conexión: link...
  12. Ejecución de sentencias Insert/Update y Delete de forma dinámica: link...
  13. Ejecución de sentencias Select de forma dinámica y recorrido del resultado: link...
Quedan pendientes aún una serie de videos tutoriales, en cuanto esten disponibles actualizaré esta entrada.


JBoss Tools / Struts:

IReports / Struts: