Data Warehousing

Uno de los desaf�os de cualquier implementaci�n de data warehouse, es el problema de transformar los datos. La transformaci�n se encarga de las inconsistencias en los formatos de datos y la codificaci�n, que pueden existir dentro de una base de datos �nica y que casi siempre existen cuando m�ltiples bases de datos contribuyen al data warehouse.

En la Figura N� 9 se ilustra una forma de inconsistencia, en la cual el g�nero se codifica de manera diferente en tres bases de datos diferentes. Los procesos de transformaci�n de datos se desarrollan para direccionar estas inconsistencias.

Figura 9

La transformaci�n de datos tambi�n se encarga de las inconsistencias en el contenido de datos. Una vez que se toma la decisi�n sobre que reglas de transformaci�n ser�n establecidas, deben crearse e incluirse las definiciones en las rutinas de transformaci�n.

Se requiere una planificaci�n cuidadosa y detallada para transformar datos inconsistentes en conjuntos de datos conciliables y consistentes para cargarlos en el data warehouse.

.�Metadata

Otro aspecto de la arquitectura de data warehouse es crear soporte a la metadata. Metadata es la informaci�n sobre los datos que se alimenta, se transforma y existe en el data warehouse. Metadata es un concepto gen�rico, pero cada implementaci�n de la metadata usa t�cnicas y m�todos espec�ficos.

Estos m�todos y t�cnicas son dependientes de los requerimientos de cada organizaci�n, de las capacidades existentes y de los requerimientos de interfaces de usuario. Hasta ahora, no hay normas para la metadata, por lo que la metadata debe definirse desde el punto de vista del software data warehousing, seleccionado para una implementaci�n espec�fica.

T�picamente, la metadata incluye los siguientes �tems:

  • Las estructuras de datos que dan una visi�n de los datos al administrador de datos.
  • Las definiciones del sistema de registro desde el cual se construye el data warehouse.
  • Las especificaciones de transformaciones de datos que ocurren tal como la fuente de datos se replica al data warehouse.

El modelo de datos del data warehouse (es decir, los elementos de datos y sus relaciones).

Un registro de cuando los nuevos elementos de datos se agregan al data warehouse y cuando los elementos de datos antiguos se eliminan o se resumen.

Los niveles de sumarizaci�n, el m�todo de sumarizaci�n y las tablas de registros de su data warehouse.

Algunas implementaciones de la metadata tambi�n incluyen definiciones de la(s) vista(s) presentada(s) a los usuarios del data warehouse. T�picamente, se definen vistas m�ltiples para favorecer las preferencias variadas de diversos grupos de usuarios. En otras implementaciones, estas descripciones se almacenan en un Cat�logo de Informaci�n.

Los esquemas y subesquemas para bases de datos operacionales, forman una fuente �ptima de entrada cuando se crea la metadata. Hacer uso de la documentaci�n existente, especialmente cuando est� disponible en forma electr�nica, puede acelerar el proceso de definici�n de la metadata del ambiente data warehousing.

La metadata sirve, en un sentido, como el coraz�n del ambiente data warehousing. Crear definiciones de metadata completa y efectiva puede ser un proceso que consuma tiempo, pero lo mejor de las definiciones y si usted usa herramientas de gesti�n de software integrado, son los esfuerzos que dar�n como resultado el mantenimiento del data warehouse.

COMPARTE ESTE ARTÍCULO

COMPARTIR EN FACEBOOK
COMPARTIR EN TWITTER
COMPARTIR EN LINKEDIN
COMPARTIR EN WHATSAPP
SIGUIENTE ARTÍCULO