9. OLAP

 

9.1 Introducción

Las herramientas de OLAP (Online Analytical Processing) presentan al usuario una visión multidimensional de los datos (esquema multidimensional) para cada actividad que es objeto de análisis.

El usuario formula consultas a la herramienta OLAP seleccionando atributos de este esquema multidimensional sin conocer la estructura interna (esquema físico) del almacén de datos.

La herramienta OLAP genera la correspondiente consulta y la envía al gestor de consultas del sistema (p.ej. mediante una sentencia SELECT).

 

Una consulta a un almacén de datos consiste generalmente en la obtención de medidas sobre los hechos parametrizadas por atributos de las dimensiones y restringidas por condiciones impuestas sobre las dimensiones

 

 

Restricciones: productos del departamento Bebidas, ventas durante este año

Parámetros de la consulta: por categoría de producto y por trimestre

 

 

 

 

 

9.2 Operadores de refinamiento

Lo interesante no es poder realizar consultas que, en cierto modo, se pueden hacer con selecciones, proyecciones, concatenaciones y agrupamientos tradicionales.

Lo realmente interesante de las herramientas OLAP son sus operadores de refinamiento o manipulación de consultas.

  • DRILL
  • ROLL
  • SLICE & DICE
  • PIVOT

El carácter agregado de las consultas en el Análisis de Datos, aconseja la definición de nuevos operadores que faciliten la agregación (consolidación) y la disgregación (división) de los datos:

  • agregación (roll): permite eliminar un criterio de agrupación en el análisis, agregando los grupos actuales.
  • disgregación (drill): permite introducir un nuevo criterio de agrupación en el análisis, disgregando los grupos actuales.

 

Si se desea introducir la dimensión Almacén en el análisis anterior e incluir un nuevo criterio de agrupación sobre la ciudad del almacén:

¿ “Importe total de las ventas durante este año de los productos del departamento Bebidas, por trimestre, por categorías y por ciudad del almacén?.

Restricciones: productos del departamento Bebidas, ventas durante este año

Parámetros de la consulta: por categoría de producto, por trimestre y por ciudad del almacén.

 

 

 

 

Si se desea eliminar el criterio de agrupación sobre la dimensión Tiempo en la consulta original:

¿ “Importe total de las ventas durante este año de los productos del departamento Bebidas, por categorías?

 

 

 

 

Las operaciones de agregación (DRILL) y disgregación (ROLL) se pueden hacer sobre:

  • atributos de una dimensión sobre los que se ha definido una jerarquía: DRILL-DOWN, ROLL-UP

    departamento – categoría - producto (Producto)

    año - trimestre – mes - día (Tiempo)

     

  • sobre dimensiones independientes: DRILL-ACROSS, ROLL-ACROSS

    Producto – Almacén -Tiempo

     

 

 

Otras operaciones de OLAP:

  • SLICE & DICE: seleccionar y proyectar datos en el informe.
  • PIVOT: reorientación de las dimensiones en el informe.

 

 

Las herramientas de OLAP se caracterizan* por:

  • ofrecer una visión multidimensional de los datos (matricial).
  • no imponer restricciones sobre el número de dimensiones.
  • ofrecer simetría para las dimensiones.
  • permitir definir de forma flexible (sin limitaciones) sobre las dimensiones: restricciones, agregaciones y jerarquías entre ellas.
  • ofrecer operadores intuitivos de manipulación: drill-down, roll-up, slice-and-dice, pivot. s
  • er transparentes al tipo de tecnología que soporta el almacén de datos (ROLAP o MOLAP).

*Subconjunto de las 12 reglas propuestas por E.F. Codd para Data Warehouses

 

9.3 Implementaciones de OLAP

9.3.1 Tipos

El Data Warehouse y las herramientas OLAP se pueden basar físicamente en varias organizaciones:

  • Sistemas ROLAP:se implementan sobre tecnología relacional, pero disponen de algunas facilidades para mejorar el rendimiento (índices de mapas de bits, índices de JOIN).
  • Sistemas MOLAP disponen de estructuras de almacenamiento específicas (arrays) y técnicas de compactación de datos que favorecen el rendimiento del almacén.
  • Sistemas HOLAP sistemas híbridos entre ambos.

 

9.3.2 ROLAP

Sistemas ROLAP:

  • El almacén de datos se construye sobre un DBMS Relacional.
  • Los fabricantes de DBMS relacionales ofrecen extensiones y herramientas para poder utilizar el RDBMS para manejar DW.
  • Extensiones de los DBMS relacionales:
    • índices de mapa de bits
    • índices de JOIN
    • técnicas de particionamiento de los datos
    • optimizadores de consultas
    • extensiones del SQL (operador CUBE, roll-up)

Productos:

  • Microsoft Analysis Services
  • Microstrategy
  • Business Objects
  • Oracle BI
  • Mondrian

 

9.3.3 MOLAP

Sistemas MOLAP.

Sistema de propósito específico:

  • estructuras de datos (arrays)
  • técnicas de compactación

El objetivo de los sistemas MOLAP es almacenar físicamente los datos en estructuras multidimensionales de forma que la representación externa y la representación interna coincidan.

  • El servidor MOLAP construye y almacena datos en estructuras multidimensionales.
  • La herramienta de OLAP presenta estas estructuras multidimensionales.
  • Datos
    • Arrays
    • Extraídos del almacén de datos
  • almacenamiento y procesos eficientes
  • la complejidad de la BD se oculta a los usuarios
  • el análisis se hace sobre datos agregados y métricas o indicadores precalculados.

 

Productos:

  • Microsoft Analysis Services
  • Essbase
  • MIS Alea
  • TM1
  • Palo

 

9.3.4 ROLAP/MOLAP: Ventajas e Inconvenientes

ROLAP:

  • pueden aprovechar la tecnología relacional.
  • pueden utilizarse sistemas relacionales genéricos (más baratos o incluso gratuitos).
  • el diseño lógico corresponde al físico si se utiliza el diseño de Kimball.

MOLAP:

  • generalmente más eficientes que los ROLAP.
  • el coste de los cambios en la visión de los datos.
  • la construcción de las estructuras multidimensionales.