Profesor Juan Luis Núñez Corella
Tema Herramientas Herramientas OLAP
Estudiantes -
Leitón Fernández Karl
- Rive Riverra Ari Arias Joh Johnny - Umañ Umaña a Vil Villa lalo lobo bos s Han Hanze zell - Ureña So Soto Melina
Fecha de Entrega 16 de febrero de 2011
Contenido Contenido............................................................................................................ 2 INTRODUCCION...................................................................................................4 INTELIGENCIA DE NEGOCIOS............................................................................... 5 FUNCIONALIDADES.......................................................................................... 5 PORQUE TENER INTELIGENCIA DE NEGOCIOS? ................................................ 5 COMO NOS APOYA?.......................................................................................... 5 CARACTERISTICAS............................................................................................6 VENTAJAS ......................................................................................................... 6 COMO SE HACE INTELIGENCIA DE NEGOCIOS? ................................................ 6 ¿QUE ES OLAP?................................................................................................... 7 OBJETIVO ..........................................................................................................7 CUBO OLAP......................................................................................................7 HERRAMIENTAS OLAP...................................................................................... 8 CONSULTAS OLAP............................................................................................ 8 LAS 18 CARACTERISTICAS DE OLAP...............................................................10 CARACTERISTICAS BASICAS........................................................................ 10 CARACTERISTICAS ESPECIALES ................................................................... 11 CARACTERISTICAS DE REPORTES ............................................... ............... 11 CONTROL DE DIMENSIONES ........................................................................ 11 PROS.............................................................................................................. 12 CONTRAS....................................................................................................... 12 TIPOS DE SISTEMAS OLAP.............................................................................. 12 ROLAP......................................................................................................... 12 2
MOLAP.......................................................................................... ..............12 COMPARACION............................................................................................13 HOLAP (Hybrid OLAP) .................................................................................. 14 OTROS TIPOS DE HERRAMIENTAS OLAP ...................................................... 14 BASES DE DATOS OLTP y OLAP...................................................................... 15 PORQUE PODEMOS USAR OLAP Y QUE LO HACE ATRACTIVO?....................... 16 CONCLUSIONES................................................................................................. 17
3
INTRODUCCION El presente trabajo de investigación pretende explicar el concepto fundamental que sustenta el procesamiento analítico en línea (OLAP) y las herramientas que están involucradas dentro de la misma. Para comprender la tecnología OLAP, es necesario, primero, entender el concepto de Inteligencia de Negocios, qué es de donde proviene esta tecnología de información y luego explicar de la manera más sencilla, la funcionalidad de la misma. Cabe recalcar también, una vez analizado el concepto de OLAP, cuáles son los pros, contras y qué hace que esta tecnología sea atractiva en el mundo de las soluciones para Inteligencia de Negocios.
4
INTELIGENCIA DE NEGOCIOS La inteligencia de negocios es un concepto altamente relacionado a la buena planeación y estrategia comercial de cualquier organización de cualquier índole y tamaño. Dicho de otra forma, se refiere al uso de los datos de una empresa para facilitar la toma de decisiones mediante la comprensión del funcionamiento actual y la anticipación de acciones para dar una dirección operativa óptima a la empresa.
FUNCIONALIDADES Provee soluciones para los tomadores de decisiones, transformar información clave de su negocio, en acciones concretas traduciéndose en beneficios visibles para la empresa.
PORQUE TENER INTELIGENCIA DE NEGOCIOS? Es importante que las organizaciones exploten datos, información existente, con el fin de convertirla en conocimientos que sirva de apoyo al proceso en la toma de decisiones. Esto nos ayuda a una adecuada gestión de conocimientos que garantiza el éxito dentro de un mercado competitivo.
COMO NOS APOYA? Con la disposición de la información correcta, en el momento adecuado para la toma de decisiones. La información está almacenada en un único lugar y se puede extraer de manera sencilla en tiempo real. Provee la capacidad para evaluar distintos escenarios al mismo tiempo. De esa manera podemos adelantar las posibles decisiones estratégicas y hacer cambios positivos para la organización. La información de calidad va mas allá de reportes, no solamente se puede consultar la información sino se centra en definir indicadores los cuales permiten medir el desempeño del negocio. Permite agrupar la información de distintas áreas en un solo cuadro. Así permite centralizar la información lo cual favorece para un cambio de políticas o de orientaciones de planes de la empresa. Genera capacidad de reacción a situaciones imprevistas con un nivel de riesgo menor. Se tiene de antemano un análisis de riesgo para así tomar decisiones correctas.
5
CARACTERISTICAS Accesibilidad a la Información: el acceso de los usuarios a los datos con independencia apoya en la toma de decisiones. Permite que los usuarios tengan acceso a una herramientas de análisis, seleccionar y manipular solo aquellos datos que les interesa. Apoyo en la toma de decisiones: los usuarios deben tener acceso a herramientas de análisis con el fin de seleccionar y analizar aquellos datos que le interesa. Orientación al usuario final: independencia entre los conocimientos técnicos de los usuarios y su capacidad para utilizar esta herramienta.
VENTAJAS •
•
•
Permite determinar si están logrando los objetivos y metas propuestas. Esto es para poder compartir esta información a los departamentos. Facilita información que permite priorizar actividades. Deben estar basados en cumplimiento de objetivos de corto, mediano y largo plazo. Reduce la incertidumbre y subjetividad en los procesos en la toma de decisiones. El usuario es capaz de construir sus propios reportes de índices de desempeño. Esto es sin necesidad de contar con el apoyo del área de tecnologías informáticas.
•
Permite crear escenarios con respecto a una decisión.
•
Disminuye tiempo de recolección en la información.
COMO SE HACE INTELIGENCIA DE NEGOCIOS? Para hacer inteligencia de negocios es necesario:
Reportes: Este elemento actualiza la información a los datos. Entrega automática de reportes filtrando según el rol del destinatario. La solución de reportes permite a las organizaciones acceder fácilmente, dar formato y distribuir a la información a los empleados y clientes. 6
Sistemas de información Ejecutivos (EIS): Es una herramienta o software que provee a los gerentes, tener acceso sencillo a la información interna y externa de su compañía, y es relevante para sus factores siendo la clave de éxito. Dicho de otra manera, se trata de brindar al ejecutivo un acceso rápido y efectivo a la información utilizando interfaces gráficas y visuales. Sistema de Soporte de Decisiones (DSS): Es una herramienta enfocada al análisis de los datos de una organización. Permite navegar por información disponible en cubos realizando consulta del comportamiento de los otros indicadores. En esta apartado es donde vamos a considerar las herramientas OLAP.
¿QUE ES OLAP? Es el acrónimo en inglés de procesamiento analítico en línea (On-Line AnalyticalProcessing). Es una solución utilizada en el campo de la Inteligencia de Negocios (Business Intelligence) y la misma ha sido creada en función a bases de datos multifuncionales, que permiten procesar grandes volúmenes de información, en campos bien definidos y con un acceso a los datos para su consulta y posterior análisis. En otras palabras: Los sistemas OLAP son bases de datos orientadas al procesamiento analítico.
OBJETIVO Su objetivo principal es agilizar la consulta de grandes cantidades de datos. Usa cubos, se usa en informe de ventas, minería de datos y similares.
CUBO OLAP Para funcionar, las aplicaciones OLAP utilizan un tipo de base de datos que posee la peculiaridad de ser multidimensional, denominada Cubo OLAP. Los cubos OLAP son vectores en los cuales se dispone la información y gracias a este orden jerárquico es posible llevar a cabo un análisis rápido de los datos. Cada una de las dimensiones que posee la base de datos incorpora un campo determinado para un tipo de dato específico, que luego podrá ser comparado con la información contenida en el resto de dimensiones, para hacer posible la evaluación y posteriores informes de la información relevante para una organización.
7
Una base de datos multidimensional puede contener varios cubos o vectores que extenderán las posibilidades del sistema OLAP con el cual se trabaja.
HERRAMIENTAS OLAP Las herramientas OLAP presentan al usuario una visión multidimensional de los datos (esquema multidimensional) para cada actividad que es objeto de análisis. El usuario formula consultas a la herramienta OLAP seleccionando atributos de este esquema multidimensional sin conocer la estructura interna (esquema físico) del almacén de datos. La herramienta OLAP genera la correspondiente consulta y la envía al gestor de consultas del sistema.
CONSULTAS OLAP Una consulta a un almacén de datos consiste generalmente en la obtención de medidas sobre los hechos parametrizados por atributos de las dimensiones y restringidas por condiciones impuestas sobre las dimensiones. Ejemplo:
Importe total de las ventas durante este año de los productos del departamento Bebidas, por trimestre y por categoría Restricciones: productos del departamento Bebidas, ventas durante este año Parámetros de la consulta: por categoría de producto y cliente
8
Presentación Tabular (relacional) de los datos seleccionados Catego ría
Trimest re
Ventas
Refresc os
T1
20000 00
Refresc os
T2
10000 00
Refresc os
T3
30000 00
Refresc os
T4
20000 00
Jugos
T1
10000 00
Jugos
T2
15000 00
Jugos
T3
80000 00
Jugos
T4
24000 00
Se asumen dos categorías en el departamento de Bebidas: Refrescos y Jugos
Presentación matricial (multidimensional) de los datos seleccionados trim
T1
T2
T3
T4
Refrescos
20000 00
10000 00
30000 00
20000 00
Jugos
10000 00
15000 00
80000 00
24000 00
estre categoría
9
Los parámetros de la consulta (“por trimestre” y “por categoría”) determinan los criterios de agrupación de los datos seleccionados (ventas de productos del departamento Bebidas durante este año). La agrupación se realiza sobre dos dimensiones (Producto, Tiempo)
LAS 18 CARACTERISTICAS DE OLAP CARACTERISTICAS BASICAS 1. Vista Conceptual Multidimensional: Por naturaleza un usuario empresarial tiene una visión multidimensional de la empresa y es por esto que los modelos OLAP deben ser de naturaleza multidimensional. Los usuarios empresariales son capaces de manipular dichos modelos de datos multidimensionales fácilmente. 2. Manipulación Intuitiva de los Datos: La manipulación de los datos se debe llevar a cabo por medio de la acción directa sobre las celdas del modo analítico, sin requerir el uso de menús o múltiples viajes a través de la interfaz de usuario. 3. Accesibilidad: La herramienta OLAP debe ubicar su propio esquema lógico para depósitos físicos heterogéneos para acceder a los datos y efectuar las conversiones necesarias a fin de presentar una visión de usuario empresarial única, coherente y consistente. El tipo de sistema de donde provienen los datos físicos debe ser transparente al usuario y debe concernir solo a la herramienta. 4. Extracción en lote vr Interpretativa: Las herramientas OLAP deben ser capaces de trabajar tanto como un depósito de datos, como un vehículo para el acceso a los datos almacenados en una base de datos externa. 5. Modelo de análisis OLAP: Los productos OLAP deben soportar cuatro modelos de análisis; exegético, categórico, contemplativos, y formulaicos. 6. Arquitectura Cliente / Servidor: El componente servidor de la herramienta OLAP debe ser lo suficientemente inteligente para que los clientes se incorporen con un mínimo de esfuerzo y programación. El 10
servidor inteligente debe ser capaz de ubicar y consolidar datos entre bases de datos físicos y lógicas para mantener la transparencia y construir un esquema conceptual común, lógico y físico. 7. Transparencia: El lugar donde reside la herramienta analítica debe ser transparente para el usuario empresarial. 8. Soporte Multiusuario: Las herramientas deben suministrar acceso concurrente (recuperación y actualización), integridad y seguridad para dar un soporte a los usuarios que necesitan trabajar en forma concurrente con el mismo modelo analítico.
CARACTERISTICAS ESPECIALES 9. Tratamiento de datos no normalizados 10.Almacenamiento de los resultados OLAP manteniéndolos separados de los datos originales 11.Extracción de valores omitidos 12.Tratamiento de los valores omitidos
CARACTERISTICAS DE REPORTES 13.Flexibilidad de reportes 14.Desempeño uniforme de reportes 15.Ajuste automático del nivel físico
CONTROL DE DIMENSIONES 16.Dimensionalidad genérica 17.Niveles ilimitados de dimensiones y agregaciones 18.Operaciones a través de dimensiones sin restricciones Desde un punto de vista más práctico:
•
Debe ser rápido. Debe tener un lenguaje funcional y de negocio.
•
Debe ser de manejo sencillo, con wizards y templates.
•
Debe poder integrar API.
•
Debe tener potentes posibilidades gráficas.
•
Debe utilizar mapas de forma habitual.
•
11
•
Posibilidad de almacenar y compartir los informes y cálculos creados por los usuarios.
•
La administración la deben llevar los usuarios, no IT.
•
El tiempo de implementación (proyecto) debe ser muy corto.
•
Deber generar respuestas medibles para la toma de decisiones.
PROS Nos permiten realizar todas las diferentes y posibles combinaciones para visualizar los resultados de una organización hasta un determinado grado de detalle. Esta estructura es independiente al sistema transaccional de la compañía y facilita consultar información histórica de manera rápida y eficiente, ofreciendo la posibilidad de navegar y analizar los datos requeridos.
CONTRAS Imposibilidad de realizar cambios en la estructura del cubo: debido a su forma de almacenamiento y funcionamiento, cuando los usuarios requieren realizar modificaciones en la estructura de este tipo de base de datos, deben rediseñar el Cubo OLAP, sin posibilidades de utilizar la estructura en la se trabajó en ese momento.
TIPOS DE SISTEMAS OLAP ROLAP Es una implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones, y las tablas se encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La arquitectura está compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que permite el análisis de una enorme cantidad de datos.
MOLAP Esta implementación OLAP almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado. Estos valores 12
precalculados o agregaciones son la base de las ganancias de desempeño de este sistema. Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.
COMPARACION Cada sistema OLAP tiene ciertos beneficios.
Herramientas MOLAP
Herramientas ROLAP
Característica Volumen de datos.
Muy compactas para Son más escalables para conjuntos de datos de manejar grandes pocas dimensiones. volúmenes, (modelos con millones de miembros). Carga de datos La etapa de carga de datos Existe una gran variedad puede ser bastante larga, de herramientas de carga sobre todo para grandes de datos para sistemas volúmenes de datos. relacionales; además la posibilidad de ajustar el código ETL a un modelo de datos particular, logrando que los tiempos de carga sean mucho menores que con las cargas MOLAP. Almacenamiento Utiliza un modelo de Los datos se almacenan en almacenamiento en una base de datos vectores y/o matrices el relacional estándar que cual proporciona una puede ser accedida por indexación natural. cualquier herramienta de Ocupa menor tamaño en generación de informes disco a las técnicas de SQL sin la necesidad que compresión utilizadas. sea de tipo OLAP. Rendimiento en Se obtiene consultas Muchos desarrolladores de las consultas rápidas por la optimización modelos dimensionales del almacenamiento, la ROLAP ignoran el paso de memoria caché y la crear tablas agregadas, por indexación lo que el rendimiento de multidimensional. una consulta se ve Sin embargo tienden a afectado al tener que sufrir un bajo rendimiento consultar las tablas con al consultar modelos con datos más detallados. dimensiones muy altas. Otras ventajas Automatizan el Posibilitan modelar datos procesamiento de los datos con éxito que de otro modo agregados de mayor nivel. no se ajustarían en un Se logra una eficaz modelo dimensional extracción de datos gracias estricto. a la pre-estructuración de 13
Otras desventajas
Productos
los datos agregados. El enfoque MOLAP Se construyen sobre bases introduce redundancia en de datos de propósito los datos. general, por lo que hay algunas funcionalidades propias de las herramientas MOLAP que no están disponibles en éstos sistemas (tales como el indexado jerárquico especial). Oracle OLAP. Microsoft Analysis Microsoft Analysis Services. Services. Essbase. MicroStrategy. icCube Server. Business Objects. Infor OLAP. Mondrian (es un servidor PALO (servidor de código open source). abierto). Microsoft SQL Server.
HOLAP (Hybrid OLAP) Es un conjunto de técnicas que tratan de combinar ROLAP y MOLAP de la mejor forma posible, almacenando una parte de los datos como en un sistema multidimensional y el resto como en uno relacional. El grado de control que el operador de la aplicación tiene sobre este particionamiento varía de unos productos a otros. Esta herramienta generalmente puede pre procesar de forma rápida, escala bien y proporciona una buena función de apoyo. Existen dos clases de particionamiento. En el vertical, HOLAP almacena agregaciones como un MOLAP para mejorar la velocidad de las consultas, y los datos se detallan en ROLAP para optimizar el tiempo en que se procesa el cubo. En el particionamiento horizontal, HOLAP almacena una sección de los datos, normalmente los más recientes en modo MOLAP para mejorar la velocidad de las consultas, y los datos más antiguos en ROLAP. Además, se pueden almacenar algunos cubos en MOLAP y otros en ROLAP. Algunos productos comerciales que soportan el modo HOLAP son Microsoft Analysis Server, MicroStratety y SAP AG BI Accelerator.
OTROS TIPOS DE HERRAMIENTAS OLAP Los siguientes sistemas también se utilizan, aunque no son tan generalizados como los anteriores: 14
WOLAP o Web OLAP: OLAP basado u orientado para la web. DOLAP o Desktop OLAP: OLAP de escritorio RTOLAP o Real Time OLAP: OLAP en tiempo real SOLAP o Spatial OLAP: OLAP espacial
BASES DE DATOS OLTP y OLAP OLTP - On-Line TransactionalProcessing Los sistemas OLTP son bases de datos orientadas al procesamiento de transacciones. Una transacción genera un proceso atómico (que debe ser validado con un commit, o invalidado con un rollback), y que puede involucrar operaciones de inserción, modificación y borrado de datos. El proceso transaccional es típico de las bases de datos operacionales. •
•
•
•
El acceso a los datos está optimizado para tareas frecuentes de lectura y escritura. (Por ejemplo, la enorme cantidad de transacciones que tienen que soportar las BD de bancos o hipermercados diariamente). Los datos se estructuran según el nivel aplicación (programa de gestión a medida, ERP o CRM implantado, sistema de información departamental...). Los formatos de los datos no son necesariamente uniformes en los diferentes departamentos (es común la falta de compatibilidad y la existencia de islas de datos). El historial de datos suele limitarse a los datos actuales o recientes.
OLAP - On-Line AnalyticalProcessing Los sistemas OLAP son bases de datos orientadas al procesamiento analítico. Este análisis suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer algún tipo de información útil: tendencias de ventas, patrones de comportamiento de los consumidores, elaboración de informes complejos… etc. Este sistema es típico de los datamarts. •
•
•
El acceso a los datos suele ser de sólo lectura. La acción más común es la consulta, con muy pocas inserciones, actualizaciones o eliminaciones. Los datos se estructuran según las áreas de negocio, y los formatos de los datos están integrados de manera uniforme en toda la organización. El historial de datos es a largo plazo, normalmente de dos a cinco años. 15
•
Las bases de datos OLAP se suelen alimentar de información procedente de los sistemas operacionales existentes, mediante un proceso de extracción, transformación y carga (ETL).
PORQUE PODEMOS USAR OLAP Y QUE LO HACE ATRACTIVO? Las empresas de hoy han llegado a confiar en las herramientas OLAP ya que éstas permiten llegar al fondo de las consultas complejas mediante la consolidación rápida de la información en matrices ricas en datos. Este tipo de funcionalidad de informes es importante para todas las empresas, pero la capacidad de enlace de informes a la estrategia de rendimiento es la clave del éxito empresarial. La integración de herramientas OLAP con una completa gestión del rendimiento en los resultados del programa de inteligencia de negocios mejora e informa más acerca de los procesos de planificación, presupuestación, y otras piezas críticas de la infraestructura de negocios.
16
CONCLUSIONES Definitivamente esta herramienta nos ayuda a la comprensión del funcionamiento actual de la empresa y con la planificación, facilita acontecimientos futuros, con el objetivo de ofrecer conocimientos para respaldar las decisiones empresariales. Es una solución empresarial estratégica para apoyar la toma de decisiones, mejora la capacidad de análisis y colabora con el logro de sus objetivos.
17