1.9 Base de datos centralizada vs distribuidas José Manuel González Peña Coral Almansa Domínguez Valerio Jurado Sánchez Estefanía Moreno Pamos
BASES DE DATOS CENTRALIZADAS Una base de datos centralizada es una base de datos almacenada en su totalidad en un solo lugar físico, es decir, es una base de datos almacenada en una sola máquina y en una sola CPU, donde los usuarios trabajan en terminales "tontas" que solo muestran resultados. Los sistemas de bases de datos centralizadas son aquellos que se ejecutan en un único sistema informático sin interaccionar con ninguna otra computadora.
Características de las bases de datos centralizadas. Entre las características más importantes de las bases de datos centralizadas se encuentran las siguientes: - Se almacena completamente en una localidad central, es decir, todos los componentes del sistema residen en un solo computador o sitio. - No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las bases de datos distribuidas. - Los componentes de las bases de datos centralizadas son: los datos, el software de gestión de bases de datos y los dispositivos de almacenamiento secundario asociados. - El problema de seguridad es fácil en estos sistemas de bases de datos.
Ventajas: - Se evita la redundancia. - Se evita la inconsistencia. Ya que si un hecho específico se representa por una sola entrada, la no concordancia de datos no puede ocurrir. - Pueden aplicarse restricciones de seguridad. - Puede conservarse la integridad. - El procesamiento de los datos ofrece un mejor rendimiento y resulta más confiable que los sistemas distribuidos.
Desventajas: - Los mainframes no ofrecen mejor proporción microprocesadores de los sistemas distribuidos.
precio/rendimiento
que
los
- Cuando un sistema de bases de datos centralizada falla, se pierde toda disponibilidad de procesamiento y sobre todo de información confiada al sistema. - En caso de un desastre o catástrofe, la recuperación es difícil de sincronizar. - Las cargas de trabajo no se pueden difundir entre varias computadoras, ya que los trabajos siempre se ejecutarán en la misma máquina. - Un mainframe en comparación con un sistema distribuido no tiene mayor poder de cómputo.
BASES DE DATOS DISTRIBUIDAS Una base de datos distribuida es un conjunto de múltiples bases de datos lógicamente relacionadas, las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones, los cuales tienen la capacidad de procesamiento autónomo lo que indica que puede realizar operaciones locales o distribuidas.
Características de las Bases de Datos Distribuidas: - Autonomía Local: los sitios distribuidos deben ser autónomos, es decir, que todas las operaciones de un sitio se controlan desde ese sitio. - Operación continua: nunca debería apagarse para realizar alguna función, como añadir un nuevo sitio. - Independencia con respecto a la localización: no debe haber dependencia de un sitio central para obtener un servicio. - Independencia con respecto a la fragmentación: la fragmentación es deseable por razones de desempeño. - Procesamiento distribuido de consultas: el objetivo es convertir transacciones de usuario en instrucciones para manipulación de datos, y así reducir el trafico en la red implica que el proceso mismo de optimización de consultas debe ser distribuido. - Independencia con respecto al equipo. - Independencia con respecto al sistema operativo. - Independencia con respecto a la red. - Puede leer y escribir datos localizados en diferentes nodos de la red.
Ventajas: - Los datos son localizados en un lugar más cercano, por tanto, el acceso es más rápido. - El procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo. - Nuevos nodos se pueden agregar fácil y rápidamente. - La comunicación entre nodos se mejora.
Desventajas: - Los datos residen en muchos nodos diferentes y se pueden consultar por nodos diversos de la red. - La probabilidad de violaciones de seguridad es creciente si no se toman las precauciones debidas. - Dado que los datos pueden estar replicados, el control de concurrencia y los mecanismos de recuperación son mucho más complejos que un sistema centralizado. - La distribución produce un aumento en la complejidad del diseño y en la implementación del sistema.
ARQUITECTURA ANSI-SPARC Arquitectura de Bases de Datos: En 1975 fue aprobado por el Instituto Nacional Estadounidense de Estándares (ANSI, por sus siglas en Inglés: American National Standards Institute) y por el Comité de Requisitos y Planificación de Estándares (SPARC, por sus siglas en inglés: Standards Planning and Requirements Committee) un esquema o arquitectura de 3 Niveles para las Bases de Datos que permitiera: - Separación de las Aplicaciones de los Datos. - Manejo de múltiples vistas por parte de los usuarios. - Uso de un catálogo para almacenar el esquema de la Base de Datos.
Descripción ANSI-SPARC 1. Nivel Externo: Se refiere a las vistas o una porción de la Base de Datos completa. 2. Nivel Conceptual: En este nivel se describen los datos que se almacenan en la Base de Datos, además de las relaciones que existen entre éstas. 3. Nivel Interno: Su labor se refiere a como se almacenan físicamente los datos, se describen estructuras de datos complejas.
Ventajas Gracias a la Arquitectura ANSI-SPARC se puede lograr: 1. Independencia Lógica: Se puede modificar la estructura de la Base de Datos son la necesidad que se deba reescribir las aplicaciones. 2. Independencia Física: Se refiere cuando se puede alterar la estructura física de la Base de Datos sin la necesidad que se deba alterar su estructura lógica.
FRAGMENTACIÓN VERTICAL El objetivo de la fragmentación vertical consiste en dividir la relación en un conjunto de relaciones más pequeñas tal que algunas de las aplicaciones de usuario sólo hagan uso de un fragmento. Sobre este marco, una fragmentación óptima es aquella que produce un esquema de división que minimiza el tiempo de ejecución de las aplicaciones que emplean esos fragmentos.
FRAGMENTACIÓN HORIZONTAL La fragmentación horizontal se realiza sobre las tuplas de la relación. Cada fragmento será un subconjunto de las tuplas de la relación. Existen dos variantes de la fragmentación horizontal: la primaria y la derivada. La fragmentación horizontal primaria de una relación se desarrolla empleando los predicados definidos en esa relación. Por el contrario, la fragmentación horizontal derivada consiste en dividir una relación partiendo de los predicados definidos sobre alguna otra.
FRAGMENTACIÓN MIXTA En muchos casos la fragmentación vertical u horizontal del esquema de la base de datos no será suficiente para satisfacer los requisitos de las aplicaciones. Podemos combinar ambas, utilizando por ello la denominada fragmentación mixta. Cuando al proceso de fragmentación vertical le sigue una horizontal, es decir, se fragmentan horizontalmente los fragmentos verticales resultantes, se habla de la fragmentación mixta HV. En el caso contrario, estaremos ante una fragmentación VH.