TECNOLOGICO DE ESTUDIOS SUPERIORES IXTAPALUCA
BASES DE DATOS DISTRIBUIDAS
PROF. GALO JARQUIN SALINAS
Guía de Base de Datos Distribuidas
CARRERA: LICENCIATURA EN INFORMÁTICA
ALUMNO:
SANTOS JIMÉNEZ JESICA
GRUPO: 2702
GUIA DE ESTUDIO PRIMER EXAMEN PARCIAL BASES DE DATOS DISTRIBUIDAS 1.- Defina base de datos distribuida.
Son un grupo de datos que pertenecen a un sistema pero a su vez está repartido entre ordenadores de una misma red, ya sea a nivel local o cada uno en una diferente localización geográfica, cada sitio en la red es autónomo en sus capacidades de procesamiento y es capaz de realizar operaciones locales y en cada uno de estos ordenadores debe estar ejecutándose una aplicación a nivel global que permita la consulta de todos los datos como si se tratase de uno solo. Es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones. 2.-Mencione las responsabilidades del SGBDD.
· Transparencia de red · Transparencia de fragmentación · Transparencia de copias o duplicación · Propagación de actualizaciones · Procesamiento de consultas distribuidas, definición de estrategias · Mantener un diccionario integrado · Control de concurrencia, integridad de la BDD, consistencia entre las múltiples copias de los datos · Fiabilidad de los SGBDD, capaz de recuperar y devolver a las bases de datos implicadas en el fallo un estado consistente y estable · Soporte de sistema operativo · Bases de datos heterogéneas, mecanismos de traducción 3.-Dibuje un diagrama con las relaciones entre los aspectos relevantes sobre las BDD.
4.-Realice una tabla comparativa entre una base de datos centralizada vs. Base de datos distribuida
5- Mencione los pasos para realizar la estrategia descendente (top-Dow): La estrategia descendente (top - Dow).- Se parte de cero y se avanza en el desarrollo del trabajo. Los pasos a realizar mediante esta estrategia son: · Análisis de requisitos · Diseño de vistas · Diseño conceptual · Diseño de la distribución · Fragmentación · Asignación · Diseño físico · Monitorización y ajuste 6.- Menciona las 5 características que un diccionario de datos debe cumplir
Debe soportar las descripciones de los modelos conceptual, lógico, interno y externo de la dase de datos. Debe estar integrado dentro del SGBD. Debe apoyar la transferencia eficiente de información al SGBD. La conexión entre los modelos internos y externo debe ser realizada en un tiempo de ejecución. Debe comenzar con la reorganización de versiones de producción de la base de datos. Además debe reflejar los cambios en la descripción de la BD. Cualquier cambio a la descripción de programas ha de ser reflejado automáticamente en la librería de descripción de programas con la ayuda del diccionario de datos. Debe estar almacenado en un medio de almacenamiento con acceso directo para la fácil recuperación de información
7.- Menciona 2 ventajas de la transparencia de replica Disponibilidad: El sistema sigue funcionando aun en caso de caída de uno de los nodos Aumento de paralelismo: Varios nodos pueden realizar consultas en paralelo sobre la misma tabla. Cuantas más replicas existan de la tabla, mayor será la posibilidad de que el dato buscado se encuentre en el nodo desde el que se realiza la consulta, minimizando con ello el tráfico de datos entre nodos.
8.-Que diferencia existe entre los algoritmos de distribución de datos no replicados y los algoritmos de distribución de datos replicados.
Los Algoritmos de Distribucion de datos no replicados son fáciles de implantar en SQL SERVER a diferencia de Algoritmos de Distribucion de datos replicados
9.-Defina los 3 objetivos del diseño de la distribución de datos. 1.-Procesamiento local. La distribución de los datos, para maximizar el procesamiento local corresponde al principio simple de colocar los datos tan cerca como sea posible de las aplicaciones que los utilizan. Se puede realizar el diseño dela distribución de los datos para maximizar el procesamiento local agregando el número de referencias locales y remotas que le corresponden a cada fragmentación candidata y la localización del fragmento, que de esta forma se seleccione la mejor solución de ellas 2.-Distribución de la carga de trabajo . La distribución de la carga de trabajo sobre los sitios, es una característica importante de los sistemas de cómputo distribuidos. Esta distribución de la carga se realiza para tomar ventaja de las diferentes características (potenciales) o utilizaciones de las computadoras de cada sitio, y maximizar el grado de ejecución de paralelismo de las aplicaciones. Sin embargo, la distribución de la carga de trabajo podría afectar negativamente el procesamiento local deseado 3.-Costo de almacenamiento y disponibilidad. La distribución de la base de datos refleja el costo y disponibilidad del almacenamiento en diferentes sitios. Para esto es posible tener sitios especializados en la red para el almacenamiento de datos. Sin embargo el costo de almacenamiento de datos no es tan relevante si éste se compara con el del CPU, I/O y costos de transmisión de las aplicaciones. 10.-Mencione las 2 razones principales por las que son necesarias las réplicas y su principal desventaja Las replicas son necesarias por dos razones principales: Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias locales en lugar de tener que comunicarse con sitios remotos) Pueden significar una mejor disponibilidad (un objeto replicado permanece disponible para su procesamiento, mientras este disponible al menos una copia). Por supuesto, la principal desventaja de las replicas es que al actualizarlas es necesario actualizar todas: el problema de la propagacion de la actualizacion. . 11-Defina 5 objetivos de implementación de las BDD. Transparencia de ubicación. Permite a los usuarios tener acceso a los datos sin que tenga conocimiento de la ubicación de éstos. Se puede conseguir este nivel de transparencia al utilizar los administradores de transacciones distribuidas, los cuales son capaces de determinar la localización de los datos y de emitir acciones a los calendarizadores apropiados, lo cual puede ejecutarse cuando los administradores de transacciones distribuidas poseen acceso a los directorios de localizaciones de los datos. Transparencia de duplicación. Para que la transparencia de duplicación sea posible, los administradores de transacciones deben traducir las solicitudes de procesamiento de transacción en acciones para el administrador de datos. Para las lecturas el administrador de transacciones selecciona uno de los nodos que almacena los datos y ejecuta la lectura.
Para optimizar el proceso, el administrador de transacciones necesita información sobre el rendimiento de varios nodos respecto al sitio de consulta, así podrá seleccionar el nodo de mejor rendimiento Transparencia de concurrencia. Cuando varias transacciones se ejecuten al mismo tiempo, los resultados de las transacciones no deberán afectarse. La trasparencia de concurrencia se logra si los resultados de todas las transacciones concurrentes son consistentes de manera lógica con los resultados que se habrían obtenido si las transacciones se hubieran ejecutado una por una, en cualquier orden secuencial. Transparencia de fallas. Significa que a pesar de fallas las transacciones sean procesadas de un modo correcto. Frente a una falla, las transacciones deben ser atómicas, significa que se procesen todas o ninguna de ellas. Para este tipo de problemas es importante tener resguardo de la base de datos, y así poder restaurarla cuando sea conveniente. El sistema debe detectar cuándo falla una localidad y tomar las medidas necesarias para recuperarse del fallo. El sistema no debe seguir utilizando la localidad que falló. Por último, cuando se recupere o repare esta localidad, debe contarse con mecanismos para reintegrarla al sistema con el mínimo de complicaciones. Localidad del procesamiento. Los datos se deben distribuir lo más cerca posible de las aplicaciones que los usan para maximizar la localidad del procesamiento, este principio responde a minimizar el acceso remoto a los datos. Diseñar una distribución que maximice localidad del procesamiento puede hacerse añadiendo la cantidad de referencias locales y remotas correspondientes a cada fragmentación candidata y asignar la fragmentación eligiendo la mejor solución. Independencia de configuración. La independencia de configuración permite añadir o reemplazar hardware sin tener que cambiar componentes de software existentes en el sistema de base de datos distribuida. Particionamiento de la Base de Datos. La base de datos se distribuye de modo que no haya solapamiento o duplicación de los datos mantenidos en las diferentes localidades, como no hay duplicaciones de los datos, se evitan los costos asociados con el almacenamiento y mantenimiento de datos redundantes. Si un mismo segmento de datos se usa en más de una localidad se ve limitada la disponibilidad de los datos. La fiabilidad también puede verse limitada cuando se produce un fallo en el sistema de cálculo de una localidad se afecta la disponibilidad de los datos de esa localidad no estén disponible para los usuarios en cualquier parte del sistema. Fragmentación de datos. Consiste en subdividir las relaciones y distribuirlas entre los sitios de la red, tiene como como objetivo buscar formas alternativas de dividir una las instancias (tablas) de relaciones en otras más pequeñas. La fragmentación se puede realizar por tuplas individuales (fragmentación horizontal), por atributos individuales fragmentación vertical) o una combinación de ambas (fragmentación híbrida). 12.-Defina las 12 reglas de una base de datos distribuida 1.- Autonomía local . Los sitios en un sistema distribuido deben ser autónomos. La autonomía local significa que todas las operaciones en un sitio dado están controladas por ese sitio; ningún sitio X debe depender de algún otro sitio Y para su operación satisfactoria. La seguridad, integridad y representación de almacenamiento de los datos locales permanecen bajo el control y jurisdicción del sitio local.
2.- No dependencia de un sitio central . La autonomía local implica que todos los sitios deben ser tratados como iguales. -Por lo tanto, no debe haber particularmente ninguna dependencia de un sitio “maestro” central para algún servicio central, tal que todo el sistema dependa de ese sitio central. -Razones por las cuales no debería haber un sitio central:
El sitio central puede ser un cuello de botella El sistema sería vulnerable; es decir, si el sitio central falla, también fallará todo el sistema
3.- Operación continúa . Una ventaja de los sistemas distribuidos es que deben proporcionar mayor confiabilidad y mayor disponibilidad . -Confiabilidad. La probabilidad de que el sistema esté listo y funcionando en cualquier momento dado. Los SD no son una propuesta de todo o nada; pueden continuar operando cuando hay alguna falla en algún componente independiente. -Disponibilidad . La probabilidad de que el sistema esté listo y funcionando continuamente a lo largo de un período especificado.
. 4.- Independencia de ubicación. Conocida también como transparencia de u bicación – Los usuarios no tienen que saber dónde están almacenados físicamente los datos, sino que deben ser capaces de comportarse como si todos los datos estuvieran almacenados en su propio sitio local. – Esto simplifica los programas de los usuarios. En particular, permite que los datos emigren de un sitio a otro sin invalidar ninguno de estos programas o actividades. 5.- Independencia de fragmentación. Un sistema soporta la fragmentación de datos cuando puede ser dividida en o partes o fragmentos, para efectos de almacenamiento físico. – La fragmentación es necesaria por razones de rendimiento: los datos pueden estar almacenados en la ubicación donde son usados más frecuentemente para que la mayoría de las operaciones sean locales y se reduzca el tráfico en la red. – Los usuarios deben comportarse como si los datos en realidad estuvieran sin fragmentación alguna. 6.- Independencia de replicación. El sistema soporta replicación de datos cuando un fragmento puede ser representado por muchas copias distintas, o réplicas, guardadas en muchos sitios distintos.
Las réplicas son necesarias por dos razones principales: 1. Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias locales en lugar de tener que comunicarse con sitios remotos) 2. Pueden significar una mejor disponibilidad (un objeto replicado permanece disponible para su procesamiento, mientras esté disponible al menos una copia). Por supuesto, la principal desventaja de las réplicas es que al actualizarlas es necesario actualizar todas: el pro blem a de la pro pagación de la actualización . 7.- Procesamiento de consultas distribuidas . La optimización es importante en un sistema distribuido que en uno centralizado, incluso mucho más. – El punto básico es que en una consulta que involucra a varios sitios, habrá muchas formas posibles de mover los datos en el sistema para satisfacer la solicitud, y es crucialmente importante que se encuentre una estrategia eficiente. 8.- Administración de transacciones distribuidas . Existen dos aspectos principales en la administración de transacciones: control de recuperación y control de la concurrencia. – Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido.
– Ya que una sola transacción puede involucrar la ejecución de código en muchos sitios. – Puede involucrar actualizaciones en muchos sitios y se debe de cuidar que la transacción no caiga en un bloqueo mortal (basado en el b l o q u e o ) . – Para el control de la recuperación, es necesario asegurarse que una transacción dada sea atómica en el ambiente distribuido, el sistema debe por lo tanto asegurarse de que la transacción sea confirmada o deshecha (se puede utilizar el protocolo de ). confirm ación de dos fases 9.- Independencia de hardware . Soporte para un gran número de máquinas diferentes. Poder integrar todos los datos de todos estos sistemas y presentar al usuario una “imagen del sistema único”. 10.- Independencia de sistema operativo. Obviamente es necesario no sólo tener la posibilidad de ejecutar el mismo DBMS en diferentes plataformas de hardware, sino también ejecutarlo en diferentes plataformas de sistema operativo 11.- Independencia de red. Si el sistema va a tener la posibilidad de soportar muchos sitios distintos es obviamente necesario tener la posibilidad de soportar también una variedad de redes de comunicación distintas. 12.- Independencia de DBMS. Lo que se necesita es que todos los ejemplares de DBMS en sitios diferentes soporten la misma interfaz. – Aunque no tienen que ser necesariamente copias del mismo software DBMS. n eo , al – En otras palabras, sería posible que el sistema distribuido fuera h et er o g é menos en cierto grado. Sería muy bueno si diferentes DBMS pudieran participar de alguna forma en un sistema distribuido
13.-Mencione 5 ventajas y 5 desventajas de las BDD. Ventajas · Organizativas · Económicas · Técnicas Desventajas · Complejidad del sistema, desarrollo de software más costoso, problemas de sincronización, dificultad para conocer la corrección de los algoritmos paralelos, detección de caídas de nodos · Dependencia de la red de comunicaciones, sobrecarga de procesamiento de mensajes · Dificultad de diseño, fases adicionales · Poca madurez de los productos comerciales, orientados a replicación · Funciones de administración compleja, sincronización y coordinación · Dificultad de cambio, inexistencia de metodologías · Personal especializado
14.-Realice un diagrama de la arquitectura de BDD y explíquelo.
1. Distribución: Los componentes del sistema están localizados en la misma computadora o no. 2. Heterogeneidad: Un sistema es heterogéneo cuando existen en él componentes que se ejecutan en diversos sistemas operativos, de diferentes fuentes, etc. 3. Autonomía: Se puede presentar en diferentes niveles, los cuales se describen a continuación: · Autonomía de diseño: Habilidad de un componente del para decidir cuestiones relacionadas a su propio diseño. · Autonomía de comunicación: Habilidad de un componente del para decidir cómo y cuándo comunicarse con otros SMBD. · Autonomía de ejecución: Habilidad 15.-Mencione 5 ventajas y 5 desventajas de la distribución de datos. Ventajas -La principal ventaja de los sistemas distribuidos es la capacidad de compartir y acceder a la información de una forma fiable y eficaz. -Utilización compartida de los datos y distribución del control -La ventaja principal de compartir los datos por medio de la distribución es que cada localidad pueda controlar hasta cierto punto los datos almacenados localmente. En un sistema centralizado, el administrador de base de datos de la localidad central controla la base de datos. -En un sistema distribuido existe un administrador global de la base de datos que se encarga de todo el sistema. Parte de esta responsabilidad se delega al administrador de base de datos de cada localidad. Dependiendo del diseño del sistema distribuido, cada administrador local podrá tener un grado de autonomía diferente, que se conoce como autonomía local. -La posibilidad de contar con autonomía local es en muchos casos una ventaja importante de las bases de datos distribuidas. Desventajas -Desarrollos de software más costosos -Mayor posibilidad de errores y costos -Extras de procesamiento. 16.-Explique el problema de diseño de las BDD.
Cómo distribuir la información entre diferentes sitios. Existen razones organizacionales las cuales determinan en gran medida lo anterior. Sin embargo, cuando se busca eficiencia en el acceso a la información, se deben abordar dos problemas relacionados. Como fragmentar la información Como asignar cada fragmento entre los diferentes sitios de la red
En el diseño de la base de datos distribuidos también es importante considerar si la información esta replicada, es decir, si existen copias múltiples del mismo dato y, en caso, como mantener la consistencia de la información. Finalmente, una parte importante en el diseño de una base de datos distribuidas se refiere al manejo del directorio. Si existen únicamente usuarios globales, se debe manejar un solo directorio global. Sin embargo, existen también usuarios locales, el directorio combina información local con información global 17.-Explique los dos enfoques de diseño de BDD.
A la hora de abordar el diseño de una base de datos distribuida podremos optar principalmente por dos tipos de estrategias: La estrategia ascendente (botton – up).- En este caso se partirá de los esquemas conceptuales locales y se trabajaría para llegar a conseguir el esquema conceptual global. Después se pasaría al diseño de distribución. Esta estrategia suele ser utilizada para integrar varias bases de datos centralizadas existentes La estrategia descendente (top - Dow).- Se parte de cero y se avanza en el desarrollo del trabajo. Los pasos a realizar mediante esta estrategia son: • Análisis de requisitos • Diseño de vistas • Diseño conceptual • Diseño de la distribución • Fragmentación • Asignación • Diseño físico • Monitorización y ajuste 18.-La organización de los sistemas de base de datos distribuidos se pude analizar en 3 dimensiones, descríbalas: Primera Dimensión
Segunda Dimension
Tercera Dimension
19- La fragmentación de la información se puede llevar a cabo de tres formas, mencione cuales son y ejemplifíquelas: Fragmentación vertical. Fragmentación horizontal. Fragmentación mixta o hibrida.
20.- La fragmentación mixta puede llevarse a cabo de tres formas diferentes, cuales son y descríbalas
FRAGMENTACION HORIZONTAL La tabla T se divide en subconjuntos, T1, T2, ...Tn. Cada tupla de T debe pertenecer al menos a uno de los fragmentos para poder reconstruir la tabla original a partir de los fragmentos. Los fragmentos se definen a través de una operación de selección y su reconstrucción se realizará en base a una operación de unión de los fragmentos componentes. En el ejemplo siguiente, se ilustra una posible fragmentación de la tabla Alumnos de dos fragmentos: uno para el nodo de la EUI y otro para el nodo de la EUIT. Nodos de las Escuelas:
Fragmentación horizontal primaria Consiste del particionamiento en tuplas de una relación global en subconjuntos, donde cada subconjunto puede contener datos que tienen propiedades comunes y se puede definir expresando cada fragmento como una operación de selección sobre la relación global.
Ejemplo Considere la relación global SUPPLIER ( SNUM, NAME, CITY ) Entonces, la fragmentación horizontal puede ser definida como: SUPPLIER ( SNUM, NAME, CITY ) Entonces, la fragmentación horizontal puede ser definida como: SUPPLIER1 = SLcity == "SF"SUPPLIER SUPPLIER1 = SLcity == "LA"SUPPLIER 1. Esta fragmentación satisface la condición de completes si "SF" y "LA" son solamente los únicos valores posibles del atributo CITY. 2. La condición de reconstrucción se logra con: SUPPLIER = SUPPLIER1 unión SUPPLIER2 3. La condición de disjuntos se cumple claramente en este ejemplo. Fragmentación horizontal derivada La fragmentación derivada horizontal se define partiendo de una fragmentación horizontal. En esta operación se requiere de Semi-junta (Semi-Join) el cual nos sirve para derivar las tuplas o registros de dos relaciones. Ejemplo Las siguientes relaciones definen una fragmentación horizontal derivada de la relación SUPPLY. SUPPLY1 = SUPPLYSJsnum == snumSUPPLIER1 SUPPLY2 = SUPPLYSJsnum == snumSUPPLIER2 Fragmentación vertical La fragmentación vertical, en cambio, se basa en los atributos de la relación para efectuar la división o fragmentación.
La fragmentación vertical es la subdivisión de atributos en grupos. Los fragmentos se obtienen proyectando la relación global sobre cada grupo. La fragmentación es correcta si cada atributo se mapea en al menos un atributo del fragmento.
Ejemplo Considere la siguiente relación global: EMP ( empnum, name, sal, tax, mgrnum, depnum ) Una fragmentación vertical de esta relación puede ser definida como: EMP1 = PJempnum, name, mgrnum, depnum EMP EMP2 = PJempnum, sal, tax EMP la reconstrucción de la relación EMP puede ser obtenida como: EMP = EMP1 (JN empnum) EMP2 porque empnum es una clave de EMP Fragmentación mixta o Hibrida
Fragmentación mixta o hibrida cuando el proceso de partición hace uso de los dos tipos anteriores. La fragmentación mixta puede llevarse a cabo de tres formas diferentes: 1.- Desarrollando primero la fragmentación vertical y posteriormente, aplicando partición horizontal de los fragmentos verticales (denominada partición VH) 2.- Aplicando primero una división horizontal para luego, sobre los fragmentos generados, desarrollar una fragmentación vertical (llamada partición HV) 3.- De forma directa considerando la semántica de las transacciones.
Defina los siguientes conceptos: Nivel conceptual. Tiene esquema conceptual. Describe la estructura de toda la base de datos para una comunidad de usuarios. Oculta los detalles físicos de almacenamiento y trabaja con elementos lógicos como entidades, atributos y relaciones. Transparencia de migración. Oculta que un recurso o un cliente del sistema sean reubicados, lo que permite hacer dichas reubicaciones sin afectar la operación de los usuarios y los servicios. Transparencia de replicación. Oculta la existencia de múltiples ejemplares del mismo recurso. Replicación de mezcla. Permite que varios sitios funcionen en línea o desconectados de manera autónoma, y mezclar más adelante las modificaciones de datos realizadas en un resultado único y uniforme. Replicación transaccional. En este caso se propaga una instantánea inicial de datos a los suscriptores, y después, cuando se efectúan las modificaciones en el publicador, las transacciones individuales se propagan a los suscriptores. Arquitecturas de nada compartido Consiste de diversos procesadores cada uno con su propia memoria y su propia unidad de almacenamiento. Aquí se tienen los clústers de estaciones de trabajo, las computadoras Intel paragón, NCR 3600 y 3700 e IBM SP2 Relaciones base o reales Corresponde al concepto de Tabla es decir una relación autónoma cuya importancia está dada por el diseñador para un uso especifico dentro de una aplicación
Default value Se usa para especificar un valor predeterminado para la columna. Fórmula Es unas propiedades exclusivas y diseñadas para aquellos campos que necesitan alguna función. Transparencia frente a fallos. Nivel externo o de vistas. Tiene varios esquemas externos o vistas de usuario. Cada esquema describe la visión que tiene de la base de datos a un grupo de usuarios, ocultando el resto. Transparencia de recolocación. Oculta que un recurso o cliente del sistema pueda moverse a una ubicación diferente mientras están en uso Transparencia de acceso. Oculta las diferencias entre la representación de los datos y la manera en que los recursos son accedidos. Independencia lógica de datos. Se refiere a la inmunidad de las aplicaciones de usuario a los cambios en la estructura lógica de la base de datos Arquitecturas de memoria compartida Consisten de diversos procesadores los cuales accesan una misma memoria y una misma unidad de almacenamiento (uno o varios discos). Algunos ejemplos de este tipo son las computadoras sequent encoré y los mainframes IBM4090 y Bull DPS8 Relaciones virtuales (Relaciones de Vistas) Una vista es una relación derivada con nombre representada dentro del sistema exclusivamente mediante su definición en término de otras relaciones no posee datos almacenados propios, separados y distinguibles a diferencia de las relaciones Bases, en si una VISTA. Descripción Esta propiedad es exclusiva para el diseñador o bien para el administrador. Grado de fragmentación Cuando se va a fragmentar una base de datos deberíamos sopesar qué grado de fragmentación va a alcanzar, ya que éste será un factor que influirá notablemente en el desarrollo de la ejecución de las consultas. El grado de fragmentación puede variar desde una ausencia de la división, considerando a las relaciones unidades de fragmentación; o bien, fragmentar a un grado en el que cada tupla o atributo forme un fragmento. Identify Si esta opción se marca con un si estaremos indicando que el campo tendrá un número generado automáticamente.
Transparencia de concurrencia. Cuando varias transacciones se ejecuten al mismo tiempo, los resultados de las transacciones no deberán afectarse. La trasparencia de concurrencia se logra si los resultados de todas las transacciones concurrentes son consistentes de manera lógica con los resultados que se habrían obtenido si las transacciones se hubieran ejecutado una por una, en cualquier orden secuencial. Transparencia de persistencia. Oculta si un recurso de software está almacenado en memoria o en disco. Nivel interno. Tiene un esquema interno que describe la estructura física de almacenamiento de base de datos. Emplea un modelo físico de datos y los únicos datos que existen están realmente en este nivel. Transparencia La separación de la semántica de alto nivel de un sistema de los aspectos de bajo nivel relacionados a la implementación del mismo. Transparencia de ubicación. Oculta la localización de los recursos y permite el acceso a los mismos sin la necesidad de conocer su localización. Fragmentación horizontal primaria Consiste del particionamiento en tuplas de una relación global en subconjuntos, donde cada subconjunto puede contener datos que tienen propiedades comunes y se puede definir expresando cada fragmento como una operación de selección sobre la relación global. Scale. Indica el número de dígitos decimales. Fragmentacion vertical Es la subdivisión de atributos en grupos. Los fragmentos se obtienen proyectando la relación global sobre cada grupo. Identify Increment Indica el valor del incremento. Is Row Guid Esta propiedad creara un contenido global y único. Cualquier tabla puede tener este tipo de columna en el momento que se crea necesario por el diseñador. Relaciones instantáneas (Snap Shop) Es también una relación derivada con nombre como una vista pero a diferencia de esta última las instantáneas son reales no virtuales, es decir, están representadas no solo por su definición, en término de otras relaciones con nombre, sino, también por sus propios datos almacenados: (Snap Shop = consulta rápida, corta) Fragmentación horizontal derivada. Se define partiendo de una fragmentación horizontal. En esta operación se requiere de Semi-junta (Semi-Join) el cual nos sirve para derivar las tuplas o registros de dos relaciones.
Precisión Se utiliza para campos numéricos, por aquí se indica la cantidad de dígitos que llevara un número. Arquitectura de disco compartido Consiste de diversos procesadores cada uno de ellos con su memoria local pero compartiendo una misma unidad de almacenamiento (uno o varios). Ejemplo de estas arquitecturas son los clúster de digital, y los modelos IMS/VS data sharing de IBM. Identify Seed Indica el valor inicial para el primer registró. Collation En este campo se debe de especificar a qué base de datos pertenece la tabla que estamos generando se hace por default esta tabla pertenecerá a la base de datos desde donde fue fragmentada. Sgbdd. Es un software que administra y controla las bases de datos distribuidas de manera transparente. Sgbdd paralelo. Este sistema gestor se ejecuta sobre múltiples procesadores y hace uso de múltiples discos, se encuentra diseñado para poder realizar operaciones en paralelo, siempre que sea posible, con la finalidad de mejorar las prestaciones. Transparencia de ubicación. Permite a los usuarios tener acceso a los datos sin que tenga conocimiento de la ubicación de éstos. Se puede conseguir este nivel de transparencia al utilizar los administradores de transacciones distribuidas, los cuales son capaces de determinar la localización de los datos y de emitir acciones a los calendarizadores apropiados, lo cual puede ejecutarse cuando los administradores de transacciones distribuidas poseen acceso a los directorios de localizaciones de los datos. Independencia física de datos. Se refiere al ocultamiento de los detalles sobre las estructuras de almacenamiento a las aplicaciones de usuario. Esto es, la descripción física de datos puede cambiar sin afectar a las aplicaciones de usuario. Por ejemplo, los datos pueden ser movidos de un disco a otro, o la organización de los datos puede cambiar. Diccionario de datos Es el lugar donde se deposita información acerca de todos los datos que forman la base de datos. Es una guía en la que se describe la base de datos y los objetos que la forman. Los diccionarios de datos son el segundo componente del análisis del flujo de datos. En sí mismos los diagramas de flujo de datos no describen por completo el objeto de la investigación. El diccionario de datos proporciona información adicional sobre el sistema. Esta sección analiza que es un diccionario de datos, por qué se necesita en el análisis de flujo de datos y como desarrollarlo. Se utilizará el ejemplo del sistema de contabilidad para describir los diccionarios de datos.
M.D.T.I JACINTO GALO JARQUIN SALINAS