BASES DE DATOS DISTRIBUIDAS Universidad Autónoma de Chihuahua Facultad de Medicina y Ciencias Biomédicas Ingeniería Biomédica Bases de datos Fatima Norely Quintana Trejo 309401 7-1
1 25/FEB/2018
INDICE ¿Qué son las bases de datos distribuidas?............................................................................ 3 Características de una base de datos distribuida. ............................................................................. 4 1.
Autonomía Local: .............................................................................................................. 4
2.
No dependencia de un sitio central: .............................................................................. 4
3.
Operación Continua: ........................................................................................................ 4
4.
Independencia con respecto a la localización: ............................................................ 4
5.
Independencia con respecto a la fragmentación: ........................................................ 4
6.
Independencia de réplica: ............................................................................................... 4
Ventajas ............................................................................................................................................ 5 Desventajas: .................................................................................................................................... 5 Niveles de abstracción de las bases de datos distribuidas ............................................... 6 Fragmentación ................................................................................................................................ 7 Comparación entre las bases de datos centralizados y la base de datos distribuida 8 Conclusión:...................................................................................................................................... 9 Referencias: ..................................................................................................................................... 9
2
¿Qué son las bases de datos distribuidas? Son un grupo de datos que pertenecen a un sistema pero a su vez esta repartido entre ordenadores de una misma red, ya sea a nivel local o cada uno en una diferente localización geográfica, cada sitio en la red es autónomo en sus capacidades de procesamiento y es capaz de realizar operaciones locales y en cada uno de estos ordenadores debe estar ejecutándose una aplicación a nivel global que permita la consulta de todos los datos como si se tratase de uno solo. Una Base de Datos Distribuida (BDD) es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones, los cuales tienen la capacidad de procesamiento autónomo lo cual indica que puede realizar operaciones locales o distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red exactamente como si los datos estuvieran
Figura 1: base de datos distribuida
3
Características de una base de datos distribuida. 1. Autonomía Local: Los sitios distribuido deben ser autónomos, es decir que todas las operaciones en un sitio dado se controlan en ese sitio. 2. No dependencia de un sitio central: No debe de haber dependencia de un sitio central para obtener un servicio. 3. Operación Continua: Nunca debería apagarse para que se pueda realizar alguna función, como añadir un nuevo sitio. 4. Independencia con respecto a la localización: No debe de ser necesario que los usuarios sepan dónde están almacenados físicamente los datos, sino que más el usuario lo debe de ver como si solo existiera un sitio local 5. Independencia con respecto a la fragmentación: La fragmentación es deseable por razones de desempeño, los datos, pueden almacenarse en la localidad donde se utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean sólo locales y se reduzca el tráfico en la red. 6. Independencia de réplica: Si una relación dada (es decir, un fragmento dado de una relación) se puede presentar en el nivel físico mediante varias copias almacenadas o réplicas, en muchos sitios distintos.
Figura 2. Características de bases de datos distribuidas
4
Ventajas 1. Mejora de la fiabilidad y disponibilidad. Al mantener los datos muchas veces replicados en varias localizaciones se tiene la ventaja de poder tener el sistema operativo aun cuando se caiga uno de los nodos. El sistema no cae por completo con lo cual se aumenta la fiabilidad y está disponible durante más tiempo mejorando su disponibilidad. En un sistema centralizado la caída del nodo único implica una pérdida del servicio. 2. Mejora en la escalabilidad. En caso de necesidad se pueden ir añadiendo nuevos nodos al sistema con una repercusión mínima sobre el mismo. 3. Aumenta la transparencia. Es posible reubicar datos, reubicar nodos, replicar datos, etc. sin que los usuarios tengan constancia de ello. Además todas estas operaciones se pueden realizar haciendo que el acceso siga siendo eficiente y efectivo. 4. Mejora del rendimiento. Al repartir la carga de trabajo entre diferentes nodos el sistema gana en rendimiento puesto que no concentra el trabajo en un punto único 5. Crecimiento. Es más fácil acomodar el incremento del tamaño en un sistema distribuido, porque la expansión se lleva a cabo añadiendo poder de procesamiento y almacenamiento en la red, al añadir un nuevo nodo. 6. Flexibilidad. Permite acceso local y remoto de forma transparente. . Desventajas: 1. El catálogo es más complejo dado que su gestión se complica. Además hay que mantener réplicas del mismo lo que implica una sincronización entre las mismas. 2. Control de la concurrencia. Aunque se utilicen bloqueos para evitar la concurrencia, el control del mismo al tener muchos nodos en funcionamiento complica su gestión. 3. Las actualizaciones hay que replicarlas en todos los nodos implicados. En el caso que un nodo no esté disponible el sistema tiene que tener constancia de ello y tenerlo en cuenta. Muchas veces estos sistemas funcionan con un sistema de copia primaria y luego una serie de copias secundarias que se irán actualizando posteriormente.
Figura 3. Ventajas Bases de datos distribuidas
5
Niveles de abstracción de las bases de datos distribuidas 1. Nivel Interno o físico. En este nivel físico se describe cómo estarán almacenados los datos en la base de datos. Para ello se apoya en un modelo físico de datos. 2. Nivel Conceptual. En este nivel se describe la estructura “conceptual” que tendrá la base de datos sin tener en cuenta los aspectos físicos de almacenamiento que se contemplan en la capa anterior. La distribución de la información en este nivel se fija en entidades, relaciones y atributos. 3. Nivel Externo o de usuario. En este nivel se hace hincapié en que cada usuario tiene una visión de la base de datos distinta. Existen distintas vistas o esquemas externos de usuario.
Figura 4. Niveles de abstracción de una base de datos distribuida
El objetivo de esta estructuración a tres niveles es independizar los programas de la base de datos física. De esa manera el desarrollo de aplicaciones es más rápido y normalizado
6
Fragmentación
La fragmentación es una característica de servidor de bases de datos que le permite controlar dónde se almacenan los datos a nivel de tabla. La fragmentación le permite definir grupos de filas o claves de índice dentro de una tabla, según algún algoritmo o esquema. Los fragmentos son porciones lógicas de relaciones globales que pueden estar físicamente ubicadas en uno o varios nodos dela red. La fragmentación básicamente se puede hacer de dos formas: 1. Fragmentación Horizontal. Selecciona registros completos de una relación 2. Fragmentación Vertical. Selecciona columnas completas de una relación
Figura 5. Tabla normal
Figura 6. Tabla Fragmentada Horizontal
Figura 7. Tabla Fragmentada Vertical
7
Comparación entre las bases de datos centralizados y la base de datos distribuida
CENTRALIZADO Control centralizado: un solo DBA
DISTRIBUIDO Control jerárquico: DBA global y DBA local
Independencia de Datos: Organización de los datos es transparente para el programador
Reducción de redundancia: Una sola copia de datos que se comparta
Estructuras físicas complejas para accesos eficientes
No hay estructuras intersitios. Uso de optimización global para reducir transferencia de datos
Seguridad
Problemas de seguridad intrínsecos
Transparencia en la Distribución: Localización de los datos es un aspecto adicional de independencia de datos Replicación de Datos: Copias múltiples de datos que incrementa la localidad y la disponibilidad de datos
Figura 6. Comparación de tipos de bases de datos
8
Conclusión: Al terminar este trabajo, pude darme cuenta que la implementación de una bases de datos distribuidas resulta importante ya que se puede distribuir y replicar los datos en diferentes sitios cuando ciertos sitios locales tienen capacidades de almacenamiento y procesamiento limitadas, también que cuentan con la ventaja de poder integrarse a otros sitios remotos con mejores recursos por medio de una red de comunicación. También pude darme cuenta que son muy importantes para mantener siempre un sitio activo ya que se evita que la información se caiga por falta de un servidor ya que, existirán otros servidores en otras partes del mundo que contendrán parte de esa información permitiendo que nuestra base de datos continua operando sin que el usuario note que la información viene de otro servidor.
Referencias: 1. GUTIERREZ. (2017). BASES DE DATOS DISTRIBUIDAS. Febrero 20,2019, de S.N Sitio web: http://cursos.aiu.edu/base%20de%20datos%20distribuidas/pdf/tema%201.pdf. 2. MORENO,J.. (2017). Análisis detallado de la distribución de BD. Febrero 20,2019, de myfpschool Sitio web: http://myfpschool.com/5-analisis-detallado-de-la-distribucion-debd/ 3. TOLEDO,V.. (2017). Bases de Datos Distribuidas. Febrero 20,2019, de S.N Sitio web: https://iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf 4. Alfaro Abreus, Yisel, TIPOS DE FRAGMENTACIÓN EN BASES DE DATOS DISTRIBUIDAS. Ingeniería Industrial 2006, [Fecha de consulta: 21 de febrero de 2019 http://www.redalyc.org/articulo.oa?id=360433560015> ISSN 0258-5960. 5.
9