Arquitectura de Los Sistemas de Bases de Datos

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 9

Arquitectura de los sistemas de bases de datos

Martnez Lucia ([email protected]) www.monografias.com 1. 2. 3. 4. Arquitectura ANSI Redundancia Integridad Terminologa en la arquitectura de la bases de datos

Hay tres caractersticas importantes inherentes a los sistemas de bases de datos: la separacin entre los programas de aplicacin y los datos, el manejo de mltiples vistas por parte de los usuarios y el uso de un catlogo para almacenar el esquema de la base de datos. En 1975, el comit ANSI-SPARC (American National Standard Institute - Standards Planning and Requirements Committee) propuso una arquitectura de tres niveles para los sistemas de bases de datos, que resulta muy til a la hora de conseguir estas tres caractersticas. La definicin de un sistema de informacin es la descripcin detallada de la arquitectura del sistema. Las arquitecturas de bases de datos han evolucionado mucho desde sus comienzos, aunque la considerada estndar hoy en da es la descrita por el comit ANSI/X3/SPARC ( Standard Planning and Requirements Committee of the American National Standards Institute on Computers and Information Processing), que data de finales de los aos setenta. Este comit propuso una arquitectura general para DBMSs basada en tres niveles o esquemas: el nivel fsico, o de mquina, el nivel externo, o de usuario, y el nivel conceptual. As mismo describi las interacciones entre estos tres niveles y todos los elementos que conforman cada uno de ellos. Arquitectura ANSI La arquitectura de sistemas de bases de datos de tres esquemas fue aprobado por la ANSI-SPARC (American National Standard Institute - Standards Planning and Requirements Committee) en 1975 como ayuda para conseguir la separacin entre los programas de aplicacin y los datos, el manejo de mltiples vistas por parte de los usuarios y el uso de un catlogo para almacenar el esquema de la base de datos. Nivel interno: Tiene un esquema interno que describe la estructura fsica de almacenamiento de base de datos. Emplea un modelo fsico de datos y los nicos datos que existen estn realmente en este nivel. Nivel conceptual: tiene esquema conceptual. Describe la estructura de toda la base de datos para una comunidad de usuarios. Oculta los detalles fsicos de almacenamiento y trabaja con elementos lgicos como entidades, atributos y relaciones. Nivel externo o de vistas: tiene varios esquemas externos o vistas de usuario. Cada esquema describe la visin que tiene de la base de datos a un grupo de usuarios, ocultando el resto. El objetivo de la arquitectura de tres niveles es el de separar los programas de aplicacin de la base de datos fsica. La mayora de los SGBD no distinguen del todo los tres niveles. Algunos incluyen detalles del nivel fsico en el esquema conceptual. En casi todos los SGBD que se manejan vistas de usuario, los esquemas externos se especifican con el mismo modelo de datos que describe la informacin a nivel conceptual, aunque en algunos se pueden utilizar diferentes modelos de datos en los niveles conceptual y externo. Hay que destacar que los tres esquemas no son ms que descripciones de los mismos datos pero con distintos niveles de abstraccin. Los nicos datos que existen realmente estn a nivel fsico, almacenados en un dispositivo como puede ser un disco. En un SGBD basado en la arquitectura de tres niveles, cada grupo de usuarios hace referencia exclusivamente a su propio esquema externo. Por lo tanto, el SGBD debe transformar cualquier peticin expresada en trminos de un esquema

externo a una peticin expresada en trminos del esquema conceptual, y luego, a una peticin en el esquema interno, que se procesar sobre la base de datos almacenada. Si la peticin es de una obtencin (consulta) de datos, ser preciso modificar el formato de la informacin extrada de la base de datos almacenada, para que coincida con la vista externa del usuario. El proceso de transformar peticiones y resultados de un nivel a otro se denomina correspondencia o transformacin. Estas correspondencias pueden requerir bastante tiempo, por lo que algunos SGBD no cuentan con vistas externas. La arquitectura de tres niveles es til para explicar el concepto de independencia de datos que podemos definir como la capacidad para modificar el esquema en un nivel del sistema sin tener que modificar el esquema del nivel inmediato superior. Se pueden definir dos tipos de independencia de datos: La independencia lgica es la capacidad de modificar el esquema conceptual sin tener que alterar los esquemas externos ni los programas de aplicacin. Se puede modificar el esquema conceptual para ampliar la base de datos o para reducirla. Si, por ejemplo, se reduce la base de datos eliminando una entidad, los esquemas externos que no se refieran a ella no debern verse afectados. La independencia fsica es la capacidad de modificar el esquema interno sin tener que alterar el esquema conceptual (o los externos). Por ejemplo, puede ser necesario reorganizar ciertos ficheros fsicos con el fin de mejorar el rendimiento de las operaciones de consulta o de actualizacin de datos. Dado que la independencia fsica se refiere slo a la separacin entre las aplicaciones y las estructuras fsicas de almacenamiento, es ms fcil de conseguir que la independencia lgica. En los SGBD que tienen la arquitectura de varios niveles es necesario ampliar el catlogo o diccionario, de modo que incluya informacin sobre cmo establecer la correspondencia entre las peticiones de los usuarios y los datos, entre los diversos niveles. El SGBD utiliza una serie de procedimientos adicionales para realizar estas correspondencias haciendo referencia a la informacin de correspondencia que se encuentra en el catlogo. La independencia de datos se consigue porque al modificarse el esquema en algn nivel, el esquema del nivel inmediato superior permanece sin cambios, slo se modifica la correspondencia entre los dos niveles. No es preciso modificar los programas de aplicacin que hacen referencia al esquema del nivel superior. Por lo tanto, la arquitectura de tres niveles puede facilitar la obtencin de la verdadera independencia de datos, tanto fsica como lgica. Sin embargo, los dos niveles de correspondencia implican un gasto extra durante la ejecucin de una consulta o de un programa, lo cual reduce la eficiencia del SGBD. Es por esto que muy pocos SGBD han implementado esta arquitectura completa.

Arquitectura funcional ANSI/X3/SPARC El nivel clave en esta arquitectura, como se puede adivinar, es el conceptual. ste contiene la descripcin de las entidades, relaciones y propiedades de inters para la empresa (UoD), y constituye una plataforma estable desde la que proyectar los distintos esquemas externos, que describen los datos segn los programadores, sobre el esquema interno, que describe los datos segn el sistema fsico. Las posibles proyecciones de datos quedan resumidas en la grafica

Posibles proyecciones de datos Como cabra esperar, en la prctica cotidiana de implementacin de bases de datos, esta arquitectura no es seguida al cien por cien por los DBMSs comerciales. Existen muy pocos productos que contengan aplicaciones para facilitar la fase de anlisis. Por lo general, el nivel conceptual se obvia en los productos comerciales, salvo honrosas excepciones. Lo habitual es que el DBA realice el modelado conceptual usando sus propios recursos, o tal vez asistido por alguna aplicacin de anlisis, ya sea general o especfica. El procesador del esquema conceptual, es por tanto el propio DBA. Los DBMSs s suelen ofrecer facilidades para la creacin de esquemas externos, pero sin pasar por el nivel conceptual. Por supuesto, un DBMS comercial no est obligado a seguir las recomendaciones de estandarizacin de arquitecturas del comit ANSI/X3/SPARC. Por lo que respecta al modelo relacional de bases de datos 11, que ya exista antes del informe de este comit, los fabricantes de RDBMSs se ajustan en mayor o menor medida al modelo terico y, en cuanto a la arquitectura, han intentado seguir las recomendaciones del grupo RDBTG ( Relational Data Base Task Group), parte del comit ANSI/X3/SPARC. El resultado de este grupo fue restar importancia a las arquitecturas y realzar la de los lenguajes e interfaces. Como consecuencia, el lenguaje SQL, est hoy en da totalmente estandarizado, y en cambio encontramos distintas arquitecturas de RDBMS. Sin embargo se pueden distinguir dos tipos generales de arquitecturas para estos sistemas de bases de datos.

Arquitectura separada de RDBMS

Arquitectura integrada de RDBMS El tipo de arquitectura integrada es en general preferible a la arquitectura separada y el ms comn entre los RDBMSs comerciales. De todos modos, la consecuencia de una integracin de los lenguajes de definicin de datos (DDL) y los de manipulacin de datos (DML) en un slo lenguaje (DMDL: Data Manipulation and Description Language) , son a nuestro parecer positivas y negativas. Por un lado, esta integracin resulta muy cmoda para el DBA, puesto que le basta con aprender un solo lenguaje formal para realizar todas las tareas de creacin y mantenimiento de la base de datos. Pero por otro lado, estos sistemas (tanto los separados como los uniformes) fuerzan una proyeccin directa desde el nivel externo al interno, haciendo que el nivel conceptual, el fundamental segn la arquitectura ANSI/X3/SPARC, desaparezca o se implemente en el nivel externo como una vista global externa. Por esta razn algunos DBAs inexpertos tienden a obviar la fase de anlisis, cuando de hecho es la vital para la correcta implementacin de la base de datos. Insistimos en que un buen modelado conceptual es una condicin indispensable para el correcto desarrollo de una base de

datos. Pensamos que lo ideal es usar un DBMS que nos permita desarrollar todas las tareas (de descripcin y de manipulacin) lo ms fcilmente posible, pero no sin antes disponer de todas las herramientas necesarias para un correcto modelado conceptual, estn stas o no incluidas en el DBMS. 1 El enfoque jerrquico Un DBMS jerrquico utiliza jerarquas o rboles para la representacin lgica de los datos. Los archivos son organizados en jerarquas, y normalmente cada uno de ellos se corresponde con una de las entidades de la base de datos. Los rboles jerrquicos se representan de forma invertida, con la raz hacia arriba y las hojas hacia abajo.

Estructura de un rbol jerrquico Un pasos: 1. 2. 3. DBMS jerrquico recorre los distintos nodos de un rbol en un preorden que requiere tres

Visitar la raz. Visitar el hijo ms a la izquierda, si lo hubiera, que no haya sido visitado. Si todos los descendientes del segmento considerado se han visitado, volver a su padre e ir al punto 1. Cada nodo del rbol representa un tipo de registro conceptual, es decir, una entidad. A su vez, cada registro o segmento est constituido por un nmero de campos que los describen las propiedades o atributos de las entidades. Las relaciones entre entidades estn representadas por las ramas. cada departamento es una entidad que mantiene una relacin de uno a muchos con los profesores, que a su vez mantienen una relacin de uno a muchos con los cursos que imparten.

Base de datos jerrquica. Estructura lgica y ejemplo A modo de resumen, enumeramos las siguientes caractersticas de las bases de datos jerrquicas: 1. Los segmentos de un archivo jerrquico estn dispuestos en forma de rbol. 2. Los segmentos estn enlazados mediante relaciones uno a muchos. 3. Cada nodo consta de uno o ms campos.

4. Cada ocurrencia de un registro padre puede tener distinto nmero de ocurrencias de registros hijos. 5. Cuando se elimina un registro padre se deben eliminar todos los registros hijos (integridad de los datos). 6. Todo registro hijo debe tener un nico registro padre excepto la raz. Las reglas de integridad en el modelo jerrquico prcticamente se reducen a la ya mencionada de eliminacin en cadena de arriba a abajo. Las relaciones muchos a muchos no pueden ser implementadas de forma directa. Este modelo no es ms que una extensin del modelo de ficheros. REDUNDANCIA Esta se presenta cuando se repiten innecesariamente datos en los archivos que conforman la base de datos. Esta redundancia aumenta los costes de almacenamiento y acceso y adems puede llevar a inconsistencia de los datos. Si un cliente ha realizado ms de un pedido todos los datos de este cliente estarn repetidos tantas veces como pedidos haya, lo mismo sucede para los artculos esto es opuesto al principal objetivo de una base de datos que consiste en evitar la repeticin de los mismos. Redundancia e inconsistencia de datos: Puesto que los archivos que mantienen almacenada la informacin son creados por diferentes tipos de programas de aplicacin existe la posibilidad de que si no se controla detalladamente el almacenamiento, se pueda originar un duplicado de informacin, es decir que la misma informacin sea ms de una vez en un dispositivo de almacenamiento. Esto aumenta los costos de almacenamiento y acceso a los taos, adems de que puede originar la inconsistencia de los datos-es decir diversas copias de un mismo dato no concuerdan entre s-, por ejemplo: que se actualiza la direccin de un cliente en un archivo y que en otros archivos permanezca la anterior. INTEGRIDAD El objetivo en cuanto a la integridad es proteger la base de datos contra operaciones que introduzcan inconsistencias en los datos, por eso hablamos de integridad en el sentido de correccin, validez o precisin de los datos de la base. El subsistema de integridad de un SGBD debe, por tanto, detectar y corregir, en la medida de lo posible, las operaciones incorrectas. Existen dos tipos de operaciones que pueden atentar contra la integridad de los datos que son las operaciones semnticamente inconsistentes y las interferencias debidas a accesos concurrentes. Seguridad e integridad de los datos Se trata de garantizar la coherencia de los datos, comprobando que slo los usuarios autorizados puedan efectuar las operaciones correctas sobre la base de datos. Esto se consigue mediante: Un control sobre los usuarios que acceden a la base de datos y los tipos de operaciones que estn autorizados a realizar. Este control se llama gestin de autorizaciones, y permite crear o borra usuarios y conceder o retirar derechos a efectuar determinados tipos de operaciones (por ejemplo: crear objetos, borrar objetos, modificar datos, etc. La validacin de las operaciones realizadas con los datos. Este control se hace mediante un conjunto de reglas llamadas restricciones de integridad. Existen varios tipos de restricciones de integridad, como por ejemplo, las restricciones de integridad referencial, que imponen que las modificaciones realizadas sobre algunos datos, obliguen a realizar modificaciones de otros datos con los que estn enlazados (por ejemplo, si se modifica el cdigo de un artculo, se debera modificar ese cdigo en todos los pedidos que soliciten el artculo. Una proteccin de los datos contra los accesos malintencionados y los fallos. Los accesos malintencionado se suelen evitar con la asignacin de palabras de paso (password) a los usuarios, la definicin de vistas, proteccin fsica de los datos (encriptado de los datos). Con respecto a los fallos causados por manipulaciones incorrectas, o accidentes lgicos o fsicos, los S.G.B.D. suelen disponer de utilidades de recuperacin de los datos despus de un fallo. La correcta utilizacin de todas estas operaciones de seguridad e integridad constituye una tarea esencial del Administrador de la base de datos (gestin de usuarios y sus derechos, gestin de vistas y recuperacin despus de un fallo).

Terminologa en la arquitectura de la bases de datos Incoherencia de los datos: Si una operacin de puesta al da mltiple no se ha realizado completamente el estado de la base de datos queda incoherente y puede producir errores importantes Versatilidad para representar la informacin : Ofrecer diferentes visiones de la informacin que se almacena en la BD. Desempeo: Debe dar respuesta en un tiempo adecuado, permitiendo el acceso simultaneo al mismo o diferente datos. Mnima redundancia. Capacidad de acceso: Debe responder en tiempo adecuado a consultas previstas e imprevistas. Simplicidad: Cambios en los requerimientos no deben suponer grandes cambios en el modelo de datos. Seguridad: Capacidad para proteger los datos contra perdidas totales y/o parciales, Contra destruccin causada por el entorno (fuego, inundacin,...) Contra destruccin causada por fallos del sistema Contra accesos no autorizados a la BD Contra accesos indebidos a los datos Privacidad: Debe reservar la informacin de accesos de personas no autorizadas. Afinacin: Organizacin de datos afines para obtener buenos tiempos de respuesta. Integridad: Que los datos sean correctos y se correspondan a los requerimientos del dominio. Integridad frente a fallos Hw o Sw o de acceso concurrente Integridad asegurando que los datos se ajustan a los requerimientos del problema Abstraccin de la informacin. Los usuarios de los SGBD ahorran a los usuarios detalles acerca del almacenamiento fsico de los datos. Da lo mismo si una base de datos ocupa uno o cientos de archivos, este hecho se hace transparente al usuario. As, se definen varios niveles de abstraccin. Independencia. La independencia de los datos consiste en la capacidad de modificar el esquema (fsico o lgico) de una base de datos sin tener que realizar cambios en las aplicaciones que se sirven de ella. Redundancia mnima. Un buen diseo de una base de datos lograr evitar la aparicin de informacin repetida o redundante. De entrada, lo ideal es lograr una redundancia nula; no obstante, en algunos casos la complejidad de los clculos hace necesaria la aparicin de redundancias. Consistencia. En aquellos casos en los que no se ha logrado esta redundancia nula, ser necesario vigilar que aquella informacin que aparece repetida se actualice de forma coherente, es decir, que todos los datos repetidos se actualicen de forma simultnea. Seguridad. La informacin almacenada en una base de datos puede llegar a tener un gran valor. Los SGBD deben garantizar que esta informacin se encuentra asegurada frente a usuarios malintencionados, que intenten leer informacin privilegiada; frente a ataques que deseen manipular o destruir la informacin; o simplemente ante las torpezas de algn usuario autorizado pero despistado. Normalmente, los SGBD disponen de un complejo sistema de permisos a usuarios y grupos de usuarios, que permiten otorgar diversas categoras de permisos. Integridad. Se trata de adoptar las medidas necesarias para garantizar la validez de los datos almacenados. Es decir, se trata de proteger los datos ante fallos de hardware, datos introducidos por usuarios descuidados, o cualquier otra circunstancia capaz de corromper la informacin almacenada. Respaldo y recuperacin. Los SGBD deben proporcionar una forma eficiente de realizar copias de seguridad de la informacin almacenada en ellos, y de restaurar a partir de estas copias los datos que se hayan podido perder. Control de la concurrencia. En la mayora de entornos (excepto quizs el domstico), lo ms habitual es que sean muchas las personas que acceden a una base de datos, bien para

recuperar informacin, bien para almacenarla. Y es tambin frecuente que dichos accesos se realicen de forma simultnea. As pues, un SGBD debe controlar este acceso concurrente a la informacin, que podra derivar en inconsistencias. Tiempo de respuesta. Lgicamente, es deseable minimizar el tiempo que el SGBD tarda en darnos la informacin solicitada y en almacenar los cambios realizados. Inconsistencia Ocurre cuando existe informacin contradictoria o incongruente en la base de datos. Dificultad en el acceso de los datos debido a que los sistemas de procesamiento de archivos generalmente se conforman en distintos tiempos o pocas y ocasionalmente por distintos programadores, el formato de la informacin no es uniforme y se requiere de establecer mtodos de enlace y conversin para combinar datos contenidos en distintos archivos. Aislamiento de los datos, Se refiere a la dificultad de extender las aplicaciones que permitan controlar a la base de datos, como pueden ser, nuevos reportes, utileras y dems debido a la diferencia de formatos en los archivos almacenados. Anomalas en el acceso concurrente Ocurre cuando el sistema es multiusuario y no se establecen los controles adecuados para sincronizar los procesos que afectan a la base de datos. Comnmente se refiere a la poca o nula efectividad de los procedimientos de bloqueo. Problemas de seguridad Se presentan cuando no es posible establecer claves de acceso y resguardo en forma uniforme para todo el sistema, facilitando as el acceso a intrusos. Problemas de integridad Ocurre cuan no existe a travs de todo el sistema procedimientos uniformes de validacin para los datos Archivos de datos Almacenan a la base de datos. Diccionario de datos Almacenan informacin referente a la estructura de la base de datos. ndices Permiten un acceso eficiente (rpido y confiable) a la informacin almacenada en la base de datos Manejador de Archivo Asigna espacio en el medio de almacenamiento para las estructuras que habrn de almacenar la informacin. Manejador de Bases de datos Es la interfase entre los datos de bajo nivel y los programas de aplicaciones. Procesador de consulta Se encarga de traducir las proposiciones de un lenguaje de consultas a instrucciones de bajo nivel. Precompiladotes de DML.- Se encarga de traducir las proposiciones en DML al lenguaje de diseo del manejador (Pascal, C, Ensamblador etc. Compilador de DDL.- Se encarga de convertir las proposiciones en DDL a tablas que contienen metadatos.

Martnez Lucia [email protected] Reyes Yismely PUERTO LA CRUZ, JUNIO 2006

También podría gustarte