Introduccion A Bases de Datos Tema 1

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 6

Tema1: DATABASES

1. Introducción a la informática:
Informática = Computer science.

Definición de Informática = Información + automática.


Información automática:

 Gran Almacenamiento.
 Gran capacidad de cálculo.
 Comunicación a través de redes (rápida y eficiente).

1.1. Almacenamiento de la información (en discos, memorias flash o DVD)

Niveles de almacenamiento:

Almacenamiento primario: Aquellos medios sobre los que la CPU del ordenador puede acceder
directamente y, por tanto, más rápidamente. Son: memoria principal o memoria RAM y las memorias
caché de primer y segundo nivel, más pequeñas, pero más rápidas.

Almacenamiento secundario: Dispositivos con más capacidad de memoria, pero más lentos.
(Discos duros, cintas). Para acceder a los datos la CPU debe copiarlos previamente en el
almacenamiento primario.

La agrupación de pistas de los discos  Cilindro. Y este se subdivide en bloques o sectores (de entre 512
y 4096 bytes) de un tamaño fijo.

Buffer  (área reservada de la memoria principal, donde se copian los bloques cuando hay orden de
lectura).

Discos: son dispositivos de acceso aleatorio ya que podemos acceder a cualquier bloque de información
solamente conociendo su dirección física en el disco, sin necesidad de recorrerlos todos.

Almacenamiento intermedio: (Sistemas de bases de datos). Mientras la CPU procesa datos de


un buffer puede leer o escribir en otro para agilizar la transferencia.

1.2. Sistemas de Archivos:

Registros: (Son colecciones de valores o elementos de información relacionados, cada uno de


los cuales corresponde a un campo del registro.)

Por ejemplo, un registro de alumno incluiría campos como el nombre (char), fecha de
nacimiento (tipo fecha) o teléfono (int), cuyos valores para cada alumno forman cada registro.
A su vez, cada campo tiene un tipo de dato que especifica el tipo de valores que puede tomar.

Archivos (fichero informático): un conjunto de registros, grabados sobre un soporte que


pueda ser leído por el ordenador.
Archivos de registro de longitud fija  más fáciles de manipular por parte de los programas, pero
desperdician espacio en disco.
Archivos de registro de longitud variable  los programas son más complejos ya que los registros no
ocupan posiciones fijas, si no que dependen del valor de cada campo.

Los ficheros son importantes porque son la unidad básica de información utilizada por cualquier
programa, incluidos los sistemas gestores de bases de datos.

1.1.2. Organización de archivos (forma en que se colocan los datos de los registros de cada
fichero sobre el soporte durante la grabación):

Hay dos tipos:

Secuencial (se almacena en orden de llegada) como una cinta de video – Inserción: rápida,
Búsqueda de datos: Complicada, Borrado: eficiente, Modificación: Complicada

Relativa/indexada (se almacena según un orden, por ejemplo, alfabético) como un CD, no
tienes que ver todo el contenido para ver algo en específico - Lectura: muy eficiente,
Búsquedas: Rápidas, Inserción: costosa por mantener el orden, Modificación: eficiente si el
registro no es de tamaño variable

Dispersión: se elige un campo llamado campo de dispersión. Al valor de ese campo se le aplica
una función llamada función de aleatorización o de dispersión que, tomando como entrada
dicho valor, devuelve un número que será la dirección del bloque de disco en que se
almacenará el registro.

Las técnicas de dispersión o hashing se utilizan para acelerar el acceso a los registros cuando
se busca un único registro según el llamado campo de dispersión. Normalmente este campo
suele ser el campo clave.

1.2.2. Métodos de acceso a los registros:


El método de acceso se refiere al procedimiento seguido para acceder a uno o más registros
determinados de un fichero.

Una de las operaciones más costosas y frecuentes es la búsqueda de información, por lo cual se usan
sistemas que permiten mejorar su eficiencia. Estos sistemas se basan en el uso de índices, que son
estructuras de datos que relacionan valores de un campo (normalmente el campo clave) de un registro
con su dirección de memoria.

En el caso de ficheros se suele usar un campo como campo de indización. Los valores de ese campo
junto con las direcciones de los bloques en los que se encuentra se usan para crear el índice y además
este estará ordenado según el campo de indización.

Búsquedas  más rápidas al poder usar la técnica de búsqueda binaria.

Operaciones  mucho más rápidas al ser el archivo de índices mucho más pequeño que el de registros.

Hay varios tipos de índices:

Índices primarios: son índices sobre el campo clave de ordenación del fichero (campos cuyo
valor no se repite en ningún otro registro) en ficheros ordenados físicamente por un campo.

Índices de agrupamiento: en el caso en que el campo de ordenación no sea el campo clave, es


decir, que pueda haber valores repetidos, hablamos de índice de agrupamiento.
Índices secundarios: cuando el campo de indización no es el de ordenación hablamos de índice
secundario.

Los árboles ayudan a la búsqueda más rápida de los datos. (Arboles B o B+)

Un árbol B es similar a un árbol B+ con la diferencia de que mientras el árbol B+ permite la
repetición de claves en nodos internos hasta llegar a los nodos hoja, el árbol B no permite la
repetición.

1.3.Sistemas de bases de datos:


Las primeras empresas y organizaciones empezaron a usar sistemas informáticos
trabajaban con sistemas de ficheros. Es decir que trabajaban con programas que
manejaban información almacenada en ficheros. Y cada equipo se encargaba de su
mantenimiento (problemas de seguridad que hay que mejorar,….).Si cada empresa tiene
su propio sistema de ficheros es muy complicado al no ser un standard que todo el mundo
entiende.

Problemas del uso de sistemas de ficheros:

Separación y aislamiento de los datos: Cuando los datos se separan en distintos ficheros es
más complicado acceder a ellos, ya que el programador de aplicaciones debe sincronizar el
procesamiento de los distintos ficheros implicados para asegurar que se extraen los datos
correctos.

Duplicación de datos: La redundancia de datos existente en los sistemas de ficheros hace que
se desperdicie espacio de almacenamiento. Se produce una inconsistencia cuando copias de
los mismos datos no coinciden. (Ocupa espacio y las copias no se actualizan al modificar).

Dependencia de Datos:

Formatos de ficheros incompatibles

Consultas fijas y proliferación de programas de aplicación

Control de concurrencia: varios acceden a la vez a un fichero y puede que uno lo esté
modificando. Entonces uno sale perjudicado.

Autorizaciones:

Catálogo:

Definición de Base de datos: un conjunto de datos almacenados entre los que existen
relaciones lógicas y ha sido diseñada para satisfacer los requerimientos de información de una
empresa u organización. También es un conjunto de datos organizados en estructuras que se
definen una sola vez y que se utilizan al mismo tiempo por muchos equipos y usuarios.

Metadatos: Datos de los datos.


1.3.1. Arquitectura de sistemas de bases de datos: El objetivo de la arquitectura de tres
niveles es el de separar en niveles de abstracción el esquema de una base de datos.

Nivel interno:

(faltan apuntes del tema 1)

Tipos de bases de datos EXAMEN

Bases de datos jerárquicas (DBMS Hierarchical Databases):

A la hora de dar una definición de bases de datos jerárquicas, nos remitimos a su propio nombre; son
bases de datos que almacenan la información en una estructura jerarquizada, Una base de datos
jerárquica está organizada en forma de pirámide, como las ramas de un árbol que se extienden hacia
abajo. Uno de los principales objetivos de las bases de datos jerárquicas es gestionar grandes volúmenes
de datos. Han existido durante mucho tiempo. Es uno de los más antiguos métodos de organización y
almacenamiento de datos.

La ventaja de las bases de datos jerárquicas es que se puede acceder a ellas


y actualizado rápidamente porque la estructura en forma de árbol y
las relaciones entre registros se definen de antemano. Sin embargo, esto
característica es una espada de dos filos. La desventaja de este tipo de
La estructura de la base de datos es que cada niño en el árbol puede tener solo un
padre, y las relaciones o vínculos entre los niños no son
permitidos, incluso si tienen sentido desde un punto de vista lógico.
Las bases de datos jerárquicas son tan rígidas en su diseño que agregar un nuevo
campo o registro requiere que se redefina toda la base de datos.

Bases de datos de red (network databases): son similares a las bases de datos jerárquicas por también
tener una estructura jerárquica. Hay algunas diferencias clave,
sin embargo. En lugar de parecer un árbol al revés, una red
La base de datos se parece más a una telaraña o una red interconectada de
registros. En las bases de datos de la red, los niños se denominan miembros y
los padres se llaman dueños. La diferencia más importante es que
cada hijo o miembro puede tener más de un padre (o propietario).
Al igual que las bases de datos jerárquicas, las bases de datos de red se utilizan principalmente
en computadoras mainframe. Dado que se pueden hacer más conexiones
entre diferentes tipos de datos, se consideran bases de datos de red
más flexible. Sin embargo, se deben considerar dos limitaciones cuando
utilizando este tipo de base de datos. Similar a las bases de datos jerárquicas,
Las bases de datos de la red deben definirse de antemano. También hay un límite
al número de conexiones que se pueden hacer entre registros.

Bases de datos relacionales (relational databases): la relación entre archivos de datos es


relacional, no jerárquico. Bases de datos jerárquicas y de red
requieren que el usuario pase a través de una jerarquía para acceder
datos necesarios. Las bases de datos relacionales conectan datos en diferentes archivos
utilizando elementos de datos comunes o un campo clave. Datos en relacional
Las bases de datos se almacenan en diferentes tablas, cada una con un campo clave que
identifica de forma única cada fila. Las bases de datos relacionales son más flexibles
que las estructuras de base de datos jerárquica o de red. En
bases de datos relacionales, tablas o archivos llenos de datos son
llamadas relaciones, tuplas designa una fila o registro, y las columnas son
referidos como atributos o campos.
Las bases de datos relacionales funcionan según el principio de que cada tabla tiene una clave
campo que identifica de forma única cada fila, y que estos campos clave pueden
utilizarse para conectar una tabla de datos a otra. Así, una mesa
podría tener una fila que consta de un número de cuenta de cliente como clave
campo junto con la dirección y el número de teléfono. El cliente
El número de cuenta en esta tabla podría estar vinculado a otra tabla de datos.
que también incluye el número de cuenta del cliente (un campo clave), pero en este
caso, contiene información sobre devoluciones de productos, incluido un artículo
número (otro campo clave). Este campo clave se puede vincular a otro
tabla que contiene números de artículo y otra información de producto como
como ubicación de producción, color, persona de control de calidad y otros datos.
Por lo tanto, utilizando esta base de datos, la información del cliente se puede vincular
a información específica del producto.
La base de datos relacional se ha vuelto bastante popular para dos
razones. Primero, las bases de datos relacionales se pueden utilizar con poca o ninguna
formación. En segundo lugar, las entradas de la base de datos se pueden modificar sin
redefiniendo toda la estructura. La desventaja de usar un relacional
base de datos es que la búsqueda de datos puede llevar más tiempo que si otros
se utilizan métodos.

Bases de datos orientadas a objetos:


Capaz de manejar muchos tipos de datos nuevos, incluidos gráficos,
fotografías, audio y video, las bases de datos orientadas a objetos representan
un avance significativo sobre sus otros primos de base de datos. Jerárquico
y las bases de datos de la red están diseñadas para manejar datos estructurados;
es decir, datos que encajan perfectamente en campos, filas y columnas. Son
útil para manejar pequeños fragmentos de información como nombres,
direcciones, códigos postales, números de producto y cualquier tipo de estadística o
número que se pueda imaginar. Por otro lado, una orientada a objetos
La base de datos se puede utilizar para almacenar datos de una variedad de fuentes de medios,
como fotografías y texto, y producir trabajo, como salida, en un
formato multimedia.
Las bases de datos orientadas a objetos utilizan trozos de software pequeños y reutilizables
llamados objetos. Los propios objetos se almacenan en la base de datos orientada a objetos. Cada
objeto consta de dos elementos: 1) una pieza
de datos (por ejemplo, sonido, video, texto o gráficos), y 2) el
instrucciones, o programas de software llamados métodos, para saber qué hacer
con los datos. La segunda parte de esta definición requiere un poco más
explicación. Las instrucciones contenidas en el objeto se utilizan para
hacer algo con los datos del objeto. Por ejemplo, puntajes de pruebas
estaría dentro del objeto al igual que las instrucciones para calcular
puntaje promedio de la prueba.
Las bases de datos orientadas a objetos tienen dos desventajas. Primero, son
más costoso de desarrollar. En segundo lugar, la mayoría de las organizaciones son reacias a
abandonar o convertir de aquellas bases de datos que ya tienen
invertido dinero en el desarrollo y la implementación. sin embargo, el
Los beneficios de las bases de datos orientadas a objetos son convincentes. La habilidad para
mezclar y combinar objetos reutilizables proporciona multimedia increíble
capacidad. Las organizaciones de salud, por ejemplo, pueden almacenar, rastrear,
y recordar tomografías computarizadas, radiografías, electrocardiogramas y muchos otros
formas de datos cruciales.
Usuarios de los SGBD:
Administradores:
Trabajan en el nivel de abstracción físico relacionado con el almacenamiento.
Distinguimos los administradores del propio sistema gestor encargados de la instalación y configuración
del sistema, del control de acceso a los recursos, de la seguridad y de la monitorización y optimización
del sistema gestor.
Por su parte, los administradores de bases de datos se encargan del diseño físico de la misma,
implementación y mantenimiento de la base de datos.

Diseñadores de la base de datos:


Realizan el diseño lógico de la base de datos, debiendo identificar los datos, las relaciones entre datos y
las restricciones sobre los datos y sus relaciones. El diseñador de la base de datos debe tener un
profundo conocimiento de los datos de la empresa y también debe conocer sus reglas de negocio. Las
reglas de negocio describen las características principales de los datos tal y como los ve la empresa. Para
obtener un buen resultado, el diseñador de la base de datos debe implicar en el desarrollo del modelo
de datos a todos los usuarios de la base de datos, tan pronto como sea posible. El diseño lógico de la
base de datos es independiente del SGBD concreto que se vaya a utilizar, es independiente de los
programas de aplicación, de los lenguajes de programación y de cualquier otra consideración física.

Programadores:
Tanto de aplicaciones que, mediante API de lenguajes de programación interactúan con las bases de
datos como de objetos de la base de datos, como rutinas almacenadas o disparadores. Estas
aplicaciones servirán a los usuarios finales para, de una forma amigable, poder consultar datos,
insertarlos, actualizarlos y eliminarlos.

Usuarios finales:
Trabajan en el nivel externo mediante vistas o porciones de las bases de datos. Son clientes de las bases
de datos que hacen uso de ellas sin conocer en absoluto su funcionamiento y organización interna. Son
personas con pocos o nulos conocimientos de informática.

También podría gustarte