Tema5: Organización de Los Datos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 52

Tema 5: Organizacin de los Datos

Informtica
Departamento de Informtica
Israel Gonzlez Carrasco
([email protected])
Mara Beln Ruiz Mezcua
([email protected])

Contenido
1. Objetivos.
2. Introduccin.
3. Tipos de Organizacin.
4. Tratamiento de Informacin no
Estructurada.
5. Tratamiento de Informacin Estructurada.

Tema 5: Organizacin de los Datos

Objetivos
Comprender la necesidad y utilidad de organizar y
estructurar la informacin para almacenarla y
recuperarla.
Reconocer los diferentes tipos de datos, bases de datos y
sistemas de recuperacin con las que se pueden manejar
la informacin.
Ser capaces de entender y manejar una base de datos en
Microsoft Access a nivel usuario.

Tema 5: Organizacin de los Datos

Introduccin
Una organizacin de datos es una estructura fsica-lgica
que permite realizar operaciones computacionales
(editar, guardar, actualizar, etc.) sobre un contenido de
informacin.
Estructura fsica; describe la manera fsica (bytes) de
almacenar los datos en un soporte (como se almacenan los
datos en el soporte).
Estructura lgica; describe la manera lgica de representar
la informacin a los usuarios (como ve el usuario la
informacin).

Tema 5: Organizacin de los Datos

Introduccin (II)
Representacin lgica

Tema 5: Organizacin de los Datos

Almacenamiento fsico

Tipos de Organizacin
Organizacin no estructurada

Utiliza informacin no estructurada contenida en libros, artculos


informes.
Es tan grande la variedad de informacin que es muy difcil saber
que es lo que nos va a interesar en el caso de una bsqueda y
seria imposible determinar un campo por cada tema.

Organizacin estructurada

Utiliza informacin estructurada o datos definidos (facturas,


recibos de clientes, etc.).
El diseo de una buena base de datos deber reconocer con
mtodo y exactitud los datos que se van a utilizar, antes de su
implementacin.
Esta organizada mediante campos.

Tema 5: Organizacin de los Datos

Tipos de Organizacin (II)


Tratamiento de datos formateados (organizados).

Sistemas orientados a proceso.


Sistemas orientados a datos.

Tratamiento de datos no formateados (No


organizados)

Documentos.

Sistemas de Recuperacin de Informacin.

Sistema de Gestin de Datos Relacionales.

Sistemas de Gestin de Bases de Datos Documentales.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


ndice

Sistemas orientados al proceso.


Sistemas orientados a los datos.

Bases de Datos Relacionales (BDR).


Sistema Gestor de Bases de Datos Relacionales (SGBDR).

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados al proceso

Son los sistemas tradicionales.


En ellos se pone ms nfasis en los tratamientos que en
los datos.
Los datos se encuentran repetidos en diversos ficheros
tratados de forma independiente por cada aplicacin.

En cada Programa hace falta definir con que datos trabaja


y en que fichero estn.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados al proceso (II)

10

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados al proceso (III)

Ejemplo de Sistemas orientados al proceso.


Departamento de RRHH utiliza el fichero Seleccin.
Campos:

DNI

Fecha Ingreso

Nombre

Formacin

Direccin

Especialidad

Puesto

Nivel de conocimiento

En una reunin posterior se decide informatizar la


Nmina de los trabajadores.
Qu soluciones puede adoptar la empresa?

11

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados al proceso (IV)

Posibles Soluciones:

Solucin 1:

Solucin 2:

Modificar el fichero Seleccin existente para que puedan


usarlo ambas aplicaciones.

Solucin 3:

12

Crear una aplicacin para la gestin de las Nminas (con su


fichero correspondiente) independiente de la de Seleccin.

Crear un nuevo fichero que contenga informacin especfica


de la aplicacin de gestin de las Nminas.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados al proceso (V)

Comentarios:

Solucin 1:

Solucin 2:

Implica modificar la aplicacin de Seleccin.

Solucin 3:

13

Esta solucin producir datos duplicados.


Conjuntos de datos iguales para aplicaciones distintas

En el nuevo fichero hay que incluir enlaces al primer fichero


para usar los datos comunes.
Al existir dos ficheros el proceso es ms lento.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados al proceso (VI)

Problemas:

14

Dificultad de mantenimiento.
Excesiva dependencia del soporte fsico.
Dependencia de los datos respecto de los programas.
Dificultad para montar sistemas de informacin orientados
a la toma de decisiones.
Los ficheros estn muy orientados a cada aplicacin.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos

Tratan de resolver los problemas del enfoque tradicional


(Sistemas orientados al proceso).

Se fundamentan en la utilizacin de una Base de Datos


que sustituye todos los ficheros por una nica coleccin
de datos que puede ser utilizada por todas las
aplicaciones.

15

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (II)

Datos 1

Resultado A

Datos 2

.
.
.

Proceso de
Almacenamiento

Datos n

16

Tema 5: Organizacin de los Datos

Proceso de
Tratamiento

Base de Datos

Resultado B

Resultado C

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (III)

Conceptos Bsicos:

Bases de Datos

Sistema Gestor de Bases de Datos (SGBD).

17

Una base de datos es un conjunto de informacin


estructurada en registros y almacenada en un soporte
electrnico legible desde un ordenador.
Cada registro constituye una unidad autnoma de informacin
que puede estar a su vez estructurada en diferentes campos o
tipos de datos que se recogen en dicha base de datos.
Surgieron para sistematizar el tratamiento de grandes
volmenes de informacin con alto grado de homogeneidad y
compartida por varios usuarios.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (IV)

Datos 1

Fichero

Datos 2

.
.
.

SGBD
(actualizacin)

Datos n

18

Tema 5: Organizacin de los Datos

SGBD
(recuperacin)

Base de Datos

Resultado

Aplicacin

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (V)

Base de datos:

19

Coleccin o depsito de datos integrados.


Con redundancia controlada.
Su estructura refleja las interrelaciones y restricciones del
mundo real.
Los datos son independientes de la aplicacin o del usuario.
Los datos tendrn definicin y descripcin nicas (y
almacenada con ellos).
Los procedimientos que involucre tendrn que preservar su
integridad, respetando adems unas normas de
disponibilidad y confidencialidad.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (VI)

Conjunto coordinado de herramientas que proporciona


los medios necesarios para interaccionar con la BD a
todos los niveles.
Herramientas: programas, procedimientos, lenguajes, etc.
Interaccionar con la base: describir, recuperar y manipular
datos almacenados en la base, preservando su integridad,
confidencialidad, y seguridad.
A todos los niveles: usuario, programador, analista, etc.

Funciones esenciales de un SGBD:


Descripcin.
Manipulacin.
Utilizacin.

20

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (VII)

Un SGBD debe disponer de lenguajes y procedimientos que


posibiliten la interaccin con la BD.

LDD (Lenguaje de Definicin de Datos).

LMD (Lenguaje de Manipulacin de Datos).

21

Permite la ejecucin de operaciones de recuperacin y


actualizacin sobre un conjunto de registros (identificado a travs
de un criterio de seleccin), indicando las estructuras externas
sobre las que se acta.

LCD (Lenguaje de Control de Datos).

Para la definicin de las estructuras de datos a todos los niveles


(externo, conceptual e interno).

El administrador de la BD utiliza este lenguaje para especificar los


aspectos de seguridad fsica as como de proteccin frente a
accesos no permitidos.

Procedimientos de administracin: copias de seguridad,


estadsticas, carga de datos, ...

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (VIII)

Niveles de Abstraccin en una BD.


En un sistema de almacenamiento de datos, se distinguen
siempre los niveles lgico (dato-usuario) y fsico (datosoporte).
Esta separacin permite solventar varias problemticas.
La idea de Base de Datos permite abstraer an ms,
apareciendo un tercer nivel: lgico global (ana los niveles
lgicos de todos los usuarios).
Este nivel contendr (esquema lgico global):

22

Descripcin de datos e interrelaciones entre ellos


Restricciones de integridad y confidencialidad

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (IX)

Niveles de Abstraccin en un SGBD:

Arquitectura a tres niveles: Interno, Conceptual y Externo.


Nivel Interno:

Nivel Conceptual:

Proporciona un eslabn intermedio entre la visin de la BD que se


ofrece al usuario y el nivel de almacenamiento fsico.
Es una representacin del contenido total de la BD.

Nivel Externo:

23

Es el nivel ms cercano a la mquina.


Describe cmo y dnde se almacena un conjunto determinado de
datos.

Es el nivel ms cercano al usuario.


Cada usuario est interesado en un subconjunto concreto de la
Base de Datos Global.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (X)
NIVELES DE UN SGBD
ESQUEMAS
EXTERNOS

Usuario Aplicacin 1

Usuario Aplicacin 2

Usuario Aplicacin 3

Usuario Aplicacin n

SISTEMA GESTOR DE BASE DE


DATOS

ESQUEMA
CONCEPTUAL

Base de Datos

ESQUEMA FISICO

24

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistemas orientados a los datos (XI)

Existen varios modelos de SGBD:

Definen como se definen las estructuras y operaciones que se


permiten en ellas.

Modelo Relacional:

Basado en la nocin matemtica de Relacin.


Propuesto por Codd.
El mas extendido en la actualidad
Ejemplos de SGBD relacionales comerciales:

25

Microsoft Access.
Oracle.
Microsoft SQL Server.
BD2.
MySQL.
Informix.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR)

Coleccin o depsito de datos integrados, almacenados


en soporte secundario cuyos datos son compartidos por
diferentes usuarios y aplicaciones, deben mantenerse
independientes de ellos.
Los procedimientos de actualizacin y recuperacin
facilitarn el conjunto de los datos.
Una base de datos relacional permite almacenar,
relacionar y acceder a la informacin de la forma ms
estructurada posible.

La informacin aparece estructurada en campos de


longitud fija.
26

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR) (II)

Es un modelo de datos extremadamente simple y claro,


que tambin ha resultado potente para la mayor parte de
las aplicaciones de BDs.

Sus principales caractersticas son:

27

Independencia de datos y programas.


Integracin de diferentes aplicaciones.
Escasa o nula redundancia.
Acceso mltiple.
Seguridad.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Terminologa
Los elementos ms importantes de las bases de datos relacionales son
las tablas (relaciones), asociaciones entre ellas (interrelaciones), filas
(tuplas), columnas (atributos o campos) y consultas.
Una relacin es una coleccin de datos acerca de un tema en particular.
Los datos de la relacin se representan en formato tabular en tuplas
(columnas y filas).
Agrupan un conjunto de atributos o campos.

Atributo 1
XXXXXXXX
XXXXXXXX
XXXXXXXX
XXXXXXXX
XXXXXXXX

28

Atributo 2
XXXXXXXX
XXXXXXXX
XXXXXXXX
XXXXXXXX
XXXXXXXX

Tema 5: Organizacin de los Datos

.....................
XXXXXXXX
XXXXXXXX
XXXXXXXX
XXXXXXXX
XXXXXXXX

Atributo n
XXXXXXXX
XXXXXXXX
XXXXXXXX
XXXXXXXX
XXXXXXXX

Tupla 1
Tupla 2
.
.
Tupla n

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Terminologa (II)

Una consulta son preguntas acerca de los datos en su


base de datos.

Los datos fuente pueden provenir de una o varias tablas.


La consulta rene la informacin solicitada.
No almacenan la informacin en un fichero.

Comparacin de la terminologa
RELACIN
TUPLA
ATRIBUTO
GRADO
CARDINALIDAD
29

Tema 5: Organizacin de los Datos

TABLA
FILA
COLUMNA
N. DE COLUMNAS
N. DE FILAS

FICHERO
REGISTRO
CAMPO
N. DE CAMPOS
N. DE REGISTROS

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Claves

Clave de una relacin:

Una clave candidata de una relacin es un conjunto de atributos


que identifican unvoca y mnimamente cada tupla de la misma.

Tipos de Claves:

Clave primaria (PRIMARY KEY o PK) permite declarar un atributo o


conjunto de atributos como la clave primaria de una tabla.

30

Conjunto no vaco de atributos que identifican unvoca y


mnimamente cada tupla.
Los valores de la clave primaria han de ser distintos y siempre
tiene que tener algn valor
Ejemplo: La tabla Alumno est identificada por el atributo NIA
(clave primaria).

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Claves (II)

Tipos de Clave:
Clave de unicidad (UNIQUE) nos permite definir claves
alternativas (que pueden ser en algn momento PRIMARY
KEY).
Clave ajena (FOREGEIN KEY o FK) es una clave que
referencia una clave de una tabla con otra tabla (crear una
interrelacin).

31

Se denomina clave ajena de una relacin R2 a un conjunto de


atributos cuyos valores han de coincidir con los valores de la
clave primaria de una relacin R1 (R1 y R2 no son
necesariamente distintas).

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Restricciones del modelo

Restricciones inherentes: impuestas por el propio modelo


1. En una relacin no puede haber dos tuplas iguales
(obligatoriedad de clave primaria).
2. El orden de las tuplas y el de los atributos no es relevante.
3. Cada atributo slo puede tomar un nico valor del dominio
sobre el cual est definido (no hay grupos repetitivos).
4. Ningn atributo que forme parte de la clave primaria de una
relacin puede tomar un valor nulo (regla de integridad de
entidad).

Restricciones semnticas (o de usuario): facilidades


ofrecidas por el modelo para representar la semntica del
mundo real.
32

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Restricciones del modelo (II)

Regla de Integridad referencial:


Lo valores que tome la clave ajena en la tabla hija han de
ser los mismos que tiene en la tabla padre.
La clave primaria de la tabla padre ha de tener un campo en
la tabla Hija.
Clave ajena del mismo tipo datos y que contenga los
mismos valores.

33

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Interrelaciones

Asociaciones entre tablas:


Asociaciones definidas entre los esquemas de relacin. No
existen vinculaciones fsicas, slo lgicas.
Se distinguen distintos tipos segn el nmero mximo de
tuplas que intervienen por parte de cada relacin.
A este nmero se le denomina cardinalidad de la relacin.
Pueden ser 1:1, 1:N o N:M.

34

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Interrelacin 1:N

Correspondencia 1:1
Entidad A
a1
a2

.
.
.
an

Correspondencia 1:N
Entidad A
a1
a2
.
.
.
an

35

Tema 5: Organizacin de los Datos

Entidad B
b1
b2
.
.
.
bn

Entidad B
b1
b2
.
.
.

bn

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Interrelacin 1:N (II)

Ejemplo: Empleados asociados a un


Departamento de una empresa.

Cardinalidad 1:N.

Regla de Integridad referencial.

36

Un departamento puede tener varios empleados y un


empleado solo pertenecer a un departamento.

Lo valores que tome la clave ajena en la tabla hija han de ser


los mismos que tiene en la tabla padre.
Los valores que toma la clave ajena DEPARTAMENTO de la
tabla EMPLEADO (11,13,14) son los que tiene la clave principal
NUMERO_DEPT en la tabla DEPARTAMENTO.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Interrelacin 1:N (III)
MODELO RELACIONAL
Clave primaria

Clave ajena

E M P L E A D O (N O M B R E ,D E P A R T A M E N T O ,S A L A R IO ,F E C H A _ N A C , E X T _ T E L E F N IC A )

Interrelacin

Clave primaria

D E P A R T A M E N T O (N U M E R O _ D E P T , N O M B R E )

TABLAS

EM PLEADO
NOMBRE

D EPA R TA M EN TO

S A L A R IO

FEC H A _N A C

E X T _ T E L E F N IC A

P ablo M ontero
B eatriz C ristobal
J. L us M artn
A lm udena L pez
A ngel V allejo
P edro G arca

14
13
11
13
14
11

220.000
300.000
150.000
350.000
400.000
200.000

10-11-67
20-9-68
25-6-77
4-5-60
15-4-72
12-3-70

6543
6577
6433
6422
6321
6323

DEPARTAM ENTO

37

N U M ER O _D EPT

NOMBRE

11
13
14

C ontabilidad
M arketing
Inform tica

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Interrelacin N:M

Correspondencia N:M
Entidad A
a1
a2

.
.
.
an

Entidad B
b1
b2
.
.
.
bn

Se crea una nueva tabla (intermedia) entre la entidad A y la


entidad B.
Esta tabla ha de tener como clave principal la que resulta de
unir las dos claves principales de las tablas que une.

38

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Interrelacin N:M (II)

Ejemplo: Libros escritos por un Autor.

Cardinalidad N:M.

Regla de Integridad referencial.

39

Un libro puede ser escrito por varios autores y un autor puede


escribir varios libros.

Es necesario crear una nueva tabla (tabla intermedia) ESCRIBE


para reflejar la semntica de este tipo de relaciones.
Esta nueva tabla ESCRIBE tiene un clave ajena a cada una de
las tablas padres (AUTOR y LIBRO).
Los valores de las claves ajenas de la tabla ESCRIBE deben
coincidir con los existentes en las tablas padres.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Bases de Datos Relacionales (BDR). Interrelacin N:M (III)
MODELO RELACIONAL

AUTOR (Cod_autor, .........)


Clave ajena
Interrelacin

Clave primaria

AUTOR

40

Clave ajena

ESCRIBE (Cod_autor, Cod_libro , ...)

LIBRO (Cod_libro, .........)

TABLAS

Clave primaria

LIBRO

COD_AUTOR

NOMBRE

COD_LIBRO TITULO

1
2

Arturo Ribagorda
Paloma Martinez

1
2

3
4

Elena Castro
Dolores Cuadra

ESCRIBE

Tema 5: Organizacin de los Datos

Diseo de bases de datos


Informtica para la empresa y
tcnicas de programacin

COD_AUTOR

COD_LIBRO

1
2
3
4

2
1
1
1

Tratamiento de la Informacin Estructurada


Sistema Gestor de Bases de Datos Relacionales (SGBDR)

Herramienta Software que proporciona una interfaz entre los


datos almacenados y los programas de aplicacin que acceden
a stos.
Se caracteriza fundamentalmente por permitir una descripcin
centralizada de los datos y por la posibilidad de definir vistas
parciales de los mismos para los diferentes usuarios.
Conjunto de programas, procedimientos y lenguajes que nos
proporcionan las herramientas necesarias para trabajar con
una base de datos.

Incorpora una serie de funciones que nos permite definir los


registros, sus campos, sus relaciones, insertar, suprimir,
modificar y consultar los datos.
41

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistema Gestor de Bases de Datos Relacionales (SGBDR) (II)

Entre sus funciones:

42

Recuperar la BD, si es daada


Seguridad contra accesos no autorizados
Que la base de datos se actualice correctamente cuando
varios usuarios la usan concurrentemente
Proporciona una catlogo de la descripcin de los datos:
Diccionario de datos (Relaciones, Usuarios)
Integridad : Restricciones y validacin de los datos.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin Estructurada


Sistema Gestor de Bases de Datos Relacionales (SGBDR) (III)

Ejemplos de SGBD relacionales comerciales:

Microsoft Access.

Microsoft SQL Server.

Licencia BSD de cdigo abierto.

Informix y DB2 (en la actualidad de IBM).

43

Licencia GPL.

PostGreSQL

Lder del mercado.

MySQL (en la actualidad de SUN MicroSystems).

Integrado en la suite de desarrollo Visual Studio.

Oracle.

Integrado en la suite de Office.

Poca cuota de mercado.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin no
Estructurada
ndice

Informtica Documental.
Base de Datos Documental (BBD ).

Sistema Gestor de Bases de Datos Documentales (SGBDD)

50

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin no
Estructurada
Informtica Documental

Trata de la resolucin de los problemas que implican el


tratamiento de la incertidumbre en la bsqueda de
informacin de documentos.

Objetivo:

Ofrecer herramientas para automatizar el anlisis


documental como parte fundamental de la documentacin.

Documentacin:

51

Disciplina terica que permite describir de forma cientfica


los documentos.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin no
Estructurada
Base de Datos Documental (BBD)

Las BDDs estn especialmente concebidas para


almacenar y extraer informacin no estructurada.

La unidad bsica y nica para obtener informacin es el


documento.
Para el acceso de las BDDs se persigue obtener una
flexibilidad en la consulta, de forma que el cliente no
deba estar restringido a un nmero limitado de trminos
de bsqueda.

52

Resolver el problema de incertidumbre en la bsqueda de


informacin

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin no
Estructurada
Base de Datos Documental (BBD) (II)

Caractersticas:
Mantienen una base de datos de informacin textual de
longitud variable.
Son capaces de recuperar documentos selectivamente a
partir de cualquiera de los aspectos de su contenido.
Los documentos se representan en la base de datos en
forma de registros.
Se utilizan descriptores para acceder al contenido y
contemplan la gestin de sinnimos.

53

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin no
Estructurada
Bases de Datos Documentales (BBDs ) (II)

Funcionamiento interno
Disponen de un sistema de indexacin por el que el SGBD
genera ndices en cada campo por cada elemento, es decir
cada palabra es indexada.
Para palabras posteriores el sistema SGBD lee textos y
comprueba si han sido almacenadas en el diccionario con lo
cual las almacena una sola vez con un puntero al
documento y situacin exacta, donde la palabra se repite.
La localizacin de una palabra se hace por consulta en el
ndice.

54

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin no
Estructurada
Sistema Gestor de Bases de Datos Documentales (SGBDD)

Los sistemas de gestin documental permiten la elaboracin


de diccionarios o ndices alfabticos.

Permiten la indexacin de textos completos.

Para ello recurren a diferentes tcnicas o heursticas:

Diccionarios terminolgicos.

Tesauro (Thesaurus).

Listado de palabras o trminos empleados para representar


conceptos.

Estrategias de bsqueda.

55

Enuncian y definen los trminos propios de una ciencia, una


tcnica u otra actividad.

Conjunto de procedimientos y operaciones que un usuario realiza


con el fin de obtener una determinada informacin.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin no
Estructurada
Sistema Gestor de Bases de Datos Documentales (SGBDD) (II)

Tienen en comn una serie de funciones especialmente


diseadas para resolver los problemas tpicos de un
entorno documental:

56

Lenguaje de definicin de datos


Lenguaje de interrogacin de la base de datos
Hipertexto
Mecanismos de seguridad
Facilidades para introduccin de informacin
Entorno amigable y facilidad de uso

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin no
Estructurada
Sistema Gestor de Bases de Datos Documentales (SGBDD) (III)

Lenguaje de definicin de datos

Permite al diseador de la base de datos especificar las


caractersticas estructurales de la misma: Campos que la
componen, restricciones y mecanismos de validacin
asociados a ellos.

Lenguaje de interrogacin de la base de datos

Tiene una sintaxis que lo caracteriza, y que precisa cules


son las frases correctas que se puedan escribir en l.

Hipertexto

57

Enlaces que permiten moverse por los documentos de


mltiples formas, utilizando referencias cruzadas.

Tema 5: Organizacin de los Datos

Tratamiento de la Informacin no
Estructurada
Sistema Gestor de Bases de Datos Documentales (SGBDD) (IV)

Mecanismos de seguridad

Permite establecer diferentes categoras de usuarios en


funcin de los distintos tipos de privilegios que tengan
sobre los documentos.

Facilidades para introduccin de informacin

Una vez generada la base de datos, se carga luego la


informacin, que se realiza por:

Entrada directa de la informacin


Entrada diferida, trabajando sobre un fichero auxiliar

Entorno amigable y facilidad de uso

58

Lo ms importante es que las BDDs sea fcil de utilizar.

Tema 5: Organizacin de los Datos

También podría gustarte