República Bolivariana de Venezuela Ministerio del Poder Popular para la Defensa
Universidad Nacional Experimental Politécnica De la Fuerza Armada Nacional
Bolivariana UNEFA-Núcleo Miranda Extensión Santa Teresa del Tuy
Carrera: Ing. Sistemas Semestre: 5to Sección: 05S-2615-D1 Materia: Base de Datos
I
N
F
O
R
M
E
Profesor: Franlia Serrano Estudiante: Manuel Ortiz
C.I: 25.792.247
Fecha: 16/08/2019
UNIDAD 1: CONCEPTOS BÁSICOS
Datos, información, conocimiento
¿En qué se diferencia el conocimiento de los datos y de la información? En una conversación
informal, los tres términos suelen utilizarse indistintamente y esto puede llevar a una
interpretación libre del concepto de conocimiento. Quizás la forma más sencilla de diferenciar los
términos sea pensar que los datos están localizados en el mundo y el conocimiento está localizado
en agentes de cualquier tipo (personas, empresas, máquinas...), mientras que la información
adopta un papel mediador entre ambos.
Los conceptos que se muestran a continuación se basan en las definiciones de Davenport y Prusak
(1999).
Datos
Los datos son la mínima unidad semántica, y se corresponden con elementos primarios de
información que por sí solos son irrelevantes como apoyo a la toma de decisiones. También se
pueden ver como un conjunto discreto de valores, que no dicen nada sobre el porqué de las cosas
y no son orientativos para la acción.
Un número telefónico o un nombre de una persona, por ejemplo, son datos que, sin un propósito,
una utilidad o un contexto no sirven como base para apoyar la toma de una decisión. Los datos
pueden ser una colección de hechos almacenados en algún lugar físico como un papel, un
dispositivo electrónico (CD, DVD, disco duro...), o la mente de una persona. En este sentido las
tecnologías de la información han aportado mucho a recopilación de datos.
Como cabe suponer, los datos pueden provenir de fuentes externas o internas a la organización,
pudiendo ser de carácter objetivo o subjetivo, o de tipo cualitativo o cuantitativo, etc.
Información
La información se puede definir como un conjunto de datos procesados y que tienen un
significado (relevancia, propósito y contexto), y que por lo tanto son de utilidad para quién debe
tomar decisiones, al disminuir su incertidumbre. Los datos se pueden transforman en información
añadiéndoles valor:
Contextualizando: se sabe en qué contexto y para qué propósito se generaron.
Categorizando: se conocen las unidades de medida que ayudan a interpretarlos.
Calculando: los datos pueden haber sido procesados matemática o estadísticamente.
Corrigiendo: se han eliminado errores e inconsistencias de los datos.
Condensando: los datos se han podido resumir de forma más concisa (agregación).
Por tanto, la información es la comunicación de conocimientos o inteligencia, y es capaz de
cambiar la forma en que el receptor percibe algo, impactando sobre sus juicios de valor y sus
comportamientos.
Información = Datos + Contexto (añadir valor) + Utilidad (disminuir la incertidumbre)
Conocimiento
El conocimiento es una mezcla de experiencia, valores, información y know-how que sirve como
marco para la incorporación de nuevas experiencias e información, y es útil para la acción. Se
origina y aplica en la mente de los conocedores. En las organizaciones con frecuencia no sólo se
encuentra dentro de documentos o almacenes de datos, sino que también está en rutinas
organizativas, procesos, prácticas, y normas.
El conocimiento se deriva de la información, así como la información se deriva de los datos. Para
que la información se convierta en conocimiento es necesario realizar acciones como:
Comparación con otros elementos.
Predicción de consecuencias.
Búsqueda de conexiones.
Conversación con otros portadores de conocimiento.
Sistema
Un sistema es un objeto compuesto cuyos componentes se relacionan con al menos algún otro
componente; puede ser material o conceptual. Todos los sistemas tienen composición, estructura
y entorno, pero sólo los sistemas materiales tienen mecanismo, y sólo algunos sistemas materiales
tienen figura (forma). Según el sistemismo, todos los objetos son sistemas o componentes de
algún sistema.
Proceso (informática)
Un proceso, en informática, puede entenderse informalmente como un programa en ejecución.
Formalmente un proceso es "Una unidad de actividad que se caracteriza por la ejecución de una
secuencia de instrucciones, un estado actual, y un conjunto de recursos del sistema asociados".
Sistema de Procesamiento de Datos
El procesamiento de datos es, en general, "la acumulación y manipulación de elementos de datos
para producir información significativa."
El procesamiento de datos trata de un subconjunto del procesamiento de la información, el
cambio (procesamiento) de la información de cualquier manera detectable por un observador. El
procesamiento de datos es distinto del procesamiento de textos, pues este último manipula textos
nada más en lugar de los datos.
Funciones del procesamiento de datos
El procesamiento de datos puede involucrar diversas funciones, entre ellas:
"Validación" - Asegurar que los datos suministrados son "limpio, correcto y útil".
Clasificación - "Ordena elementos de cierta secuencia y / o en diferentes conjuntos".
Recapitulación - Reducir los detalles de los datos a sus principales puntos.
Agregación - Combinación de múltiples piezas de datos.
"Análisis" - La "colección, organización, análisis, interpretación y presentación de datos".
Información - Lista detallada o resumen de los datos de información computarizada.
Sistema de procesamiento de conocimiento
Los sistemas de conocimiento son sistemas expertos ideados para crear nuevo conocimiento a
partir del conocimiento explícito presente en los documentos de las bases de datos.
Siguen el proceso KDD en sus diferentes fases. Desarrollados para facilitar el análisis de grandes
conjuntos documentales científicos o tecnológicos (artículos científicos, patentes, tesis doctorales,
etc.).
Los sistemas de conocimiento son de gran utilidad para los equipos de inteligencia competitiva y
de vigilancia tecnológica de las organizaciones ya que proporcionan informes, diagramas, gráficos
y mapas muy apreciados en la toma de decisiones estratégicas. La evaluación de redes de
conocimiento se beneficia de la existencia de sistemas de conocimiento desarrollados para
transformar la información en conocimiento, procesando de una manera rápida y controlada
ingentes conjuntos documentales y creando nuevo conocimiento a partir de ellos.
La ingeniería del conocimiento es la rama de la inteligencia artificial que tiene por objetivo la
creación de indicadores, métodos e instrumentos de naturaleza matemática, informática y
lingüística, para el análisis y la representación cartográfica de la información científica y técnica
Sistemas de Archivos
Un sistema de archivos es un conjunto de normas y procedimientos para almacenar la
información. Todo sistema operativo tiene uno.
Un archivo es un conjunto independiente de datos, como una foto o un texto. Hay diferentes tipos
de archivo como veremos más adelante. Toda la información que hay en una computadora está
agrupada en forma de archivos.
Cada sistema operativo suele usar un sistema de archivos diferente. Pero todos comparten otro
concepto: la carpeta. Una carpeta es una manera de agrupar libremente archivos. Las carpetas
también se conocen como directorios.
Al sistema de archivos que utiliza un sistema operativo se le llama sistema de archivos nativo. Esa
es la manera en que un S.O. prefiere guardar la información.
El proceso de crear un sistema de archivos en un dispositivo de almacenamiento se llama
formatear o dar formato: preparar el dispositivo para guardar la información como lo hace el
sistema elegido. Si formateamos un dispositivo, se borrará toda la información que está en él.
Sistemas manejadores de Base de Datos
Un sistema manejador de bases de datos (SGBD, por sus siglas en inglés) o DataBase Management
System (DBMS) es una colección de software muy específico, cuya función es servir de interfaz
entre la base de datos, el usuario y las distintas aplicaciones utilizadas.
Como su propio nombre indica, el objetivo de los sistemas manejadores de base de datos es
precisamente el de manejar un conjunto de datos para convertirlos en información relevante para
la organización, ya sea a nivel operativo o estratégico.
Lo hace mediante una serie de rutinas de software para permitir su uso de una manera segura,
sencilla y ordenada. Se trata, en suma, de un conjunto de programas que realizan tareas de forma
interrelacionada para facilitar la construcción y manipulación de bases de datos, adoptando la
forma de interfaz entre éstas, las aplicaciones y los mismos usuarios.
Su uso permite realizar un mejor control a los administradores de sistemas y, por otro lado,
también obtener mejores resultados a la hora de realizar consultas que ayuden a la gestión
empresarial mediante la generación de la tan perseguida ventaja competitiva.
Diferencias: Diferencias entre manejadores de archivos y sistemas manejadores de bases de datos.
Diferencias entre sistemas de archivo y sistema de base de datos.
Sistema de archivos:
1. Manejo de archivos en texto plano.
2. Búsqueda de tres tipos: secuencial, aleatorio, indexado.
3. No existen las actualizaciones, se simulan dando de baja el registro y dando de alta el nuevo con
la modificación.
4. Tienen independencia lógica y física la mayoría de ellos.
5. Cuenta con redundancia no controlada y errores de referencias.
6. Sus componentes son: archivos, registros, campos.
Sistemas de bases de datos:
1. Existe redundancia controlada e integridad referencia.
2. Implementa mayor seguridad.
3. Existen actualizaciones directas.
4. No tienen independencia ni lógica ni física.
5. Sus componentes son Hw, Sw, BD y Usuarios.
Por eso se puede decir que una base de datos es un conjunto de datos pertenecientes a un mismo
contexto y almacenados sistemáticamente para su posterior uso, y un sistema de gestión de datos
son un tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el
usuario y las aplicaciones que la utilizan. También se puede considerar que el sistema de gestión
de datos sirve de interfaz entre la persona y la base de datos y la base de datos ya es el programa
donde el efectúa su trabajo U ocupación.
UNIDAD 2: MODELOS DE BASES DE DATOS
Modelo de datos
Un modelo de datos es un lenguaje orientado a hablar de una base de datos. Típicamente un
modelo de datos permite describir:
Las estructuras de datos de la base: El tipo de los datos que hay en la base y la forma en
que se relacionan.
Las restricciones de integridad: Un conjunto de condiciones que deben cumplir los datos
para reflejar la realidad deseada.
Operaciones de manipulación de los datos: típicamente, operaciones de agregado,
borrado, modificación y recuperación de los datos de la base.
Otro enfoque es pensar que un modelo de datos permite describir los elementos de la realidad
que intervienen en un problema dado y la forma en que se relacionan esos elementos entre sí.
No hay que perder de vista que una Base de Datos siempre está orientada a resolver un problema
determinado, por lo que los dos enfoques propuestos son necesarios en cualquier desarrollo de
software.
Sub-lenguajes de un modelo de datos
Un modelo de datos es un lenguaje que, típicamente, tiene dos sub-lenguajes:
Un Lenguaje de Definición de Datos o DDL (Data Definition Language), orientado a
describir de una forma abstracta las estructuras de datos y las restricciones de integridad.
Un Lenguaje de Manipulación de Datos o DML (Data Manipulation Language), orientado a
describir las operaciones de manipulación de los datos.
o A la parte del DML orientada a la recuperación de datos, usualmente se le llama
Lenguaje de Consulta o QL (Query Language).
Modelo entidad-relación
Un modelo de entidad relación es una herramienta para el modelo de datos, la cual permite
representar entidades de una Base de Datos
1. Se elabora el diagrama (o diagramas) entidad-relación.
2. Se completa el modelo con listas de atributos y una descripción de otras restricciones que
no se pueden reflejar en el diagrama.
El modelado de datos no acaba con el uso de esta técnica. Son necesarias otras técnicas para
lograr un modelo directamente implementable en una base de datos.
Permite mostrar resultados entre otras entidades pertenecientes a las existentes de manera que
se encuentre la normatividad de archivos que se almacenarán.
Transformación de relaciones múltiples en binarias.
Normalización de una base de datos de relaciones (algunas relaciones pueden
transformarse en atributos y viceversa).
Conversión en tablas (en caso de utilizar una base de datos relacional).
Modelo Entidad/Relación Extendido
El modelo entidad/relación extendido describe con un alto nivel de abstracción la distribución de
datos almacenados en un sistema. Existen dos elementos principales: las entidades y las
relaciones. Las extensiones al modelo básico añaden además los atributos de las entidades y la
jerarquía entre estas. Estas extensiones tienen como finalidad aportar al modelo una mayor
capacidad expresiva.
Los elementos fundamentales del modelo son los siguientes:
Entidad
Es aquel objeto, real o abstracto, acerca del cual se desea almacenar información en la base de
datos. La estructura genérica de un conjunto de entidades con las mismas características se
denomina tipo de entidad.
Existen dos clases de entidades: regulares, que tienen existencia por si ́ mismas, y débiles cuya
existencia depende de otra entidad. Las entidades deben cumplir las siguientes tres reglas:
Tienen que tener existencia propia.
Cada ocurrencia de un tipo de entidad debe poder distinguirse de las demás.
Todas las ocurrencias de un tipo de entidad deben tener los mismos atributos.
Relación:
Es una asociación o correspondencia existente entre una o varias entidades. La relación puede ser
regular, si asocia tipos de entidad regulares, o débil, si asocia un tipo de entidad débil con un tipo
de entidad regular. Dentro de las relaciones débiles se distinguen la dependencia en existencia y la
dependencia en identificación.
Se dice que la dependencia es en existencia cuando las ocurrencias de un tipo de entidad débil no
pueden existir sin la ocurrencia de la entidad regular de la que dependen. Se dice que la
dependencia es en identificación cuando, además de lo anterior, las ocurrencias del tipo de
entidad débil no se pueden identificar solo mediante sus propios atributos, sino que se les tiene
que añadir el identificador de la ocurrencia de la entidad regular de la cual dependen.
Modelo semántico de datos
El modelo de dato semántico en ingeniería de software tiene varios significados:
1. Es un modelo conceptual de datos en el que se incluye información semántica. Esto
significa que el modelo describe el significado de sus instancias. Tal modelo de dato
semántico es una abstracción que define cómo los símbolos almacenados (los datos de la
instancia) se relacionan con el mundo real.
2. Es un modelo de datos conceptual que incluye la capacidad de expresar información que
permite el intercambio de información para interpretar su significado (semántico) de las
instancias, sin necesidad de conocer la meta-modelo. Estos modelos semánticos están
orientados a los hechos (en oposición a los orientados a objetos). Los hechos son
típicamente expresados por relaciones binarias entre elementos de datos, mientras que
las relaciones de orden superior se expresan como colecciones de relaciones binarias.
Típicamente las relaciones binarias tienen la forma de ternas: Objeto-<Tipo de Relación>-
Objeto. Por ejemplo: La Torre Eiffel <se encuentra en> París.
Típicamente, los datos de instancia de los modelos de datos semánticos incluyen explícitamente
los tipos de relaciones entre los diversos elementos de datos. Para interpretar el significado de los
hechos de las instancias se requiere que se conozca el significado de los tipos de relaciones (tipos
de relación). Por lo tanto, los modelos de datos semánticos típicamente estandarizan tales tipos
de relación. Esto significa que el segundo tipo de modelos de datos semánticos permiten que las
instancias expresen hechos que incluyen su propio significado. El segundo tipo de modelos de
datos semánticos suele estar destinado a crear bases de datos semánticas. La capacidad de incluir
significado en bases de datos semánticas facilita la creación de bases de datos distribuidas que
permiten a las aplicaciones interpretar el significado del contenido. Esto implica que las bases de
datos semánticas pueden ser integradas cuando usan los mismos tipos de relación (estándar). Esto
también implica que en general tienen una aplicabilidad más amplia que las bases de datos
relacionales u orientados a objetos.
Estructuras del Modelo Entidad-Relación
En el Modelo Entidad-Relación se describe el mundo real a través de entidades, relaciones entre
las entidades y atributos.
El modelo de datos entidad-relación está basado en una percepción del mundo real que consta de
una colección de objetos básicos, llamados entidades, y de relaciones entre esos objetos amorfos.
Entidad
Representa una “cosa”, "objeto" o "concepto" del mundo real con existencia independiente, es
decir, se diferencia únicamente de otro objeto o cosa, incluso siendo del mismo tipo, o una misma
entidad.
Algunos Ejemplos:
Una persona. (Se diferencia de cualquier otra persona, incluso siendo gemelos).
Un automóvil. (Aunque sean de la misma marca, el mismo modelo,..., tendrán atributos
diferentes, por ejemplo, el número de chasis).
Una casa (Aunque sea exactamente igual a otra, aún se diferenciará en su dirección).
Una entidad puede ser un objeto con existencia física como: una persona, un animal, una casa,
etc. (entidad concreta); o un objeto con existencia conceptual como: un puesto de trabajo, una
asignatura de clases, un nombre, etc. (entidad abstracta).
Una entidad está descrita y se representa por sus características o atributos. Por ejemplo, la
entidad Persona tiene como características: Nombre, Apellido, Género, Estatura, Peso, Fecha de
nacimiento.
Atributos
Los atributos son las características que definen o identifican a una entidad. Estas pueden ser
muchas, y el diseñador solo utiliza o implementa las que considere más relevantes.
En un conjunto de entidades del mismo tipo, cada entidad tiene valores específicos asignados para
cada uno de sus atributos, de esta forma, es posible su identificación unívoca.
Ejemplos:
A la colección de entidades «alumnos», con el siguiente conjunto de atributos en común, (id,
nombre, edad, semestre), pertenecen las entidades:
(1, Sophia, 15 años, 2)
(2, Josefa, 19 años, 5)
(3, Carlos, 20 años, 2)
...
Cada una de las entidades pertenecientes a este conjunto se diferencia de las demás por el valor
de sus atributos. Nótese que dos o más entidades diferentes pueden tener los mismos valores
para algunos de sus atributos, pero nunca para todos.
En particular, los atributos identificativos son aquellos que permiten diferenciar a una instancia de
la entidad de otra distinta. Por ejemplo, el atributo identificativo que distingue a un alumno de
otro es su número de id.
Para cada atributo, existe un dominio del mismo, este hace referencia al tipo de datos que será
almacenado a restricciones en los valores que el atributo puede tomar (cadenas de caracteres,
números, solo dos letras, solo números mayores que cero, solo números enteros...).
Cuando algún atributo correspondiente a una entidad no tiene un valor determinado, recibe el
valor nulo, bien sea porque no se conoce, porque no existe o porque no se sabe nada al respecto
del mismo.
Conjunto de relaciones
Consiste en una colección, o conjunto, de relaciones de la misma naturaleza.
Ejemplo:
Dados los conjuntos de entidades "Habitación" y "Huésped", todas las relaciones de la forma
habitación-huésped, permiten obtener la información de los huéspedes y sus respectivas
habitaciones.
La dependencia o asociación entre los conjuntos de entidades es llamada participación. En el
ejemplo anterior los conjuntos de entidades "Habitación" y "Huésped" participan en el conjunto
de relaciones habitación-huésped.
Se llama grado del conjunto de relaciones a la cantidad de conjuntos de entidades participantes en
la relación.
Representación de los datos
Para entender la manera en que las computadoras procesan datos, es importante conocer cómo la
computadora representa los datos. Las personas se comunican a través del habla combinando
palabras en oraciones. El habla humana es análoga porque utiliza señales continuas que varían en
fortaleza y calidad. Las computadoras son digitales, pues reconocen solo dos estados: encendido
(on) y apagado (off). Esto es así porque las computadoras son equipos electrónicos que utilizan
electricidad, que también tiene solo dos estados: on y off. Los dos dígitos 0 y 1 pueden fácilmente
representar estos dos estados. El dígito cero representa el estado electrónico apagado (la ausencia
de carga electrónica). El dígito uno representa el estado electrónico encendido (presencia de carga
electrónica).
El sistema binario es un sistema numérico que tiene tan solo dos dígitos, 0 y 1, llamados bits. Un
bit (binary digit) es la unidad de datos más pequeña que la computadora puede representar. Por sí
solo, un bit no es muy informativo. Cuando ocho bits se agrupan como una unidad, forman un
byte. El byte es informativo porque provee suficientes combinaciones diferentes de 0 y 1 para
representar 256 caracteres individuales. Esos caracteres incluyen números, letras mayúsculas y
minúsculas, signos de puntuación y otros.
Las combinaciones de 0 y 1 que representan caracteres son definidas por patrones llamados
esquemas de códigos (coding scheme). Esquemas de códigos populares son:
1. ASCII – American Standard Code for Information Interchange – es el sistema de código para
representar datos que más se utiliza. La mayoría de las computadoras personales y servidores mid-
range utilizan el esquema de código ASCII.
2. EBCDIC – Extended Binary Coded Decimal Interchange Code – es utilizado principalmente en
computadoras mainframe.
3. Unicode – es el único esquema de código capaz de representar todos los lenguajes del mundo
actual. Se desarrolló precisamente porque el ASCII y el EBCDIC no eran suficientes para
representar lenguajes para alfabetos diferentes al inglés o Europeo, como los asiáticos y otros.
Diferencias entre el modelo Entidad-Relación y Relacional
Tanto el Modelo E-R como el Modelo Relacional son los tipos de Modelado de Datos.
El modelo de datos describe una manera de diseñar la base de datos a nivel físico, lógico y de
vista.
La principal diferencia entre el Modelo E-R y el Modelo Relacional es que el Modelo E-R es
específico para cada entidad, y el Modelo Relacional es específico para cada tabla.
Tabla Comparativa
Diferencias Principales
La diferencia básica entre el Modelo E-R y el Modelo Relacional es que el modelo E-R trata
específicamente con las entidades y sus relaciones. Por otro lado, el Modelo Relacional se
ocupa de las Tablas y de la relación entre los datos de esas tablas.
Un Modelo E-R describe los datos con conjuntos de entidades, conjuntos de relaciones y
atributos. Sin embargo, el modelo relacional describe los datos con las tuplas, atributos y
dominio del atributo.
Uno puede entender más fácilmente la relación entre los datos en el Modelo E-R en
comparación con el Modelo Relacional.
El Modelo E-R tiene la Cardinalidad del Mapeo como una restricción mientras que el
Modelo Relacional no tiene tal restricción.
Entidad Relación
Relacional