0% encontró este documento útil (0 votos)

37 vistas5 páginas

Activdad 3

El documento describe varias tecnologías relacionadas con el análisis de datos. El machine learning permite que las máquinas aprendan sin programación explícita identificando patrones en los datos. KDD es el proceso de descubrir conocimiento útil a partir de grandes conjuntos de datos mediante la aplicación de técnicas estadísticas y de minería de datos. Un data warehouse almacena grandes cantidades de datos de una organización de forma segura y fácil de recuperar para su análisis.

Cargado por

saturvinng

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

37 vistas5 páginas

Activdad 3

Cargado por

saturvinng

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 5

Machine learning

El ‘machine learning’ –aprendizaje automático– es una rama de la inteligencia

artificial que permite que las máquinas aprendan sin ser expresamente programadas para ello. Una
habilidad indispensable para hacer sistemas capaces de identificar patrones entre los datos para
hacer predicciones. Esta tecnología está presente en un sinfín de aplicaciones como las
recomendaciones de Netflix o Spotify, las respuestas inteligentes de Gmail o el habla de Siri y
Alexa.

Caracteristicas del machine learning

, la estadística es una de las bases del machine learning, pues gracias a esa información se crean
algoritmos que calculan el mejor resultado para una tarea en cuestión de minutos y horas (cuando
antes llevaba días o semanas enteras, según el volumen de información).

Es importante tener en cuenta los siguientes factores a la hora de utilizar estas tecnologías:

 A mayor cantidad de datos, las predicciones se vuelven más confiables y precisas.

 Requieren un proceso de entrenamiento antes de poder generar predicciones.
 Se basan en la generación de modelos predictivos como producto de la detección de patrones.
 El machine learning permite procesar diferentes tipos de información, como imágenes, textos,
sonidos o valores numéricos.
 La capacidad del computador que utilices dependerá de las acciones que quieras llevar a cabo.
 Siempre existe un margen de error en la toma de decisión de los sistemas de machine
learning, pero generalmente es mucho menor que la humana.

KDD
Se dice entonces que KDD (Descubrimiento de Conocimiento en Bases de Datos) es el proceso
para la identificación de patrones válidos, nuevos, útiles y sobre todo comprensibles, que conlleva
al descubrimiento de nuevo conocimiento. En cambio, la minería de datos se refiere a solo una de
las etapas de dicho proceso, considerada por muchos como la más importante.

Caracteristicas de KDD

 Interdisciplinario: KDD es un enfoque interdisciplinario que combina elementos de la

estadística, la minería de datos, el aprendizaje automático, la visualización de datos, la
inteligencia artificial y más. Requiere la colaboración de expertos en diversas áreas para
obtener resultados significativos.

 Fases del proceso: El proceso KDD se divide generalmente en varias fases: selección,
preprocesamiento, transformación, minería de datos, evaluación y presentación. Cada fase
tiene su propio conjunto de tareas y técnicas específicas.

 Extracción de conocimiento: El objetivo principal de KDD es descubrir conocimiento nuevo

y valioso a partir de los datos. Esto podría incluir patrones, tendencias, relaciones, anomalías
u otras estructuras ocultas en los datos.

 Datos de entrada: KDD parte de grandes conjuntos de datos almacenados en bases de datos u
otras fuentes. Estos datos pueden ser estructurados (como tablas de bases de datos) o no
estructurados (como texto, imágenes o videos).

 Preprocesamiento: Antes de que los datos puedan ser analizados, generalmente se requiere un
proceso de preprocesamiento para limpiar y transformar los datos en un formato adecuado.
Esto puede incluir la eliminación de valores faltantes, la normalización de variables y la
eliminación de ruido.

 Minería de datos: La fase de minería de datos implica la aplicación de algoritmos y técnicas

para descubrir patrones y relaciones en los datos. Esto puede incluir la identificación de
grupos (clustering), la predicción de valores futuros (regresión), la detección de anomalías y
más.

 Evaluación: Después de aplicar técnicas de minería de datos, es importante evaluar la calidad

y la relevancia de los patrones y resultados descubiertos. Esto puede implicar la validación
cruzada, la comparación con datos de prueba o la evaluación por expertos.

 Aplicaciones: KDD se utiliza en una variedad de campos, incluyendo la investigación

científica, la medicina, la industria, las finanzas y más. Se puede aplicar para la toma de
decisiones informadas, la identificación de oportunidades comerciales y la mejora de
procesos.

 Iterativo: El proceso KDD es iterativo, lo que significa que los resultados iniciales pueden
llevar a ajustes en las fases anteriores o posteriores del proceso. La retroalimentación y la
refinación son comunes a medida que se obtiene un mayor entendimiento de los datos y los
patrones.

 Privacidad y ética: Dado que KDD implica el manejo de datos sensibles, es importante
considerar cuestiones de privacidad y ética en todas las etapas del proceso, especialmente en
lo que respecta a la anonimización y la protección de la información personal.

Data Warehouse
Un Data Warehouse es un almacén electrónico donde generalmente una empresa u organización
mantiene una gran cantidad de información. Los datos de un data warehouse deben almacenarse
de forma segura, fiable, fácil de recuperar y fácil de administrar.

Caracteristicas del data Warehouse

Las características del data warehouse son muy variadas, pues estas son las que dotan al sistema
de capacidades bastante potentes. Sin embargo, Bill Inmon (precursor del data warehousing)
estableció, desde un principio, las siguientes como las principales características:
 Es integrado: el sistema del data warehousing busca eliminar las inconsistencias en los
sistemas operacionales para que los datos se puedan integrar en una estructura homogenizada.
 Es temático: todos los datos se organizan por temas, así los usuarios finales pueden acceder y
entender fácilmente la información almacenada, la cual está debidamente categorizada.
 Es de tiempo variante: los datos almacenados en el DWH guardan sus registros temporales,
con lo cual se puede acceder a información histórica según consultadas basadas en periodos
de tiempo.
 No es volátil: la información ingresada en el DWH es permanente, esta puede ser leída mas
no eliminada, lo que respalda la fiabilidad de los datos almacenados. Por lo tanto, hay 0% de
volatilidad sobre lo ingresado.

Elementos de Data Warehouse

Un almacén de datos típico tiene cuatro componentes principales: una base de datos central,
herramientas de ETL (extraer, transformar, cargar), metadatos, y herramientas de
acceso. Todos estos componentes están diseñados para ser rápidos, de modo que usted
pueda obtener resultados en seguida y analizar los datos sobre la marcha.
 Base de datos central
 Intragracion de datos
 Metadatos
 Herarmientas de acceso al almacen de datos.

Cubos OLAP
Los cubos de procesamiento analítico en línea (OLAP) son una característica de Service Manager
que usan la infraestructura de almacenamiento de datos existente para proporcionar
funcionalidades de inteligencia empresarial de autoservicio a los usuarios finales.
Un cubo OLAP es una estructura de datos que supera las limitaciones de las bases de datos
relacionales y proporciona un análisis rápido de datos. Los cubos pueden mostrar y sumar grandes
cantidades de datos, a la vez que proporcionan a los usuarios acceso mediante búsqueda a los
puntos de datos. De este modo, los datos se pueden agrupar, segmentar y segmentar según sea
necesario para controlar la mayor variedad de preguntas relevantes para el área de interés de un
usuario.

Caracteristicas de OLAP
.
 Multidimensionalidad: OLAP se organiza en torno a estructuras multidimensionales. Los
datos se ven desde múltiples perspectivas, lo que permite a los usuarios analizar y explorar
los datos desde diferentes dimensiones, como tiempo, producto, ubicación, etc.

 Cubo de Datos: En OLAP, los datos se organizan en lo que se conoce como "cubos". Cada eje
del cubo representa una dimensión diferente, y las celdas del cubo contienen los valores
agregados que se están analizando. Los cubos permiten una visualización más intuitiva y
flexible de los datos.

 Operaciones Analíticas: OLAP admite una variedad de operaciones analíticas, como la

consolidación, el desglose, la perforación y la rotación. Estas operaciones permiten a los
usuarios realizar análisis detallados y resúmenes de datos en diferentes niveles de
granularidad.

 Agregación y Jerarquías: Los datos se pueden agregar en diferentes niveles de jerarquía, lo

que permite una exploración profunda. Por ejemplo, los datos de ventas pueden agregarse a
nivel de año, trimestre, mes o día. Las jerarquías facilitan la navegación por los datos y el
análisis detallado.

 Interactividad: OLAP proporciona una experiencia interactiva para los usuarios, lo que les
permite realizar análisis ad hoc y explorar datos en tiempo real. Los usuarios pueden cambiar
las dimensiones, aplicar filtros y ver los resultados de inmediato.

 Rendimiento Optimizado: Las bases de datos OLAP están diseñadas para ofrecer un alto
rendimiento en consultas analíticas. Utilizan técnicas como la preagregación, el
almacenamiento multidimensional y la indexación especializada para acelerar las consultas.

 Consultas Complejas: OLAP admite consultas complejas que involucran múltiples

dimensiones y operaciones. Los usuarios pueden combinar fácilmente diferentes atributos y
medidas para obtener información detallada y significativa.

 Enfoque en la Toma de Decisiones: OLAP está diseñado para respaldar el proceso de toma de
decisiones al proporcionar a los usuarios herramientas poderosas para analizar tendencias,
identificar patrones y evaluar el rendimiento.

 Modelado de Datos Dimensionales: Para implementar OLAP, se utiliza el modelado de datos

dimensionales. Esto implica la creación de esquemas de estrella o copo de nieve que
organizan los datos en torno a hechos (medidas cuantitativas) y dimensiones (atributos
descriptivos).

 Compatibilidad con Herramientas de BI: OLAP se integra estrechamente con herramientas de

Business Intelligence (BI) que permiten a los usuarios crear informes, paneles y análisis
visuales basados en los datos almacenados en cubos OLAP.
.
Me gusto mucho el de OLAP porque son una forma de organizar y visualizar datos
multidimensionales para facilitar el análisis interactivo

Bibliografía

Pursell, S. (2022, octubre 19). ¿Qué es el machine learning? Características,

tipos y ejemplos. Hubspot.es.
https://blog.hubspot.es/marketing/machine-learning

Agencia, F. (2021, junio 1). Descubrimiento de Conocimiento en Bases de

Datos – KDD. Salud Electrónica.
https://saludelectronica.com/descubrimiento-de-conocimiento-en-
bases-de-datos-kdd/

Data Warehouse: todo lo que necesitas saber sobre almacenamiento de datos.

(s/f). Powerdata.Es. Recuperado el 18 de agosto de 2023, de
https://www.powerdata.es/data-warehouse

Sierra, Y. (2019, septiembre 13). DWH: ejemplos, características y

arquitectura del Data Warehouse. #ADNCLOUD; Mediacloud.
https://blog.mdcloud.es/dwh-ejemplos-arquitectura-data-warehouse/

Uso de cubos OLAP para análisis avanzado. (s/f). Microsoft.com.

Recuperado el 18 de agosto de 2023, de
https://learn.microsoft.com/es-es/system-center/scsm/olap-cubes-
overview?view=sc-sm-2022

También podría gustarte

Curso General 2023 Parte2
Aún no hay calificaciones
Curso General 2023 Parte2
43 páginas
Intelogencia de Negocios
Aún no hay calificaciones
Intelogencia de Negocios
51 páginas
Tema Mineria de Datos
Aún no hay calificaciones
Tema Mineria de Datos
90 páginas
Introducción A La IA - Módulo 2
Aún no hay calificaciones
Introducción A La IA - Módulo 2
19 páginas
PresentacionX (Data Mining & Data Warehouse)
Aún no hay calificaciones
PresentacionX (Data Mining & Data Warehouse)
62 páginas
Big Data. Módulo 2
Aún no hay calificaciones
Big Data. Módulo 2
8 páginas
Data Warehouse y Data Mining
100% (2)
Data Warehouse y Data Mining
19 páginas
Almacenes de Datos
Aún no hay calificaciones
Almacenes de Datos
18 páginas
Módulo Analisis Multidimensional1
Aún no hay calificaciones
Módulo Analisis Multidimensional1
76 páginas
Bases de Datos Avanzadas: Conferencia # 3. Sistema de Soporte A La Toma de Decisiones
Aún no hay calificaciones
Bases de Datos Avanzadas: Conferencia # 3. Sistema de Soporte A La Toma de Decisiones
55 páginas
MPA-LaCiencia de Datos Yaplicaciones
Aún no hay calificaciones
MPA-LaCiencia de Datos Yaplicaciones
67 páginas
Material Complementario 02 Unidad2
Aún no hay calificaciones
Material Complementario 02 Unidad2
6 páginas
Que Es Un DATAWAREHAUSE
Aún no hay calificaciones
Que Es Un DATAWAREHAUSE
8 páginas
INVESTIGACION
Aún no hay calificaciones
INVESTIGACION
9 páginas
B.I. - Datawarehouse
Aún no hay calificaciones
B.I. - Datawarehouse
42 páginas
Sesión 2 - DWH y Procesos para La Toma de Decisiones
Aún no hay calificaciones
Sesión 2 - DWH y Procesos para La Toma de Decisiones
49 páginas
Base de Datos Extemp
Aún no hay calificaciones
Base de Datos Extemp
24 páginas
Comparación Entre Data Warehouse, Data Mining y Data Mart
83% (6)
Comparación Entre Data Warehouse, Data Mining y Data Mart
2 páginas
Unidad 2
0% (2)
Unidad 2
61 páginas
Informe Final Base de Datos II - C1113 - Inteligencia Empresarial
Aún no hay calificaciones
Informe Final Base de Datos II - C1113 - Inteligencia Empresarial
12 páginas
Unidad 2.1 - Datawarehouse Modelado de Datos Multidimensional
Aún no hay calificaciones
Unidad 2.1 - Datawarehouse Modelado de Datos Multidimensional
20 páginas
Almacenes de Datos
Aún no hay calificaciones
Almacenes de Datos
10 páginas
Sesion 2 - Datawarehouse
Aún no hay calificaciones
Sesion 2 - Datawarehouse
75 páginas
Introduccion Al Soporte de Decisione
Aún no hay calificaciones
Introduccion Al Soporte de Decisione
115 páginas
Mineria de Datos
Aún no hay calificaciones
Mineria de Datos
30 páginas
Lectura 1
Aún no hay calificaciones
Lectura 1
17 páginas
GADTD S06 Business Intelligence
Aún no hay calificaciones
GADTD S06 Business Intelligence
43 páginas
Bussiness Intelligence
Aún no hay calificaciones
Bussiness Intelligence
10 páginas
DataWareHouse y Consultas
Aún no hay calificaciones
DataWareHouse y Consultas
15 páginas
Temas de Minería de Datos
Aún no hay calificaciones
Temas de Minería de Datos
38 páginas
INFORMATICA
Aún no hay calificaciones
INFORMATICA
13 páginas
Unidad I - Material ISO931
Aún no hay calificaciones
Unidad I - Material ISO931
20 páginas
Cubos OLAP Como Fuente de Información para La Toma de Decisiones PDF
Aún no hay calificaciones
Cubos OLAP Como Fuente de Información para La Toma de Decisiones PDF
4 páginas
Resultado de Aprendizaje Unidad 4docx
Aún no hay calificaciones
Resultado de Aprendizaje Unidad 4docx
6 páginas
4 Olap
Aún no hay calificaciones
4 Olap
45 páginas
BI Análisis
Aún no hay calificaciones
BI Análisis
5 páginas
Que Es Bussiness Intelligence
Aún no hay calificaciones
Que Es Bussiness Intelligence
30 páginas
Bodegas de Datos y Mineria de Datos
Aún no hay calificaciones
Bodegas de Datos y Mineria de Datos
28 páginas
Mineria de Datos
Aún no hay calificaciones
Mineria de Datos
32 páginas
Qué Es Datawarehouse
Aún no hay calificaciones
Qué Es Datawarehouse
11 páginas
Cubos Olap
Aún no hay calificaciones
Cubos Olap
26 páginas
Tema 3. Apartado 6. Elaborar El Plan de Acción Tutorial de Una UF Impartida en Modalidad en Línea
100% (3)
Tema 3. Apartado 6. Elaborar El Plan de Acción Tutorial de Una UF Impartida en Modalidad en Línea
5 páginas
Unidad 6 Base de Datos Domitila Velazquez de La Cruz
Aún no hay calificaciones
Unidad 6 Base de Datos Domitila Velazquez de La Cruz
22 páginas
Mineriadedatos 1229479290664133 1
Aún no hay calificaciones
Mineriadedatos 1229479290664133 1
44 páginas
Taller de Aplicacion de Erp Segunda y Tercera Clase
Aún no hay calificaciones
Taller de Aplicacion de Erp Segunda y Tercera Clase
51 páginas
Data Warehouse
0% (1)
Data Warehouse
7 páginas
Mineria de Datos
Aún no hay calificaciones
Mineria de Datos
22 páginas
Olap - Rolap - Molap
Aún no hay calificaciones
Olap - Rolap - Molap
5 páginas
Ensayo Introducción
Aún no hay calificaciones
Ensayo Introducción
7 páginas
Paper IEEE
Aún no hay calificaciones
Paper IEEE
3 páginas
Almacenes de Datos - Leccion I
Aún no hay calificaciones
Almacenes de Datos - Leccion I
19 páginas
Comparacion Entre Data Warehouse Data Mining y Data Mart PDF
Aún no hay calificaciones
Comparacion Entre Data Warehouse Data Mining y Data Mart PDF
2 páginas
Objetivo Justificacion
Aún no hay calificaciones
Objetivo Justificacion
8 páginas
Topicos
Aún no hay calificaciones
Topicos
4 páginas
Bodegas de Datos Mineria de Datos
Aún no hay calificaciones
Bodegas de Datos Mineria de Datos
28 páginas
Introducción A La Minería de Datos
Aún no hay calificaciones
Introducción A La Minería de Datos
41 páginas
El Juego-Daniil B. Elkonin PDF
50% (2)
El Juego-Daniil B. Elkonin PDF
10 páginas
Aplicacion de La Mineria de Datos Sobre Bases
Aún no hay calificaciones
Aplicacion de La Mineria de Datos Sobre Bases
9 páginas
Conceptos Básicos de Datawarehouse
Aún no hay calificaciones
Conceptos Básicos de Datawarehouse
10 páginas
Semana 5 Cuestionario-Habilidades-Sociales
Aún no hay calificaciones
Semana 5 Cuestionario-Habilidades-Sociales
11 páginas
Libro HD I
Aún no hay calificaciones
Libro HD I
226 páginas
Parcial Semana 4 Neuropsicologia
100% (1)
Parcial Semana 4 Neuropsicologia
13 páginas
Evidencia de Aprendizaje Semana 3
0% (1)
Evidencia de Aprendizaje Semana 3
6 páginas
Preposiciones Simples Italiano
Aún no hay calificaciones
Preposiciones Simples Italiano
3 páginas
Cuidado Humanizado de Enfermeria Visibilizando La Teoria y La Investigacion en La Practica
100% (1)
Cuidado Humanizado de Enfermeria Visibilizando La Teoria y La Investigacion en La Practica
20 páginas
Instrumentos de Evaluacion 1
100% (1)
Instrumentos de Evaluacion 1
7 páginas
Pud 6to Unidad5 Lengua y Literatura
Aún no hay calificaciones
Pud 6to Unidad5 Lengua y Literatura
28 páginas
Anàlisis Crìtico
Aún no hay calificaciones
Anàlisis Crìtico
3 páginas
Intervenciones Nic
Aún no hay calificaciones
Intervenciones Nic
4 páginas
Hernandez Rojas. Una Mirada Histórica de La Psciología Educativa
Aún no hay calificaciones
Hernandez Rojas. Una Mirada Histórica de La Psciología Educativa
34 páginas
Los Pronombres
Aún no hay calificaciones
Los Pronombres
6 páginas
Fundamentos Psicologicos de La Educacion
Aún no hay calificaciones
Fundamentos Psicologicos de La Educacion
10 páginas
Jessicapaillan Semana3
Aún no hay calificaciones
Jessicapaillan Semana3
7 páginas
Dimensión Estetica
Aún no hay calificaciones
Dimensión Estetica
4 páginas
Sustantivos Mas Fem
Aún no hay calificaciones
Sustantivos Mas Fem
4 páginas
Técnicas de Modificación de Conducta - (Capítulo 16. Técnicas de Modelado)
Aún no hay calificaciones
Técnicas de Modificación de Conducta - (Capítulo 16. Técnicas de Modelado)
27 páginas
1.1 Bedollaerick
Aún no hay calificaciones
1.1 Bedollaerick
3 páginas
Plan Mejoramiento de Comprensión Lectora 1
Aún no hay calificaciones
Plan Mejoramiento de Comprensión Lectora 1
4 páginas
Planificación de Un Contexto de Aprendizaje para El I Ciclo
Aún no hay calificaciones
Planificación de Un Contexto de Aprendizaje para El I Ciclo
8 páginas
Triptico2019 Marzo (Ok
Aún no hay calificaciones
Triptico2019 Marzo (Ok
2 páginas
La Oracion
Aún no hay calificaciones
La Oracion
7 páginas
Modelo Parcial Metodología Cualitativa
Aún no hay calificaciones
Modelo Parcial Metodología Cualitativa
10 páginas
Programa Analítico PLC PDF
Aún no hay calificaciones
Programa Analítico PLC PDF
8 páginas
Diapositivas Robbins Cap 7 171222020620 PDF
Aún no hay calificaciones
Diapositivas Robbins Cap 7 171222020620 PDF
22 páginas
Ejemplo Diario de Doble Entrada
Aún no hay calificaciones
Ejemplo Diario de Doble Entrada
5 páginas
Control de La Conducta Por Estimulo Unidad 6
Aún no hay calificaciones
Control de La Conducta Por Estimulo Unidad 6
4 páginas
Formato de Entrevista Inicial INFANTIL
Aún no hay calificaciones
Formato de Entrevista Inicial INFANTIL
2 páginas
Ingeniería de datos. Diseño, implementación y optimización de flujos de datos en Python
De Everand
Ingeniería de datos. Diseño, implementación y optimización de flujos de datos en Python
José Manuel Ortega
Aún no hay calificaciones
SQL para Analistas de Datos: Serie Dominio de Datos
De Everand
SQL para Analistas de Datos: Serie Dominio de Datos
Michael Chen
Aún no hay calificaciones
UF1890 - Desarrollo de componente software y consultas dentro del sistema de almacén de datos
De Everand
UF1890 - Desarrollo de componente software y consultas dentro del sistema de almacén de datos
Jorge Martínez Mostazo
Aún no hay calificaciones