0% encontró este documento útil (0 votos)

41 vistas5 páginas

Diseno de Centro de Datos

Cargado por

Freddy Virgil

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

41 vistas5 páginas

Diseno de Centro de Datos

Cargado por

Freddy Virgil

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 5

Diseño de centro de datos.

Freddy Joel Virgil.

17-MISM-1-048

1. Panorama general de la minería de datos.

La minería de datos o exploración de datos (es la etapa de análisis de

"Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las
ciencias de la computación referido al proceso que intenta descubrir patrones
en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la
inteligencia artificial, aprendizaje automático, estadística y sistemas de bases
de datos. El objetivo general del proceso de minería de datos consiste en
extraer información de un conjunto de datos y transformarla en una estructura
comprensible para su uso posterior. Además de la etapa de análisis en bruto,
supone aspectos de gestión de datos y de bases de datos, de procesamiento de
datos, del modelo y de las consideraciones de inferencia, de métricas de
Intereses, de consideraciones de la teoría de la complejidad computacional, de
post-procesamiento de las estructuras descubiertas, de la visualización y de la
actualización en línea.

El término es un concepto de moda, y es frecuentemente mal utilizado para

referirse a cualquier forma de datos a gran escala o procesamiento de la
información (recolección, extracción, almacenamiento, análisis y estadísticas),
pero también se ha generalizado a cualquier tipo de sistema informático de
apoyo a decisiones, incluyendo la inteligencia artificial, aprendizaje automático
y la inteligencia empresarial. En el uso de la palabra, el término clave es el
descubrimiento, comúnmente se define como "la detección de algo nuevo".
Incluso el popular libro "La minería de datos: sistema de prácticas herramientas
de aprendizaje y técnicas con Java" (que cubre todo el material de aprendizaje
automático) originalmente iba a ser llamado simplemente "la máquina de
aprendizaje práctico", y el término "minería de datos" se añadió por razones de
marketing. A menudo, los términos más generales "(gran escala) el análisis de
datos", o "análisis". O cuando se refieren a los métodos actuales, la inteligencia
artificial y aprendizaje automático, son más apropiados.

La tarea de minería de datos real es el análisis automático o semi-automático

de grandes cantidades de datos para extraer patrones interesantes hasta ahora
desconocidos, como los grupos de registros de datos (análisis clúster), registros
poco usuales (la detección de anomalías) y dependencias (minería por reglas de
asociación). Esto generalmente implica el uso de técnicas de bases de datos
como los índices espaciales. Estos patrones pueden entonces ser vistos como
una especie de resumen de los datos de entrada, y pueden ser utilizados en el
análisis adicional o, por ejemplo, en el aprendizaje automático y análisis
predictivo.

2. Objetivos de la minería de datos.

El objetivo general del proceso de minería de datos consiste en extraer

información de un conjunto de datos y transformarla en una estructura
comprensible para su uso posterior.

3. Aplicaciones de la minería de datos.

Cuando se habla de minería de datos, aplicaciones, herramientas y soluciones

trabajan de forma conjunta para lograr un objetivo común: garantizar la calidad
de los datos. Se busca llegar a un nivel que aporte fiabilidad a la toma de
decisiones, asegurando que con ellos se crea un conocimiento sólido, íntegro y
completo.

Dentro del campo de la minería de datos, las aplicaciones más extendidas son
las siguientes:
1. Análisis de datos financieros: se emplea tanto en el sector bancario como en
el de las finanzas. Se busca proveer datos que aseguren que es posible practicar
análisis sistemáticos en condiciones avanzadas y con garantías de fiabilidad.
Algunos ejemplos son:

 Diseño y construcción de almacenes de datos para el análisis

multidimensional de datos.
 Predicción de pago de préstamos y análisis de políticas de crédito de
cliente.
 Clasificación y el agrupamiento de los clientes para la creación de
ofertas personalizadas.
 Detección de blanqueamiento de dinero y otros delitos financieros.

2. Industria minorista: el sector retail recoge grandes cantidades de datos

provenientes de las ventas, el historial de compra de los clientes o el transporte
de mercancías. La cantidad de datos recogidos continúa expandiéndose
rápidamente debido al aumento de la facilidad, disponibilidad y popularidad de
la web y las transacciones online. La minería de datos con sus aplicaciones para
la industria minorista ayuda a identificar patrones de compra de los clientes y
tendencias. De esta forma, las empresas están en condiciones de proporcionar
una mejor calidad de servicio al cliente, aumentando su satisfacción y
facilitando su retención. Entre estas aplicaciones destacan las que permiten:

 El análisis multidimensional de las ventas, los clientes, los productos, el

tiempo y la región.
 Los análisis de la eficacia de las campañas de ventas.
 La recomendación personalizada de productos.
 Las referencias cruzadas de artículos.
3. Industria de las telecomunicaciones: en este sector, los datos son
especialmente importantes para alcanzar una buena comprensión del negocio.
La minería de datos y aplicaciones específicamente diseñadas para este área,
ayudan en la identificación de los patrones de telecomunicaciones, facilitan la
detección de actividades fraudulentas y posibilitan el hacer un mejor uso de los
recursos, mejorando la calidad del servicio. Entre las más ventajosas están:

 Análisis multidimensional de datos de telecomunicaciones.

 Análisis de patrones fraudulentos.
 Identificación de patrones inusuales, hábitos y tendencias.
 Asociación multidimensional y análisis de patrones secuenciales.

4. Análisis de datos biológicos: el campo de la biología es uno de los más

beneficiados por los avances de la tecnología. La genómica, la proteómica, la
genómica funcional y la minería de datos aplicada a la investigación de los seres
vivos son sólo algunos ejemplos, una lista donde no hay que olvidarse de la
bioinformática. La minería de datos con sus aplicaciones aporta una
contribución importante para el análisis de datos biológicos:

 Integración semántica de las bases de datos genómicos y proteómicos

heterogéneos distribuidos.
 Alineamiento, indexación, búsqueda de similitudes y análisis
comparativo de múltiples secuencias de nucleótidos.
 Descubrimiento de patrones y análisis de redes genéticas.
 Identificación de patrones de proteínas estructurales.

4. Herramientas comerciales de minería de datos.

Clementine / SPSS: Herramienta de data mining que permite desarrollar

modelos predictivos y desplegarlos para mejorar la toma de decisiones. Está
diseñada teniendo en cuenta a los usuarios empresariales, de manera que no
es preciso ser un experto en data mining.
Clementine es la más avanzada herramienta de Data Mining del mercado,
combina modernas técnicas de modelamiento con poderosas herramientas de
acceso, manipulación y exploración de datos en una interfaz simple e intuitiva.

SAS Enterprise Miner / SAS: Solución de minería de datos que proporciona

gran cantidad de modelos y de alternativas. Permite determinar pautas y
tendencias, explica resultados conocidos e identifica factores que permiten
asegurar efectos deseados. Además, compara los resultados de las distintas
técnicas de modelado, tanto en términos estadísticos como de negocio, dentro
de un marco sencillo y fácil de interpretar.

Keel: Es un software para evaluar la evolución de los algoritmos de minería de

datos y problemas de regresión, entre ellos: clasificación, agrupamiento y
patrón de la minería. Contiene una gran colección de algoritmos clásicos de
extracción de conocimientos, técnicas de pre procesamiento (selección de
instancias, selección de características, discretización, métodos de imputación
de valores), Inteligencia Computacional de aprendizaje basado en algoritmos,
incluido el estado evolutivo de algoritmos de aprendizaje basados en diferentes
enfoques (Pittsburgh, Michigan y IRL) y modelos híbridos como sistemas difusos
genéticos, redes neuronales evolutivas, etc. Nos permite realizar un análisis
completo de cualquier modelo de aprendizaje en comparación con los
existentes, incluido un módulo de prueba estadística para la comparación entre
ellos.

SAS Analytics / SAS: Suite de soluciones analíticas que permiten transformar

todos los datos de la organización en conocimiento, reduciendo la
incertidumbre, realizando predicciones fiables y optimizando el desempeño.

RapidMiner / Yale: Es el líder mundial de código abierto para la minería de

datos debido a su combinación de su tecnología de primera calidad y su rango
de funcionalidad. Esta aplicación de RapidMiner cubre un amplio rango de
minería de datos. Además de ser una herramienta flexible para aprender y
explorar la minería de datos, la interfaz gráfica de usuario tiene como objetivo
simplificar el uso para las tareas complejas de esta área.

Microsoft SQL Server 2005 / Microsoft: Solución que ofrece un entorno

integrado para crear modelos de minería de datos y trabajar con ellos. La
solución SQL Server Data Mining permite el acceso a la información necesaria
para tomar decisiones inteligentes sobre problemas empresariales complejos.

Dlife / Apara: Plataforma bioinformática para la toma de decisiones clínicas.

Proporciona un soporte computacional a la toma de decisiones médicas en los
procesos de diagnóstico, tratamiento y seguimiento de la evolución de los
pacientes que permite a los profesionales clínicos incrementar su precisión y la
eficiencia de la prestación sanitaria en una media del 20%.

KNIME: Fue desarrollado originalmente en el departamento de bioinformática

y minería de datos de la Universidad de Constanza, Alemania, bajo la
supervisión del profesor Michael Berthold.

También podría gustarte

Codigos de Activacion Autocad
69% (16)
Codigos de Activacion Autocad
7 páginas
Material de Estudiantes SMPC (R) V022020A SP PDF
0% (1)
Material de Estudiantes SMPC (R) V022020A SP PDF
46 páginas
Presentación Del Curso
Aún no hay calificaciones
Presentación Del Curso
36 páginas
Mapa de Ideas
Aún no hay calificaciones
Mapa de Ideas
8 páginas
Formatos PSP
Aún no hay calificaciones
Formatos PSP
83 páginas
Tema 1 Fundamentos Teóricos de Las Bases de Datos-Clase Teórica
Aún no hay calificaciones
Tema 1 Fundamentos Teóricos de Las Bases de Datos-Clase Teórica
59 páginas
IS1 EQ1 Tiposdesoftware
100% (1)
IS1 EQ1 Tiposdesoftware
4 páginas
Importancia de Base de Datos
100% (1)
Importancia de Base de Datos
1 página
Metodología CRMR
Aún no hay calificaciones
Metodología CRMR
11 páginas
Mineria Datos.
Aún no hay calificaciones
Mineria Datos.
19 páginas
Datos en Mineria
Aún no hay calificaciones
Datos en Mineria
9 páginas
Lectura Mineria de Datos (Hacer Analisis)
Aún no hay calificaciones
Lectura Mineria de Datos (Hacer Analisis)
8 páginas
Minería de Datos
Aún no hay calificaciones
Minería de Datos
6 páginas
Tema I-Introducción A La Minería de Datos
Aún no hay calificaciones
Tema I-Introducción A La Minería de Datos
5 páginas
Características de Los Motores de Bases de Datos
Aún no hay calificaciones
Características de Los Motores de Bases de Datos
6 páginas
Unidad Transferencia
Aún no hay calificaciones
Unidad Transferencia
16 páginas
Herramientas de Minería de Datos
Aún no hay calificaciones
Herramientas de Minería de Datos
10 páginas
Data Mining
Aún no hay calificaciones
Data Mining
19 páginas
Lectura - 6 Big Data y Ciencia de Datos
Aún no hay calificaciones
Lectura - 6 Big Data y Ciencia de Datos
34 páginas
Mineria de Datos Unh Posgrado Ing - Gustavo Veliz, Ing - Hernan y Ing - Erica
Aún no hay calificaciones
Mineria de Datos Unh Posgrado Ing - Gustavo Veliz, Ing - Hernan y Ing - Erica
21 páginas
2.3 Fundamentos de Inteligencia de Negocios JACOBO ADAN VICTOR MANUEL
Aún no hay calificaciones
2.3 Fundamentos de Inteligencia de Negocios JACOBO ADAN VICTOR MANUEL
8 páginas
Actividad No - 1 (Etapa 1 - Contextualización)
Aún no hay calificaciones
Actividad No - 1 (Etapa 1 - Contextualización)
8 páginas
Marco Teorico, Reflexion y Referencias
Aún no hay calificaciones
Marco Teorico, Reflexion y Referencias
8 páginas
Informe Datamining
Aún no hay calificaciones
Informe Datamining
15 páginas
Exploracion de Datos - Grupo#8
Aún no hay calificaciones
Exploracion de Datos - Grupo#8
33 páginas
Análisis de Producción Avícola Mediante Técnicas de Inteligencia de Negocios y Minería de Datos
Aún no hay calificaciones
Análisis de Producción Avícola Mediante Técnicas de Inteligencia de Negocios y Minería de Datos
15 páginas
DD 1 2 Practice Esp
Aún no hay calificaciones
DD 1 2 Practice Esp
2 páginas
Presentación 1-Diseño de Base de Datos
Aún no hay calificaciones
Presentación 1-Diseño de Base de Datos
12 páginas
Base de Datos Cesar Romero
Aún no hay calificaciones
Base de Datos Cesar Romero
6 páginas
Fundamentos de Inteligencia de Negocios
Aún no hay calificaciones
Fundamentos de Inteligencia de Negocios
18 páginas
Comparación de Los SGBD Mas Usados
Aún no hay calificaciones
Comparación de Los SGBD Mas Usados
9 páginas
Minería de Datos
Aún no hay calificaciones
Minería de Datos
5 páginas
Sesion1 Mina
Aún no hay calificaciones
Sesion1 Mina
14 páginas
Procesamiento de Datos y Su Uso en La Industria Minera
Aún no hay calificaciones
Procesamiento de Datos y Su Uso en La Industria Minera
4 páginas
Bodegas de Datos
Aún no hay calificaciones
Bodegas de Datos
28 páginas
Practica Con Ev Entre Pares VRE-Ago24
Aún no hay calificaciones
Practica Con Ev Entre Pares VRE-Ago24
4 páginas
Tareas y Técnicas de Ingeniería de Requisitos
Aún no hay calificaciones
Tareas y Técnicas de Ingeniería de Requisitos
9 páginas
Algoritmos
Aún no hay calificaciones
Algoritmos
12 páginas
Minería de Datos
Aún no hay calificaciones
Minería de Datos
19 páginas
Dpo1 U1 Ea Keaa
0% (1)
Dpo1 U1 Ea Keaa
10 páginas
Tabla Comparativa de Los Modelos Emergentes de Base de Datos
Aún no hay calificaciones
Tabla Comparativa de Los Modelos Emergentes de Base de Datos
3 páginas
Ensayo Cuadro Mágico de Gartner
Aún no hay calificaciones
Ensayo Cuadro Mágico de Gartner
6 páginas
Investigacion Metodos y Tecnicas de Mineria de Datos 2021
Aún no hay calificaciones
Investigacion Metodos y Tecnicas de Mineria de Datos 2021
12 páginas
Estudio de Caso - Industria Sevco
Aún no hay calificaciones
Estudio de Caso - Industria Sevco
13 páginas
Sistemas de Bases de Datos, Diseño, Implementación y Administración
Aún no hay calificaciones
Sistemas de Bases de Datos, Diseño, Implementación y Administración
5 páginas
Business Intelligence E4
Aún no hay calificaciones
Business Intelligence E4
14 páginas
Importancia de Las Bases de Datos
Aún no hay calificaciones
Importancia de Las Bases de Datos
3 páginas
Cuadro Comparativo
Aún no hay calificaciones
Cuadro Comparativo
6 páginas
Tendencia Decision Intelligence
Aún no hay calificaciones
Tendencia Decision Intelligence
8 páginas
Adsc S1121 PP 18 Eist 1 012
Aún no hay calificaciones
Adsc S1121 PP 18 Eist 1 012
4 páginas
Curso Introductorio 2016 Informatica
Aún no hay calificaciones
Curso Introductorio 2016 Informatica
103 páginas
S02.s2 - Ejercicios Data Mining y Balanced Scorecard
Aún no hay calificaciones
S02.s2 - Ejercicios Data Mining y Balanced Scorecard
4 páginas
Gestion
Aún no hay calificaciones
Gestion
59 páginas
Unidad 3 Desarrollo de Aplicaciones
Aún no hay calificaciones
Unidad 3 Desarrollo de Aplicaciones
18 páginas
Cubo OLAP
0% (1)
Cubo OLAP
4 páginas
Clase 1 - Introducción BI
Aún no hay calificaciones
Clase 1 - Introducción BI
59 páginas
Manual para El Proceso de Minería de Datos en SQL Server V
100% (1)
Manual para El Proceso de Minería de Datos en SQL Server V
30 páginas
TFM Comparativa Herramientas de Visualización
Aún no hay calificaciones
TFM Comparativa Herramientas de Visualización
57 páginas
Introducción A La Minería de Datos
Aún no hay calificaciones
Introducción A La Minería de Datos
10 páginas
Data Mining
Aún no hay calificaciones
Data Mining
13 páginas
Fundamentos y Aplicaciones de Mineria de Datos
Aún no hay calificaciones
Fundamentos y Aplicaciones de Mineria de Datos
67 páginas
Mineria de Datos O.
Aún no hay calificaciones
Mineria de Datos O.
5 páginas
Trabajo de Hoy 29-04
Aún no hay calificaciones
Trabajo de Hoy 29-04
11 páginas
Informática Forense
Aún no hay calificaciones
Informática Forense
16 páginas
Instalación de Docker - Platzi
Aún no hay calificaciones
Instalación de Docker - Platzi
3 páginas
Alcatel Onetouch w800 PDF
Aún no hay calificaciones
Alcatel Onetouch w800 PDF
11 páginas
TPV-Virtual Guia de Integracion BIZUM Comercios SIS PDF
Aún no hay calificaciones
TPV-Virtual Guia de Integracion BIZUM Comercios SIS PDF
9 páginas
Plantilla Caso de Uso Aplicación
Aún no hay calificaciones
Plantilla Caso de Uso Aplicación
3 páginas
Tejedoras Circulares - EuroTrade - Tecnologia Textil
Aún no hay calificaciones
Tejedoras Circulares - EuroTrade - Tecnologia Textil
6 páginas
PR-10-015 Procedimiento de Queja y Reclamos
Aún no hay calificaciones
PR-10-015 Procedimiento de Queja y Reclamos
2 páginas
Trabajo Entregable 02
Aún no hay calificaciones
Trabajo Entregable 02
5 páginas
Proceso de Diseño Lógico de Base de Datos
Aún no hay calificaciones
Proceso de Diseño Lógico de Base de Datos
5 páginas
RegNotasFinales 10470340 20 F020211401 24433
Aún no hay calificaciones
RegNotasFinales 10470340 20 F020211401 24433
67 páginas
Educacion Religiosa Noveno
Aún no hay calificaciones
Educacion Religiosa Noveno
5 páginas
Historia PC
Aún no hay calificaciones
Historia PC
4 páginas
Contabilidad I
Aún no hay calificaciones
Contabilidad I
4 páginas
Manual de Java
Aún no hay calificaciones
Manual de Java
6 páginas
Activar Office 2019 Full Español Dale Webo
Aún no hay calificaciones
Activar Office 2019 Full Español Dale Webo
26 páginas
Presentación - Clase 7 PDF
Aún no hay calificaciones
Presentación - Clase 7 PDF
32 páginas
Bases de Datos Distribuidas
Aún no hay calificaciones
Bases de Datos Distribuidas
31 páginas
La Evolucion de Las Tic Sobre Las Tac
Aún no hay calificaciones
La Evolucion de Las Tic Sobre Las Tac
4 páginas
1.2 Aspectos Del Diseño de Sistemas Distribuidos
Aún no hay calificaciones
1.2 Aspectos Del Diseño de Sistemas Distribuidos
8 páginas
CV - Cesar Carbajal
Aún no hay calificaciones
CV - Cesar Carbajal
1 página
Evaluacion N°2 Implementacion de Proyectos de Automatizacion Hugo Catril Matamala
Aún no hay calificaciones
Evaluacion N°2 Implementacion de Proyectos de Automatizacion Hugo Catril Matamala
33 páginas
I2o Logger 17 Manual de Usuario Feb 2019 v4
Aún no hay calificaciones
I2o Logger 17 Manual de Usuario Feb 2019 v4
24 páginas
TP Grupo06
Aún no hay calificaciones
TP Grupo06
14 páginas
Introducción A Los Sistemas de Apoyo A Las Decisiones e Inteligencia Empresarial
Aún no hay calificaciones
Introducción A Los Sistemas de Apoyo A Las Decisiones e Inteligencia Empresarial
2 páginas
X Series User Manual - ES - V1.0 11 12 2017
Aún no hay calificaciones
X Series User Manual - ES - V1.0 11 12 2017
100 páginas
Induccion Senati 202310
Aún no hay calificaciones
Induccion Senati 202310
37 páginas
Evaluacion 02
Aún no hay calificaciones
Evaluacion 02
7 páginas