Activdad 3
Activdad 3
Es importante tener en cuenta los siguientes factores a la hora de utilizar estas tecnologías:
KDD
Se dice entonces que KDD (Descubrimiento de Conocimiento en Bases de Datos) es el proceso
para la identificación de patrones válidos, nuevos, útiles y sobre todo comprensibles, que conlleva
al descubrimiento de nuevo conocimiento. En cambio, la minería de datos se refiere a solo una de
las etapas de dicho proceso, considerada por muchos como la más importante.
Caracteristicas de KDD
Fases del proceso: El proceso KDD se divide generalmente en varias fases: selección,
preprocesamiento, transformación, minería de datos, evaluación y presentación. Cada fase
tiene su propio conjunto de tareas y técnicas específicas.
Datos de entrada: KDD parte de grandes conjuntos de datos almacenados en bases de datos u
otras fuentes. Estos datos pueden ser estructurados (como tablas de bases de datos) o no
estructurados (como texto, imágenes o videos).
Preprocesamiento: Antes de que los datos puedan ser analizados, generalmente se requiere un
proceso de preprocesamiento para limpiar y transformar los datos en un formato adecuado.
Esto puede incluir la eliminación de valores faltantes, la normalización de variables y la
eliminación de ruido.
Iterativo: El proceso KDD es iterativo, lo que significa que los resultados iniciales pueden
llevar a ajustes en las fases anteriores o posteriores del proceso. La retroalimentación y la
refinación son comunes a medida que se obtiene un mayor entendimiento de los datos y los
patrones.
Privacidad y ética: Dado que KDD implica el manejo de datos sensibles, es importante
considerar cuestiones de privacidad y ética en todas las etapas del proceso, especialmente en
lo que respecta a la anonimización y la protección de la información personal.
Data Warehouse
Un Data Warehouse es un almacén electrónico donde generalmente una empresa u organización
mantiene una gran cantidad de información. Los datos de un data warehouse deben almacenarse
de forma segura, fiable, fácil de recuperar y fácil de administrar.
Cubos OLAP
Los cubos de procesamiento analítico en línea (OLAP) son una característica de Service Manager
que usan la infraestructura de almacenamiento de datos existente para proporcionar
funcionalidades de inteligencia empresarial de autoservicio a los usuarios finales.
Un cubo OLAP es una estructura de datos que supera las limitaciones de las bases de datos
relacionales y proporciona un análisis rápido de datos. Los cubos pueden mostrar y sumar grandes
cantidades de datos, a la vez que proporcionan a los usuarios acceso mediante búsqueda a los
puntos de datos. De este modo, los datos se pueden agrupar, segmentar y segmentar según sea
necesario para controlar la mayor variedad de preguntas relevantes para el área de interés de un
usuario.
Caracteristicas de OLAP
.
Multidimensionalidad: OLAP se organiza en torno a estructuras multidimensionales. Los
datos se ven desde múltiples perspectivas, lo que permite a los usuarios analizar y explorar
los datos desde diferentes dimensiones, como tiempo, producto, ubicación, etc.
Cubo de Datos: En OLAP, los datos se organizan en lo que se conoce como "cubos". Cada eje
del cubo representa una dimensión diferente, y las celdas del cubo contienen los valores
agregados que se están analizando. Los cubos permiten una visualización más intuitiva y
flexible de los datos.
Interactividad: OLAP proporciona una experiencia interactiva para los usuarios, lo que les
permite realizar análisis ad hoc y explorar datos en tiempo real. Los usuarios pueden cambiar
las dimensiones, aplicar filtros y ver los resultados de inmediato.
Rendimiento Optimizado: Las bases de datos OLAP están diseñadas para ofrecer un alto
rendimiento en consultas analíticas. Utilizan técnicas como la preagregación, el
almacenamiento multidimensional y la indexación especializada para acelerar las consultas.
Enfoque en la Toma de Decisiones: OLAP está diseñado para respaldar el proceso de toma de
decisiones al proporcionar a los usuarios herramientas poderosas para analizar tendencias,
identificar patrones y evaluar el rendimiento.
Bibliografía