0% encontró este documento útil (0 votos)
37 vistas5 páginas

Activdad 3

El documento describe varias tecnologías relacionadas con el análisis de datos. El machine learning permite que las máquinas aprendan sin programación explícita identificando patrones en los datos. KDD es el proceso de descubrir conocimiento útil a partir de grandes conjuntos de datos mediante la aplicación de técnicas estadísticas y de minería de datos. Un data warehouse almacena grandes cantidades de datos de una organización de forma segura y fácil de recuperar para su análisis.

Cargado por

saturvinng
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
37 vistas5 páginas

Activdad 3

El documento describe varias tecnologías relacionadas con el análisis de datos. El machine learning permite que las máquinas aprendan sin programación explícita identificando patrones en los datos. KDD es el proceso de descubrir conocimiento útil a partir de grandes conjuntos de datos mediante la aplicación de técnicas estadísticas y de minería de datos. Un data warehouse almacena grandes cantidades de datos de una organización de forma segura y fácil de recuperar para su análisis.

Cargado por

saturvinng
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 5

Machine learning

El ‘machine learning’ –aprendizaje automático– es una rama de la inteligencia


artificial que permite que las máquinas aprendan sin ser expresamente programadas para ello. Una
habilidad indispensable para hacer sistemas capaces de identificar patrones entre los datos para
hacer predicciones. Esta tecnología está presente en un sinfín de aplicaciones como las
recomendaciones de Netflix o Spotify, las respuestas inteligentes de Gmail o el habla de Siri y
Alexa.

Caracteristicas del machine learning


, la estadística es una de las bases del machine learning, pues gracias a esa información se crean
algoritmos que calculan el mejor resultado para una tarea en cuestión de minutos y horas (cuando
antes llevaba días o semanas enteras, según el volumen de información).

Es importante tener en cuenta los siguientes factores a la hora de utilizar estas tecnologías:

 A mayor cantidad de datos, las predicciones se vuelven más confiables y precisas.


 Requieren un proceso de entrenamiento antes de poder generar predicciones.
 Se basan en la generación de modelos predictivos como producto de la detección de patrones.
 El machine learning permite procesar diferentes tipos de información, como imágenes, textos,
sonidos o valores numéricos.
 La capacidad del computador que utilices dependerá de las acciones que quieras llevar a cabo.
 Siempre existe un margen de error en la toma de decisión de los sistemas de machine
learning, pero generalmente es mucho menor que la humana.

KDD
Se dice entonces que KDD (Descubrimiento de Conocimiento en Bases de Datos) es el proceso
para la identificación de patrones válidos, nuevos, útiles y sobre todo comprensibles, que conlleva
al descubrimiento de nuevo conocimiento. En cambio, la minería de datos se refiere a solo una de
las etapas de dicho proceso, considerada por muchos como la más importante.

Caracteristicas de KDD

 Interdisciplinario: KDD es un enfoque interdisciplinario que combina elementos de la


estadística, la minería de datos, el aprendizaje automático, la visualización de datos, la
inteligencia artificial y más. Requiere la colaboración de expertos en diversas áreas para
obtener resultados significativos.

 Fases del proceso: El proceso KDD se divide generalmente en varias fases: selección,
preprocesamiento, transformación, minería de datos, evaluación y presentación. Cada fase
tiene su propio conjunto de tareas y técnicas específicas.

 Extracción de conocimiento: El objetivo principal de KDD es descubrir conocimiento nuevo


y valioso a partir de los datos. Esto podría incluir patrones, tendencias, relaciones, anomalías
u otras estructuras ocultas en los datos.

 Datos de entrada: KDD parte de grandes conjuntos de datos almacenados en bases de datos u
otras fuentes. Estos datos pueden ser estructurados (como tablas de bases de datos) o no
estructurados (como texto, imágenes o videos).

 Preprocesamiento: Antes de que los datos puedan ser analizados, generalmente se requiere un
proceso de preprocesamiento para limpiar y transformar los datos en un formato adecuado.
Esto puede incluir la eliminación de valores faltantes, la normalización de variables y la
eliminación de ruido.

 Minería de datos: La fase de minería de datos implica la aplicación de algoritmos y técnicas


para descubrir patrones y relaciones en los datos. Esto puede incluir la identificación de
grupos (clustering), la predicción de valores futuros (regresión), la detección de anomalías y
más.

 Evaluación: Después de aplicar técnicas de minería de datos, es importante evaluar la calidad


y la relevancia de los patrones y resultados descubiertos. Esto puede implicar la validación
cruzada, la comparación con datos de prueba o la evaluación por expertos.

 Aplicaciones: KDD se utiliza en una variedad de campos, incluyendo la investigación


científica, la medicina, la industria, las finanzas y más. Se puede aplicar para la toma de
decisiones informadas, la identificación de oportunidades comerciales y la mejora de
procesos.

 Iterativo: El proceso KDD es iterativo, lo que significa que los resultados iniciales pueden
llevar a ajustes en las fases anteriores o posteriores del proceso. La retroalimentación y la
refinación son comunes a medida que se obtiene un mayor entendimiento de los datos y los
patrones.

 Privacidad y ética: Dado que KDD implica el manejo de datos sensibles, es importante
considerar cuestiones de privacidad y ética en todas las etapas del proceso, especialmente en
lo que respecta a la anonimización y la protección de la información personal.

Data Warehouse
Un Data Warehouse es un almacén electrónico donde generalmente una empresa u organización
mantiene una gran cantidad de información. Los datos de un data warehouse deben almacenarse
de forma segura, fiable, fácil de recuperar y fácil de administrar.

Caracteristicas del data Warehouse


Las características del data warehouse son muy variadas, pues estas son las que dotan al sistema
de capacidades bastante potentes. Sin embargo, Bill Inmon (precursor del data warehousing)
estableció, desde un principio, las siguientes como las principales características:
 Es integrado: el sistema del data warehousing busca eliminar las inconsistencias en los
sistemas operacionales para que los datos se puedan integrar en una estructura homogenizada.
 Es temático: todos los datos se organizan por temas, así los usuarios finales pueden acceder y
entender fácilmente la información almacenada, la cual está debidamente categorizada.
 Es de tiempo variante: los datos almacenados en el DWH guardan sus registros temporales,
con lo cual se puede acceder a información histórica según consultadas basadas en periodos
de tiempo.
 No es volátil: la información ingresada en el DWH es permanente, esta puede ser leída mas
no eliminada, lo que respalda la fiabilidad de los datos almacenados. Por lo tanto, hay 0% de
volatilidad sobre lo ingresado.

Elementos de Data Warehouse


Un almacén de datos típico tiene cuatro componentes principales: una base de datos central,
herramientas de ETL (extraer, transformar, cargar), metadatos, y herramientas de
acceso. Todos estos componentes están diseñados para ser rápidos, de modo que usted
pueda obtener resultados en seguida y analizar los datos sobre la marcha.
 Base de datos central
 Intragracion de datos
 Metadatos
 Herarmientas de acceso al almacen de datos.

Cubos OLAP
Los cubos de procesamiento analítico en línea (OLAP) son una característica de Service Manager
que usan la infraestructura de almacenamiento de datos existente para proporcionar
funcionalidades de inteligencia empresarial de autoservicio a los usuarios finales.
Un cubo OLAP es una estructura de datos que supera las limitaciones de las bases de datos
relacionales y proporciona un análisis rápido de datos. Los cubos pueden mostrar y sumar grandes
cantidades de datos, a la vez que proporcionan a los usuarios acceso mediante búsqueda a los
puntos de datos. De este modo, los datos se pueden agrupar, segmentar y segmentar según sea
necesario para controlar la mayor variedad de preguntas relevantes para el área de interés de un
usuario.

Caracteristicas de OLAP
.
 Multidimensionalidad: OLAP se organiza en torno a estructuras multidimensionales. Los
datos se ven desde múltiples perspectivas, lo que permite a los usuarios analizar y explorar
los datos desde diferentes dimensiones, como tiempo, producto, ubicación, etc.

 Cubo de Datos: En OLAP, los datos se organizan en lo que se conoce como "cubos". Cada eje
del cubo representa una dimensión diferente, y las celdas del cubo contienen los valores
agregados que se están analizando. Los cubos permiten una visualización más intuitiva y
flexible de los datos.

 Operaciones Analíticas: OLAP admite una variedad de operaciones analíticas, como la


consolidación, el desglose, la perforación y la rotación. Estas operaciones permiten a los
usuarios realizar análisis detallados y resúmenes de datos en diferentes niveles de
granularidad.

 Agregación y Jerarquías: Los datos se pueden agregar en diferentes niveles de jerarquía, lo


que permite una exploración profunda. Por ejemplo, los datos de ventas pueden agregarse a
nivel de año, trimestre, mes o día. Las jerarquías facilitan la navegación por los datos y el
análisis detallado.

 Interactividad: OLAP proporciona una experiencia interactiva para los usuarios, lo que les
permite realizar análisis ad hoc y explorar datos en tiempo real. Los usuarios pueden cambiar
las dimensiones, aplicar filtros y ver los resultados de inmediato.

 Rendimiento Optimizado: Las bases de datos OLAP están diseñadas para ofrecer un alto
rendimiento en consultas analíticas. Utilizan técnicas como la preagregación, el
almacenamiento multidimensional y la indexación especializada para acelerar las consultas.

 Consultas Complejas: OLAP admite consultas complejas que involucran múltiples


dimensiones y operaciones. Los usuarios pueden combinar fácilmente diferentes atributos y
medidas para obtener información detallada y significativa.

 Enfoque en la Toma de Decisiones: OLAP está diseñado para respaldar el proceso de toma de
decisiones al proporcionar a los usuarios herramientas poderosas para analizar tendencias,
identificar patrones y evaluar el rendimiento.

 Modelado de Datos Dimensionales: Para implementar OLAP, se utiliza el modelado de datos


dimensionales. Esto implica la creación de esquemas de estrella o copo de nieve que
organizan los datos en torno a hechos (medidas cuantitativas) y dimensiones (atributos
descriptivos).

 Compatibilidad con Herramientas de BI: OLAP se integra estrechamente con herramientas de


Business Intelligence (BI) que permiten a los usuarios crear informes, paneles y análisis
visuales basados en los datos almacenados en cubos OLAP.
.
Me gusto mucho el de OLAP porque son una forma de organizar y visualizar datos
multidimensionales para facilitar el análisis interactivo

Bibliografía

Pursell, S. (2022, octubre 19). ¿Qué es el machine learning? Características,


tipos y ejemplos. Hubspot.es.
https://blog.hubspot.es/marketing/machine-learning

Agencia, F. (2021, junio 1). Descubrimiento de Conocimiento en Bases de


Datos – KDD. Salud Electrónica.
https://saludelectronica.com/descubrimiento-de-conocimiento-en-
bases-de-datos-kdd/

Data Warehouse: todo lo que necesitas saber sobre almacenamiento de datos.


(s/f). Powerdata.Es. Recuperado el 18 de agosto de 2023, de
https://www.powerdata.es/data-warehouse

Sierra, Y. (2019, septiembre 13). DWH: ejemplos, características y


arquitectura del Data Warehouse. #ADNCLOUD; Mediacloud.
https://blog.mdcloud.es/dwh-ejemplos-arquitectura-data-warehouse/

Uso de cubos OLAP para análisis avanzado. (s/f). Microsoft.com.


Recuperado el 18 de agosto de 2023, de
https://learn.microsoft.com/es-es/system-center/scsm/olap-cubes-
overview?view=sc-sm-2022

También podría gustarte