0 calificaciones0% encontró este documento útil (0 votos)
34 vistas1 página
Big Data Con Python 2 21
Este documento describe la ciencia de datos y los procesos involucrados, incluyendo técnicas como bases de datos, visualización, estadísticas y aprendizaje automático. También describe la estructura típica de un proyecto de análisis de datos e identifica los actores clave.
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0 calificaciones0% encontró este documento útil (0 votos)
34 vistas1 página
Big Data Con Python 2 21
Este documento describe la ciencia de datos y los procesos involucrados, incluyendo técnicas como bases de datos, visualización, estadísticas y aprendizaje automático. También describe la estructura típica de un proyecto de análisis de datos e identifica los actores clave.
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 1
Ciencia de datos
el proceso de descubrimiento, mientras que el término minería de datos o machine
learning es utilizado más por los especialistas en inteligencia artificial. Hasta ahora, los mayores éxitos en big data se pueden atribuir directa o indirecta- mente a avances en bases de datos (un campo en el que los ordenadores superan a los humanos). No obstante, muchos problemas de representación del conocimiento y de reducción de la complejidad de la búsqueda necesaria (usando conocimiento a priori) están aún por resolver. Ahí reside el interés que ha despertado el tema entre investigadores de todo el mundo. Los procesos de BD involucran diversas tecnologías: • Bases de datos que permiten almacenar los datos de forma estructurada, tan- to a nivel lógico (con la aparición en los últimos años de las bases de datos no relacionales) y a nivel de hardware (con la capacidad para el proceso en clúster). • Técnicas de visualización que permiten realizar representaciones gráficas de los datos que facilitan la labor del usuario a la hora de entender los datos, para filtrarlos y procesarlos. • Técnicas estadísticas, que permiten analizar analíticamente los datos almacena- dos en las bases de datos y desarrollar modelos estadísticos que los expliquen. • Técnicas de aprendizaje automático, que permiten desarrollar modelos concep- tuales que representan los datos almacenados en la base de datos.
1.5 Estructura de un proyecto de análisis de datos
En este apartado se repasan las fases de un proyecto de BD y se identifican los actores correspondientes. Por actores entendemos: • La empresa que requiere el conocimiento extraído, el cliente, en principio ese conocimiento puede ser estático, es decir, un conjunto de reglas o relaciones que les permitan interpretar lo que está ocurriendo en un momento determinado, o puede ser dinámico, es decir, un software con los algoritmos adecuados para la extracción de conocimiento que puedan ejecutar sobre los datos a medida que se van almacenando. • La empresa especializada en desarrollo de herramientas avanzadas, la empresa TIC, y que habitualmente ha desarrollado el sistema de información del cliente, y que desea incorporar entre las herramientas del sistema de información un núcleo de visualización y extracción de conocimiento para incrementar el valor innovador del sistema de información. Un ejemplo claro de estos sistemas son las herramientas de business intelligence, cuya idea es proporcionar la información procesada y el conocimiento extraído para que los directivos tomen las decisio-