0% encontró este documento útil (0 votos)
34 vistas1 página

Big Data Con Python 2 21

Este documento describe la ciencia de datos y los procesos involucrados, incluyendo técnicas como bases de datos, visualización, estadísticas y aprendizaje automático. También describe la estructura típica de un proyecto de análisis de datos e identifica los actores clave.

Cargado por

Poe
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
34 vistas1 página

Big Data Con Python 2 21

Este documento describe la ciencia de datos y los procesos involucrados, incluyendo técnicas como bases de datos, visualización, estadísticas y aprendizaje automático. También describe la estructura típica de un proyecto de análisis de datos e identifica los actores clave.

Cargado por

Poe
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 1

Ciencia de datos

el proceso de descubrimiento, mientras que el término minería de datos o machine


learning es utilizado más por los especialistas en inteligencia artificial.
Hasta ahora, los mayores éxitos en big data se pueden atribuir directa o indirecta-
mente a avances en bases de datos (un campo en el que los ordenadores superan a
los humanos). No obstante, muchos problemas de representación del conocimiento
y de reducción de la complejidad de la búsqueda necesaria (usando conocimiento a
priori) están aún por resolver. Ahí reside el interés que ha despertado el tema entre
investigadores de todo el mundo.
Los procesos de BD involucran diversas tecnologías:
• Bases de datos que permiten almacenar los datos de forma estructurada, tan-
to a nivel lógico (con la aparición en los últimos años de las bases de datos no
relacionales) y a nivel de hardware (con la capacidad para el proceso en clúster).
• Técnicas de visualización que permiten realizar representaciones gráficas de
los datos que facilitan la labor del usuario a la hora de entender los datos, para
filtrarlos y procesarlos.
• Técnicas estadísticas, que permiten analizar analíticamente los datos almacena-
dos en las bases de datos y desarrollar modelos estadísticos que los expliquen.
• Técnicas de aprendizaje automático, que permiten desarrollar modelos concep-
tuales que representan los datos almacenados en la base de datos.

1.5 Estructura de un proyecto de análisis de datos


En este apartado se repasan las fases de un proyecto de BD y se identifican los actores
correspondientes. Por actores entendemos:
• La empresa que requiere el conocimiento extraído, el cliente, en principio ese
conocimiento puede ser estático, es decir, un conjunto de reglas o relaciones que
les permitan interpretar lo que está ocurriendo en un momento determinado, o
puede ser dinámico, es decir, un software con los algoritmos adecuados para la
extracción de conocimiento que puedan ejecutar sobre los datos a medida que
se van almacenando.
• La empresa especializada en desarrollo de herramientas avanzadas, la empresa
TIC, y que habitualmente ha desarrollado el sistema de información del cliente,
y que desea incorporar entre las herramientas del sistema de información un
núcleo de visualización y extracción de conocimiento para incrementar el valor
innovador del sistema de información. Un ejemplo claro de estos sistemas son las
herramientas de business intelligence, cuya idea es proporcionar la información
procesada y el conocimiento extraído para que los directivos tomen las decisio-

22
E-Books & Papers for Statisticians

También podría gustarte