Terminologia Analisis de Datos
Terminologia Analisis de Datos
Terminologia Analisis de Datos
necesidades, pueden aplicarse para analizar los datos en sus diferentes formas; estas se
basan tanto en aspectos matemático-estadísticos como visuales. Algunas de ellas existen
desde hace mucho tiempo, mientras que otras han tomado el relevo principalmente en la
última década gracias a una importante mejora de la tecnología y las herramientas
disponibles. Hoy en día no hay ningún ámbito de aplicación en el que no se utilice el
análisis de datos día tras día, para proporcionar información significativa y apoyar/guiar al
personal de todos los niveles de la empresa para tomar decisiones basadas en datos y
hechos. En algunos contextos este análisis ya está consolidado y ha pasado a formar parte
de los mecanismos organizativos, mientras que en otros todavía hay aspectos éticos y
culturales que deben madurar para que sea plenamente aceptado.
Índice de temas
El análisis de datos es la práctica de trabajar con datos para obtener información útil, que
luego se puede emplear para tomar decisiones informadas.
Llegando a tiempos más recientes, el uso de las matemáticas y la estadística, junto con la
creciente potencia computacional del hardware, principalmente en la nube, ha
contribuido a la difusión de metodologías que pretenden replicar la inteligencia humana
para extraer información útil en el análisis de datos. Por lo tanto, podemos decir en
general que se aprovechan todos los conocimientos lógicos y tecnológicos para apoyar
eficazmente las decisiones futuras y comprender mejor lo que ocurrió en el pasado.
Hay una multitud de pasos y actividades que, en conjunto, conforman todo el proceso de
análisis de datos. Algunas de ellas a veces solo se llevan a cabo parcialmente, mientras
que otras son más importantes y requieren más tiempo en algunas técnicas y contextos
que en otros; las principales se enumeran a continuación:
Recopilación de requisitos
La fase primordial del proceso de análisis de datos no puede separarse de una definición
cuidadosa y clara del problema, de la necesidad, del objetivo del propio análisis. Identificar
los desiderata y el valor que el análisis debe aportar a la empresa, ayuda a guiar las fases
posteriores; cómo elegir las fuentes de datos correctas (o partes de ellas) que debemos
considerar, qué debemos medir dentro de este perímetro de información y cómo se
comunicarán luego los resultados de forma adecuada. Este primer paso también ayuda a
orientar la elección de la mejor metodología y las herramientas a utilizar.
Recolección de datos
Tras recoger los datos de las fuentes, hay que procesarlos y organizarlos adecuadamente
para utilizarlos en el análisis. En este momento, se aplican medidas como la comprobación
de la integridad referencial o la conversión de los datos a un formato útil para su posterior
procesamiento.
Limpieza de datos
Una vez organizados y procesados, los datos pueden estar incompletos, contener
duplicados o errores. Para garantizar que los resultados generados por los análisis que se
preparan son coherentes y fiables, es importante contar con iniciativas de limpieza de
datos que puedan proporcionar un nivel adecuado de calidad de los mismos. A menudo,
esta fase, junto con la anterior, es la que más tiempo consume, dada la variedad y el
volumen de datos que implican los procesos de análisis.
Análisis/Comunicación
Limpiados y organizados, los datos están listos para la fase de análisis propiamente dicha.
Dependiendo de las técnicas elegidas, este paso puede abordarse de formas muy
diferentes. Sin embargo, lo que tienen en común estas diferentes formas de enfocar el
problema es la comunicación hacia las partes interesadas o que han encargado
directamente el análisis de los datos en cuestión: la información puede presentarse en
diferentes formatos para satisfacer los requisitos iniciales. Para ello, se suelen aplicar
diferentes metodologías de visualización de datos que guían la comunicación de los
mensajes clave contenidos en la información analizada.
Los usuarios finales, basándose en todo el proceso, pueden decidir tomar las medidas
oportunas y aportar comentarios sobre el análisis generado, lo que generará nuevos
análisis, dando lugar a un proceso analítico iterativo.
Metodologías y tipos de análisis de datos actuales
Los diferentes métodos que pueden utilizarse para analizar los datos se dividen
generalmente en dos macrogrupos: los análisis cuantitativos y los cualitativos. Los análisis
cuantitativos son aquellos en los que la información se expresa numéricamente, puede
utilizarse en consecuencia en cálculos de distinta naturaleza y puede representarse
visualmente mediante tablas o gráficos. Por lo tanto, proporcionan indicaciones sobre
cómo clasificar las posibles causas de los problemas o cuantificar su impacto, pero no nos
dicen directamente cómo y qué problema abordar primero. El segundo macrogrupo de
análisis responde a las preguntas «cómo, por qué, qué» en forma de texto y ofrece la
posibilidad de definir un problema y las acciones para abordarlo.
Análisis descriptivo
Entre las metodologías más populares, el análisis descriptivo o estadístico aplica todos los
pasos mencionados anteriormente para ofrecer una imagen global de lo que ha ocurrido
en la historia de los datos recogidos. Este tipo de análisis proporciona una visión clara de
lo que ha sucedido en el pasado, aportando así los elementos necesarios para respaldar
las decisiones que suelen basarse en la experiencia del usuario. El siguiente paso en el
análisis descriptivo es el llamado análisis de diagnóstico, que proporciona un análisis más
profundo de las razones por las que se produjeron los acontecimientos del pasado.
Análisis predictivo
Utilizar las observaciones obtenidas para derivar predicciones sobre cómo podría ser el
comportamiento futuro es lo que se conoce como metodología de análisis predictivo. La
identificación de tendencias, patrones, clusters o relaciones causa-efecto, realizada de
manera ingenieril gracias a la aplicación de algoritmos de Machine Learning, asegura que
la cantidad de datos disponibles se aproveche al máximo para no dejar las acciones a
tomar enteramente a la experiencia del decisor, a su instinto: por lo tanto, proporciona
una ayuda válida hacia un verdadero enfoque basado en datos.
Business Intelligence (BI) y Analytics en un sentido más amplio es la principal técnica que
se ha utilizado y se utiliza actualmente para el análisis de datos. Se basa en la
estructuración de los datos empresariales procedentes de diferentes fuentes y en la
definición de un modelo semántico de metadatos en el que se aplican reglas de lógica
empresarial y de contexto empresarial para convertir los datos brutos en información real
de valor. Los sistemas de BI se han convertido en un producto básico en todas las
empresas, en todos los sectores, y permiten el apoyo a la toma de decisiones descriptivas
y de diagnóstico dentro de una organización.
Minería de datos
Como corolario de las técnicas mencionadas, hay un mundo de tecnologías que se están
haciendo cada vez más populares y que responden a la creciente necesidad de pasar de
una cultura centrada en las TI a un enfoque mixto, en el que las figuras empresariales
también entran en el proceso de modelización real del análisis de datos; este conjunto de
técnicas incluye la visualización de datos, la exploración de datos y el descubrimiento de
datos. En estas técnicas, el mayor esfuerzo no está en la fase de procesamiento y
modelización de los datos, sino en su interpretación mediante la representación gráfica
para poder identificar situaciones anómalas o potenciales oportunidades explotando
visualizaciones avanzadas. Este tipo de técnica hace uso de herramientas que se basan en
una fuerte predisposición a analizar los datos en modo autoservicio, donde son
directamente los profesionales con actitudes más orientadas al proceso y menos técnicas
los que aplican sus conocimientos y experiencia para tratar de extraer información útil.
Gracias a este tipo de técnicas, no estamos atados al tiempo técnico del departamento de
informática, podemos crear un fuerte compromiso empresarial y no dependemos de las
competencias técnicas, aprovechando así los conocimientos internos. Por otro lado, estos
enfoques, a largo plazo, acaban sufriendo la falta de una «estructura» subyacente para
diseñar los resultados obtenidos dentro de la cadena de valor de la empresa y es poco
probable que se amplíen a un uso más amplio.
Ámbitos de aplicación
Hoy en día, es difícil imaginar contextos en los que no se aplique el análisis de datos,
aunque sea de forma no exhaustiva. Desde las pequeñas empresas que quieren controlar
su inventario y su tesorería, hasta las grandes organizaciones que quieren ofrecer
automáticamente el artículo que mejor se adapte a los gustos de sus usuarios, el análisis
de datos se ha convertido en una parte integral de la cadena de valor de las
organizaciones, como un proceso que apoya las actividades principales.
Ciberseguridad: Luxottica y Enel son sólo las últimas de una larga lista de empresas que
han sufrido un ataque de ransomware a sus sistemas de información, con daños
potenciales muy elevados. El análisis estadístico avanzado de los datos de la red de la
propia empresa (junto con una formación adecuada del personal en esta materia) y la
supervisión de los dispositivos que se comunican con el exterior son pasos fundamentales
para identificar anomalías y predecir posibles intrusiones.
Gestión de activos: los productos de Business Intelligence, especialmente los visuales, de
síntesis y geoespaciales, permiten supervisar el estado y los KPI asociados a los distintos
activos (puentes, tuberías, vías, por ejemplo) para organizar los ciclos de mantenimiento y
las zonas de intervención. Trenitalia, por ejemplo, ha puesto en marcha su proyecto de
gestión dinámica del mantenimiento para gestionar de forma inteligente los trenes y las
vías y reducir los costes de explotación.
Los tipos de análisis descriptivos, poco mencionados hasta ahora, deben considerarse sin
embargo como el mínimo común denominador entre las diferentes realidades. Aunque no
generen nuevos conocimientos, su linealidad y sencillez (en comparación con otras
técnicas), han sido el punto de partida para la creación de una cultura de Análisis de Datos
en la empresa y siguen siendo las más extendidas y utilizadas incluso en realidades que
hacen de la analítica avanzada el principal motor de su negocio.
Desde el momento en que las empresas vieron los flujos de datos y los depósitos de
información como un activo estratégico, su análisis se convirtió en una actividad
totalmente integrada en el tejido organizativo. A medida que la tecnología ha mejorado y
el volumen de datos disponibles ha aumentado, las técnicas y metodologías aplicadas
también han evolucionado en consecuencia (y seguirán haciéndolo). Estos, así como las
herramientas y los diversos pasos que sustentan el proceso, se fusionan, se cruzan y a
veces se retroalimentan en la complejidad y heterogeneidad de la multitud de análisis de
datos existentes.
Tanto si se trata de orientar mejor a sus clientes, como de anticiparse a una avería en la
cadena de producción, de comprender qué rendimiento de la inversión se ha obtenido
con la última campaña de marketing o de evaluar el rendimiento de su fuerza de ventas,
el análisis de datos (y la analítica en el sentido más amplio) le ayuda a tomar las decisiones
que con mayor probabilidad le permitirán alcanzar los objetivos que se ha fijado, de forma
objetiva.
1. R and Python
2. Microsoft Excel
3. Tableau
4. RapidMiner
5. KNIME
6. Power BI
7. Apache Spark
8. QlikView
9. Talend
10. Splunk
Futuro laboral de los expertos en análisis de datos
El Informe sobre el futuro de los trabajos del Foro Económico Mundial 2020 enumeró a los
analistas de datos y científicos como el principal trabajo emergente, seguido
inmediatamente por los especialistas en inteligencia artificial y aprendizaje automático, y
los especialistas en big data.
Actualmente, muchas industrias usan el análisis de datos para sacar conclusiones y decidir
acciones a implementar. Cabe mencionar que la ciencia también usa el análisis de datos
para comprobar o descartar teorías o modelos existentes.
Recursos Humanos: el análisis de datos también es muy útil dentro de las empresas para
mantener un buen clima laboral , y fuera de ella, calificando empleados potenciales.
Académicos: Al igual que las empresas el análisis de datos también está presente en la
educación, sirve para seleccionar a los alumnos de nuevo ingreso y para medir el
rendimiento de los estudiantes.
La técnica más usada por los expertos son las encuestas online, ya que puede traer grandes
beneficios como la reducción de tiempo y dinero.
En QuestionPro contamos con una herramienta de análisis de datos precisa que te ayudará a
tomar mejores decisiones de forma profesional.
Capacidad para tomar decisiones de negocios más rápidas e informadas, respaldadas por
hechos.
Ayuda a las empresas a identificar problemas de rendimiento que requieren algún tipo de
acción.
Comprensión más profunda de los requisitos de los clientes, lo que, a su vez, crea mejores
relaciones comerciales.
Puede verse de forma visual, lo que permite tomar decisiones más rápidas y mejores.
Se ha demostrado que reduce los costos y, por lo tanto, aumenta los beneficios.
Realizar un análisis descriptivo es esencial, ya que permite organizar los datos y dejarlos
listos para llevar a cabo nuevas investigaciones. Es pertinente mencionar que este análisis
por sí solo no permitirá predecir resultados futuros ni dirá la respuesta a preguntas como
por qué sucedió algo.
Por ello, una vez investigados los datos, el análisis exploratorio permite encontrar
conexiones y generar hipótesis y soluciones para problemas concretos. Un área típica de
aplicación para ello es la minería de datos.
Análisis de diagnóstico
El análisis de diagnóstico de datos permite a los analistas y ejecutivos obtener una firme
comprensión contextual de por qué ha sucedido algo. Si se sabe por qué ha sucedido,
además de cómo ha sucedido, se podrán identificar mejor las formas exactas de abordar el
problema o el reto.
Análisis predictivo
El análisis predictivo permite mirar al futuro para responder a la pregunta ¿qué pasará?
Para ello, utiliza los resultados de los análisis descriptivos, exploratorios y de diagnóstico
mencionados anteriormente, además de herramientas de aprendizaje automático e
inteligencia artificial.
A través del análisis predictivo se pueden desarrollar iniciativas que no solo mejorarán los
diversos procesos operativos, sino que también ayudarán a obtener una ventaja competitiva
importante.
Comienza seleccionando las preguntas correctas. Las preguntas deben ser medibles, claras
y concisas. Diseñe sus preguntas para calificar o descalificar posibles soluciones a su
problema u oportunidad específicos.
Paso 2: Establece prioridades de medición
B) Decidir cómo medirlo: Pensar en cómo medir sus datos es igual de importante,
especialmente antes de la fase de recolección de datos, porque su proceso de medición
respalda o desacredita su análisis más adelante.
Antes de recopilar nuevos datos, determina qué información podría recopilarse de las bases
de datos o fuentes existentes.
Mantén los datos recopilados organizados en un registro con las fechas de recopilación y
agrega cualquier nota de origen a medida que avanza.
Una vez que haya recopilado los datos correctos para responder a su pregunta del Paso 1, es
el momento de realizar un análisis más profundo de la información. Encuentra relaciones,
tendencias, ordena y filtra tu información de acuerdo a las variables. A medida que haces
un análisis de los datos encontrarás que tienes los datos exactos que necesitas.
¿Hay alguna limitación en las conclusiones, algún ángulo que no hayas considerado?
Con estos cinco pasos en tu proceso de análisis de datos, tomarás mejores decisiones para
tu negocio ya que tus elecciones están respaldadas por datos que han sido robustamente
recopilados y analizados.