01 - Guía para El Análisis de Datos
01 - Guía para El Análisis de Datos
01 - Guía para El Análisis de Datos
Pregunta 1:
¿Considera que el matrimonio igualitario debe ser respetado por todos los ciudadanos?
5 Muy de acuerdo
4 De acuerdo
3 Indiferente x
2 En desacuerdo
1 Muy en desacuerdo
…
Construcción de la escala para valorar el puntaje total por cada factor o dimensión.
Una variable numérica se puede categorizar o crear puntos de cortes con reglas probabilísticas
(intervalos con el método de Sturges); Se puede hacer con baremos basados en la teoría; se
pueden crear grupos con análisis factorial.
K= # de clases o intervalos
N=# observaciones de la muestra
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 2 de 11
Dependiendo del estudio, los puntajes directos(total), calculados por factor, categoría,
dimensión o cuestionario, pueden ser clasificados a través de una escala cualitativa o
cuantitativa mediante baremos, centiles, desviaciones standard, etc.,:
1. Cálculo de nueva variable para obtener puntajes totales por factor, categoría o total
Transformar/Calcular variable…
2. Transformar/Recodificar en distintas variables
Valores antiguos y nuevos;
Rango desde-hasta
Rango INFERIOR hasta el valor
Rango, valor hasta SUPERIOR
Las tablas de contingencia, término acuñado por Karl Pearson en 1904 (Sanchez Rivero, 1998),
se utilizan en estudios estadísticos interesados en la posible relación entre dos atributos
cualitativos de los individuos de una población. Usualmente cada atributo se maneja como una
variable cualitativa o , y la variación de cada variable está representada por los valores 1,
x2,x3,…xi y y1, y2, y3,…yj respectivamente. La información se organiza en un tabla de doble
entrada de observaciones bivariadas que tienen como primera columna y primera fila o
renglón, los valores que asumen y (Cañadas G., 2010)
En general, si se toma una muestra de tamaño de una población, y se desean estudiar dos
características de un mismo individuo o grupo de personas, se tiene que:
Ref. www.bioestadistico.com
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 5 de 11
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 6 de 11
ANOVA (de una sola vía o con un factor): Cuando necesitamos comparar más de dos grupos
usamos: Para comparar dos medidas en un solo grupo, usaremos t de Student para muestras
relacionadas. Estas pruebas paramétricas deben cumplir, además, distribución normal
(normalidad) y homogeneidad de varianzas (homocedasticidad). Cuando no cumplen
tenemos las pruebas equivalentes no paramétricas siendo la variable ordinal o numérica, así
los equivalentes no paramétricos:
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 7 de 11
Vamos a correlacionar el grado de estrés con los años de servicio que prestan a la institución.
Se ha medido el grado de stress laboral (ordinal) como alto, moderado y bajo y el tiempo de
servicio en años (numérica).
Siendo correlación baja podría haber otras variables que determinen el estrés laboral y no solo
el tiempo de servicio.
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019 Página 10 de
11
Kappa de Kohen: mide la concordancia entre dos observadores sobre un mismo fenómeno, o
cuando un solo investigador evalúa con dos métodos o instrumentos diferentes (validez de
criterio) a un mismo fenómeno.
Primero debe demostrarse la asociación, es decir cuando p-valor está por debajo del nivel de
significancia y luego la fuerza de asociación.
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019 Página 11 de
11
No confundir índice con coeficiente: el Riesgo Relativo y el ODDs Ratio son índices y el Kappa
de kohen es un coeficiente. Los coeficientes varían de 0 a 1 ( se pueden transformar a %) pero
los índices pueden valer más de 1 para considerarlos como significativos.
Condiciones para realizar medidas de asociación: no hay muestra mínima para realizar
medidas de asociación. El riesgo relativo es una estimación puntual (es un número) que debe
ser acompañado de un Intervalo de Confianza al 95%. Mientras más grande es la muestra, más
corto es el IC y viceversa.
Coeficiente Gamma (similar al Rho de Spearman) es una medida de asociación para variables
ordinales. El coeficiente Rho de Spearman es una medida de asociación (correlación) de dos
variables ordinales (numéricas).
Tau-b de Kendall en correlaciones bivariadas de dos variables que tengan exactamente las
mismas categorías (leve moderado y severo), es un equivalente al Spearman (equivalente no
paramétrica del r de Pearson) es un coeficiente nativo para dos variables ordinales siendo ésta
la primera opción. La Tau-c de Kendall es aplicable cuando las categorías son diferentes y no
las mismas.
El análisis de correspondiente una variable con 4 categorías y otra con 5 categorías si p-valor es
significativo, entonces se hace análisis de correspondencia categoría por categoría (se trata de
dicotomización, por pares de categorías).