01 - Guía para El Análisis de Datos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

ANÁLISIS ESTADÍSTICO DE DATOS

Juan Bahamonde Sola


Recopilación: UCE-2019
Página 1 de 11

Análisis de datos de un Cuestionario con escala Likert.

Construcción de una escala

Pregunta 1:

¿Considera que el matrimonio igualitario debe ser respetado por todos los ciudadanos?

5 Muy de acuerdo
4 De acuerdo
3 Indiferente x
2 En desacuerdo
1 Muy en desacuerdo

Si el cuestionario tiene 25 preguntas, Pmin=1, Pmax=5

Puntaje total mínimo: Tmin= 1 * 25 = 25

Puntaje total máximo: Tmax= 5 * 25 = 125

Rango (Tmax – Tmin): R=125-25 = 100

Amplitud del Intervalo (R/Pmax): A= 100/5 = 20

Construcción de la escala para valorar el puntaje total por cada factor o dimensión.

Valor Etiqueta desde hasta


5 Muy de acuerdo 105 125
4 De acuerdo 85 104
3 Indiferente 65 84
2 En desacuerdo 45 64
1 Muy en desacuerdo 25 44

N P1 P2 P3 P4 … P25 Total Valor Etiqueta


1 3 1 5 1 1 78 3 Indiferente
2 5 5 2 1 4 93 4 De acuerdo
3 3 2 2 1 3 69 3 Indiferente
… 112 5 Muy de acuerdo
100 5 1 3 2 2 40 1 Muy en desacuerdo

Una variable numérica se puede categorizar o crear puntos de cortes con reglas probabilísticas
(intervalos con el método de Sturges); Se puede hacer con baremos basados en la teoría; se
pueden crear grupos con análisis factorial.

K= # de clases o intervalos
N=# observaciones de la muestra
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 2 de 11

a = Amplitud de cada intervalo

Dependiendo del estudio, los puntajes directos(total), calculados por factor, categoría,
dimensión o cuestionario, pueden ser clasificados a través de una escala cualitativa o
cuantitativa mediante baremos, centiles, desviaciones standard, etc.,:

N P1 P2 P3 P4 … P25 Total Percentil Etiqueta


1 3 1 5 1 1 78
2 5 5 2 1 4 93
3 3 2 2 1 3 69
… 112
100 5 1 3 2 2 40

Ejercicio de aplicación: Base de datos ExcelSPSS

1. Cálculo de nueva variable para obtener puntajes totales por factor, categoría o total
 Transformar/Calcular variable…
2. Transformar/Recodificar en distintas variables
Valores antiguos y nuevos;
 Rango desde-hasta
 Rango INFERIOR hasta el valor
 Rango, valor hasta SUPERIOR

3. Transformar/Agrupación Visual/Crear puntos de corte


 Intervalos de igual amplitud
 Percentiles iguales basados en datos explorados
 Media y Desviaciones estándar basados en datos explorados
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 3 de 11

Análisis de Contingencia o cruce de variables:

Las tablas de contingencia, término acuñado por Karl Pearson en 1904 (Sanchez Rivero, 1998),
se utilizan en estudios estadísticos interesados en la posible relación entre dos atributos
cualitativos de los individuos de una población. Usualmente cada atributo se maneja como una
variable cualitativa o , y la variación de cada variable está representada por los valores 1,
x2,x3,…xi y y1, y2, y3,…yj respectivamente. La información se organiza en un tabla de doble
entrada de observaciones bivariadas que tienen como primera columna y primera fila o
renglón, los valores que asumen y (Cañadas G., 2010)
En general, si se toma una muestra de tamaño de una población, y se desean estudiar dos
características de un mismo individuo o grupo de personas, se tiene que:

Sean estas características X y Y la muestra se divide en:

 Clase xi para la variable X


 Clase yj para la variable Y
 fij es la frecuencia absoluta o frecuencia observada en cada celda
 fi es la frecuencia absoluta acumulada en xi, distribución marginal por fila
 fj es la frecuencia absoluta acumulada en yi, distribución marginal por columna

Se utiliza la prueba de chi-cuadrado para la independencia o asociación de variables


categóricas.
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 4 de 11

Ref. www.bioestadistico.com
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 5 de 11
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 6 de 11

Criterios que deben ser considerados para seleccionar el estadístico de prueba:

1. Los tipos de investigación: transversal o longitudinal


2. Los niveles de la investigación: descriptivo (univariado o de un grupo); relacional o
analítico (bivariado o de 2 o más grupos)
3. Los diseños de la investigación: no experimentales y experimentales (longitudinal,
medidas repetidas con valores numéricos)
4. El objetivo estadístico: comparativas (Pearson y Spearman no es para comparativo)
5. La escala de medición de las variables: dicotómica o politómica, ordinal, numérica.
6. El comportamiento de los datos (distribución): normalidad y homocedasticidad

X2 Cuadrado de homogeneidad: utilizamos cuando tenemos dos grupos y queremos


comparar una variable aleatoria dicotómica o politómica. X2 no solo es aplicable para tablas
de 2x2 sino tablas mayores, es decir más de dos grupos.

T de Student para muestras independientes: se utiliza cuando queremos comparar dos


grupos y la variable aleatoria es numérica. Existen otras variedades de t de Student, como
cuando trabajamos con una sola muestra o un solo grupo.

ANOVA (de una sola vía o con un factor): Cuando necesitamos comparar más de dos grupos
usamos: Para comparar dos medidas en un solo grupo, usaremos t de Student para muestras
relacionadas. Estas pruebas paramétricas deben cumplir, además, distribución normal
(normalidad) y homogeneidad de varianzas (homocedasticidad). Cuando no cumplen
tenemos las pruebas equivalentes no paramétricas siendo la variable ordinal o numérica, así
los equivalentes no paramétricos:
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 7 de 11

Prueba paramétrica Prueba no paramétrica


t Student para muestras independientes U de Mann-Withney
t Student para muestras relacionadas Wilcoxon
ANOVA Inter sujetos (independientes) H Kruskal-Wallis
ANOVA Intra sujetos (relacionadas) Friedman

Para la correlación con r de Pearson, cuando relacionamos dos variables numéricas, su


equivalente no paramétrico es la correlación Ro de Spearman, cuando las variables no
cumplen el supuesto de normalidad y homocedasticidad.

Correlación No Paramétrica de Spearman (transversal):

Vamos a correlacionar el grado de estrés con los años de servicio que prestan a la institución.
Se ha medido el grado de stress laboral (ordinal) como alto, moderado y bajo y el tiempo de
servicio en años (numérica).

Debemos hallar n, media, desviación estándar y error típico o estándar de la media:

Analizar/comparar medias/medias…variable de estudio o lista de dependientes tenemos el


tiempo de servicios y como factor o lista de independientes, estrés laboral. En opciones
seleccionamos número de casos, media, desviación y Desv. error de la media
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 8 de 11

Edad cuantitativa Edad Cualitativa

Rho de Spearman calculamos con Análisis, correlaciones, bivariadas y seleccionamos Spearman


obteniendo los valores de rho y p-valor.
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019
Página 9 de 11

Siendo correlación baja podría haber otras variables que determinen el estrés laboral y no solo
el tiempo de servicio.
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019 Página 10 de
11

Para el análisis de tablas de contingencia o cruzadas:

Para el análisis de tablas de contingencia o cruzadas:

Kappa de Kohen: mide la concordancia entre dos observadores sobre un mismo fenómeno, o
cuando un solo investigador evalúa con dos métodos o instrumentos diferentes (validez de
criterio) a un mismo fenómeno.

Coeficiente Phi y V de Cramer es una medida de asociación de variables nominales dicotómicas.


Si es politómica se usa el coeficiente de contingencia (es una extensión del Phi). Éstas miden la
fuerza de asociación entre las dos variables y estos coeficientes se interpretan así:

Primero debe demostrarse la asociación, es decir cuando p-valor está por debajo del nivel de
significancia y luego la fuerza de asociación.
ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola
Recopilación: UCE-2019 Página 11 de
11

No confundir índice con coeficiente: el Riesgo Relativo y el ODDs Ratio son índices y el Kappa
de kohen es un coeficiente. Los coeficientes varían de 0 a 1 ( se pueden transformar a %) pero
los índices pueden valer más de 1 para considerarlos como significativos.

Cuando se tienen dos variables politómicas (categóricas), podemos usar la medida de


asociación V de Cramer.

Condiciones para realizar medidas de asociación: no hay muestra mínima para realizar
medidas de asociación. El riesgo relativo es una estimación puntual (es un número) que debe
ser acompañado de un Intervalo de Confianza al 95%. Mientras más grande es la muestra, más
corto es el IC y viceversa.

Coeficiente Gamma (similar al Rho de Spearman) es una medida de asociación para variables
ordinales. El coeficiente Rho de Spearman es una medida de asociación (correlación) de dos
variables ordinales (numéricas).

Tau-b de Kendall en correlaciones bivariadas de dos variables que tengan exactamente las
mismas categorías (leve moderado y severo), es un equivalente al Spearman (equivalente no
paramétrica del r de Pearson) es un coeficiente nativo para dos variables ordinales siendo ésta
la primera opción. La Tau-c de Kendall es aplicable cuando las categorías son diferentes y no
las mismas.

Lambda Simetrica&Asimétrica (da la dirección de la fuerza de la asociación). El coeficiente


Correlaciones (SPSS) se refiere a la r de Pearson. McNemar es un estadístico no un coeficiente.
Eta se utiliza cuando son variables numéricas (intervalo).

El análisis de correspondiente una variable con 4 categorías y otra con 5 categorías si p-valor es
significativo, entonces se hace análisis de correspondencia categoría por categoría (se trata de
dicotomización, por pares de categorías).

También podría gustarte