Tarea Unidad 5

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 18

INSTITUTO TECNOLÓGICO DE VILLAHERMOSA

ALUMNO: FERIA DÍAZ YEIMI

PROFESOR: YZRRAEL HERNÁNDEZ GARCÍA

MATERIA: ESTADÍSTICA INFERENCIAL 1


Qué es una estadística no parametrica

La estadística no paramétrica no es muy popular. Sin embargo, existe una literatura


muy extensa sobre ella. El problema que pretende solucionar la estadística no
paramétrica es el desconocimiento de la distribución de probabilidad.

En otras palabras, la estadística no paramétrica intenta averiguar la naturaleza de


una variable aleatoria. Para, una vez sabe cómo se comporta, realizar cálculos y
métricas que la caracterizan.

Este es el objetivo de la estadística no paramétrica. A continuación, lo vemos más


en detalle.

Objetivo de la estadística no paramétrica


Existen diferentes tipos de distribuciones de probabilidad sobre las que trabaja
la estadística paramétrica. Ahora bien, cuando no sabemos a qué tipo de
distribución de probabilidad corresponde una variable, ¿qué cálculos utilizamos?

Es decir, cuando no conocemos la distribución de probabilidad de un conjunto de


datos, debemos hacer inferencias estadística con procedimientos no paramétricos.

Dicho con otras palabras, si no sabemos qué tipo de distribución de probabilidad


tiene un fenómeno, no podemos realizar estimaciones como si realmente
supiéramos cómo se distribuye. Este es el objetivo de la estadística paramétrica,
permitir conocer la distribución para que podamos ir al siguiente paso (la
estadística paramétrica).
Pruebas no paramétricas
Claro que si no sabemos cómo se distribuye un fenómeno aleatorio, ¿qué debemos
hacer? Muy sencillo. Nuestra misión será intentar saber cómo se distribuye. Para
intentar averiguar qué tipo de distribución tiene un fenómeno determinado,
tenemos disponibles una serie de pruebas o test que nos ayudan a ello. Entre las
pruebas no paramétricas más conocidas se encuentran:

 Test binomial
 Prueba de Anderson-Darling
 Prueba de Cochran
 Prueba de Cohen kappa
 Prueba de Fisher
 Prueba de Friedman
 Prueba de Kendall
 Prueba de Kolmogórov-Smirnov
 Prueba de Kuiper
 Prueba de Mann-Whitney o prueba de Wilcoxon
 Prueba de McNemar
 Prueba de la mediana
 Prueba de Siegel-Tukey
 Prueba de los signos
 Coeficiente de correlación de Spearman
 Tablas de contingencia
 Prueba de Wald-Wolfowitz
 Prueba de los rangos con signo de Wilcoxon

Todas estas pruebas pretenden indicarnos si una variable aleatoria se distribuye de


una u otra forma. Por ejemplo, un posible resultado podría ser: la variable aleatoria
X se distribuye a razón de una distribución normal.

EJEMPLO
¿Qué es la hipótesis?
Una hipótesis es un enunciado o una proposición que de entrada se considera como
cierto, aunque aún no se haya podido comprobar. Esto hace que se construya en base
de una conjetura o una especulación de trabajo, carente de refutación o de
confirmación mediante la experiencia.

La hipótesis sirve como primer paso en la investigación, aunque se plantee con


menor o mayor datos reales. Se buscará demostrar la teoría o refutarla, mediante
argumentaciones sustentadas o evidencia empírica, esto dependerá si es una
investigación cualitativa o cuantitativa.

En otros términos, una hipótesis es una teoría provisional, ya que, si se puede probar
pasa a ser un enunciado demostrado o verificado.

¿Qué son las hipótesis nula y alternativa?


Esta teoría surge como resultado de una determinada investigación realizada sobre
una muestra o una población.

En otras palabras, la hipótesis alternativa sostiene la conclusión que el investigador


quiere afirmar o demostrar de su estudio, y en su hipótesis principal. Esta teoría se
identifica con la expresión “H1”, y generalmente, representa lo contrario a la
hipótesis nula, que se representa con la expresión «H0».

La hipótesis alternativa es una conjetura que intenta demostrar la falsedad de


la hipótesis nula, formulada en una investigación y/o un experimento. Lo contrario
de la hipótesis nula es el método científico, ya que pretende demostrar lo contrario a
la hipótesis alternativa, exponiendo que no es cierto.

¿De dónde se obtiene la hipótesis alternativa y nula?


La hipótesis alternativa es la presunción alternativa a la hipótesis nula, que se
formula en consecuencia de una investigación o un experimento.

Es resultado de una investigación determinada sobre una muestra o un fragmento de


la población.

Ejemplo del contraste de la hipótesis nula y alternativa


A continuación, te daremos un ejemplo para que comprendas mejor cómo hacer y
aplicar las hipótesis nula y alternativa.

Vamos a suponer que has realizado un estudio sobre el sueldo medio mensual en un
barrio de la ciudad. Imaginémonos que de la población de ese barrio te tomaste el
trabajo de encuestar a 1.000 personas, llegando a la conclusión de que el sueldo
medio mensual por habitante es de 25.000 unidades monetarias.

Por lo tanto, vos como investigador querés contrastar si ese sueldo medio mensual es
igual a 25.000 u.m. Esta sería la conclusión de tu estudio y, por ende, también la
hipótesis alternativa. Si por el contrario el sueldo medio mensual es distinto a 25.000
u.m., esto sería una conclusión contraria a la del estudio que se busca negar y, por
ende, es una hipótesis nula.

A continuación, te mostramos el contraste a realizar:

H0: El sueldo medio mensual es distinto a 25.000 u.m.

H1: El salario mensual es igual a 25.000 u.m.


Como podemos ver, la hipótesis alternativa, o sea H1, es la conclusión que alcanzó
el investigador. Para lograr demostrarla, vos como investigador vas a querer probar
que lo contrario de su hipótesis alternativa, no es cierto (hipótesis nula, H0)

En conclusión, se puede deducir que la enunciación de la hipótesis alternativa es la


que va a coincidir con la enunciación de la hipótesis nula.

Conclusión del contraste del ejemplo de la hipótesis


alternativa
En el caso de que se haya rechazado la hipótesis, se puede usar la siguiente
afirmación: “como se muestra en los datos y luego del resultado obtenido por medio
del contraste de la hipótesis realizada, se establece de evidencias suficientes para
poder repeler la hipótesis nula”.

La conclusión sería que el sueldo medio mensual es igual a 25.000 u.m. Por el
contrario, si no has podido rechazar la hipótesis de contraste realizado, podrías usar
la siguiente afirmación: “como se demuestra en los datos y luego del resultado
obtenido por medio del contraste de hipótesis llevado a cabo, no hay suficientes
evidencias para repeler la hipótesis nula”.

De presentarse este caso, la conclusión sería que el sueldo medio mensual no es


igual a 25.000 u.m.

Resumen
El estadístico ji-cuadrado (o chi cuadrado), que tiene distribución de
probabilidad del mismo nombre, sirve para someter a prueba hipótesis
referidas a distribuciones de frecuencias. En términos generales, esta
prueba contrasta frecuencias observadas con las frecuencias esperadas
de acuerdo con la hipótesis nula. En este artículo se describe el uso del
estadístico ji-cuadrado para probar la asociación entre dos variables
utilizando una situación hipotética y datos simulados. Luego se describe
su uso para evaluar cuán buena puede resultar una distribución teórica,
cuando pretende representar la distribución real de los datos de una
muestra determinada. A esto se le llama evaluar la bondad de un ajuste.
Probar la bondad de un ajuste es ver en qué medida se ajustan los
datos observados a una distribución teórica o esperada. Para esto, se
utiliza una segunda situación hipotética y datos simulados.

Del mismo modo que los estadísticos “z”, con su distribución normal y
“t”, con su distribución t de Student, nos han servido para someter a
prueba hipótesis que involucran a promedios y porcentajes, el
estadístico ji-cuadrado (o chi cuadrado), que tiene distribución de
probabilidad del mismo nombre, nos servirá para someter a prueba
hipótesis referidas a distribuciones de frecuencias.

En primer lugar usaremos el estadístico ji-cuadrado para probar la


asociación entre dos variables, y luego lo usaremos para evaluar en qué
medida se ajusta la distribución de frecuencias obtenida con los datos de
una muestra, a una distribución teórica o esperada.

En términos generales, esta prueba contrasta frecuencias observadas


con las frecuencias esperadas de acuerdo con la hipótesis nula. Al igual
que en el caso de las pruebas anteriormente presentadas, ilustraremos
con ejemplos.

Ji- cuadrado como prueba de asociación


Supongamos que un investigador está interesado en evaluar la
asociación entre uso de cinturón de seguridad en vehículos particulares
y el nivel socioeconómico del conductor del vehículo. Con este objeto se
toma una muestra de conductores a quienes se clasifica en una tabla de
asociación, encontrando los siguientes resultados:

Uso de Nivel Nivel Nivel TOTAL


cinturón socioeconómico socioeconómico socioeconómico
bajo medio alto
SI 8 15 28 51
NO 13 16 14 43
TOTAL 21 31 42 94

Tabla I. Tabla de asociación, valores observados.

¿Permiten estos datos afirmar que el uso del cinturón de seguridad


depende del nivel socioeconómico? Usaremos un nivel de significación
alfa=0,05.

Los pasos del análisis estadístico en este caso son los siguientes:

1. En primer lugar se debe plantear las hipótesis que


someteremos a prueba

H0: “El uso de cinturón de seguridad es independiente del nivel


socioeconómico”.
H1: “El uso de cinturón de seguridad depende del nivel
socioeconómico”.

En esta prueba estadística siempre la hipótesis nula plantea que las


variables analizadas son independientes.

2. En segundo lugar, obtener (calcular) las frecuencias


esperadas

Estas son las frecuencias que debieran darse si las variables fueran
independientes, es decir, si fuera cierta la hipótesis nula.
Las frecuencias esperadas se obtendrán de la distribución de frecuencias
del total de los casos, 51 personas de un total de 94 usan el cinturón y
43 de 94 no lo usan. Esa misma proporción se debería dar al interior de
los tres grupos de nivel socioeconómico, de manera que el cálculo
responde al siguiente razonamiento: si de 94 personas 51 usan
cinturón; de 21 personas, ¿cuántas debieran usarlo?

La respuesta a esta pregunta se obtiene aplicando la “regla de tres” y es


11,4. Este procedimiento debe repetirse con todas las frecuencias del
interior de la tabla.

El detalle de los cálculos es el siguiente:

Nivel bajo: (21x51/94)=11,4-(21x43/94)=9,6


Nivel medio: (31x51/94)=16,8-(31x43/94)=14,2
Nivel alto: (42x51/94)=22,8-(42x43/94)=19,2

Estas son las frecuencias que debieran presentarse si la hipótesis nula


fuera verdadera y, por consiguiente, las variables fueran
independientes.

Estos valores los anotamos en una tabla con las mismas celdas que la
anterior; así tendremos una tabla con los valores observados y una
tabla con los valores esperados, que anotaremos en cursiva, para
identificarlos bien.

Uso de Nivel
Nivel bajo Nivel alto TOTAL
cinturón medio
SI 11,4 16,8 22,8 51
NO 9,6 14,2 19,2 43
TOTAL 21 31 42 94

Tabla II. Tabla de asociación, valores esperados.

3. En tercer lugar se debe calcular el estadístico de prueba

En este caso, el estadístico de prueba es Ji-cuadrado que, como dijimos


al comienzo, compara las frecuencias que entregan los datos de la
muestra (frecuencias observadas) con las frecuencias esperadas, y tiene
la siguiente fórmula cálculo:
donde oi representa a cada frecuencia observada y ei representa a
cada frecuencia esperada.

De este modo el valor del estadístico de prueba para este problema


será:

Entonces Este es el valor de nuestro estadístico de prueba que


ahora, siguiendo el procedimiento de problemas anteriores (paso 4),
debemos comparar con un valor de la tabla de probabilidades para ji-
cuadrado (x2). Esta tabla es muy parecida a la tabla t de student, pero
tiene sólo valores positivos porque ji-cuadrado sólo da resultados
positivos. Véase gráfico 1, que muestra la forma de la curva, con
valores desde 0 hasta infinito.

Gráfico 1.
Dado que el estadístico ji cuadrado sólo toma valores positivos, la zona
de rechazo de la hipótesis nula siempre estará del lado derecho de la
curva.

Uso de tabla ji-cuadrado

La tabla de ji-cuadrado tiene en la primera columna los grados de


libertad y en la primera fila la probabilidad asociada a valores mayores a
un determinado valor del estadístico (véase gráfico de la tabla III).
Los grados de libertad dependen del número de celdas que tiene la tabla
de asociación donde están los datos del problema y su fórmula de
cálculo es muy sencilla:

Grados de libertad (gl)=(nº de filas–1)x(nº de columnas–1)

Así, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de


libertad serán:

gl=(2-1)x(3-1)=2

Nótese que no se consideran la fila ni la columna de los totales.


Tabla III. Tabla de ji-cuadrado.

Al comienzo elegimos un nivel de significación alfa=0,05. Entonces un


valor de tabla para x2
asociado a 2 grados de libertad y alfa 0,05 es
5,99.
Por lo tanto, como en el gráfico 2 vemos que 5,23 se encuentra a la
izquierda de 5,99, la probabilidad asociada a valores superiores a 5,23
es mayor que alfa (0,05).

Gráfico 2.

Según esto, debemos aceptar la hipótesis nula que plantea que las
variables “uso de cinturón de seguridad” y “nivel socioeconómico” son
independientes. Limitación: como norma general, se exige que el 80%
de las celdas en una tabla de asociación tengan valores esperados
mayores de 5.

Ji-cuadrado como prueba de bondad de ajuste

También se puede usar el estadístico ji-cuadrado para evaluar cuán


buena puede resultar una distribución teórica, cuando pretende
representar la distribución real de los datos de una muestra
determinada. A esto se le llama evaluar la bondad de un ajuste.
Probar la bondad de un ajuste es ver en qué medida se ajustan los
datos observados a una distribución teórica o esperada.

Tomemos como ejemplo la distribución esperada para los individuos de


una población que son clasificados según grupo sanguíneo. Según
estudios realizados en población, se espera que dicha distribución, en
porcentajes, sea la siguiente:
Grupo Frecuencia esperada
AB 2,0%
A 30,5%
B 9,3%
0 58,2%

Tabla IV. Ejemplo de distribución esperada.

En una muestra de 150 dadores de sangre se encontró la siguiente


distribución:

Grupo Frecuencia observada


AB 4
A 48
B 15
0 83

Tabla V. Ejemplo de distribución observada.

1. Las hipótesis del problema son:

H0: los datos se ajustan a la distribución teórica.


H1: los datos no se ajustan a la distribución teórica.

2. Siguiendo el esquema general de solución propuesto para las


pruebas de hipótesis, ahora corresponde elegir un nivel de
significación

Elegimos entonces alfa=0,01. El estadístico de prueba será ji-cuadrado,


cuya fórmula es:

Debemos calcular las frecuencias esperadas en nuestro grupo. Si


aplicamos los porcentajes esperados a la muestra de 150 casos
podemos obtener las siguientes frecuencias esperadas (ei):

Grupo Frec. oi Frec. ei


AB 4 3,00
A 48 45,75
B 15 13,95
0 83 87,30
Total 150 150,00
Tabla VI. Ejemplo de frecuencias esperadas.

Los grados de libertad de esta tabla se obtienen restando 1 al número


de filas, en este caso: gl=4-1=3
Recordemos que la fila del total no se considera para los grados de
libertad.

Si ya tenemos las frecuencias observadas y esperadas, podemos


proceder a evaluar la diferencia entre ellas utilizando el estadístico ji-
cuadrado. Si la diferencia entre frecuencias observadas y esperadas es
grande, significará que la hipótesis nula es falsa, o sea, esta distribución
no se ajusta a la distribución teórica y si, en cambio, resulta que la
diferencia entre frecuencias observadas y esperadas no es muy grande,
significará que la hipótesis nula es verdadera; por lo tanto, la
distribución en la muestra se ajusta a la distribución teórica y diremos
que no hay significación estadística.

El valor del estadístico de prueba (x2) es una medida de la diferencia


entre frecuencias observadas y esperadas; por lo tanto, mientras mayor
resulte , más fácil será rechazar la hipótesis nula.

3. Se calcula el estadístico de prueba con los datos del ejemplo

4. Se compara este valor con el valor de ji-cuadrado de la tabla

El valor de ji-cuadrado lo buscaremos con alfa=0,01 y 3 grados de


libertad. Según tabla, ese valor es 11,34.
Al comparar el valor del estadístico de prueba (0,73) con el valor de
tabla (11,34), vemos que 0,73 se encuentra a la izquierda de 11,34
desplazado hacia el centro de la curva y que, por lo tanto, la
probabilidad de valores mayores a él es muy superior al nivel de
significación alfa=0,01.
5. Conclusión Tecnica

Dado que la probabilidad de es mayor que alfa, se acepta


la hipótesis nula. Esto significa que los datos observados se ajustan a la
distribución teórica, por lo tanto las diferencias observadas no son
estadísticamente significativas.

6. Gráfico

https://www.medwave.cl/series/MBE04/5266.html
https://rpubs.com/luisxsuper/ejemplo_1

También podría gustarte