Inferencia Estadistica. Estimacion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 31

INFERENCIA ESTADÍSTICA

ESTIMACIÓN
INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA
Conjunto de métodos que permiten obtener
conclusiones acerca de una población, a
través de la información proporcionada
por una muestra.
Utiliza un procedimiento inductivo que va de
lo particular (la muestra) a lo general (la
población)
INFERENCIA ESTADÍSTICA

INTRODUCCIÓN:

• Comienzo: Pregunta/s o hipótesis a investigar en una población

• Población o universo: Conjunto de individuos o elementos en los que se desea


estudiar alguna/s característica/s.

• Muestra: Parte o subconjunto representativo de una población.

• Errores aleatorios (imposible de controlar) y errores sistemáticos (asociados al


proceso de medición: elección, instrumento,…)

• Objetivo fundamental de la Inferencia Estadística clásica:


Responder a la/s pregunta/s a investigar sobre la población a partir de la información
obtenida en la muestra, tratando de disminuir en lo posible los errores que no sean
aleatorios.
INFERENCIA ESTADÍSTICA

INTRODUCCIÓN:

• Diseño experimental: Conjunto de procedimientos necesarios para llevar a


cabo el objetivo anterior. Se compone de
-Determinación de la población
-Determinación de las variables y forma de medirlas
-Elección de la muestra: Técnicas de muestreo
-Utilización de técnicas estadísticas inferenciales:
Estimación puntual
Estimación por intervalos de confianza
Contrastes de hipótesis
-Conclusión

• Tipos de inferencia:
-Paramétrica
-No paramétrica
INFERENCIA ESTADÍSTICA

EL PROCESO DE LA INFERENCIA ESTADÍSTICA


Pregunta/hipótesis
Variables

Técnicas muestreo Estadística


descriptiva
Respuesta

μ
Técnicas inferenciales
INFERENCIA ESTADÍSTICA

TÉCNICAS DE MUESTREO
Conjunto de técnicas que permiten obtener muestras representativas de la población
tratando de evitar los errores no producidos por el azar (errores sistemáticos o
sesgos).
Muestreo probabilístico :
Cada individuo de la población tiene una probabilidad específica de ser seleccionado.
Proporciona muestras con una base rigurosa para asegurar la representatividad de la
población, que pueden utilizarse en la construcción de intervalos de confianza o en los
contrastes de hipótesis.
Ej.:Muestreos aleatorios simples, sistemático, estratificado, por conglomerados.

Muestreo no probabilístico :
Cada individuo de la población no tiene una probabilidad específica de ser seleccionado.
Proporciona muestras lo más parecidas posible a una muestra probabilística de la
población, con la ventaja de ser menos costosas.
Ej.: Muestreo por cuotas, muestreo de casos consecutivos.
INFERENCIA ESTADÍSTICA

TÉCNICAS DE MUESTREO : Probabilísticas


Muestreo aleatorio simple:
Es el proceso de enumerar cada unidad de la población accesible y, a continuación,
seleccionar la muestra al azar. En este tipo de muestreo se garantiza que todos los
elementos de la población tienen la misma probabilidad de ser incluidos en la muestra.

Muestreo sistemático:
Ordenadas las unidades en una lista, consiste en una selección según un proceso
periódico, eligiendo el punto de partida al azar.

Muestreo estratificado:
Consiste en dividir la población en subgrupos, de acuerdo con ciertas características
(sexo, edad, …) y luego extraer una muestra al azar a partir de cada uno de los “estratos”

Muestreo por conglomerados:


Consiste en extraer una muestra al azar a partir de agrupaciones (conglomerados)
naturales de individuos dentro de la población. Resulta muy práctico cuando la población
está muy dispersa y es muy costoso confeccionar una lista de todos sus elementos.
INFERENCIA ESTADÍSTICA

TÉCNICAS DE MUESTREO : No Probabilísticas

Muestreo por cuotas:


Se utiliza mucho en sondeos de opinión y estudios de mercado. Se divide a la población
en estratos, y se asigna un número de individuos a elegir en cada estrato, proporcional a
al peso del estrato, para configurar una muestra de tamaño n con el total de estratos. Se
diferencia del muestreo estratificado en que el investigador es libre de elegir a los sujetos
de la muestra dentro de cada estrato

Muestreo de casos consecutivos:


Consiste en elegir a cada individuo que cumpla con unos criterios de selección y dentro de
un intervalo de tiempo, hasta alcanzar un número definido de antemano. En muchos
casos, es la técnica más factible en Medicina
INFERENCIA ESTADÍSTICA

ESTIMACIÓN DE PARÁMETROS

Estadístico:
Cualquier función de los valores muestrales que puede utilizarse para
estimar parámetros o para ayudarnos a decidir ante las posibles
respuestas a una pregunta o hipótesis sobre la población.

Ejemplos:
n
x  20
n
 ( xi  x )
n 2
 xi  ( xi  x )
2
i 1
x  i 1 S
i 1 s s
n n n 1 n
INFERENCIA ESTADÍSTICA

ESTIMACIÓN DE PARÁMETROS

Estimador :
Parámetro de los valores muestrales obtenido para dar una idea acerca del parámetro
de la población de la que se tomó la muestra.
El valor de un estimador depende de la muestra.

POBLACIÓN
☺☺☺☺☺☺☺☺
☺☺☺☺☺☺
☺☺☺☺☺☺☺☺
☺☺☺☺☺☺☺☺ Parámetros muestrales
 Modelo de probabilidad Estimadores : p, x , S ó s
 Parámetros poblacionales: , , 
INFERENCIA ESTADÍSTICA

ESTIMACIÓN DE PARÁMETROS

Ejemplo :
Un anatómico quiere conocer la longitud media (en cm.) del brazo derecho en la
población de varones adultos.

Toma una muestra de


100 individuos con mas Mide en cada uno
Calcula
x  58.17 cm.
el brazo derecho
de 25 años s  30.9 cm.
• Ha utilizado un muestreo no probabilístico de casos consecutivos

• Ha estimado :

Con x  La media poblacional


de La población de varones adultos.
Con s  La desv. típica pobl.
INFERENCIA ESTADÍSTICA

ESTIMACIÓN DE PARÁMETROS

Distribución en el muestreo de un estadístico:

Los estadísticos y estimadores son variables aleatorias que tendrán una


distribución de probabilidad con una media y una desviación típica.

Ejemplo:

Si llamamos X a la variable aleatoria cuyos valores resultan de obtener


las medias de muestras del mismo tamaño (n), X será una variable
aleatoria y, por tanto, tendrá una media y una varianza (y desv. típica):
μX σ  EE(X)
X

Y si fuera posible saber cómo se distribuye (con qué modelo), podríamos


calcular probabilidades de que X se encuentre en el intervalo que nos interese
INFERENCIA ESTADÍSTICA

Ejemplo: Distribución de valores de la media muestral


Puede demostrarse que:

La desviación típica de x
ó
Error estándar de la media :
s
EE ( x ) 
n
siendo s la desviación
típica de la muestra

(en nuestro ejemplo)


cm 30.9
EE( x )   3.09
Distribución de la longitud media del brazo de varones adultos 100
en base a 200 muestras de 100 individuos de una población
de varones adultos.
INFERENCIA ESTADÍSTICA

CARACTERÍSTICAS DESEABLES DE LAS ESTIMACIONES


(ó valor de la información que nos proporciona nuestra muestra)
• Nuestra muestra nos proporciona uno de los posibles valores que nos permite
estimar a un parámetro de la población.
• Cuando la media de los posibles valores que pueden estimar al parámetro de la
población coincide con tal parámetro, se dice que el estimador es insesgado.

Ej: E( x) =  , E(S2) = n  1 σ 2 , E(s2) = 2


n
• Para medir cuánto de fiable es el valor de la estimación de nuestra muestra, se tiene
el error estándar del estimador, que trata de captar la variabilidad que tienen los
valores del estimador en todas las posibles muestras de un tamaño determinado.
s p(1  p )
EE ( x )  EE ( p ) 
n n
• Generalmente, en el error estándar de cualquier estimador, el tamaño de la muestra
figura en el denominador, lo que significa que cuanto mayor sea el tamaño, menor
será el error estándar
INFERENCIA ESTADÍSTICA

Algunas distribuciones en el muestreo:

RESULTADO 1 (Teorema Central del Límite): Si x1, x2, x3, ..., xn es una
muestra aleatoria procedente de una población cualquiera con media  y
desviación típica , puede deducirse que cuando n crece
xμ
•Z= σ tiende a tener una distribución parecida a la N(0, 1)
n

ó también

• x tiene una distribución parecida a la N(; n )


INFERENCIA ESTADÍSTICA
Algunas distribuciones en el muestreo:
Si x1, x2, x3, ..., xn es una muestra aleatoria procedente de una población
N  ,  , y siendo n n
 i  ( xi  x )
2
x
x  i 1 , s 2  i 1
n n 1
pueden deducirse los siguientes resultados:
x
• (RESULTADO 2): Z  se distribuye con una distribución N(0, 1).

n
x
• (RESULTADO 3): T  se distribuye con una distribución T-Student
s
n
con (n-1) grados de libertad: t(n-1).

• (RESULTADO 4): X  (2n  1)  s 2


se distribuye con una distribución
2

Chi-cuadrado con (n –1) grados de libertad: 2(n-1)
INFERENCIA ESTADÍSTICA
Algunas distribuciones en el muestreo:

Distribución t-Student:
Función densidad de distribuciuones t-Student
0,4

0,3

0,2

0,1

0
-6 -4 -2 0 2 4 6
x

Cuando n tiende a , la distribución t(n) se aproxima a N(0,1)


INFERENCIA ESTADÍSTICA

Algunas distribuciones en el muestreo:

Distribución Chi-cuadrado:

Función densidad de distribuciones Chi-cuadrado


0,1

0,08

0,06

0,04

0,02

0
0 20 40 60 80
x

Sólo toma valores positivos


ESTIMACIÓN

INTERVALOS DE CONFIANZA

• Los estimadores proporcionan una estimación puntual de los parámetros de la


población, pero no proporcionan ninguna idea de la precisión de tal estimación ni de la
probabilidad de que tal estimación sea la correcta.

• Los intervalos de confianza son un medio de conocer el valor de un parámetro en


una población, midiendo el grado de error debido al azar que lleva implícito el proceso.

Definición:

• Un intervalo de confianza es un método de estimación que permite estimar un


parámetro poblacional a partir de un intervalo aleatorio (L 1, L 2) del que se tiene
una cierta confianza, medida en probabilidad, de que contiene al verdadero valor
del parámetro poblacional.

•Su construcción se basa en obtener los extremos L1 y L2 (estadísticos) a partir de las


distribuciones en el muestreo.
ESTIMACIÓN

Intervalo de Confianza para  de N(,) con  conocida :


Por ejemplo, si x1, x2, x3, ..., xn es una muestra aleatoria procedente de una
población N(, ) con  conocida, utilizando el resultado 2, se distribuye x
como una N(0,1), y utilizando el percentil z1 de la N(0,1) se tendrá que:
  2
x 
P  z    z    1
 1 2  1 
 n 2

   
De la expresión anterior se deduce que: P  x  z    xz     1
 1
2
n 1
2
n 
indicando que hay una probabilidad de (1-) de que el verdadero valor de la
media  de la población se encuentre entre las cantidades L1 y L2.
 , xz

I.C.() = ( x  z     )
1 n 1 n
2 2
INTERVALO AL 100·(1-)% DE CONFIANZA PARA 
CUANDO SE CONOCE 
ESTIMACIÓN

Ejemplo:
Si queremos construir un IC al 95% para la media de pulsaciones por
minuto de una población Normalmente distribuida con  = 10, y hemos
obtenido con una muestra de 49 individuos que x =90:
10 10
( 90  z 0.975  , 90  z 0.975  )
49 49

(90 – 1.96·1.43, 90+1.96·1.43)

(87.20, 92.80) al 95% de confianza


ESTIMACIÓN

Intervalo de Confianza para  de N(,) con  desconocida :


x
Utilizando el resultado 3, T  tiene una distribución t-Student con n-1
s
n
grados de libertad.

Utilizando el percentil t1 ( n  1) de la t-Student se tendrá que:


2

I.C.() = ( x  t
s , s )
 ( n  1)  x  t  ( n  1) 
1 n 1 n
2 2
INTERVALO AL 100·(1-)% DE CONFIANZA PARA 
CUANDO SE DESCONOCE 
ESTIMACIÓN

Ejemplo:
Si queremos construir un IC al 95% para la media de IMC en
Hipertensos, y hemos obtenido con una muestra de 20 individuos una
media de x = 31.85 y una desviación típica de s = 5.21, se tendrá:
5.21 5.21
( 31.85  t 0.975 (20  1)  , 31.85  t 0.975 (20  1)  )
20 20

(31.85 – 2.44, 31.85+2.44)


(29.41, 34.29) al 95% de confianza


ESTIMACIÓN

INTERVALOS DE CONFIANZA

• En general, si el estimador muestral sigue una distribución Normal, un intervalo de


confianza para el parámetro de la población viene dado por

estimador ± z • EE

donde EE es el error estándar del estimador y z es un percentil de N(0;1), que


depende del nivel de confianza (1-) con que se quiera obtener el intervalo:
(para niveles de 0.90, 0.95 y 0.99 los valores de z son 1.64, 1.96 y 2.58 respect.).

• Al valor  se le denomina nivel de error.

• Al desvío z• EE que se suma y resta al estimador se le denomina error de estimación


ó precisión del IC.
• Este tipo de intervalos puede utilizarse incluso en los casos en que la población no
sea Normal para tamaños de muestra grandes (n>50), gracias al Teorema Central del
Límite (Resultado 1)
MODELOS Y TÉCNICAS INFERENCIALES

INTERVALOS DE CONFIANZA
Interpretación de los intervalos de confianza
Que la confianza de un intervalo es del 95% significa que, por término medio, de cada
100 de los intervalos que podemos construir con muestras de este tamaño, 95 de ellos
contendrán en su interior el valor del parámetro de la población.
MODELOS Y TÉCNICAS INFERENCIALES

Ejemplo (continuación)
En el caso del anatómico :x  58.17 cm. s  30.9 cm.
s 1- = 0.90  z1-/2=1.64
I.C.( )  x  z1- 1- = 0.95  z1-/2=1.96
2 n
1- = 0.99  z1-/2=2.58

30.9
I.C.0.95 ( )  58.17  1.96  (52.11 , 64.23 )
100
I.C.0.90 ( )  58.17  .......... .....  ( , )

I.C.0.99 () 

Ejercicio :
Construir un IC al 99% para la media de IMC en Hipertensos, a partir de una muestra
de 20 individuos en los que la media de IMC es = 31.85 y la desviación típica s = 5.21
MODELOS Y TÉCNICAS INFERENCIALES

Tamaño de muestra para la media  con una confianza dada

El número de observaciones que debe tomarse para que el error de estimación z•EE
no supere un valor ε dado con una confianza (1-) viene dado por :
2
z   s
1
n  2  donde s es la d.t. de una muestra piloto
   (Si se conociera , se utilizaría en lugar de s)
 

Ej.: El tamaño de muestra para un IC99%() del IMC con una precisión  = 1, siendo
s = 5.21 de una muestra piloto, es:
2
z   s 2
 1 2   2.56  5.21  n = 178
n   177.89
   1 

 
 
ESTIMACIÓN

Intervalo de confianza para 2 de N(,) con  desconocida :


( n  1)  s 2
Utilizando el resultado 4,X  2
tiene una distribución chi-cuadrado
 2 ( n  1) con n -1 g.l.  2

Utilizando los percentiles   ( n  1) y   ( n  1) se tendrá que:


2 2
1
2 2
 2 (n 1)  s2 
P  (n 1)    2
 ( n  1)  1
 2  2 1
2 
y de la expresión anterior se puede deducir que:
 
 2
I.C.(2) =  ( n  1)  s , ( n  1)  s 
2

   ( n  1)   ( n  1) 
2 2

 1 2 2 
INTERVALO AL 100·(1-)% DE CONFIANZA PARA 2
CUANDO SE DESCONOCE 
ESTIMACIÓN

Ejemplo:

Si queremos construir un IC al 99% para  de IMC en Hipertensos,x y


hemos obtenido con una muestra de 20 individuos una media de =
31.85 y una desviación típica de s = 5.21, se tendrá:
 19  5.212 19  5.212   515 .74 515 .74 
2   2
 (19 )
, 2
 (19 )
  
38 . 632
,
6 . 825
  (13.35 , 75.57 )
 0.995 0.005   

( 13.35 , 75.57 )  (3.65 , 8.69 )


ESTIMACIÓN

Intervalo de confianza para una proporción aproximado por la Normal:


Si x1, x2, x3, ..., xn es una muestra aleatoria procedente de una población donde los
individuos pueden presentar o no una característica con probabilidad  (proporción
poblacional), y x es el número de los que la presentan entre los n elegidos, entonces si
llamamos p = x/n (proporción muestral)

x  N ( n , n (1   ) )  p  x / n  N (  ,  (1   ) / n )
siempre que : x = n·p > 5 ; p > 0.05
n – x = n·(1-p) > 5 ; (1-p) > 0.05

El resultado anterior obtenido en el muestreo, nos permite construir un intervalo de


confianza para la proporción poblacional , dado por

 p  (1  p ) 1 p  (1  p ) 1 
  p  z   , pz  
 1 n 2 n 1 n 2n
 2 2 

INTERVALO AL 100·(1-)% DE CONFIANZA PARA 


válido si n·p > 5 ; n·(1-p) > 5 ; p > 0.05 ; (1-p) > 0.05
ESTIMACIÓN

Ejemplo:
En el caso de querer estimar mediante un IC al 99 % la proporción de
fumadores en una población, a partir de una muestra de 80 individuos,
de los cuales 37 fumaban, se tendrá:

p  37  0.46 1  p  0.54 z 0.995  2.576


80
 0.46  0.54 1 0.46  0.54 1 
   0.46  2.576  , 0.46  2.576  
 80 2  80 80 2  80 

  (0.31, 0.61) al 99% de confianza

Tamaño de muestra para una proporción 


El número de observaciones que debe tomarse para que el error de estimación z•EE
no supere un valor  dado con una confianza (1-) viene dado por :

z2   p  (1  p) donde p es una estimación de una muestra piloto


1
2
n (Si no se conociera p, se utilizaría p=1/2)
2

También podría gustarte