Error No Muestral
Error No Muestral
Error No Muestral
=
NO reponde persona sima - i la si ; 0
SI responde persona sima - i la si ; 1
i
x
Luego,
P = P(X
i
= 1) = p+(1-)(1-p)
Q = 1 - P = (1-)p + (1-p)
El estimador insesgado que presenta el modelo de Warner, es:
) 1 2 (
) 1 (
) 1 2 (
=
p
p
p n
x
n
i
i
w
La varianza del estimador es:
2
) 1 2 (
) 1 ( ) 1 (
)
=
p n
p p
n
V
w
Warner observa que la cooperacin del entrevistado est en funcin del grado de anonimato y
depender de p.
Si p=0.5, el estimador de Warner no estar definido y por lo tanto, la muestra no arroja
informacin sobre el parmetro.
Si p=1, el estimador de Warner, se reduce a la estimacin convencional de , que requiere que
el entrevistado informe sin reserva si pertenece o no al grupo A.
Si p=0, el estimador de Warner se reduce a la estimacin convencional de (1-)
Warner, basado en su experiencia, propone utilizar un valor de p entre 0.70 y 0.80
El estimador insesgado de la varianza del estimador de es dado por:
=
2
2
) 5 . 0
(
) 5 . 0 ( 16
1
1
1
)
w w
p n
V
2. Modelo de Simons
Simmons y Horvitz modificaron el modelo de Warner, con el propsito de que el entrevistado tenga
una mayor disposicin a colaborar, sustituyendo la segunda proposicin No pertenezco al grupo
A por otra pregunta referente a una caracterstica B, no relacionada con A.
En consecuencia el entrevistado debe seleccionar a travs de un mecanismo aleatorio, una de las
siguientes proposiciones a las que se supone responde correctamente.
1. Pertenezco al grupo A
2. Pertenezco al grupo B
Los parmetros que se desean estimar son:
A
= proporcin de elementos de la poblacin que pertenecen al grupo A
B
= proporcin de elementos de la poblacin que pertenecen al grupo B
Estos dos parmetros se estiman en base a dos muestras aleatorias simples independientes de
tamao n
1
y n
2
respectivamente. Definimos las variables:
=
NO reponde 2 muestra la de persona sima - i la si ; 0
SI responde 1 muestra la de persona sima - i la si ; 1
1i
x
=
NO reponde 2 muestra la de persona sima - j la si ; 0
SI responde 1 muestra la de persona sima - j la si ; 1
2 j
x
Luego, mediante un proceso de estimacin por el mtodo de momentos, obtenemos los estimadores
insesgados siguientes:
2 1
2
2
1
2
1
1
1
1
1
2
) 1 ( ) 1 (
p p
n
x
p
n
x
p
n
n
j
j
i
i
A
+
=
=
=
1 2
2
2
1
2
1
1
1
1
1
2
p p
n
x
p
n
x
p
n
n
j
j
i
i
B
+
=
=
=
La Varianza de los estimadores anteriores esta dado mediante la siguiente frmula:
2
2 1 2
2 2 2
1
1
1 1 2
2
) (
1 ) 1 (
) 1 (
) 1 (
) 1 ( )
(
p p n
u u
p
n
u u
p V
A
=
2
2 1 2
2 2 2
1
1
1 1 2
2
) (
1 ) 1 ( ) 1 (
)
(
p p n
u u
p
n
u u
p V
B
=
Uno de los problemas en la aplicacin del modelo de Simmons, es la eleccin de los valores p
1
y p
2
.
Se sugiere:
- Disminucin de la varianza
- Disposicin a colaborar por parte del entrevistado. Para mantener esta disposicin se propone
que p
1
+ p
2
=1.
Moors (1971) demuestra que si en el modelo de Simmmons se escoge p
2
=0, se obtiene un diseo
ms eficiente que el obtenido a travs de la eleccin de p
2
=1-p
1
y n
1
y n
2
con afijacin ptima.
Lanke (1975) demuestra que, en muchos casos resulta conveniente escoger la caracterstica B de tal
forma que
B
tome valores grandes.
3. Modelo de Greenberg
Greenberg sugiere una extensin del modelo de la pregunta no correlacionada de Simmons, para
variables cuantitativas.
Sea X la variable cuantitativa que resulta comprometedor para el entrevistado. Suponemos que la
funcin de densidad de probabilidad de X es g(x).
Sea Y la variable cuantitativa no correlacionada y no comprometedora que se supone tiene funcin
de densidad h(y).
El entrevistado debe responder a la pregunta sobre la variable comprometedora con probabilidad
Py a la pregunta sobre la variable no correlacionada con probabilidad (1-P)=Q.
Luego el estimador esta relacionado a la variable Z que es la mezcla de X e Y segn P y (1-P).
Suponemos un MAS con reemplazamiento, entonces la respuesta aleatorizada Z, tiene funcin de
densidad:
f(z)=Pg(z) + Qh(z)
Sean z
1
, z
2
, ....., z
n
las respuestas aleatorizadas. Entonces la media y varianza muestral de Z son:
n
z
Z
n
i
i
=
=
1
1
) (
1
2
2
=
n
Z z
S
n
i
i
z
El estimador insesgado del parmetro
x
es dado por:
P
Q Z
y
x
) (
=
cuya varianza es dada por:
2
2
2
) (
)
(
nP P
Z V
V
z
x
= =
Luego, un estimador insesgado de esta varianza es dado por:
2
2
)
nP
S
V
z
x
=
En algunos casos el valor de
y
es desconocido por lo tanto es necesario una estimacin del
mismo. Este problema se puede solucionar seleccionando dos muestras aleatorias simples
independientes, similar al modelo de Simmons.
B. I mputacin de Datos
Es un mtodo para ajustar la falta de respuesta al asignar la caracterstica de inters a las personas
que no responden con base en la similitud de las variables disponibles tanto para las personas que
no respondieron como para quienes si lo hicieron.
El procedimiento de imputacin de datos, por lo general, se realiza en la etapa de estimacin de
parmetros, con el propsito de reemplazar datos faltantes de las unidades que no respondieron para
reducir el sesgo de no respuesta.