Estimación de Parametros

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 8

ESTADÍSTICA INFERENCIAL

Hugo Saavedra Saavedra


1. ESTIMACIÓN PUNTUAL

Si a partir de las observaciones de una muestra se calcula un solo valor como estimación de un
parámetro de la población desconocido, el procedimiento se denomina estimación puntual.
Por ejemplo queremos estimar la nota media de los alumnos de bachiller en la asignatura de
matemáticas que notaremos . Sea X la variable aleatoria que indica la nota obtenida por cada
estudiante. Tomamos una muestra de tamaño n y denotamos la nota media de la muestra. Si
al tomar una muestra de 100 estudiantes obtenemos que la media es 6´2, este número lo
tomaríamos como estimativo de . Decimos que 6,2 es una estimación puntual de .

Un estimador puntual T de un parámetro es cualquier estadística que nos permita, a partir de los
datos muestrales, obtener valores aproximados del parámetro .

PARÁMETROS MÁS USUALES Y SUS ESTIMADORES

PARÁMETRO SÍMBOLO ESTIMADOR


Media de la población µ n

x i
Media de la muestra X i 1
n
Varianza de la población σ2 n

 (x i  X )2
Varianza de la muestra S 2  i 1
n 1
Proporción de la población p x
Proporción muestral pˆ 
n
Diferencia de medias µ1 - µ2 Diferencia de medias muestrales X 1  X 2
Diferencia de proporciones p1 - p2 Diferencia de proporciones muestrales
x x
pˆ 1  pˆ 2  1  2
n n

Para indicar que T es un estimador del parámetro escribimos =T.


Con esto queremos decir que empleamos la expresión dada mediante T para obtener valores
próximos al valor del parámetro.
Es muy probable que haya error cuando un parámetro es estimado. Es cierto que si el número de
observaciones al azar se hace suficientemente grande, éstas proporcionarían un valor que casi sería
semejante al parámetro; pero a menudo hay limitaciones de tiempo y de recursos y se tendrá que
trabajar con unas cuántas observaciones. Para poder utilizar la información que se tenga de la mejor
forma posible, se necesita identificar las estadísticas que sean “buenos” estimadores. Hay cuatro
criterios que se suelen aplicar para determinar si una estadística es un buen
estimador: Insesgamiento, eficiencia, consistencia y suficiencia

EJERCICIOS SOBRE ESTIMACIÓN PUNTUAL


1. De una población se escogieron al azar 10 personas y se les tomo la estatura. Los
resultados en cm fueron: 160, 170, 170, 150, 160, 180, 160, 170, 130, 150. Estime la
media y la varianza.(Sol. 169,14).
2. En una universidad se desea conocer la opinión de los estudiantes acerca de ciertas
medidas que han tomado los directivos. De 120 estudiantes consultados, 90 estuvieron
a favor. Estime la proporción de estudiantes que están a favor de las medidas. (Sol.
75%).
3. Un conjunto residencial está formado por 200 apartamentos. Se seleccionaron 18
apartamentos y se observó que, en promedio, viven 4,5 personas por apartamento.
Estime el total de personas que viven en el conjunto residencial. ( Sol. 900 personas).
4. De un lote de 1.000 licuadoras se escogen aleatoriamente 30 y se encontró que 2 de
ellas estaban estropeadas; ¿cuántas licuadoras se estima que estén estropeadas? (Sol.
67 licuadoras).

2. EL ERROR ESTÁNDAR

Un mismo estimador ofrece distintos valores para distintas muestras del mismo tamaño extraídas
de la misma población. Por lo tanto deberíamos tener una medida de la variabilidad del estimador
respecto del parámetro que se trata de estimar. Esta variabilidad se mide en términos de la
desviación estándar del estimador, la cual recibe el nombre de error estándar.

El error estándar de un estimador T de un parámetro es la desviación estándar del estimador.

Así por ejemplo, si tomamos como estimador de , entonces el error estándar está dado por

Error de estimación es el valor absoluto de la diferencia entre una estimación particular y el valor
del parámetro.

En realidad por cada valor estimado del parámetro se tiene un error de estimación por lo general
diferente. Sin embargo, es posible fijar un intervalo dentro del cual se encontrarán la mayoría de
los valores de error de estimación para un estimador y parámetro dados.

En la tabla siguiente se dan las fórmulas de los errores de estimación para algunos estimadores y
los estimadores para tales errores. Los estimadores se usan cuando los parámetros que se incluyen
en las fórmulas de los errores de estimación son desconocidos.
PARÁMETRO ESTIMADOR ERROR ESTÁNDAR ESTIMADOR DEL ERROR

N
=

EJERCICIOS SOBRE EL ERROR ESTÁNDAR


1. Una agencia de encuesta selecciona 900 familias y calcula la proporción de éstas que
utilizan cierto tipo de detergente. Si la proporción estimada es 0´35 ¿Cuál es el error
estándar estimado? (Sol. 0,016).
2. En el estudio de cierta característica X de una población se sabe que la desviación
estándar es 3. Se va a escoger una muestra de tamaño 100, halle el error estándar de la
media muestral. (Sol. 0,3).
3. Se escogió al azar una muestra de 10 clientes de un banco y se les preguntó el número de
veces que habían utilizado el banco para llevar a cabo alguna transacción comercial. Los
resultados fueron los siguientes: 0, 4, 2, 3, 2, 0, 3, 4, 1, 1. Estime el error estándar del
número de transacciones promedio. ( Sol. 0,47).

3. ESTIMACÓN DE PARÁMETROS MEDIANTE INTERVALOS DE CONFIANZA

Nos proponemos determinar dos números entre los cuales se halla el parámetro estudiado con
cierta certeza.
El procedimiento para obtener un intervalo (de confianza) para un parámetro, la media , por
ejemplo, requiere de la determinación de un estimador del parámetro y de la distribución del
estimador.
Un intervalo de confianza para un parámetro es un intervalo construido alrededor del
estimador del parámetro de tal manera que podemos esperar que el verdadero valor del
parámetro quede incluido en dicho intervalo.
El nivel de confianza de un intervalo es una probabilidad (expresada en porcentaje) que
representa la seguridad de que el intervalo encierra el verdadero valor del parámetro .
En el ejemplo el nivel de confianza es del 95%.En general el nivel de confianza se expresa en la
forma 100(1 - )%. (1- )=0´95. El valor representa la probabilidad de que el parámetro quede
fuera del intervalo y en este caso es 0´5

FÓRMULAS.
MEDIA POBLACIÓN NORMAL EJERCICIO1
VARIANZA CONOCIDA

O VARIANZA
DESCONOCIDA Y
N>30

POBLACIÓN NORMAL EJERCICIO2


VARIANZA
DESCONOCIDA Y
N<30

POBLACIONES EJERCICIO3
NORMALES
INDEPENDIENTES.

VARIANZAS
DIFERENCIA
CONOCIDAS.

DE POBLACIONES EJERCICIO4
NORMALES
MEDIAS INDEPENDIENTES.

VARIANZAS IGUALES
DESCONOCIDAS

SE RECOMIENDA EL EJERCICIO5
PROPORCIÓN USO DE ESTA
FÓRMULA EN
MUESTRAS DE
TAMAÑO GRANDE

DIFERENCIA DE SE RECOMIENDA EL EJERCICIO6


PROPORCIONES USO DE ESTA
FÓRMULA EN
MUESTRAS DE
TAMAÑO GRANDE

VARIANZA POBLACIONES EJERCICIO7


NORMALES

COCIENTE DE VARIANZAS MUESTRAS EJERCICIO8


INDEPENDIENTES DE
POBLACIONES ;
NORMALES

b=
EJERCICIOS SOBRE ESTIMACIÓN POR INTERVALOS.

1. Una muestra aleatoria de 36 cigarrillos de una determinada marca dio un contenido


promedio de nicotina de 3 miligramos. El contenido en nicotina de estos cigarrillos sigue
una normal con una desviación estándar de 1 miligramo. a) Obtenga e interprete un
intervalo de confianza del 95% para el verdadero contenido promedio de nicotina en
estos cigarrillos. b) El fabricante garantiza que el contenido promedio de nicotina es 2´9
miligramos, ¿qué puede decirse de acuerdo con el intervalo hallado? (Sol. [2.67, 3.33] .
No podemos descartar lo afirmado por el fabricante ya que el valor 2´9 se encuentra
dentro del intervalo).

2. Los siguientes números representan el tiempo(en minutos) que tardaron 15 operarios en


familiarizarse con el manejo de una nueva máquina adquirida por la empresa: 3´4, 2´8, 4´4,
2´5, 3´3, 4, 4´8, 2´9, 5´6, 5´2, 3´7, 3, 3´6, 2´8, 4´8. Supongamos que los tiempos se distribuyen
normalmente. A) Determina e interpreta un intervalo del 95% de confianza para el
verdadero tiempo promedio. B) El instructor considera que el tiempo promedio requerido
por los trabajadores es mayor que 5 minutos, ¿qué se puede decir de acuerdo con el
intervalo hallado? (Sol.[3´26 , 4´34]. La apreciación del instructor no parece correcta ya que
el valor 5 minutos se encuentra fuera del intervalo.)

3. Queremos medir la diferencia en ventas entre dos categorías de empleados. Una está
formada por personas con título superior y la otra por personas con estudios secundarios.
Tomamos una muestra de 45 empleados del primer grupo y la media de ventas resulta ser
32. Tomamos una muestra de 60 empleados del segundo grupo y la media obtenida es 25.
Supongamos que las ventas de los dos grupos siguen una normal con varianza 48 para el
primer grupo y de 56 para el segundo. A) Calcula un intervalo del 90% de confianza para la
verdadera diferencia de las medias. B) De acuerdo con el intervalo hallado, ¿hay evidencia
de que las ventas medias de los grupos son iguales?( Sol.[4´67,9´33]. El hecho de que las
medias sean iguales quiere decir que la diferencia de las medias es 0. Como el 0 no está
contenido en el intervalo, no hay evidencia de que se de la igualdad.)

4. Se desea saber si hay diferencia entre el tiempo (en minutos) que tardan los empleados de
la pizzería A y los de la pizzería B en atender un pedido. Tomamos una muestra de 14
empleados de A y obtenemos una media muestral de 17 minutos y una varianza muestral
de 1´5. Tomamos una muestra de B de 25 empleados obteniendo la media muestral de 19
y la varianza muestral de 1´8. Suponemos que los tiempos para los dos grupos se
distribuyen normalmente y que las varianzas son iguales aunque desconocidas. A) Calcula
un intervalo de confianza del 99% para la verdadera diferencia de las medias. B) De acuerdo
con el intervalo hallado, ¿hay evidencia de que los dos tiempos promedios son iguales?
(Sol. [0´83,3´17]. Como el cero no está contenido en el intervalo, no hay evidencia de que
los tiempos sean iguales.)

5. Una marca de lavadoras quiere saber la proporción de amas de casa que preferirían usar
su marca. Toman al azar una muestra de 100 amas de casa y 20 dicen que la usarían. Calcula
un intervalo de confianza del 95% para la verdadera proporción de amas de casa que
preferirían dicha lavadora. (Sol. [0´122, 0´278].)

6. Se desea cambiar una máquina en una cadena de producción. Se toman muestras con la
máquina actual y con la nueva máquina para determinar si se van a producir mejoras en el
sistema. 75 de 1.000 artículos del procedimiento actual presentaron defectos y lo mismo
sucedió con 80 de 2.500 partes del nuevo, determine un intervalo de confianza del 90%
para la verdadera diferencia de proporciones de partes defectuosas. (Sol. [0´0281,
0´0579]).

7. Un fabricante de baterías para automóvil asegura que las baterías que produce duran en
promedio 2 años, con una desviación típica de 0,5 años. Si 5 de estas baterías tienen
duración 1,5 2,5 2,9 3,2 4.0 años, determine un intervalo de confianza del 95% para la
varianza e indique si es válida la afirmación del fabricante. (Sol. [0,3 – 7,0]. Como el valor
garantizado por el fabricante queda fuera del intervalo rechazamos dicha afirmación.)

8. Determina un intervalo de confianza del 90% para el cociente de varianzas tomando los
datos del ejercicio 4. (Sol. [0,552 - 2,904])

TAMAÑO DE LA MUESTRA PARA ESTIMAR MEDIAS Y PROPORCIONES.

El tamaño de la muestra que debemos escoger para hacer una estimación del parámetro con las
características especificadas (de nivel de confianza y error de estimación.) es un problema de
gran importancia ya que:
1. Si tomamos una muestra más grande de la indicada para alcanzar los resultados propuestos,
constituye un desperdicio de recursos (tiempo, dinero, etc.); mientras que una muestra
demasiado pequeña conduce a menudo a resultados poco confiables.
2. cuando elegimos una muestra de tamaño n sólo revisamos una fracción o parte de la población
y con base en ella tomamos decisiones que afectan a toda la población. Es evidente que por
este procedimiento se abre la posibilidad de que nos equivoquemos en nuestras decisiones,
pero esta posibilidad depende en gran medida del tamaño de muestra o fracción de población
que se haya analizado.
El tamaño que debe tener la muestra depende del nivel de confianza propuesto, así como del
máximo error que estemos dispuestos a admitir entre el valor estimado y el valor real del
parámetro que corresponde al error de estimación.
Veamos cómo se determinaría el tamaño de la muestra a partir de la consideración del nivel de
confianza y del error de estimación cuando hacemos muestreo con repetición o en poblaciones
infinitas.
Supongamos que d es el error de estimación (precisión) y el nivel de confianza es 100(1- )
para la estimación de la media de una población normal con varianza conocida, con estos

datos formamos la ecuación d=

De esta ecuación, elevando al cuadrado obtenemos d2 = Z2 de esta ecuación despejamos

nd2=Z2 por lo tanto n = .

Esta fórmula nos permite obtener el tamaño de la muestra cuando tratamos de estimar un
intervalo de confianza para la media con error de estimación y nivel de confianza dados.

El tamaño de la muestra depende de dos elementos básicos (supuesta dada la varianza) que hay
que sopesar cuando se va a tomar una decisión al respecto; se trata del nivel de confianza y del
error de estimación y tenemos:
1. El tamaño de la muestra aumenta a medida que aumenta el nivel de confianza para un
error de estimación y una varianza dados.
2. El tamaño de la muestra aumenta a medida que disminuye el error de estimación para
un nivel de confianza y varianza dados.
Si la población es finita y el tamaño de ésta debe ser tenida en cuenta, el tamaño

muestral viene dado por:

En las dos fórmulas anteriores aparece la varianza, por lo tanto es necesario conocerla. Si es
desconocida debe ser estimada por cualquiera de los medios siguientes:
1. Se toma una muestra preliminar llamada “muestra piloto” y estimamos la varianza
mediante S2. Si el tamaño de la muestra piloto es inferior a 30 se recomienda
emplear el valor t en lugar del valor normal.
2. Se utilizan estimaciones previas que se hayan hecho acerca de la varianza en estudios
anteriores.
3. Si existe evidencia de que la población estudiada tiene distribución normal,
estimaremos mediante A/4 donde A es la amplitud o rango de la población. Este
método requiere el conocimiento del valor máximo y mínimo de la varianza
investigada.
Estudiemos el caso de la proporción poblacional. En este caso el tamaño de la muestra
está dado por:

n=

Cuando no se da estimación alguna para la proporción, utilizaremos la fórmula


anterior tomando =0,5. Esto arroja por lo general una muestra mucho mayor de la
indicada.

Si el tamaño de la población debe ser tenido en cuenta el tamaño de muestra está dado por:

n=

EJERCICIOS SOBRE EL TAMAÑO DE LA MUESTRA.

1. Queremos ajustar una máquina de refrescos de modo que el promedio del líquido
dispensado quede dentro de cierto rango. La cantidad de líquido vertido por la máquina
sigue una distribución normal con desviación estándar 0,15 decilitros. Deseamos que el
valor estimado que se vaya a obtener comparado con el verdadero no sea superior a 0,2
decilitros con una confianza del 95%. ¿De qué tamaño debemos escoger la muestra? (Sol.
N=217).

2. Es necesario estimar entre 10.000 establos, el número de vacas lecheras por establo con
un error de estimación de 4 y un nivel de confianza del 95%. Sabemos que la varianza es
1.000. ¿Cuántos establos deben visitarse para satisfacer estos requerimientos? (Sol. Como
sabemos que hay 10.000 establos, tendremos que usar la fórmula en la que interviene el
tamaño de la población y obtenemos n=235).
3. Una máquina llena cajas con cierto cereal. El supervisor desea conocer con un error de
estimación de máximo 0,1 y un nivel de confianza del 90%, una media estimada del peso.
Como la varianza era desconocida se procedió a escoger una muestra piloto. Los resultados
fueron los siguientes: 11,02, 11,14, 10,78, 11,59, 11,58, 11,19, 11,71, 11,27, 10,93, 10,94.
¿Cuántas cajas debe escoger para que se cumplan los requisitos propuestos? (Sol. Debemos
tomar la varianza estimada y al ser n<30 el valor de t, al sustituir en la fórmula obtenemos
n=34).

4. Se desea conocer el peso promedio de una determinada clase de pescado con un error de
estimación de 0,02 y con un nivel de confianza del 99%. Por datos anteriores se sabe que
el peso mínimo es 1,48 libras y el máximo es de 2,47 libras. ¿De qué tamaño debe escoger
la muestra? Suponga que los pesos de estos pescados se distribuyen normalmente. (Sol.
No conocemos la varianza pero la podemos estimar a partir de la fórmula A/4. Al sustituir
en la fórmula obtenemos n=1015)

5. Se desea hacer una encuesta para determinar la proporción de familias que carecen de
medios económicos para atender los problemas de salud. Existe la impresión de que esta
proporción está próxima a 0,35. Se desea determinar un intervalo de confianza del 95%
con un error de estimación de 0,05. ¿De qué tamaño debe tomarse la muestra? (Sol.
N=350).

6. Un productor de semillas desea saber con un error de estimación del 1% el porcentaje de


semillas que germinan en la granja de su competidor. ¿Qué tamaño de muestra debe
tomarse para obtener un nivel de confianza del 95%? (Sol. Como no tenemos ninguna
estimación de la proporción, tomaremos 0,5 y así obtenemos n=9.604)

7. Se desea realizar una encuesta entre la población juvenil de una determinada localidad
para determinar la proporción de jóvenes que estaría a favor de una nueva zona de ocio.
El número de jóvenes de dicha población es N=2000. Determinar el tamaño de muestra
necesario para estimar la proporción de estudiantes que están a favor con un error de
estimación de 0,05 y un nivel de confianza del 95%. (Sol. Como no nos dan ninguna
estimación de la proporción, tomaremos 0,5. El valor de n es 322).

También podría gustarte