Teoria Unidad 2 Estadistica Aplicada

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 14

1

UNIDAD 2 ESTADISTICA APLICADA


Estadística inferencial o inductiva

La inferencia estadística es el conjunto de métodos y técnicas que permiten inducir, a partir de la


información empírica proporcionada por una muestra, cual es el comportamiento de una determinada
población con un riesgo de error medible en términos de probabilidad.
2

INTRODUCCION A LA INFERENCIA ESTADISTICA


MUESTREO Y ESTIMACION PUNTUAL Y POR INTERVALOS

1.- INTRODUCCION Y MOTIVACION

Es común escuchar la frase “No creo en las estadísticas”, incluso entre profesionales cercanos a la
disciplina. Efectivamente las “estadísticas” como posible ayuda a la toma de decisiones dependen de
quién y como se hayan tomado los datos y de si las respuestas que dan los encuestados se ajustan a su
opinión real. “Dime cual quieres que sea el resultado y arreglo las estadísticas”
En este sentido los datos pueden ser susceptibles de creencia puesto que uno puede dudar de la
intención del encuestado.
El Método Estadístico, tal y como está concebido en la actualidad, forma parte del saber científico y es
aceptado lo mismo que lo es, por ejemplo, la Teoría de la Relatividad en Física; no es, por tanto, terreno
de las creencias y seguirá siendo aceptado como válido hasta que alguien proponga una nueva teoría
que lo modifique.

La Estadística se configura como la tecnología del método científico que proporciona instrumentos para
la toma de decisiones cuando estas se adoptan en ambientes de incertidumbre, siempre que esta
incertidumbre pueda ser cuantficada en términos de probabilidad.

El objeto de la Estadística Aplicada son los Métodos Estadísticos, los resultados y su aplicación en
otras disciplinas científicas; la obtención teórica de dichos métodos utiliza herramientas matemáticas
(Cálculo, Algebra o Geometría) o conceptos de Cálculo de Probabilidades.

2.- INFERENCIA Y MUESTRAS

La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar


conclusiones de una población en estudio, a partir de la información que proporciona una muestra
representativa de la misma.
 También es denominada Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento
para generar nuevo conocimiento científico.

La muestra se obtiene por observación o experimentación. La necesidad de obtener un subconjunto


reducido de la población es obvia si tenemos en cuenta los costos económicos de la experimentación o el
hecho de que muchos de los métodos de medida son destructivos.
Toda inferencia inductiva exacta es imposible ya que disponemos de información parcial, sin embargo es
posible realizar inferencias inseguras y medir el grado de inseguridad si el experimento se ha realizado de
acuerdo con determinados principios.
Uno de los propósitos de la inferencia Estadística es el de conseguir técnicas para hacer inferencias
inductivas y medir el grado de incertidumbre de tales inferencias.
La medida de la incertidumbre se realiza en términos de probabilidad.
3

Figura 3: Esquema de Inferencia Estadística.

El primer concepto importante es el de población, que es el conjunto de individuos sobre los que se
desea información. La población ha de estar perfectamente definida a la hora de comenzar el estudio.
De la población se extrae un subconjunto que se denomina muestra. La muestra ha de ser
representativa de la población, en el sentido de que debe tener una composición similar en cuanto a la
proporción de distintas características.
Por ejemplo, una muestra para un estudio de estaturas no incluirá solamente individuos bajos o altos, sino
individuos de ambas clases en proporciones similares a las de la población.

Sobre cada uno de los individuos medimos una o varias características que denominamos
variables. Así a cada población le corresponde una variable aleatoria que denotaremos con X.

En la teoría de la Estadística quedan identificadas Población y variable aleatoria asociada.


Así en toda la teoría de la Inferencia población significará el conjunto de individuos a estudiar, pero también
la variable aleatoria asociada a la característica que medimos sobre los individuos.

En general, trataremos con poblaciones infinitas, entendiendo que en la práctica "población infinita"
significa lo mismo que "población muy grande" ya que conceptualmente la mayor parte de las poblaciones
no pueden ser consideradas infinitas.

La inferencia Estadística puede dividirse en dos apartados de acuerdo con el conocimiento sobre la
distribución en la población.

Inferencia Paramétrica:
 Se conoce la forma de la distribución (Normal, Binomial, Poisson, etc .... ) pero se
desconocen sus parámetros. Se realizan inferencias sobre los parámetros desconocidos de la
distribución conocida.

Inferencia No Parámetrica:
 Forma y parámetros desconocidos. Se realizan inferencias sobre características que no tienen
porque ser parámetros de una distribución conocida (Mediana, Estadísticos de Orden).

De acuerdo con la forma en que se estudian los parámetros o características desconocidas, la inferencia
puede dividirse en dos apartados:

Estimación:
Se intenta dar estimaciones de los parámetros desconocidos sin hacer hipótesis previas sobre posibles
valores de los mismos.
 Estimación puntual: Un único valor para cada parámetro.
 Estimación por intervalos: Intervalo de valores probables para el parámetro.

Contraste de Hipótesis:
Se realizan hipótesis sobre los parámetros desconocidos y se desarrolla un procedimiento para comprobar
la verosimilitud de la hipótesis planteada.

3.- MUESTREO
Los pasos a seguir para la recolección de una muestra son los siguientes:

- Definir la población en estudio especificando las unidades que la componen, el área geográfica
donde se realiza el estudio (si procede) y el periodo de tiempo en el que se realizará el mismo.
- Definir el marco: listado o descripción de los elementos que forman la población.
- Definir la unidad de muestreo: Ciudades, calles, hogares, individuos, etc ...
- Definir las variables a medir o las preguntas que se harán si se trata de una encuesta.
4

- Seleccionar el método de muestreo: Probabilístico o No Probabilístico, aunque son los primeros


los que nos permiten la estimación correcta de parámetros.
- Calcular el tamaño necesario para obtener una determinada precisión en la estimación. Este punto
se verá con más detalle en el apartado dedicado a la estimación por intervalos.
- Elaborar el plan de muestreo que guiará el trabajo de campo.
En cuanto al tipo de muestreo, algunas de las características más importantes de los muestreos
probabilísticos más usuales se detallan a continuación:

MUESTREO ALEATORIO SIMPLE (MAS)


Se trata de un procedimiento de muestreo (sin reemplazamiento), en el
que se seleccionan n unidades de las N en la población, de forma que
cualquier posible muestra del mismo tamaño tiene la misma probabilidad de
ser elegidas.
Se realizan n selecciones independientes de forma que en cada selección los
individuos que no han sido elegidos tengan la misma probabilidad de serlo.
El procedimiento habitual consiste en numerar todos los elementos de la
población y se seleccionan muestras del tamaño deseado utilizando una tabla de números aleatorios o un
programa de ordenador que proporcione números aleatorios.
Recuérdese que "al azar" no significa "de cualquier manera", para que el procedimiento de muestreo
sea válido es necesario utilizar correctamente el proceso de generación de números aleatorios.
Entre las ventajas de este procedimiento esta la compensación de valores altos y bajos con lo que la
muestra tiene una composición similar a la de la población, es además un procedimiento sencillo y produce
estimadores de los parámetros desconocidos próximos a los valores reales de los mismos.
El principal inconveniente de este tipo de muestreo es que necesita un marco adecuado y amplio que no
siempre es fácil de conseguir y que no contiene información a priori sobre la población que podría ser útil
en la descripción de la misma.

MUESTREO SISTEMATICO
- Se ordenan los individuos de la población y se numeran.
- Se divide la población en tantos grupos como individuos se quieren tener en
la muestra.
Se selecciona uno al azar en el primer grupo y se elige el que ocupa el mismo
lugar en todos los grupos.
-La ventaja principal es que es más sencillo y más barato que el muestreo
aleatorio simple, además, se comporta igual si no hay patrones o periodicidades en los datos.
-La aparición de patrones desconocidos puede llevar a importantes errores en la estimación de los
parámetros.
Este tipo de muestreo puede utilizarse, por ejemplo, en encuestas telefónicas programadas mediante
ordenador.

MUESTREO POR CONGLOMERADOS

-Se divide la población en grupos de acuerdo con su proximidad geográfica o


de otro tipo. (conglomerados). Cada grupo ha de ser heterogéneo y tener
representados todos las características de la población.
Por ejemplo, los conglomerados en un estudio sobre la situación de las
mujeres en una determinada zona rural pueden ser los municipios de la zona.
-Se selecciona una muestra de conglomerados al azar y se toma el
conglomerado completo o una muestra del mismo.
-Necesitan menos información previa sobre los individuos particulares.
-Soluciona el problema de los patrones en los datos.
-Si el número de bloques no es muy grande se puede incurrir en errores de estimación si se han incluido
conglomerados atípicos.
-Los conglomerados que se realizan teniendo en cuenta proximidad geográfica pueden no tener un
significado importante en la población (no responden a una característica real).
5

- Este tipo de muestreo se utiliza fundamentalmente para reducir los costos de toma de muestras al tomar
grupos de individuos completos.

MUESTREO ESTRATIFICADO
-Se divide la población en grupos homogéneos (estratos) de acuerdo con las
características a estudiar. Por ejemplo, en un estudio de las características
socioeconómicas de una ciudad los estratos pueden ser los barrios de la
misma, ya que los barrios suelen presentar características diferenciales.
-Se selecciona una muestra aleatoria de cada estrato tratando de que todos
los estratos de la población queden representados.
-Permite utilizar información a priori sobre la estructura de la población en
relación con las variables a estudiar.
-Obtiene representantes de todos los estratos de la población.
-Diferentes opciones de selección del tamaño de la muestra en los estratos:
-El mismo número en cada estrato.
-Proporcional. (La más común)
-Optima.

4.- ESTADISTICOS Y DISTRIBUCIONES MUESTRALES

Todo lo que veremos a continuación está pensado para poblaciones infinitas (muy grandes) y con
muestreo aleatorio simple. El muestreo aleatorio simple garantiza una muestra representativa de la
población y la obtención de observaciones independientes.

Dada una población X, el proceso de muestreo consiste en obtener, al azar, un valor de la variable X, x 1;
El valor obtenido puede ser cualquiera de los de la población, luego los posibles valores para x 1 son todos
los de X, y por tanto x1 puede considerarse como una realización particular (observación) de una variable
aleatoria X1 con la misma distribución que X.

A continuación obtenemos, independientemente de la primera observación, un valor x 2 que puede


considerarse como una realización particular de una variable aleatoria X 2 con la misma distribución que X
e independiente de X1. Obsérvese que la población no se modifica al extraer uno de sus individuos ya que
es infinita. (Si la población es finita podría utilizarse un muestreo con reemplazamiento).

El proceso continúa hasta obtener una muestra de tamaño n, n observaciones x 1, x2, ... , xn de n variables
aleatorias X1, X2, ... , Xn independientes e idénticamente distribuidas.

Definición: Sea X una variable aleatoria con f.d.p F, y sean X 1, X2, ... , Xn , n variables aleatorias
independientes con la misma f.d.p F que X. Se dice que X 1, X2, ... , Xn , son una muestra aleatoria de
tamaño n de F o bien n observaciones independientes de X.

Hemos utilizado letras minúsculas, como en descriptiva, para denotar las observaciones particulares de
una muestra, y letras mayúsculas para denotar las variables aleatorias de las que se han tomado. A lo
largo de la exposición teórica ambas serán intercambiables y serán utilizadas indistintamente para
representar a las correspondientes variables aleatorias.

Otra forma de ver la muestra es como una variable aleatoria multivariante con función de densidad de
probabilidad es el producto de las funciones de densidad de cada una de las componentes (ya que son
independientes)

f(X1, X2, ... , Xn) = f(X1) f(X2) ... f(Xn)

donde las funciones de densidad son iguales a la de X.


6

Una vez obtenida la muestra la describimos en términos de algunas de sus características


fundamentales como la media, la desviación típica, etc ... A tales características las solemos
denominar estadísticos.

Definición: Un estadístico es una función de los valores muestrales que no depende de ningún
parámetro poblacional desconocido.

Un estadístico es también una variable aleatoria ya que es una función de variables aleatorias. Por
ejemplo la media muestral

es una variable aleatoria de la que tenemos una sola observación

Veámoslo con un ejemplo sencillo

Supongamos que disponemos de una población finita en la que disponemos de 4 individuos que
toman los valores {1, 2, 3, 4}.
- Supongamos que obtenemos una muestra sin reemplazamiento de tamaño 2.
- Las distintas posibilidades son

{1, 2} {1, 3} {1, 4} {2, 3} {2, 4} {3, 4}

Obtendremos, dependiendo de la muestra elegida, las siguientes medias respectivamente:

1.5 2 2.5 2.5 3 3.5

Es claro que la media muestral no es un valor fijo sino que puede considerarse también como una variable
aleatoria de la que tenemos una sola observación, la media de la muestra concreta seleccionada.
Dicha variable tendrá una distribución de probabilidad asociada. (En este caso una distribución discreta
que toma los valores 1.5, 2, 2.5, 3 y 3.5 con probabilidades 1/6, 1/6, 2/6, 1/6, 1/6, respectivamente.

Definición: A la distribución de un estadístico calculado a partir de los valores tomados de una


muestra se la denomina distribución muestral del estadístico.

- En la mayor parte de los casos supondremos que nuestra población tiene distribución
normal y que los estadísticos que vamos a utilizar son la media y la desviación típica (o la
desviación típica).

5.- DISTRIBUCIONES MUESTRALES DE LA MEDIA Y LA DESVIACION TIPICA.

Sea X1, X2, ... , Xn , una muestra aleatoria de una población X en la que
E(X) = m Var(X)= s2
Entonces el valor esperado (media) y la varianza del estadístico "media muestral" son
7

- Si además, la población es normal, es decir, entonces la media muestral es


también normal .

El resultado es importante en estimación ya que, aunque la media poblacional y la media muestral no


coincidan, los posibles valores de la media muestral se concentran de forma simétrica alrededor de la
media poblacional, además, la dispersión es menor a medida que aumenta el tamaño muestral.

Figura 6: Distribución muestral de las medias.

La distribución muestral asociada a varianzas es un poco más compleja y su obtención supera los objetivos
del curso, de forma que nos limitaremos a exponerlas.

Sea X1, X2, ... , Xn , una muestra aleatoria simple de una población X º N(m, s 2), entonces la variable
aleatoria

sigue una ji-cuadrado con n-1 grados de libertad.

Del resultado anterior se deduce que las variables

donde siguen ambas una ji-cuadrado con n-1 grados de libertad.

6.- EL TEOREMA CENTRAL DEL LIMITE.

- Lo que hemos visto hasta el momento parece bastante restrictivo ya que hemos supuesto, de
entrada, que la distribución en la población es normal, pero existen muchos casos en los que no
es posible suponer distribución Normal.

El siguiente resultado permite trabajar con la normal para la distribución muestral de medias
aunque la población no lo sea, y es conocido como Teorema Central del Límite.

Sea X1, X2, ... , Xn , una muestra aleatoria de una población X con una distribución de probabilidad no
especificada para la que la media es E(X) = m y la varianza Var(X)= s 2 finita. La media muestral tiene una
distribución con media m y varianza s2 /n que tiende a una distribución normal cuando n tiende a infinito.
La aproximación a la distribución normal es mejor para n grande ya que se trata de una aproximación y no
de una distribución exacta como en el caso de poblaciones normales. En Estadística consideramos n
grande cuando es mayor de 30.
8

Una consecuencia directa del teorema es que la suma de los valores muestrales sigue una distribución
normal de media nm y varianza ns2.

7.- ESTIMADORES Y PROPIEDADES DESEABLES DE LOS ESTIMADORES.

Supongamos ahora que disponemos de una población en la que se mide una variable X con distribución
de forma conocida y parámetros desconocidos, por ejemplo una normal con media y varianzas
desconocidas como en el caso práctico que planteábamos anteriormente.

De la población se extrae una muestra aleatoria simple de tamaño n, X 1, X2, ... , Xn. Se trata de calcular, a
partir de los valores muestrales, una función de los mismos que proporcione un valor = u(X2, ... , Xn) que
sustituya al parámetro desconocido de la población q, de forma que ambos sean lo más parecidos en algún
sentido. A tal valor obtenido de la muestra se le denomina estimador.

8.-METODOS DE ESTIMACION

Método de los Mínimos Cuadrados


-Consiste en minimizar la suma de cuadrados de los errores (diferencias entre valores observados y
esperados tras suponer que las observaciones se obtienen como la suma de una parte sistemática o
controlada y una parte aleatoria no controlada o fuente de error).
El método es ampliamente utilizado cuando se trabaja con modelos de regresión y técnicas relacionadas.

Ejemplo: Media y varianza de una población normal

Los valores muestrales X1, ... , Xn se supone que son variables aleatorias independientes y todas con
distribución N(m, s). La función de densidad conjunta será el producto de las funciones de densidad de
cada una de ellas.

Tomando logaritmos

Derivando con respecto a m y s y resolviendo el sistema se obtienen como estimadores para la


media y la varianza

9.-ESTIMADORES PUNTUALES DE LOS PARAMETROS DE UNA POBLACION NORMAL

Sea una muestra aleatoria simple, X1, X2, ...... , Xn de una población con distribución N(m , s).
Estimador de la media

Se trata de un estimador eficiente (insesgado y de varianza mínima).


La distribución muestral de la media es :
9

La cantidad estima a la desviación típica de la media y se denomina error estándar de


la media, por esta razón se dice que el error estándar de la media mide la variabilidad de la media en el
muestreo.

-Estimador de la Varianza

Varianza muestral (estimador sesgado).

10.- ESTIMADORES DE LOS PARAMETROS DE LAS DISTRIBUCIONES DISCRETAS MAS USUALES

Se dispone de una muestra de tamaño n en la que el resultado de la observación es una variable


dicotómica (dos posibles resultados). Una variable cualitativa con más de dos resultados puede reducirse
a una dicotómica sin más que agrupar algunas de las categorías.
Se trata de estimar la probabilidad p de éxito en la población.
La variable X= número de éxitos en las n pruebas, puede tener distintas distribuciones dependiendo de las
condiciones en las que se toma la muestra.

-BINOMIAL
Si se toman muestras de poblaciones infinitas o se realiza un muestreo con reemplazamiento de una
población finita. Se realizan n pruebas y se contabiliza el número de éxitos en las n pruebas. El estimador
de la proporción de éxito es

Aproximando X mediante una distribución normal, la distribución muestral del estimador de la probabilidad
de éxito para muestras grandes es

-HIPERGEOMETRICA

Si se toman muestras sin reemplazamiento de una población finita de tamaño N conocido.

Aproximando X mediante una distribución normal, la distribución muestral del estimador de la probabilidad
de éxito para muestras grandes es
10

12.- ESTIMACION POR INTERVALOS

INTRODUCCION

Dada una muestra aleatoria X1, X2, ... , Xn , de una población con función de densidad f(x; q) Un intervalo
de confianza, de extremos L1 y L2, para el parámetro q de la población es un par ordenado de funciones
reales de las n medidas de la muestra

construidas de forma que la probabilidad de que los extremos contengan al verdadero valor del parámetro
es un valor prefijado 1 - a. Al número 1 - a se le denomina “nivel de confianza”.

El nivel de confianza suele ser 0,95 (95%) ó 0,99 (99%). La interpretación práctica es sencilla, por
ejemplo si el nivel de confianza es del 95%, significa que en el 95% de las veces que repitieramos el
experimento, el intervalo de confianza calculado contendría al verdadero valor del parámetro y en el 5%
restante el intervalo no contendría el verdadero valor.

Una vez que el intervalo de confianza ha sido particularizado para una muestra concreta, el intervalo
obtenido contiene o no contiene al verdadero valor del parámetro, con probabilidad 1, por esa razón,
cuando ya tenemos un valor concreto hablamos de confianza y no de probabilidad. Confiamos en que el
intervalo que hemos calculado sea del 95% que contiene el verdadero valor.

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION NORMAL DE VARIANZA


CONOCIDA

Supongamos que disponemos de una población en la que tenemos una v.a. con distribución N(m , s) con
s conocida (de estudios previos, por ejemplo).
Obtenemos una muestra de tamaño n y deseamos estimar la media m de la población.
El estimador puntual de la misma es la media muestral cuya distribución muestral es conocida

la cantidad

tendrá distribución normal estándar.


Sobre la distribución N(0 , 1) podremos seleccionar dos puntos simétricos -za/2 y za/2 , tales que

Figura 1: Selección de los puntos críticos para el cáculo del intervalo de confianza.
11

Sustituyendo Z por su valor en este caso particular

Despejando la media muestral y la varianza

que verifica las condiciones de la definición.

Así, el intervalo de confianza para la media puede escribirse como

en la práctica, de todos los posibles valores de tenemos uno sólo y por tanto un único intervalo de
todos los posibles para distintas muestras

La importancia del intervalo de confianza para la estimación está en el hecho de que el intervalo contiene
información sobre el estimador puntual (valor central del intervalo) y sobre el posible error en la estimación
a través de la dispersión y de la distribución muestral del estimador. Observese que el error en la
estimación está directamente relacionado con la distribución muestral del estimador y con la varianza
poblacional, e inversamente relacionado con el tamaño muestral.

El gráfico siguiente ilustra la interpretación del nivel de confianza para el intervalo de confianza para la
media de una distribución normal con varianza conocida. Para los distintos posibles valores de la media,
representados mediante su distribución muestral, obtenemos distintos intervalos de confianza. La mayor
parte incluye al verdadero valor del parámetro, pero el resto no. Concretamente el 95% lo incluye y el 5%
no, si el nivel de confianza es del 95%.

En la práctica disponemos de una única repetición del experimento, y por tanto de un único intervalo de
confianza, el señalado en negro en el gráfico, por ejemplo. Confiamos en que nuestro intervalo sea de la
mayoría que con tiene al verdadero valor objetivo aunque no tenemos la seguridad de que sea así, tenemos
concretamente un riesgo del 5% de equivocarnos.
12

Figura 2: Interpretación del nivel de conmfianza en el intervalo para la media de una distribición normal.

LONGITUD DEL INTERVALO Y ERROR EN LA ESTIMACIÓN

En la práctica hemos de tratar de que la longitud del intervalo de confianza sea lo más pequeña posible,
es decir, que el error en la estimación sea lo mas pequeño posible.

Esto puede conseguirse modificando las distintas cantidades que aparecen en la fórmula: el nivel de
confianza, a través del valor crítico, la variabilidad y el tamaño muestral. Estudiaremos cada una por
separado

-NIVEL DE CONFIANZA
La longitud del intervalo de confianza aumenta al aumentar el nivel de confianza ya que el valor crítico de
la distribución es mayor. Si consideramos un nivel de confianza del 100%, el intervalo de confianza será
que, evidentemente contiene al verdadero valor del parámetro pero no es de ninguna utilidad
en la práctica. Si disminuimos el nivel de confinza también disminuye la longitud, sin embargo conviene
mantenerlo en unos límites razonables que suelen ser del 95% o del 99% en la mayor partede las
aplicaciones.

-VARIANZA
La longitud del intervalo de confianza disminuye con la varianza, es decir, la estimación será más precisa
cuanto menor sea la variabilidad en la población, lo que significa que la población es más homogénea. En
la práctivca es posible obtener estimaciones más precisas, por ejemplo, restringiendo la población a
conjunts lo m,ás homogéneos posible.

-TAMAÑO MUESTRAL
La longitud del intervalo de confianza disminuye al aumentar el tamaño muestral, lo que significa que se
obtienen estimaciones más precisas cuanto mayor sea el tamaño muestral. Debido a consideraciones
prácticas de coste y tiempo, en general no es posible aumentar indefinidamente el tamaño muestral para
obtener estimaciones más precisas, es por ello que en la práctica se selecciona el tamaño muestral
necesario para obtener una determinada precisión, establecida a priori.

CALCULO DEL TAMAÑO MUESTRAL PARA ESTIMAR LA MEDIA DE UNA POBLACION CON UNA
DETERMINADA PRECISION
13

Supóngase que un investigador está interesado en estimar la media de una población normal de forma
que la diferencia existente entre la media muestral que obtenfdrá del experimento y la media poblacional
verdadera, esté por debajo de un error prefijado de antemano.

Teniendo en cuenta el intervalo de confianza

podemos escribir

Despejando n de la igualdad

obtenemos la expresión deseada para el tamaño muestral.


Obsérvese que n ha sido calculado en el supuesto de que la variabilidad es conocida. Si no es así, la
variabilidad aproximada puede obtenerse de trabajos bibliográficos o experimentos previos o a partir una
muestra piloto con unas pocas observaciones.

Obsérvese que en el cálculo del tamaño muestral se han igualado el error fijado a priori con el error en la
estimación obtenido del intervalo de confianza y que este último incluye el nivel de confianza. En este
aprtado un nivel de confianzadel 95%, por ejemplo, implicaria que en el 95% de las veces que repitieramos
el experimento con el tamaño muestral calculado, obtendríamos un error por debajo del prefijado, mientras
que en el 5% restante obtendríamos un error superior.

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION NORMAL CON VARIANZA


DESCONOCIDA

La situación práctica más habitual es aquella en la que no se conoce la varianza de la población, que habrá
que estimar a partir de los datos muestrales. Utilizaremos la cuasi-varianza muestral como estimador por
sus buenas propiedades.

La distribución muestral asociada es la siguiente:

Teniendo en cuenta la distribución normal asociada a las medias y combinándola con la ji-cuadrado,
obtenemos una distribución t de Student:
14

Siguiendo el mismo proceso que en el caso de la normal el intervalo de confianza resulta

Obsérvese la similitud con el intervalo calculado para la distribución normal, salvo en el valor crítico y en
que la varianza ha sido estimada a partir de la muestra.

Desde el punto de vista práctico esto implica que los valores críticos son un poco más grandes y, por tanto
el intervalo tiene mayor longitud, este es el precio que debemos pagar a cambio de no conocer la varianza
de la población.

Cuando el tamaño muestral es grande, la distribución t es muy similar a la normal, de forma que pueden
intercambiarse los valores críticos correspondientes. El intervalo de confianza para la media en muestras
grandes se puede escribir como

TEOREMA DE LIMITE CENTRAL


DEFINICION
Si Xtestada es la Media de la Muestra elegida al azar de tamaño “n” de una población infinita con
media µ (mu) y desviación estándar σ (sigma) y “n” es grande mayor que 30, entonces:
Z=X-µ
σ/√n
DONDE:
σ/√n para población infinita o

σ/√n * √(N-n)/N-1 para población finita

También podría gustarte