Estadistica Inferencial Unidad2

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 8

Introducción

La inferencia estadística es el proceso que permite hacer inferencias (predicciones,


suposiciones, le interesa sacar conclusiones de un gran número de acontecimientos
ocurridos o por ocurrir (población), basándose en las observaciones de una parte
de los mismos (muestra). La estadística nos proporciona herramientas que
formalizan y uniforman los procedimientos para sacar conclusiones siempre que las
muestras seleccionadas sean representativas de la población que han sido
extraídas. Esta representatividad permite extender los valores que describen a las
muestras, tales como la media, la desviación típica, un coeficiente de correlación, a
la población correspondiente, es decir, la media o la desviación típica pueden
tomarse como estimadores de los parámetros μ y σ, valores que caracterizan a la
población.
Los estadísticos, valores obtenidos en la muestra, son, pues, estimadores de los
parámetros correspondientes (valores de la población).
Para profundizar más el tema de los estimadores, en este trabajo se presentarán
los temas de distribución muestral, estimación puntual y estimación de intervalos
mismos que aparecen en el temario de esta materia ESTADISTICA INFERENCIAL
I.
UNIDAD 2. INFERENCIA ESTADISTICA: ESTIMACION

2.1 CONCEPTOS BASICOS

POBLACIÓN: Conjunto de elementos sobre los que se observa un carácter común.


Se representa con la letra N.
MUESTRA: Conjunto de unidades de una población. Cuanto más significativa sea,
mejor será la muestra. Se representa con la letra n.
UNIDAD DE MUESTREO: Está formada por uno o más elementos de la población.
El total de unidades de muestreo constituyen la población. Estas unidades son
disjuntas entre sí y cada elemento de la población pertenece a una unidad de
muestreo.
PARÁMETRO: Es un resumen numérico de alguna variable observada de la
población. Los parámetros normales que se estudian son:

 Media poblacional: 𝑋
 Total poblacional: 𝑋
 Proporción: 𝑃

ESTIMADOR: Un estimador θ* de un parámetro θ, es un estadístico que se emplea


para conocer el parámetro θ desconocido.

ESTADÍSTICO: Es una función de los valores de la muestra. Es una variable


aleatoria, cuyos valores dependen de la muestra seleccionada. Su distribución de
probabilidad, se conoce como “Distribución muestral del estadístico”.

ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra (un resumen
estadístico con las medidas que conocemos de Descriptiva) se extrapola o
generaliza dicho resultado muestral a la población total, de modo que lo estimado
es el valor generalizado a la población. Consiste en la búsqueda del valor de los
parámetros poblacionales objeto de estudio. Puede ser puntual o por intervalo de
confianza:

 Puntual: cuando buscamos un valor concreto.

 Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se


supone que va a estar el valor del parámetro que se busca con una cierta
 probabilidad.

CONTRATE DE HIPÓTESIS: Consiste en determinar si es aceptable, partiendo de


datos muéstrales, que la característica o el parámetro poblacional estudiado tome
un determinado valor o esté dentro de unos determinados valores.
NIVEL DE CONFIANZA: Indica la proporción de veces que acertaríamos al afirmar
que el parámetro θ está dentro del intervalo al seleccionar muchas muestras.

2.2 DISTIBUCIONES DE MUESTREO


La inferencia estadística es el proceso que permite hacer inferencias (predicciones,
suposiciones, …) acerca de los parámetros de la población a partir de los
estimadores obtenidos con una muestra. Utiliza como base el muestreo aleatorio
simple. La distribución muestral de un estimador es la distribución de la probabilidad
de la variable que recoge los distintos valores del estimador obtenidos al analizar
diferentes muestras.
Las distribuciones de muestreo constituyen una pieza importante de estudio por
varias razones. En la mayoría de los casos, la viabilidad de un experimento dicta el
tamaño de la muestra. La distribución de muestreo es la distribución de probabilidad
de una muestra de una población en lugar de toda la población.
Supongamos que de una determinada población tomas todas las muestras posibles
de tamaño n y calculas una estadística (por ejemplo, media) de todas las muestras.
Si luego preparas una distribución de probabilidad de esta estadística, obtendrás
una distribución de muestreo.

PROPIEDADES

Pueden variar dependiendo de cuán pequeña sea la muestra en comparación con


la población. Se supone que la población se distribuye normalmente como
generalmente sucede. Si el tamaño de la muestra es lo suficientemente grande, la
distribución de muestreo también estará cerca de lo normal.
Si éste es el caso, entonces la distribución de muestreo puede ser totalmente
determinada por dos valores:
la media y la desviación estándar. Estos dos parámetros son importantes para
calcular la distribución de muestreo si se nos da la distribución normal de toda la
población.
Una población con cualquier distribución de frecuencias, que tiene una µ y σ

concretas, tiene una distribución muestral de la 𝑋 (las medias de infinitas muestras
obtenidas de dicha población):

 Con una media igual al a la media de la población

 Una desviación estándar, denominada error típico o estándar, igual a σ,


desviación
estándar de la población, dividida entre la raíz cuadrada del tamaño de

la muestra, n:
2.3 ESTIMACION PUNTUAL
Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido
de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de
un determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos. Lo más importante de un
estimador, es que sea un estimador eficiente. Es decir, que sea insesgado (ausencia
de sesgos) y estable en el muestreo o eficiente (varianza mínima)
Con la estimación puntual se estima el valor del parámetro poblacional desconocido,
a partir de una muestra. Para cada muestra se tendrá un valor que estima el
parámetro. Esta estimación no es muy útil si desconocemos el grado de
aproximación de la estimación al parámetro.
Un estimador de un parámetro poblacional es una función de los datos muéstrales.
En pocas palabras, es una fórmula que depende de los valores obtenidos de una
muestra, para realizar estimaciones. Lo que se pretende obtener es el valor exacto
de un parámetro. Por ejemplo, si se pretende estimar la talla media de un
determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos de la muestra.
La media de la muestra puede ser un estimador de la media de la población, la cuasi
varianza muestral es un buen estimador de la varianza poblacional y el total
muestrales un buen estimador del total poblacional.
Las propiedades o criterios para seleccionar un buen estimador son los
siguientes:
A) Insesgadez: Diremos que un estimador θ* de un parámetro θ es insesgado si su
esperanza coincide con el verdadero valor del parámetro.

En el caso de que no coincidan, diremos que el estimador es sesgado.


B) Eficiencia: Dados dos estimadores θ1* y θ2* para un mismo parámetro θ, se dice
que θ1* es más eficiente que θ2* si:

C) Suficiencia: Se dice que un estimador de un parámetro es suficiente cuando para


su cálculo utiliza toda la información de la muestra.
D) Consistencia: Decimos que un estimador θ* de un parámetro θ es consistente si
la distribución del estimador tiende a concentrarse en un cierto punto cuando el
tamaño de la muestra tiende a infinito.
La probabilidad de que la media muestral sea igual a la media poblacional es cero,
es decir, que será bastante complicado obtener un estimador puntual,
por ello se utiliza más el Intervalo de Confianza y el Contraste de Hipótesis.

Una estimación puntual del valor de un parámetro poblacional desconocido (como


puede ser la media μ, o la desviación estándar σ), es un número que se utiliza
para aproximar el verdadero valor de dicho parámetro poblacional. A fin de realizar
tal estimación, tomaremos una muestra de la población y calcularemos el
parámetro muestral asociado (x para la media, s para la desviación estándar, etc.).
El valor de este parámetro muestral será la estimación puntual del parámetro
poblacional.
Por ejemplo:
Supongamos que la compañía Sonytron desea estimar la edad media de los
compradores de equipos de alta fidelidad. Seleccionan una muestra de 100
compradores y calculan la media de esta muestra, este valor será un estimador
puntual de la media de la población.

2.4 ESTIMACION DE INTERVALO


La estimación por intervalos consiste en establecer el intervalo de valores donde es
más probable se encuentre el parámetro. La obtención del intervalo se basa en las
siguientes consideraciones:
a) Si conocemos la distribución muestral del estimador podemos obtener las
probabilidades de ocurrencia de los estadísticos muestrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.
c) El problema es que el parámetro poblacional es desconocido, y por ello el
intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran
número de veces y definimos un intervalo alrededor de cada valor del estadístico
muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido
de ocasiones. Este intervalo es denominado "intervalo de confianza".
Es deseable conocer un método que nos permita saber dónde se encuentra el
parámetro con un cierto grado de certeza. Este método va a ser la determinación
de un intervalo donde estará el parámetro con un nivel de confianza. Estimación de
intervalo expresa la amplitud dentro de la cual probablemente se encuentra un
parámetro poblacional.
En la estimación por intervalos se obtienen dos puntos (un extremo inferior y un
extremo superior) que definen un intervalo sobre la recta real, el cual contendrá con
cierta seguridad el valor del parámetro θ.
El intervalo se construye a partir de una muestra, entonces, para cada muestra se
tendrá un intervalo distinto. Llamaremos 1 ”?” al error que se permite al dar el
intervalo y el nivel de confianza será 1-a. Un intervalo tiene un nivel de confianza 1-
a cuando el 100·(1-a) % de los intervalos que se construyen para el parámetro lo
contienen. Es deseable para un intervalo de confianza que tenga la menor amplitud
posible, esta amplitud dependerá de:
 El tamaño de la muestra, mientras mayor sea el tamaño mejor será la
estimación, aunque se incurre en un aumento de costes
 Nivel de confianza, si se pide mayor nivel de confianza, el intervalo será
mayor
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la
distribución Normal, y resulta:

La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias


muestrales es
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución
muestral son los valores cuya función de distribución es igual a 0.975 y 0.025
respectivamente y se pueden obtener en las tablas de la distribución Normal
estandarizada o de funciones en aplicaciones informáticas como Excel).
Seguidamente generamos una muestra de la población y obtenemos su Media, que
es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el
parámetro poblacional (5.1) está incluido dentro de sus límites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por


esa razón, la distancia desde m a la Media muestral es la misma que va de la Media
muestral a m. En consecuencia, si hacemos un muestreo con un número grande de
muestras observamos que el 95% de las veces (aproximadamente) el valor de la
Media de la población (m) se encuentra dentro del intervalo definido alrededor
de cada uno de los valores de la Media muestral. El porcentaje de veces que el valor
de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es
denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que él % de veces que m se
halle dentro del intervalo sea igual al 99%, la expresión anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución


muestral en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel), y son los valores cuya función de
probabilidad es igual a 0.995 y 0.005 respectivamente).
CIBERGRAFÍA

 Inferencia Estadística Unidad II, extraído de:

https://es.scribd.com/document/130447032/Inferencia-Estadistica-Unidad-II

 Estimación estadística, extraído de:

https://es.scribd.com/document/59824674/estimacion-puntual

 Unidad 2 inferencia estadística: estimación, extraído de:

https://es.scribd.com/presentation/339442927/2-1-2-2-2-3-2-4

 Estimación por intervalos, extraído de:

https://www.uv.es/Webgid/Inferencial/5_estimacin_por_intervalos.html

 PyEC013.pdf, extraído de:

http://www.dm.uba.ar/materias/probabilidades_estadistica_C/2005/1/PyEC0

También podría gustarte