Módulo 4 - Estadística aplicada - Universidad John F. Kennedy
Módulo 4 - Estadística aplicada - Universidad John F. Kennedy
Módulo 4 - Estadística aplicada - Universidad John F. Kennedy
inferencia estadística
IN TR ODUCCIÓN AL MÓDULO
Introducción
Introducción a la unidad
Cierre de unidad
Introducción a la unidad
8.1 Muestreo
Cierre de la unidad
Introducción
Inferencia estadística
¿Qué recorrido debemos hacer y para qué sirve a inferencia en los distintos campos?
En este módulo veremos las distintas formas de trabajar con probabilidad en funciones aplicadas
a cada caso con sus propias características. Y luego aplicar estas distribuciones para realizar
estimaciones sobre la población original en base a muestras y evaluar posibles resultados para
revisar su veracidad.
Nota. Elaboración propia (2018).
Distribuciones discretas
Explica el concepto de distribución de probabilidad y pasa por todas las distribuciones discretas
con ejemplos de cada una.
Distribuciones de probabilidad.wmv
de: https://www.youtube.com/watch?v=unUpFZiI6DM&list=RDunUpFZiI6DM&
2 13
Introducción a la unidad
Objetivos
Contenido de la unidad
Distribuciones discretas de probabilidades. Distribución Binominal.
1
Distribución de Bernoullí
En esta unidad necesitamos los conceptos anteriores de probabilidad, pero vamos a tratar de
encasillar cada caso en determinadas características que responderán a una distribución
específica.
Una vez que se reconozca estas características propias, se podrán sacar los valores propios de
probabilidad con la función de la distribución, igual que el promedio y la dispersión de esa
muestra.
Este cálculo se hará más rápido en probabilidad, ya que las funciones están estandarizadas.
3 13
Distribución Binomial
Dado un experimento aleatorio que puede presentar dos resultados posibles: A y A, mutuamente
excluyentes y exhaustivos.
Se define la v.a. X como el número de veces que aparece el suceso A en las n repeticiones
independientes del experimento aleatorio.
X es una v.a. discreta que toma valores entre 0 (puede no aparecer nunca el suceso) y n (puede
aparecer siempre). Es decir: 0 X n.
Bajo estas condiciones se tiene una distribución de probabilidad denominada Binomial para la
Donde:
X = número de mujeres
n = 4 hijos
p = P (mujer) = 0.5
Características
Variancia: V(x)=n p q
2
3 Desvío standard
4 Representación gráfica
El gráfico de la distribución Binomial puede ser simétrico o asimétrico, dependiendo de la relación
entre p y q.
4 13
Distribución Hipergeométrica
Dada una población de N elementos, en la cual hay Np elementos que presentan el suceso A y Nq
elementos que no lo presentan. Es decir: Np + Nq = N ( p + q ) = N (Población dicotómica)
Se define la variable aleatoria X como el número de veces que aparece el suceso A en las n
extracciones sin reposición.
Luego X es una variable aleatoria discreta que puede variar entre 0 y n ó Np (dependiendo del valor
que se alcance primero).
Ejemplo:
Una caja contiene 10 artículos, de los cuales 2 son defectuosos. Hallar la probabilidad de obtener un artículo
defectuoso si se extraen simultáneamente tres.
X = número de artículos defectuosos.
N = 10 artículos.
Np = 2 art. Defectuosos.
Nq = 8 art. Buenos.
Características
Esperanza matemática
2
E(x)= np
3 Variancia
Desvío Standard
4
Aproximación a la Binomial
6
Ejemplo:
De un lote de 52 piezas, de las cuales hay 4 defectuosas, se extraen dos. Hallar la probabilidad de
obtener una defectuosa.
Distribución de Poisson
Bajo estas condiciones, la distribución de Poisson está dada por la siguiente expresión:
Ejemplo:
Determinar la probabilidad de que entre las 14:00 hs. y las 14:02 hs. se presenten 5 personas.
Representación gráfica
La probabilidad elemental P(A), que indica la probabilidad de aparición del suceso A en la unidad
del espacio continuo, generalmente tiende a cero, por lo que el suceso A se lo denomina suceso
raro y a la distribución de Poisson, de las pequeñas probabilidades. Esto hace que el gráfico sea -
generalmente - asimétrico por derecha.
Ejemplo:
Variancia V(x) = σ 2
2
Desvío Standard: σ
3
4 Representación gráfica.
Gráficamente:
Gráficamente:
Aunque los gráficos de f (x) y f (z) son coincidentes sólo cuando µ= 0 y σ= 1, las áreas son
proporcionales, por lo que el cálculo de probabilidades será:
Función de acumulación
Gráficamente:
Aproximaciones
1 Aproximación de la Binomial
Aproximación de Poisson
2
Sea
Si se verifica que el número medio de veces que aparece el suceso es muy grande,
Donde:
Donde:
Características
Representación gráfica
1
2 Esperanza matemática E ( x ) = n
3 Variancia V ( x ) = 4 . n / 2 = 2 n
Luego una variable chi cuadrado se la puede definir como la suma de los cuadrados
de n variables aleatorias normales estandarizadas independientes, donde los
grados de libertad (n) están dados por el número de variables que intervienen en su
formación.
6 Ley de aditividad
Distribución t de Student
Sean las siguientes variables aleatorias independientes:
Características
Representación gráfica
1
Esperanza matemática E ( t ) = 0
2
4 Aproximación a la Normal
F~Fm,n
Características
1 Representación gráfica
Esperanza matemática E ( F ) = n / ( n - 2 )
2
3 Variancia
4 Aproximación a la Normal
6 13
Desigualdad de Tchebycheff
Interpretación gráfica
Tomando el complemento:
Ejemplo:
Dada la v.a. X definida como el número obtenido al arrojar un dado, hallar la probabilidad acotada
de que la variable no difiera de su media en a lo sumo dos puntos. Comparar este resultado con la
probabilidad exacta.
Luego
Partiendo de:
Luego, para encontrar el valor de k, se debe encontrar el valor de σ. Para ello, se aplica la
definición:
Luego:
Por lo tanto:
Variable proporción
Es decir: h = x / n donde x ~ Bi ( n , p )
Teorema de Bernoullí
Ejemplo:
Determinar cuántas observaciones deben realizarse para que la proporción de compra de un
artículo se encuentre entre el 9 y el 21% con una probabilidad superior al 75%.
n = número de observaciones.
Fórmulas
7 13
Cierre de unidad
Por medio del siguiente vídeo se explica de manera breve qué es la probabilidad y la distribución
discreta de probabilidad.
Viscarranet Ricardo Viscarra. (2017, 28 de abril). Distribución discreta de probabilidad [Video]. Recuperado
de: https://www.youtube.com/watch?v=ao6ceIWy3Eg
8 13
Introducción a la unidad
Objetivos
Contenido de la unidad
Muestreo
1
2 Estimación de parámetros
3 Test de hipótesis
En esta unidad intentaremos estudiar muestras para sacar conclusiones sobre los valores de las
poblaciones de las que provienen (estimaciones) y saber con cierto nivel de probabilidad si esos
valores están dentro de ciertos parámetros.
Todas estas acciones se llevarán a cabo bajo ciertas reglas y fórmulas de inferencia.
9 13
8.1 Muestreo
Introducción
Si se desea estudiar las características de los elementos de una población, dicho estudio se
puede realizar a través de una muestra, observando algunos elementos de la población.
Se desea realizar una investigación de mercado para determinar cuál es el consumo promedio de
un determinado artículo de las familias de esta ciudad.
Ventajas
6 Por último, el muestreo puede ser más eficiente que el censo, ya que el
error total, de muestreo y de no muestreo, puede llegar a ser menor en la
muestra y los resultados obtenidos pueden utilizarse con un cierto grado
de confianza.
Desventajas
Modelos de muestreo
Los modelos de muestreo pueden agruparse en muestreo al azar y no al azar. El primero, también
llamado muestreo probabilístico, es el proceso de seleccionar la muestra teniendo en cuenta la
aleatoriedad.
El muestreo probabilístico establece una probabilidad conocida de incluir en la muestra todos los
elementos de la población. Al seleccionar la muestra por métodos probabilísticos, estos aseguran
la representatividad de la muestra y permiten estimar los valores de los parámetros con un cierto
grado
de confianza.
depende del juicio personal del experto, por lo que es esencial el conocimiento de la población por
parte del muestreo. Cuanto más homogénea sea la población, más representativa será la
muestra.
Este tipo de muestreo no probabilístico exige personal menos entrenado y tiene menor costo que
el muestreo al azar, pero presenta una gran desventaja en la generalización debido a que el error
cometido en la estimación del parámetro no se puede evaluar cuantitativamente.
Si el muestreo se hace con reposición o con reemplazo, todos los elementos de la población
tienen la misma probabilidad (1/N) de ser seleccionados y se regresan a la misma luego de ser
examinados. Si el muestreo es sin reposición o sin reemplazo, todos los elementos tienen la
misma probabilidad de selección en cada extracción, pero ésta dependerá de los elementos que
fueron extraídos anteriormente, puesto que no son regresados a la población luego de ser
analizados.
2) Muestreo estratificado
En este tipo de muestreo se divide a la población en grupos denominados estratos, tomando una
muestra en cada estrato por métodos simples al azar.
Una muestra estratificada desproporcionada asigna mayor representatividad a un estrato con una
gran dispersión y menor representatividad a un estrato con pequeña variación. También puede
tomar un número igual de unidades en cada estrato, o dar menor representatividad a los estratos
más costosos, etc.
2 Entre los distintos estratos las dispersiones sean lo más grande posible,
Entre las desventajas, una es que puede no proveer un número suficiente de casos para estratos
pequeños. Por otro lado, presenta una desventaja económica importante: requiere altos costos y
tiempo de selección de la muestra.
Muestreo bietápico
De la población clasificada en áreas o conglomerados, se seleccionan una muestra de las áreas (1 etapa) y
dentro de cada una de las áreas seleccionadas, se toma una muestra de unidades elementales (2da
etapa).
Por ejemplo: de todos los depósitos de una ciudad, se seleccionan algunos de ellos y entre los depósitos
elegidos, se eligen m cajas conteniendo s artículos a analizar, para estudiar el porcentaje de artículos
defectuosos en la muestra de n = m.s artículos.
Muestreo polietápico
En el primer caso considerado anteriormente (3.a) el muestreo se denomina en una sola etapa; en el
segundo caso (3.b), muestreo en dos etapas o submuestreo; si el muestreo comprende más de dos
etapas, se denomina muestreo polietápico o en múltiples etapas.
Por ejemplo: estudios sociales o económicos realizados a nivel geográfico.
Un muestreo por áreas eficiente presenta:
1) diferencias entre las unidades elementales del mismo grupo lo más grande posible y
2) diferencias entre los grupos lo más pequeñas posibles.
Este tipo de muestreo presenta bajos costos y tiempos de realización de la muestra, sobre todo porque
concentra las encuestas en áreas próximas. Algunas desventajas técnicas son que exige tratamientos
estadísticos complejos y se produce una pérdida de precisión y del carácter aleatorio del muestreo.
Muestreo sistemático
Para obtener una muestra sistemática de n elementos, se enumeran los N elementos de la población de 1
a N y se determina el intervalo de muestreo (k) haciendo el cociente N / n . Luego se escoge al azar un
número (i) del primer intervalo de muestreo tal que 0 < i < k Los elementos de la muestra serán: i , i + k , i + 2
k , . . . , i + ( n - 1 ) .k
Por ejemplo:
Suponiendo una población de N = 890 elementos, de la cual se desea extraer una muestra sistemática de n
= 50 elementos.
Calculando k = N / n = 890 / 50 = 17,8 y suponiendo que se eligió al azar i = 12 los 50 elementos de la
muestra son los siguientes elementos enumerados de la población: 012, 030, 048, 065, 083, 101, . . . , 884.
El muestreo sistemático tiene la ventaja de la sencillez en el diseño, siendo fácil de escoger cada unidad de
una lista o archivo de la población.
Al realizar este tipo de muestreo, se corre el riesgo de que si hay algún tipo de vicio en las unidades de la
población, puede influir en la muestra si es coincidente con el módulo k.
Por ejemplo: en un proceso productivo se extraen n unidades cada hora de producción, determinándose el
número de artículos defectuosos. Si la máquina que los produce presenta un mal funcionamiento
periódico, dicha cantidad de defectuosos podría estar sesgada.
La muestra sistemática no es una muestra simple al azar ya que las unidades de muestreo escogidas no
son independientes, sino que es una muestra por agrupación en una sola etapa porque cada elemento de la
población pertenece a un solo grupo.
Para el ejemplo anterior, los elementos de cada uno de los 17 grupos son:
1° grupo: 001, 019, 037, 054, . . . , 873
2° grupo: 002, 020, 038, 055, . . . , 874
.......
17° grupo: 017, 035, 053, 070, . . . , 889.
Para este tipo de muestreo, como un solo grupo es elegido al azar, no se pueden calcular los errores
estadísticos ya que hay una sola selección.
El número de unidades de la muestra (n) varía de uno a todos los elementos de la población (N). El
tamaño de la muestra depende de la variabilidad de la población y del grado de precisión
requerido.
La elección de una muestra al azar asegura la aleatoriedad
del procedimiento de muestreo, el cual
consiste en hacer una lista completa de todos los
elementos de la población, para luego escoger los
elementos de la muestra por medio de una tabla de dígitos
al azar.
Ejemplo:
Suponiendo una población de N = 890 elementos, de la cual se desea extraer una muestra simple
al azar de n = 50 elementos. Los elementos de la población están identificados con los números
del 001 al 890.
Distribución en el muestreo
Por ejemplo, supongamos la variable (X) número de hijos por familia, donde los N valores de la
población son: 1 2 3 4 (N = 4).
Dada una población con media y variancia 2, ambas finitas, entonces la distribución en el
muestreo de la media aritmética tiende a la distribución Normal, con la misma media poblacional
Es decir:
Distribución en el muestreo
Dada una variable aleatoria x que presenta una distribución Normal en la población, con media y
variancia σ 2.
1)
Sea la media aritmética el estimador de la media poblacional, donde:
2)
Sea la variancia muestral S2 el estimador de la variancia poblacional σ2, donde:
3)
Dada una variable aleatoria x que presenta una distribución Normal en la población, con media y
variancia 2 desconocida.
La diferencia entre las medias muestral y poblacional, dividida por el cociente entre el desvío
standard muestral y la raíz cuadrada del tamaño de la muestra define una variable t que presenta
4)
Si la población es finita, las observaciones no son independientes, por lo tanto, la variancia de la
media muestral presentará la siguiente expresión:
En la práctica, si la fracción de muestreo n / N 0.05, se considera que la
población es infinita, por lo que el factor de corrección para poblaciones
finitas se puede despreciar.
5)
Sea una muestra de tamaño n extraída de una población finita dicotómica, entonces la variable
aleatoria x que indica el número de éxitos, presenta una distribución Binomial si las extracciones
son con reposición o una distribución Hipergeométrica si las extracciones son sin reposición.
Considerando una distribución Binomial, la variable aleatoria x presenta las siguientes
características:
E( x ) = n P y V ( x ) = nPQ
donde x indica el número de éxitos y P Q son las proporciones poblacionales de éxito y fracaso
respectivamente. Sea la proporción muestral p el estimador de la proporción poblacional P, dado
por la siguiente expresión:
Ejemplo
Se tienen los siguientes valores en la población:
2 4 6 8 10
Calcular la esperanza y variancia de la media muestral si se extrae una muestra de 2 elementos:
1. con reposición
2. sin reposición
a) Si se realizan dos extracciones con reposición, se tiene las siguientes muestras posibles:
La esperanza matemática de la media muestral es la media poblacional. Es decir: E ( x )µ
Insesgamiento
Un estimador es insesgado o no viciado cuando la esperanza del estimador es igual al parámetro. Por
ejemplo:
Consistencia
Un estimador es consistente cuando la probabilidad de que el estimador tienda al parámetro tiende a uno, a
medida que aumenta el tamaño de la muestra. Por ejemplo: La media muestral es un estimador
consistente de la media poblacional, ya que:
Eficiencia
De dos estimadores de un mismo parámetro, será más eficiente el que tiene menor variancia. Por ejemplo:
La media muestral x es un estimador eficiente de la media poblacional ya que tiene variancia mínima por
propiedad de la x.
Suficiencia
Un estimador es suficiente si contiene toda la información posible proporcionada por la muestra, relativa al
valor verdadero del parámetro. Es decir que el estimador transmite tanta información de la muestra cómo
es posible acerca del parámetro, de modo que no será proporcionada más información por cualquier otro
estimador calculada de la misma muestra. Luego, los valores de la muestra no proporcionan más
información sobre el parámetro. Esta propiedad significa que la distribución de las variables de la muestra
debe ser independiente del parámetro. Matemáticamente se comprueba cuando la función de densidad
conjunta de la muestra puede factorearse en dos funciones: una que dependa solamente del estimador y
otra que dependa solamente del parámetro. Por ejemplo: la media muestral x es un estimador suficiente
de la media poblacional.
Error de muestreo
Se desea lograr un buen estimador, es decir, que el valor del estimador se encuentre, con una alta
probabilidad de suceder, muy cerca del valor verdadero del parámetro. Esto requiere que la
distribución en el muestreo del estimador se concentre lo más posible alrededor del valor del
parámetro, lo cual significa que la dispersión del estimador sea lo más pequeña posible. Los
estimadores están sujetos a un cierto error de muestreo, el cual está dado por el desvío standard
de la distribución en el muestreo.
Introducción
La teoría de la Inferencia estadística trata de métodos por los cuales se extrae una muestra de
una población y en base a ella se puede:
Estimación puntual
Sea x una variable aleatoria cuya distribución f (x, O) en la población tiene parámetro O.
Se extrae una muestra de tamaño n de dicha población, obteniéndose x1, x 2 , . . , x n valores. Sea
el estadístico
O ˆ = f (x1, x 2,. . ., x n) el estimador de O
Ejemplo:
De una población de 40 artículos, se extrae una muestra de 6. Los pesos obtenidos (en Kg) son:
10 13 16 12 9 10
Estimar puntualmente el peso promedio de los artículos suponiendo una distribución Normal para
la variable peso.
X = peso x ~ N ( u, o 2 ) donde,
Para realizar una estimación por intervalos, se establece un intervalo de posibles valores del
estimador, con una cierta probabilidad de que dicho intervalo contenga el verdadero valor del
parámetro. Una estimación por intervalos es la estimación de un parámetro por un intervalo al
azar, llamado intervalo de confianza, tal que la probabilidad de que L1 <= O <= L 2 es igual a 1 - a.
En símbolos:
Los dos límites del intervalo de confianza se calculan teniendo en cuenta el valor del estimador
(estimación puntual), el error de muestreo (desvío estándar del estimador) y la probabilidad de
Donde:
1) La Cámara de Comercios de Mar del Plata desea estimar el gasto promedio por turista y por
visita a dicha ciudad. Se escogió para ello una muestra simple al azar de 100 turistas que dio un
gasto promedio de $ 200 con una dispersión de $ 80. Se desea construir un intervalo de confianza
del 90% para el gasto promedio.
Sx = $ 80 Variancia muestral
Intervalo de confianza:
El gasto promedio por turista y por visita se encuentra entre $ 187 y $
213 con una confianza del 90%.
2) De una población de 40 artículos, se extrae una muestra de 6.Los pesos obtenidos (en Kg)
son:
10 13 16 12 9 10
Estimar por intervalo de confianza el peso promedio de los artículos suponiendo una distribución
Normal para la variable peso y un nivel de confianza del 95%.
El peso promedio de los 40 artículos se encuentra comprendido entre
9,15 y 14,19 Kg con una confianza del 95%.
3) De una población de 400 personas se extrae una muestra simple al azar de 60 personas,
obteniéndose 40 personas fumadoras. Estimar por intervalo de confianza del 95% la proporción de
fumadores.
El porcentaje de fumadores se encuentra comprendido entre el 56 y 78
% con una confianza del 95%.
4) Una fábrica que produce piezas electrónicas de precisión está interesada en la variación del
peso de las mismas. Para ello extrae una muestra de 10 piezas y calcula la variabilidad del peso,
obteniendo que es de 0,0026 gr2 . Con un error del 5%, estimar por intervalos el valor de la
dispersión poblacional del peso de las piezas fabricadas, suponiendo una distribución normal
para el peso.
La dispersión del peso de las piezas electrónicas se encuentra
comprendida entre 0,035 y 0,093 gr. con una confianza del 95%.
5) De una población de 2.000 artículos, se extrajo una muestra de 58, obteniéndose los pesos ( en
Kg) de los mismos, que aparecen en la siguiente tabla:
Estimar puntualmente y por intervalo de confianza del 99% el peso promedio y total de los 2.000
artículos
Introducción
El test de hipótesis es un caso especial relacionado principalmente con la elección de uno de dos
cursos de acción posibles. Como toda distribución de población es inalcanzable, se elige entre
dichos cursos con base a la información de la muestra.
Por ejemplo: Las dimensiones críticas de una pieza de máquina
que ha de ser acoplada a otras piezas para montar una máquina
completa son especificadas como Normal con una media de 2,5
mm. Si la pieza es demasiada corta o larga, no encaja. El gerente
de planta decide continuar con el proceso de montaje a menos que
se encuentre una evidencia sustancial de que la dimensión media
no es de 2,5 mm. ¿Cómo debe decidirse si el proceso continúa en
operación?.
Hipótesis estadísticas
Esta hipótesis es simple, porque asigna valores particulares a los parámetros desconocidos e
identifica la forma de la distribución. De otra forma es compuesta. Una hipótesis nula debe
considerarse como verdadera a menos que exista suficiente evidencia en contra. La hipótesis
nula se prueba contra la alternativa (H1), la cual refleja el valor posible o intervalo de valores del
parámetro de interés si la hipótesis nula es falsa.
Errores
Estadístico de prueba
Ejemplo:
Una estación de TV considera que la proporción de televidentes de una serie que se proyecta a la
tarde no es superior al 2%. Para verificar tal afirmación se extrae una muestra aleatoria
encontrando una proporción del 0.05. Verificar la hipótesis con un nivel de confianza del 90%.
Por lo tanto, la proporción de televidentes de una serie que se proyecta
a la tarde es superior al 2%, a un nivel de significación del 10%.
En una región de la provincia de Santa Fe, la cosecha promedio de maíz fue de 5.4 toneladas por
ha. Para un año dado en el que el clima fue particularmente bueno, se seleccionaron 9 parcelas
en forma aleatoria, arrojando una cosecha promedio de 5.2 toneladas por ha., para la misma
variedad de maíz. Si la producción por ha. se distribuye normal con una desviación estándar de
0.43 toneladas. A un nivel de significación del 0.05, ¿existe alguna razón para creer que este año la
producción será no inferior que la producción promedio normal?
Luego, la producción será inferior que la producción promedio normal, a
un nivel de significación del 5%.
Un fabricante espera que el contenido medio de su producto sea de 260 gr. Supone que la
variabilidad del contenido es de 100 gr2 . Para comprobarlo, toma una muestra de 36 envases,
obteniéndose un peso medio de 267 gr. Realizar la prueba de hipótesis con un nivel de
significación del 5 %.
Luego, el contenido medio del producto no es de 260 gr, con una
confianza del 95%.
Fórmulas
12 13
Cierre de la unidad
Por medio del siguiente video se busca desarrollar el concepto de Estadística Inferencial
Luis Rincón. (2017, 26 de noviembre). 0398 ¿Qué es la estadística inferencial? [Video]. Recuperado
de: https://www.youtube.com/watch?v=N_Bnk9Wq7E4
13 13