Módulo 4 - Estadística aplicada - Universidad John F. Kennedy

Módulo 4: Distribuciones de probabilidad e
inferencia estadística
IN TR ODUCCIÓN AL MÓDULO
Introducción
UN IDAD 7: DISTR IB UCION ES DE PR OB AB ILIDAD
Introducción a la unidad
7.1 Distribuciones discretas de probabilidades. Distribución Binominal. Distribución de Bernoullí
7.2 Distribución Hipergeométricas. Distribución de Poisson. Características y aproximaciones
7.3 Distribuciones continuas de probabilidad
7.4 Teorema de Tchebycheff. Teorema de Bernoulli
Cierre de unidad
UN IDAD 8: IN FER EN CIA ESTADISTICA
8.1 Muestreo
8.2 Estimación de parámetros
8.3 Test de hipótesis
Cierre de la unidad
CIER R E DEL MÓDULO
Descarga del contenido

1 13
Introducción
Inferencia estadística
¿Qué recorrido debemos hacer y para qué sirve a inferencia en los distintos campos?
En este módulo veremos las distintas formas de trabajar con probabilidad en funciones aplicadas
a cada caso con sus propias características. Y luego aplicar estas distribuciones para realizar
estimaciones sobre la población original en base a muestras y evaluar posibles resultados para
revisar su veracidad.
Nota. Elaboración propia (2018).
Objetivos del módulo
Conocer las distintas aplicaciones de la probabilidad y poder inferir

conclusiones sobre la población original.
Contenidos del módulo
Unidad 7: Distribuciones de probabilidades

7.1 Distribuciones discretas de probabilidades. Distribución Binominal. Distribución de Bernoullí
7.2 Distribución Hipergeométricas. Distribución de Poisson. Características y aproximaciones
Unidad 8: Inferencia estadística

8.1 Muestreo
Función de distribución continua
Explica el concepto de función de probabilidad, con valores continuos, con ejemplos.

Variable Aleatoria Discreta | Función de probabilidad y de distribuc…
distribuc…
FísicayMates. (2014, 10 de abril). Variable Aleatoria Discreta | Función de probabilidad y de distribución
[Video]. Recuperado de: https://www.youtube.com/watch?v=naEqsDvkIXs
Distribuciones discretas
Explica el concepto de distribución de probabilidad y pasa por todas las distribuciones discretas
con ejemplos de cada una.
Distribuciones de probabilidad.wmv
Mmteresass. (2012, 9 de febrero). Distribuiciones de probabilidad.wmv [Video]. Recuperado
de: https://www.youtube.com/watch?v=unUpFZiI6DM&list=RDunUpFZiI6DM&
2 13
¿Se podrán diferenciar los distintos tipos de distribuciones

para poder aplicarlas en los distintos casos?
Objetivos
Que el alumno reconozca las distintas distribuciones y las aplique en

problemas de casos.
Contenido de la unidad
Distribuciones discretas de probabilidades. Distribución Binominal.
1
Distribución de Bernoullí
2 Distribución Hipergeométricas. Distribución de Poisson. Características y

aproximaciones
Distribuciones continúas de probabilidad

3
4 Teorema de Tchebycheff. Teorema de Bernoulli
En esta unidad necesitamos los conceptos anteriores de probabilidad, pero vamos a tratar de
encasillar cada caso en determinadas características que responderán a una distribución
específica.
Una vez que se reconozca estas características propias, se podrán sacar los valores propios de
probabilidad con la función de la distribución, igual que el promedio y la dispersión de esa
muestra.
Este cálculo se hará más rápido en probabilidad, ya que las funciones están estandarizadas.
3 13
7.1 Distribuciones discretas de probabilidades.

Distribución Binominal. Distribución de Bernoullí
Distribución Binomial
Dado un experimento aleatorio que puede presentar dos resultados posibles: A y A, mutuamente
excluyentes y exhaustivos.
Se realizan n repeticiones (observaciones o pruebas) independientes del experimento.
En cada prueba, la probabilidad de que se presente el

suceso A se mantiene constante. Dicha probabilidad se
denomina probabilidad elemental, probabilidad a priori o
probabilidad de éxito y se simboliza con p.
Se define la v.a. X como el número de veces que aparece el suceso A en las n repeticiones
independientes del experimento aleatorio.
X es una v.a. discreta que toma valores entre 0 (puede no aparecer nunca el suceso) y n (puede
aparecer siempre). Es decir: 0 X n.
Bajo estas condiciones se tiene una distribución de probabilidad denominada Binomial para la
variable aleatoria, cuya expresión matemática, p(x ), está dada por:
Donde:
X es la variable aleatoria que varía entre 0 y n.
n y p son los parámetros de la distribución Binomial.
C... número combinatorio.
La expresión matemática anterior se la puede simbolizar X ~ Bi (x / n, p)
Si se quiere calcular la probabilidad de que la variable X tome el valor xo
La probabilidad de que la variable X se encuentre entre x 1 y x2 es:

Ejemplo: Dada una familia de 4 hijos, cuál es la probabilidad de que:
1. Todos los hijos sean mujeres.
2. Por lo menos dos sean mujeres.
X = número de mujeres
n = 4 hijos
p = P (mujer) = 0.5
q = P (varón) = 1 – 0.5 = 0.5
Características
Esperanza matemática: E(x)=nP

1
Variancia: V(x)=n p q
2
3 Desvío standard
4 Representación gráfica
El gráfico de la distribución Binomial puede ser simétrico o asimétrico, dependiendo de la relación
entre p y q.
4 13
7.2 Distribución Hipergeométricas. Distribución de

Poisson. Características y aproximaciones
Distribución Hipergeométrica
Dada una población de N elementos, en la cual hay Np elementos que presentan el suceso A y Nq
elementos que no lo presentan. Es decir: Np + Nq = N ( p + q ) = N (Población dicotómica)
Se extraen n elementos sin reposición de dicha población.
Se define la variable aleatoria X como el número de veces que aparece el suceso A en las n
extracciones sin reposición.
Luego X es una variable aleatoria discreta que puede variar entre 0 y n ó Np (dependiendo del valor
que se alcance primero).
La ley de probabilidad P(x), que bajo estas condiciones se

denomina distribución Hipergeométrica está dada por:
Donde:
X es la variable aleatoria que varía entre 0 y n ó Np
N, n y p son los parámetros de la distribución Hipergeométrica
La expresión matemática anterior se la puede simbolizar X ~ Hi (x/ N, n, p)
Si se quiere calcular la probabilidad de que la variable X tome el valor xo
La probabilidad de que la variable X se encuentre entre x 1 y x2 es:
Ejemplo:
Una caja contiene 10 artículos, de los cuales 2 son defectuosos. Hallar la probabilidad de obtener un artículo
defectuoso si se extraen simultáneamente tres.
X = número de artículos defectuosos.
n = 3 extracciones sin reposición.
N = 10 artículos.
Np = 2 art. Defectuosos.
Nq = 8 art. Buenos.
Características
Relación con la Binomial

1
Si se extraen n elementos con reposición de la población dicotómica de N

elementos, las observaciones son independientes, por lo que la variable
aleatoria X que indica el número de veces que aparece un suceso A en las
n extracciones con reposición presenta una distribución Binomial, en la
cual:
Esperanza matemática
2
E(x)= np
3 Variancia
Desvío Standard
4
5 Factor de corrección para poblaciones finitas
Aproximación a la Binomial
6
Dada una variable aleatoria que presenta una distribución

Hipergeométrica, en la cual:
1. El número de elementos de la población es muy

grande.
2. El número de extracciones es pequeño, de tal forma

que el cociente (llamado fracción de muestreo) tiende
a cero.
Entonces se puede aproximar mediante la distribución Binomial.
Ejemplo:
De un lote de 52 piezas, de las cuales hay 4 defectuosas, se extraen dos. Hallar la probabilidad de
obtener una defectuosa.
Aproximando por la distribución Binomial:
Distribución de Poisson
1 La distribución de Poisson se presenta en forma exacta, con la ocurrencia

de un suceso en un espacio continuo.
Sea el promedio de veces que aparece el suceso A en dicho espacio

2
continuo t. Donde λ se mantiene constante.
3 Sea X el número de veces que aparece un suceso A en un espacio

continuo t.
Entonces X es una v.a. discreta que varía entre 0 (nunca

aparece el suceso) e infinito (el suceso puede ocurrir un
número muy grande de veces) y t es un espacio continuo
(longitud, tiempo, superficie, etc.).
Bajo estas condiciones, la distribución de Poisson está dada por la siguiente expresión:
Donde: X es una v.a. discreta
Ejemplo:
A la ventanilla de pagos de un banco se presentan, en promedio, 3 personas por minuto.
Determinar la probabilidad de que entre las 14:00 hs. y las 14:02 hs. se presenten 5 personas.
Representación gráfica
La probabilidad elemental P(A), que indica la probabilidad de aparición del suceso A en la unidad
del espacio continuo, generalmente tiende a cero, por lo que el suceso A se lo denomina suceso
raro y a la distribución de Poisson, de las pequeñas probabilidades. Esto hace que el gráfico sea -
generalmente - asimétrico por derecha.
Aproximación a la distribución Binomial

Dada una variable distribuida según la Binomial, x ~ Bi (n,p), en la cual:
El número de observaciones es muy grande (n).

1
2 La probabilidad elemental del suceso es pequeña (p 0).
De tal forma que = np se mantiene constante, entonces se puede

aproximar mediante la distribución de Poisson.
Ejemplo:
La probabilidad de que se produzca un accidente de trenes es 0,001. Si en un mes circulan 500

trenes, calcular la probabilidad de que se produzcan a lo sumo 2 accidentes.
X = número de accidentes de trenes en un mes.

Aproximando mediante la distribución de Poisson:
5 13
Distribución Normal (Gauss-Laplace)
Sea X una variable aleatoria continua que puede tomar

cualquier valor real, es decir: - < x < . Entonces X presenta
una distribución Normal si presenta la siguiente función de
densidad de probabilidad:
Para expresar esta distribución se indica:

Características
1 Esperanza matemática E(x) = µ
Variancia V(x) = σ 2
2
Desvío Standard: σ
3
4 Representación gráfica.
La distribución Normal, es una función exponencial decreciente a partir de x =µ por lo que

presenta el siguiente gráfico, el cual se denomina campana de Gauss:
Un cambio en el valor de µ (manteniendo constante el valor de σ) produce una traslación de la
curva a la izquierda o a la derecha.
Un cambio en el valor de σ (manteniendo constante el valor de µ) produce una rotación de la
función, haciéndola más o menos apuntalada.

La probabilidad de que la v.a. X se encuentre entre x1 y x2 está dada por:
Gráficamente:
Distribución normal standard
Haciendo la siguiente sustitución (cambio de variable):
variable (z) denominada normal estandarizada, para la cual E (z) = 0 y V (z) = 1

La función de densidad estará dada por:
La cual se simboliza z ~ N ( 0, 1 ) y se denomina Normal Standard.
Gráficamente:
La probabilidad de que la v.a. z se encuentre entre z1 y z2 está dada por:

Gráficamente:
Aunque los gráficos de f (x) y f (z) son coincidentes sólo cuando µ= 0 y σ= 1, las áreas son
proporcionales, por lo que el cálculo de probabilidades será:
Función de acumulación
Gráficamente:
Aproximaciones
1 Aproximación de la Binomial
Sea x~Bi( x/ n,p) con E(x) = np y V(x) = npq
Si se verifican las siguientes condiciones:
El número de observaciones es muy grande.
La probabilidad elemental p tiende a q.
Entonces se puede aproximar mediante la distribución Normal, donde:

El valor de variable x se ajusta +/- 0.5 según el caso (Corrección por
continuidad).
Aproximación de Poisson
2
Sea
Si se verifica que el número medio de veces que aparece el suceso es muy grande,
Entonces se puede aproximar mediante la distribución Normal
Donde:
Distribución Chi cuadrado
Esta distribución tiene una cierta expresión matemática

(f.d.p.) la cual se puede simbolizar x ~ 2 n
Donde:
x es la v.a.cta. que varía entre 0 e infinito.

n es el parámetro que se denomina grados de libertad.
Características
1
2 Esperanza matemática E ( x ) = n
3 Variancia V ( x ) = 4 . n / 2 = 2 n
Aproximación a la distribución Normal.

4
Variable Chi cuadrado
5
Sean n variables aleatorias estandarizadas z1 , z2 , . . . z n , donde cada

una se distribuye independientemente como una N ( 0 , 1). Entonces la
variable suma de los cuadrados de dichas n variables tendrá una
distribución Chi cuadrado, es decir:
Luego una variable chi cuadrado se la puede definir como la suma de los cuadrados
de n variables aleatorias normales estandarizadas independientes, donde los
grados de libertad (n) están dados por el número de variables que intervienen en su
formación.
6 Ley de aditividad
La suma de variables aleatorias chi cuadrado es una nueva variable chi

cuadrada cuyo grados de libertad es igual a la suma de los grados de
libertad de las variables aleatorias componentes.
Distribución t de Student
Sean las siguientes variables aleatorias independientes:
Entonces la variable aleatoria t definida como:
Presenta una función de densidad de probabilidad (fdp) que

se denomina distribución t de Student y se simboliza como:
t~tn
Donde n es único parámetro denominado grados de

libertad.
Características
1
Esperanza matemática E ( t ) = 0
2
3 Variancia V ( t ) = n / ( n - 2 ) ( Para n > 2 )
4 Aproximación a la Normal
Distribución F de Fisher ( Snedecor)
Sean dos variables chi cuadrada, es decir:

Entonces la variable aleatoria F definida como:
Presenta una fdp que se denomina distribución F de Fisher

o de Snedecor y se simboliza como:
F~Fm,n
Donde m y n son los parámetros, es decir, los grados de

libertad del numerador y denominador, respectivamente.
Características
1 Representación gráfica
Esperanza matemática E ( F ) = n / ( n - 2 )
2
3 Variancia
4 Aproximación a la Normal
6 13
Desigualdad de Tchebycheff
Dada una variable aleatoria x con cualquier ley de

probabilidad, y estando definida la esperanza matemática
E(x), entonces se cumple para todo número k positivo y
arbitrario, que la probabilidad de que la variable aleatoria
difiera de su esperanza en más o en menos un número k de
veces su desvío, está acotada en la inversa del cuadrado de
dicho número k.
Interpretación gráfica
Aplicando propiedad de valor absoluto:

Gráficamente, significa que se tiene una cota superior de probabilidad para los valores de la
variable que difieren de su esperanza en más o en menos k veces el desvío standard.
Tomando el complemento:
Luego se tiene que:
La desigualdad de Tchebycheff no requiere el conocimiento

de la ley de probabilidad de la variable aleatoria. Por otro
lado, brinda una probabilidad acotada (no exacta) donde (1
- 1/k 2) es la cota inferior y ( 1/k 2) la cota superior.
Ejemplo:
Dada la v.a. X definida como el número obtenido al arrojar un dado, hallar la probabilidad acotada
de que la variable no difiera de su media en a lo sumo dos puntos. Comparar este resultado con la
probabilidad exacta.
Siendo X = número obtenido al tirar un dado
Luego
Partiendo de:
Luego, para encontrar el valor de k, se debe encontrar el valor de σ. Para ello, se aplica la
definición:
Luego:
Por lo tanto:
Para calcular la probabilidad exacta, se aplica propiedad de valor absoluto:
Variable proporción
Se define la variable h como el cociente entre una variable

binomial y el número de pruebas.
Es decir: h = x / n donde x ~ Bi ( n , p )
Esta variable se denomina proporción ( o frecuencia

relativa) e indica la fracción de veces que aparece el suceso
A en las n repeticiones del experimento.
E( h) =E( x /n) =1/n.E( x ) =1/n.np=p
V ( h) =V ( x /n) =1/n2.V ( x ) =1/n2.npq=pq/n
Teorema de Bernoullí
Aplicando la desigualdad de Tchebycheff para la variable proporción, se tiene que:

Lo cual se puede enunciar de la siguiente manera:
La probabilidad de que la proporción (frecuencia relativa) de aparición de un suceso tienda a la

probabilidad elemental del mismo tiende a uno, a medida que aumenta el número de
observaciones del experimento aleatorio.
El complemento estará dado por:
Ejemplo:
Determinar cuántas observaciones deben realizarse para que la proporción de compra de un
artículo se encuentre entre el 9 y el 21% con una probabilidad superior al 75%.
x = número de unidades compradas del artículo.
n = número de observaciones.
h = x / n = proporción de unidades compradas.
Fórmulas
7 13
Cierre de unidad
¿Se podrán diferenciar los distintos tipos de distribuciones

para poder aplicarlas en los distintos casos?
Complete the content above before moving on.

Podemos estudiar las características de los casos de probabilidad para poder direccionarlas a las
características de cada distribución y realizar más fácilmente y con más precisión los cálculos
correspondientes.
Distribución completa de probabilidad
Por medio del siguiente vídeo se explica de manera breve qué es la probabilidad y la distribución
discreta de probabilidad.
DISTRIBUCION DISCRETA DE PROBABILIDAD
Viscarranet Ricardo Viscarra. (2017, 28 de abril). Distribución discreta de probabilidad [Video]. Recuperado
de: https://www.youtube.com/watch?v=ao6ceIWy3Eg
8 13
¿Se puede a partir de valores muestrales inferir o aproximar

los valores de la población que les dio origen, con la suficiente
certeza?
Objetivos
Que el alumno reconozca los conceptos y aplicación de la inferencia

estadística.
Contenido de la unidad
Muestreo
1
2 Estimación de parámetros
3 Test de hipótesis
En esta unidad intentaremos estudiar muestras para sacar conclusiones sobre los valores de las
poblaciones de las que provienen (estimaciones) y saber con cierto nivel de probabilidad si esos
valores están dentro de ciertos parámetros.
Luego se partirá de valores poblacionales que se suponen ciertos y se tratará de conocer la

veracidad de esas afirmaciones, teniendo el menor error posible.
Todas estas acciones se llevarán a cabo bajo ciertas reglas y fórmulas de inferencia.
9 13
8.1 Muestreo
Introducción
Si se desea estudiar las características de los elementos de una población, dicho estudio se
puede realizar a través de una muestra, observando algunos elementos de la población.
A una población se la define como un conjunto finito o infinito de

1
elementos, donde N indica el número de elementos de la misma.
2 Una muestra es un subconjunto formado por algunos elementos de la

población, donde n indica el número de elementos que la conforman.
Un parámetro se define como una constante indeterminada e indica una

3
característica poblacional.
4 Muestreo es el proceso de aprender algo acerca de la población sobre la

base de una muestra extraída de ella.
Un estimador o estadístico es una característica muestral, que se obtiene

5
a partir de los elementos de la muestra.
A partir del valor del estadístico se puede inferir el valor del parámetro, es
decir, generalizar o inferir a nivel de población.
Los parámetros y estimadores más usuales son:
Ejemplo:
Se desea realizar una investigación de mercado para determinar cuál es el consumo promedio de
un determinado artículo de las familias de esta ciudad.
Variable en estudio (X): consumo del artículo
Parámetro (μ): consumo promedio de dicho artículo
Población (N): todas las familias de la ciudad
Muestra (n): las familias encuestadas
Estimador (x): consumo promedio
Ventajas
Una de las ventajas del muestreo frente al censo es la economía y rapidez,

1
ya que reduce el tiempo, el costo y el personal necesario para realizar la
muestra.
2 Entre las otras ventajas, está la obtención de resultados precisos sobre la

base a procedimientos correctos. Hoy casi todas las encuestas
estadísticas, tanto para la toma de decisiones en los negocios como el
desarrollo de teorías sociales y económicas, se realizan basándose en
muestras.
3 En algunos casos la población a investigar puede ser muy grande o

infinita, por lo que el muestreo es el único procedimiento posible. Por
ejemplo, si se desea determinar las preferencias de los consumidores por
algún artículo en particular o de los electores por algún candidato
presidencial.
En otros casos, la medición de los elementos de la población requiere la

4
destrucción de los mismos. Por ejemplo, si se desea estudiar la duración
promedio en horas de un lote de lamparitas eléctricas.
5 Otra ventaja es la calidad del estudio, ya que al tener menos elementos

que analizar en la muestra, se reducen los errores de codificación,
tabulación y manipuleo de los datos, por lo que se mejora la precisión de
los resultados obtenidos.
6 Por último, el muestreo puede ser más eficiente que el censo, ya que el
error total, de muestreo y de no muestreo, puede llegar a ser menor en la
muestra y los resultados obtenidos pueden utilizarse con un cierto grado
de confianza.
Desventajas
Entre las desventajas, se puede mencionar el riesgo con que se estima el

1
valor del parámetro, ya que el nivel de confianza generalmente es del 90,
95 ó 99%, pero nunca con un 100%.
Otra desventaja es que en algunos estudios se necesita un equipo

2
interdisciplinario, como ser estadísticos, sociólogos, economistas, etc.,
dependiendo de las variables a manejar en la muestra.
En una muestra, al tener menos de elementos a analizar, se reduce el error
3
de no muestreo y se puede manejar el error de muestreo poniéndolo
dentro de límites que no invaliden las decisiones que se tomen y así
aumentar la precisión de los resultados. Realizar un censo no significa que
se anule el error, ya que el error de muestreo desaparece, pero queda el
error de no muestreo.
Modelos de muestreo
Los modelos de muestreo pueden agruparse en muestreo al azar y no al azar. El primero, también
llamado muestreo probabilístico, es el proceso de seleccionar la muestra teniendo en cuenta la
aleatoriedad.
El muestreo probabilístico establece una probabilidad conocida de incluir en la muestra todos los
elementos de la población. Al seleccionar la muestra por métodos probabilísticos, estos aseguran
la representatividad de la muestra y permiten estimar los valores de los parámetros con un cierto
grado
de confianza.
El muestreo no al azar, también llamado dirigido o digitado, es un proceso de selección de

muestra sin uso del azar, sino en base al juicio personal del investigador. En una muestra dirigida
se desconoce la probabilidad de selección de cada elemento. La precisión de los resultados
depende del juicio personal del experto, por lo que es esencial el conocimiento de la población por
parte del muestreo. Cuanto más homogénea sea la población, más representativa será la
muestra.
Este tipo de muestreo no probabilístico exige personal menos entrenado y tiene menor costo que
el muestreo al azar, pero presenta una gran desventaja en la generalización debido a que el error
cometido en la estimación del parámetro no se puede evaluar cuantitativamente.
Modelos de muestreo probabilísticos

1) Muestreo simple al azar
Es un procedimiento de muestreo que genera muestras simples al azar, en la cual las n unidades
de la muestra son escogidas independientemente y las N unidades de la población tienen la
misma probabilidad de ser incluidas en la muestra.
Si el muestreo se hace con reposición o con reemplazo, todos los elementos de la población
tienen la misma probabilidad (1/N) de ser seleccionados y se regresan a la misma luego de ser
examinados. Si el muestreo es sin reposición o sin reemplazo, todos los elementos tienen la
misma probabilidad de selección en cada extracción, pero ésta dependerá de los elementos que
fueron extraídos anteriormente, puesto que no son regresados a la población luego de ser
analizados.
El muestreo aleatorio simple es representativo cuando la población es homogénea. También es

un procedimiento práctico si la población no es muy grande y si no es costoso encontrar las
unidades de muestreo. Por otro lado, puede presentar distorsiones en cuanto a la
representatividad al no proveer un número suficiente de casos para grupos especiales.
2) Muestreo estratificado
En este tipo de muestreo se divide a la población en grupos denominados estratos, tomando una
muestra en cada estrato por métodos simples al azar.
Cuando la población es heterogénea, sus elementos son clasificados de acuerdo a ciertas

variables en subpoblaciones o estratos, de modo que estos sean internamente homogéneos. Por
ejemplo: ingreso por categorías ocupacional, tasa de desempleo por ciudad, etc.
Una muestra estratificada es proporcional cuando el número de unidades extraídas de cada

estrato es proporcional al tamaño de este. Este procedimiento es eficiente cuando las
dispersiones no difieren sustancialmente en los distintos estratos.
Una muestra estratificada desproporcionada asigna mayor representatividad a un estrato con una
gran dispersión y menor representatividad a un estrato con pequeña variación. También puede
tomar un número igual de unidades en cada estrato, o dar menor representatividad a los estratos
más costosos, etc.
La estratificación es eficiente en poblaciones heterogéneas o altamente asimétricas, tales como
datos por ingresos o ventas al por menor. Al estratificar se persigue que:
1 Dentro de cada estrato haya la mayor uniformidad posible y,
2 Entre los distintos estratos las dispersiones sean lo más grande posible,
Luego se puede obtener una muestra de menos elementos que con el

muestreo simple al azar.
Este tipo de muestreo elimina los errores entre estratos, si

están bien determinados para que sean
homogéneos.
Entre las desventajas, una es que puede no proveer un número suficiente de casos para estratos
pequeños. Por otro lado, presenta una desventaja económica importante: requiere altos costos y
tiempo de selección de la muestra.
3) Muestreo de etapas múltiples

Muestreo por áreas o conglomerados
En el muestreo agrupado o por áreas, se divide a la población en grupos, denominados conglomerados

(cluster) y se extrae una muestra de ellos que representan a la población. Es decir que los conglomerados
se denominan unidades primarias y son las unidades de muestreo que contienen las unidades de análisis
o unidades elementales que conforman la muestra.
Por ejemplo: del total de N cajas de un depósito, se seleccionan m cajas (cluster) que contienen s artículos
cada una, para estudiar el porcentaje de artículos defectuosos mediante una muestra de n = m.s artículos.
Muestreo bietápico
De la población clasificada en áreas o conglomerados, se seleccionan una muestra de las áreas (1 etapa) y
dentro de cada una de las áreas seleccionadas, se toma una muestra de unidades elementales (2da
etapa).
Por ejemplo: de todos los depósitos de una ciudad, se seleccionan algunos de ellos y entre los depósitos
elegidos, se eligen m cajas conteniendo s artículos a analizar, para estudiar el porcentaje de artículos
defectuosos en la muestra de n = m.s artículos.
Muestreo polietápico
En el primer caso considerado anteriormente (3.a) el muestreo se denomina en una sola etapa; en el
segundo caso (3.b), muestreo en dos etapas o submuestreo; si el muestreo comprende más de dos
etapas, se denomina muestreo polietápico o en múltiples etapas.
Por ejemplo: estudios sociales o económicos realizados a nivel geográfico.
Un muestreo por áreas eficiente presenta:
1) diferencias entre las unidades elementales del mismo grupo lo más grande posible y
2) diferencias entre los grupos lo más pequeñas posibles.
Este tipo de muestreo presenta bajos costos y tiempos de realización de la muestra, sobre todo porque
concentra las encuestas en áreas próximas. Algunas desventajas técnicas son que exige tratamientos
estadísticos complejos y se produce una pérdida de precisión y del carácter aleatorio del muestreo.
Muestreo sistemático
Para obtener una muestra sistemática de n elementos, se enumeran los N elementos de la población de 1
a N y se determina el intervalo de muestreo (k) haciendo el cociente N / n . Luego se escoge al azar un
número (i) del primer intervalo de muestreo tal que 0 < i < k Los elementos de la muestra serán: i , i + k , i + 2
k , . . . , i + ( n - 1 ) .k
Por ejemplo:
Suponiendo una población de N = 890 elementos, de la cual se desea extraer una muestra sistemática de n
= 50 elementos.
Calculando k = N / n = 890 / 50 = 17,8 y suponiendo que se eligió al azar i = 12 los 50 elementos de la
muestra son los siguientes elementos enumerados de la población: 012, 030, 048, 065, 083, 101, . . . , 884.
El muestreo sistemático tiene la ventaja de la sencillez en el diseño, siendo fácil de escoger cada unidad de
una lista o archivo de la población.
Al realizar este tipo de muestreo, se corre el riesgo de que si hay algún tipo de vicio en las unidades de la
población, puede influir en la muestra si es coincidente con el módulo k.
Por ejemplo: en un proceso productivo se extraen n unidades cada hora de producción, determinándose el
número de artículos defectuosos. Si la máquina que los produce presenta un mal funcionamiento
periódico, dicha cantidad de defectuosos podría estar sesgada.
La muestra sistemática no es una muestra simple al azar ya que las unidades de muestreo escogidas no
son independientes, sino que es una muestra por agrupación en una sola etapa porque cada elemento de la
población pertenece a un solo grupo.
Para el ejemplo anterior, los elementos de cada uno de los 17 grupos son:
1° grupo: 001, 019, 037, 054, . . . , 873
2° grupo: 002, 020, 038, 055, . . . , 874
.......
17° grupo: 017, 035, 053, 070, . . . , 889.
Para este tipo de muestreo, como un solo grupo es elegido al azar, no se pueden calcular los errores
estadísticos ya que hay una sola selección.
Proceso de selección de la muestra
El número de unidades de la muestra (n) varía de uno a todos los elementos de la población (N). El
tamaño de la muestra depende de la variabilidad de la población y del grado de precisión
requerido.
La elección de una muestra al azar asegura la aleatoriedad
del procedimiento de muestreo, el cual
consiste en hacer una lista completa de todos los
elementos de la población, para luego escoger los
elementos de la muestra por medio de una tabla de dígitos
al azar.
Enumerados los elementos de la población de 1 a N, se determina el tamaño de la muestra n, se

elige un dígito cualquiera de la tabla y luego los siguientes dígitos se eligen de manera vertical u
horizontal, hasta completar los n elementos de la muestra.
Ejemplo:
Suponiendo una población de N = 890 elementos, de la cual se desea extraer una muestra simple
al azar de n = 50 elementos. Los elementos de la población están identificados con los números
del 001 al 890.
Suponiendo que en la tabla se presentó la siguiente sucesión de dígitos al azar:

34 86 88 15 52 01 54 03 54 55 05 01 48 11 73 etc.
Luego, el 1° elemento de la muestra es el elemento número 348 de la población; el 2°, el 688 ; el 3°

, el 155 ; etc.. hasta completar los 50 elementos de la muestra.
Otra forma de seleccionar una muestra es a través de un generador de dígitos seudoaleatorios en

una computadora o calculadora científica. En este caso los números aleatorios (Random)
generados, aparecen comprendidos entre 0 y 1.
Supongamos la siguiente secuencia: 0,0769 0,0580 0,8886 0,7894 . . ..

Para obtener los n elementos de la muestra, se multiplica cada número aleatorio por el tamaño de
la
población (N).
Luego, para el ejemplo anterior, el 1° elemento de la muestra es el 068 ( 0,0769 . 890 ) de la

población; el 2° elemento, el 052 ; el 3°, el 791; etc.
Distribución en el muestreo
La selección de muestras probabilísticas es importante

porque todas las muestras posibles extraídas
de una misma población arrojan distintos valores de los
estadísticos. Así, un estadístico calculado a
partir de una muestra al azar, es una variable aleatoria que
presenta una cierta distribución de
probabilidad denominada distribución en el muestreo.
Por ejemplo, supongamos la variable (X) número de hijos por familia, donde los N valores de la
población son: 1 2 3 4 (N = 4).
El siguiente parámetro indica el promedio de hijos por familia:

Luego, en función de las distintas muestras al azar de igual tamaño que se pueden extraer de una
población y obtener para cada muestra distintos valores de estadísticos, éstos se pueden
considerar variables aleatorias.
Un estadístico, como toda variable aleatoria, presenta una

distribución de probabilidad denominada distribución en el
muestreo, con esperanza matemática y variancia definidas.
Teorema central del límite (De Moivre)
Dada una población con media y variancia 2, ambas finitas, entonces la distribución en el
muestreo de la media aritmética tiende a la distribución Normal, con la misma media poblacional
y variancia partida el tamaño de la muestra, cuando éste aumenta.
Es decir:
Distribución en el muestreo
Dada una variable aleatoria x que presenta una distribución Normal en la población, con media y
variancia σ 2.
Es decir: x ~ N (µ; σ2 ) con E ( x ) = µ y V ( x ) = σ 2
Sean x 1 , x 2 , . . . , x n n variables aleatorias correspondientes a una muestra de tamaño n extraída

de dicha población.
1)
Sea la media aritmética el estimador de la media poblacional, donde:
2)
Sea la variancia muestral S2 el estimador de la variancia poblacional σ2, donde:
3)
Dada una variable aleatoria x que presenta una distribución Normal en la población, con media y
variancia 2 desconocida.
Es decir: x ~ N (µ; σ 2 ) con E (x ) =µ y σ 2 desconocida
La diferencia entre las medias muestral y poblacional, dividida por el cociente entre el desvío
standard muestral y la raíz cuadrada del tamaño de la muestra define una variable t que presenta
una distribución t de Student con (n-1) grados de libertad.
4)
Si la población es finita, las observaciones no son independientes, por lo tanto, la variancia de la
media muestral presentará la siguiente expresión:
En la práctica, si la fracción de muestreo n / N 0.05, se considera que la
población es infinita, por lo que el factor de corrección para poblaciones
finitas se puede despreciar.
5)
Sea una muestra de tamaño n extraída de una población finita dicotómica, entonces la variable
aleatoria x que indica el número de éxitos, presenta una distribución Binomial si las extracciones
son con reposición o una distribución Hipergeométrica si las extracciones son sin reposición.
Considerando una distribución Binomial, la variable aleatoria x presenta las siguientes
características:
E( x ) = n P y V ( x ) = nPQ
donde x indica el número de éxitos y P Q son las proporciones poblacionales de éxito y fracaso
respectivamente. Sea la proporción muestral p el estimador de la proporción poblacional P, dado
por la siguiente expresión:
Ejemplo
Se tienen los siguientes valores en la población:
2 4 6 8 10
Calcular la esperanza y variancia de la media muestral si se extrae una muestra de 2 elementos:
1. con reposición
2. sin reposición
Dada la población de tamaño N = 5, los parámetros son:
a) Si se realizan dos extracciones con reposición, se tiene las siguientes muestras posibles:
La esperanza matemática de la media muestral es la media poblacional. Es decir: E ( x )µ
La variancia de la media muestral es igual a la variancia poblacional dividida el tamaño de la

muestra. Es decir:
b) Si se realizan dos extracciones sin reposición:
Propiedades de los estimadores
Insesgamiento
Un estimador es insesgado o no viciado cuando la esperanza del estimador es igual al parámetro. Por
ejemplo:
La media muestral es un estimador insesgado de µ ya que E ( x ) = µ
La variancia muestral definida como:
Consistencia
Un estimador es consistente cuando la probabilidad de que el estimador tienda al parámetro tiende a uno, a
medida que aumenta el tamaño de la muestra. Por ejemplo: La media muestral es un estimador
consistente de la media poblacional, ya que:
Eficiencia
De dos estimadores de un mismo parámetro, será más eficiente el que tiene menor variancia. Por ejemplo:
La media muestral x es un estimador eficiente de la media poblacional ya que tiene variancia mínima por
propiedad de la x.
Suficiencia
Un estimador es suficiente si contiene toda la información posible proporcionada por la muestra, relativa al
valor verdadero del parámetro. Es decir que el estimador transmite tanta información de la muestra cómo
es posible acerca del parámetro, de modo que no será proporcionada más información por cualquier otro
estimador calculada de la misma muestra. Luego, los valores de la muestra no proporcionan más
información sobre el parámetro. Esta propiedad significa que la distribución de las variables de la muestra
debe ser independiente del parámetro. Matemáticamente se comprueba cuando la función de densidad
conjunta de la muestra puede factorearse en dos funciones: una que dependa solamente del estimador y
otra que dependa solamente del parámetro. Por ejemplo: la media muestral x es un estimador suficiente
de la media poblacional.
Error de muestreo
Se desea lograr un buen estimador, es decir, que el valor del estimador se encuentre, con una alta
probabilidad de suceder, muy cerca del valor verdadero del parámetro. Esto requiere que la
distribución en el muestreo del estimador se concentre lo más posible alrededor del valor del
parámetro, lo cual significa que la dispersión del estimador sea lo más pequeña posible. Los
estimadores están sujetos a un cierto error de muestreo, el cual está dado por el desvío standard
de la distribución en el muestreo.
La precisión con que se estima un parámetro se mide en

términos del error de muestreo, ya que cuanto menor sea
su valor, mayor será la precisión con que muestras
repetidas de una población reproducirán una estimación de
un parámetro poblacional.
10 13
Introducción
La teoría de la Inferencia estadística trata de métodos por los cuales se extrae una muestra de
una población y en base a ella se puede:
Estimar el valor del parámetro desconocido (Método de estimación)
Determinar si el parámetro es o no igual que cierto valor preestablecido

(Método de prueba de hipótesis).
La inferencia estadística es una herramienta fundamental en investigaciones científicas,

formulación de políticas y toma de decisiones en los negocios. Por ejemplo: estimación de los
rendimientos de distintos tipos de inversión; determinación de niveles generales de precios,
ventas, ingresos y costos, etc.
Estimación puntual
Sea x una variable aleatoria cuya distribución f (x, O) en la población tiene parámetro O.
Se extrae una muestra de tamaño n de dicha población, obteniéndose x1, x 2 , . . , x n valores. Sea
el estadístico
O ˆ = f (x1, x 2,. . ., x n) el estimador de O
Con el valor del estadístico calculado en la muestra se

obtiene una estimación puntual, con la cual se pretende
inferir el valor del parámetro O en la población. Así, un
estimador es un estadístico, y una estimación puntual es
cualquiera de sus valores.
Los parámetros y estimadores más usuales son:
Ejemplo:
De una población de 40 artículos, se extrae una muestra de 6. Los pesos obtenidos (en Kg) son:
10 13 16 12 9 10
Estimar puntualmente el peso promedio de los artículos suponiendo una distribución Normal para
la variable peso.
X = peso x ~ N ( u, o 2 ) donde,
u = peso promedio poblacional (Parámetro)
N = 40 artículos (Elementos de la población)
n = 6 artículos (Elementos de la muestra)
Luego x = peso promedio muestral (Estimador)
La estimación puntual será:
Estimación por intervalos
Para realizar una estimación por intervalos, se establece un intervalo de posibles valores del
estimador, con una cierta probabilidad de que dicho intervalo contenga el verdadero valor del
parámetro. Una estimación por intervalos es la estimación de un parámetro  por un intervalo al
azar, llamado intervalo de confianza, tal que la probabilidad de que L1 <= O <= L 2 es igual a 1 - a.
En símbolos:
Los dos límites del intervalo de confianza se calculan teniendo en cuenta el valor del estimador
(estimación puntual), el error de muestreo (desvío estándar del estimador) y la probabilidad de
que el intervalo cubra el valor verdadero del parámetro (nivel de confianza).

Un intervalo de confianza da una probabilidad de 1 - α de que el parámetro que se estima se
encuentre el intervalo [L 1 ; L 2]. Por ejemplo, si 1 - α es igual a 0,95, esto significa que 95 de cada
100 intervalos cubrirán el verdadero valor del parámetro y 5 de 100 de ellos no.
Intervalo de confianza para la media poblacional μ
El intervalo de confianza para la media poblacional μ está dado por:
Donde:
Distribución Normal. Variancia poblacional conocida.

Distribución Normal. Variancia poblacional desconocida.
Distribución no Normal. Tamaño de la muestra grande.
Distribución no Normal. Tamaño de la muestra chica.

Intervalo de confianza para la proporción poblacional P
El intervalo de confianza para la proporción poblacional P está dado por:
Intervalo de confianza para la variancia poblacional σ 2
El intervalo de confianza para la variancia poblacional σ 2 está dado por:

Ejemplos:
1) La Cámara de Comercios de Mar del Plata desea estimar el gasto promedio por turista y por
visita a dicha ciudad. Se escogió para ello una muestra simple al azar de 100 turistas que dio un
gasto promedio de $ 200 con una dispersión de $ 80. Se desea construir un intervalo de confianza
del 90% para el gasto promedio.
x = gasto por turista
μ = gasto promedio poblacional
μ = x = $ 200 Gasto promedio muestral
Sx = $ 80 Variancia muestral
n = 100 Tamaño de muestra grande
Intervalo de confianza:
El gasto promedio por turista y por visita se encuentra entre $ 187 y $
213 con una confianza del 90%.
2) De una población de 40 artículos, se extrae una muestra de 6.Los pesos obtenidos (en Kg)
son:
10 13 16 12 9 10
Estimar por intervalo de confianza el peso promedio de los artículos suponiendo una distribución
Normal para la variable peso y un nivel de confianza del 95%.
El peso promedio de los 40 artículos se encuentra comprendido entre
9,15 y 14,19 Kg con una confianza del 95%.
3) De una población de 400 personas se extrae una muestra simple al azar de 60 personas,
obteniéndose 40 personas fumadoras. Estimar por intervalo de confianza del 95% la proporción de
fumadores.
El porcentaje de fumadores se encuentra comprendido entre el 56 y 78
% con una confianza del 95%.
4) Una fábrica que produce piezas electrónicas de precisión está interesada en la variación del
peso de las mismas. Para ello extrae una muestra de 10 piezas y calcula la variabilidad del peso,
obteniendo que es de 0,0026 gr2 . Con un error del 5%, estimar por intervalos el valor de la
dispersión poblacional del peso de las piezas fabricadas, suponiendo una distribución normal
para el peso.
La dispersión del peso de las piezas electrónicas se encuentra
comprendida entre 0,035 y 0,093 gr. con una confianza del 95%.
5) De una población de 2.000 artículos, se extrajo una muestra de 58, obteniéndose los pesos ( en
Kg) de los mismos, que aparecen en la siguiente tabla:
Estimar puntualmente y por intervalo de confianza del 99% el peso promedio y total de los 2.000
artículos
El peso promedio de los 2.000 artículos se encuentra comprendido

entre 10.53 y 11.29 kg., mientras que el peso total se encuentra entre
21.055 y 22.585 kg con una confianza del 99%.
Fórmulas
11 13
Introducción
El test o prueba de hipótesis es una afirmación respecto a

alguna característica desconocida de una población de
interés. La esencia de probar una hipótesis estadística es el
decidir si la afirmación se encuentra apoyada por la
evidencia muestral.
La afirmación involucra ya sea a un parámetro o a alguna forma funcional no conocida de la

distribución a partir de la cual se obtiene una muestra aleatoria. La decisión acerca de si los datos
muestrales apoyan estadísticamente la afirmación se toma a con base en la probabilidad, y si
esta es mínima, entonces será rechazada.
El test de hipótesis es un caso especial relacionado principalmente con la elección de uno de dos
cursos de acción posibles. Como toda distribución de población es inalcanzable, se elige entre
dichos cursos con base a la información de la muestra.
Por ejemplo: Las dimensiones críticas de una pieza de máquina
que ha de ser acoplada a otras piezas para montar una máquina
completa son especificadas como Normal con una media de 2,5
mm. Si la pieza es demasiada corta o larga, no encaja. El gerente
de planta decide continuar con el proceso de montaje a menos que
se encuentre una evidencia sustancial de que la dimensión media
no es de 2,5 mm. ¿Cómo debe decidirse si el proceso continúa en
operación?.
Hipótesis estadísticas
Si la afirmación es estadísticamente aceptable con base a la evidencia muestral, entonces se

asume que el valor promedio es de 2,5 y se deja que el proceso continúe. Por otro lado, si la
afirmación no está apoyada por la evidencia muestral, el gerente de la planta puede decidir
detener el proceso para llevar a cabo los ajustes necesarios.
A la afirmación de que μ = 2,5 se denomina hipótesis nula (H0) y se

simboliza: H 0 ) μ = 2,5
Esta hipótesis es simple, porque asigna valores particulares a los parámetros desconocidos e
identifica la forma de la distribución. De otra forma es compuesta. Una hipótesis nula debe
considerarse como verdadera a menos que exista suficiente evidencia en contra. La hipótesis
nula se prueba contra la alternativa (H1), la cual refleja el valor posible o intervalo de valores del
parámetro de interés si la hipótesis nula es falsa.
Errores
Las posibles decisiones que pueden tomarse con respecto

a la hipótesis nula H 0 ) μ = 2,5 Una vez extraída la muestra
y observado el resultado, se debe decidir entre las
siguientes alternativas:
La hipótesis nula puede ser verdadera o falsa. Si se acepta una hipótesis

cierta o si se rechaza una hipótesis falsa, no se comete ningún error.
Si se rechaza una hipótesis nula cierta, se comete un error denominado

error de tipo I, cuya probabilidad se simboliza D. Luego, D es la
probabilidad de cometer un error de tipo I, es decir, la probabilidad de
rechazar una hipótesis nula verdadera (rechazar mal).
Si no se rechaza una hipótesis nula falsa, se comete un error denominado
error de tipo II, cuya probabilidad se simboliza con E. Luego, β es la
probabilidad de cometer un error de tipo II, es decir, la probabilidad de
aceptar una hipótesis nula falsa (aceptar mal).
Si la hipótesis nula es cierta, solo puede cometerse un error de tipo I; si la

hipótesis nula es falsa, solo puede cometerse un error de tipo II. No
pueden cometerse ambos errores en forma simultánea.
Estadístico de prueba
Una prueba de una hipótesis estadística con respecto a

alguna característica desconocida de la población, es
cualquier regla para decidir si se rechaza la hipótesis nula
con base en una muestra aleatoria de la población. La
decisión se basa en un estadístico de prueba cuya
distribución en el muestreo sea conocida en el supuesto que
la hipótesis nula sea cierta.
Reglas de decisión para el test a una cola por derecha
Para ciertos valores del estadístico de prueba, la decisión

será rechazar la hipótesis nula. Estros valores conforman la
región crítica.
Veamos el siguiente ejemplo: H 0 ) μ = 2,5 H 1 ) μ > 2,5
Supongamos que n es suficientemente grande, de manera que la distribución en el muestreo de la

media, dado que H0 es cierta, es:
Interpretación de D: Si el valor de P es 2.5, y si se tomasen muchas

muestras de tamaño n de la población, debe esperarse que en un
100D% de las veces, se encuentre un valor del estadístico de prueba x
mayor al c x , y de esta forma debe rechazarse H0.
La probabilidad D del error de tipo I también se conoce como el nivel de significación. Esto implica
que la evidencia muestral es tal que garantiza el rechazo de H0 a un nivel dado de D. El
procedimiento de prueba se construye de manera tal que la hipótesis nula sea no rechazada. Sin
embargo, con la inclusión de la hipótesis alternativa, probar una hipótesis estadística es

proporcionar una decisión entre H0 y H1. Para ello se clasifica el campo de variación en dos
subconjuntos:
Región crítica o de rechazo: que contiene los resultados no favorables a la

1
hipótesis nula.
2 Región de no rechazo: que contiene los resultados favorables a la

hipótesis nula.
Se trata de minimizar ambos errores, pero estos varían en

forma inversamente proporcional. En la práctica, se
especifica el valor de D y se elige la región de rechazo de
manera que se minimice E. Por esta razón se dice “no
rechazar H0“ más que “aceptar H” cuando la evidencia
muestral no apoya el rechazo de la hipótesis nula.
Ejemplo:
Una estación de TV considera que la proporción de televidentes de una serie que se proyecta a la
tarde no es superior al 2%. Para verificar tal afirmación se extrae una muestra aleatoria
encontrando una proporción del 0.05. Verificar la hipótesis con un nivel de confianza del 90%.
Por lo tanto, la proporción de televidentes de una serie que se proyecta
a la tarde es superior al 2%, a un nivel de significación del 10%.
Regla de decisión para el test a una cola por izquierda
En una región de la provincia de Santa Fe, la cosecha promedio de maíz fue de 5.4 toneladas por
ha. Para un año dado en el que el clima fue particularmente bueno, se seleccionaron 9 parcelas
en forma aleatoria, arrojando una cosecha promedio de 5.2 toneladas por ha., para la misma
variedad de maíz. Si la producción por ha. se distribuye normal con una desviación estándar de
0.43 toneladas. A un nivel de significación del 0.05, ¿existe alguna razón para creer que este año la
producción será no inferior que la producción promedio normal?
Luego, la producción será inferior que la producción promedio normal, a
un nivel de significación del 5%.
Regla de decisión para el test a dos colas
Un fabricante espera que el contenido medio de su producto sea de 260 gr. Supone que la
variabilidad del contenido es de 100 gr2 . Para comprobarlo, toma una muestra de 36 envases,
obteniéndose un peso medio de 267 gr. Realizar la prueba de hipótesis con un nivel de
significación del 5 %.
Luego, el contenido medio del producto no es de 260 gr, con una
confianza del 95%.
Fórmulas
12 13
Cierre de la unidad
¿Se puede a partir de valores muestrales inferir o aproximar

los valores de la población que les dio origen, con la suficiente
certeza?
Complete the content above before moving on.

A partir de valores muestrales y técnicas de inferencia, rastrearemos los valores poblacionales
correspondientes y en el caso en que no den valores poblacionales, corroborar esas afirmaciones
con cierto nivel de certeza.
¿Qué es la Estadística Inferencial?
Por medio del siguiente video se busca desarrollar el concepto de Estadística Inferencial
0398 ¿Qué es la estadística inferencial?
Luis Rincón. (2017, 26 de noviembre). 0398 ¿Qué es la estadística inferencial? [Video]. Recuperado
de: https://www.youtube.com/watch?v=N_Bnk9Wq7E4
13 13
Descarga del contenido
¿Quieres imprimir el contenido del módulo?

Para descargar el contenido del módulo, e imprimirlo, haz clic en el archivo que se encuentra a
continuación.

Módulo 4 - Estadística aplicada - Universidad John F. Kennedy

Cargado por

Copyright:

Formatos disponibles

Módulo 4 - Estadística aplicada - Universidad John F. Kennedy

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Módulo 4 - Estadística aplicada - Universidad John F. Kennedy

Cargado por

Copyright:

Formatos disponibles

Módulo 4: Distribuciones de probabilidad e

UN IDAD 7: DISTR IB UCION ES DE PR OB AB ILIDAD

7.1 Distribuciones discretas de probabilidades. Distribución Binominal. Distribución de Bernoullí

7.2 Distribución Hipergeométricas. Distribución de Poisson. Características y aproximaciones

7.3 Distribuciones continuas de probabilidad

7.4 Teorema de Tchebycheff. Teorema de Bernoulli

UN IDAD 8: IN FER EN CIA ESTADISTICA

8.2 Estimación de parámetros

8.3 Test de hipótesis

CIER R E DEL MÓDULO

Descarga del contenido

Objetivos del módulo

Conocer las distintas aplicaciones de la probabilidad y poder inferir

Contenidos del módulo

Unidad 7: Distribuciones de probabilidades

Unidad 8: Inferencia estadística

Función de distribución continua

Explica el concepto de función de probabilidad, con valores continuos, con ejemplos.

FísicayMates. (2014, 10 de abril). Variable Aleatoria Discreta | Función de probabilidad y de distribución

[Video]. Recuperado de: https://www.youtube.com/watch?v=naEqsDvkIXs

Mmteresass. (2012, 9 de febrero). Distribuiciones de probabilidad.wmv [Video]. Recuperado

¿Se podrán diferenciar los distintos tipos de distribuciones

Que el alumno reconozca las distintas distribuciones y las aplique en

2 Distribución Hipergeométricas. Distribución de Poisson. Características y

Distribuciones continúas de probabilidad

4 Teorema de Tchebycheff. Teorema de Bernoulli

7.1 Distribuciones discretas de probabilidades.

Se realizan n repeticiones (observaciones o pruebas) independientes del experimento.

En cada prueba, la probabilidad de que se presente el

variable aleatoria, cuya expresión matemática, p(x ), está dada por:

X es la variable aleatoria que varía entre 0 y n.

n y p son los parámetros de la distribución Binomial.

C... número combinatorio.

La expresión matemática anterior se la puede simbolizar X ~ Bi (x / n, p)

Si se quiere calcular la probabilidad de que la variable X tome el valor xo

La probabilidad de que la variable X se encuentre entre x 1 y x2 es:

1. Todos los hijos sean mujeres.

2. Por lo menos dos sean mujeres.

q = P (varón) = 1 – 0.5 = 0.5

Esperanza matemática: E(x)=nP

7.2 Distribución Hipergeométricas. Distribución de

Se extraen n elementos sin reposición de dicha población.

La ley de probabilidad P(x), que bajo estas condiciones se

X es la variable aleatoria que varía entre 0 y n ó Np

N, n y p son los parámetros de la distribución Hipergeométrica

La expresión matemática anterior se la puede simbolizar X ~ Hi (x/ N, n, p)

Si se quiere calcular la probabilidad de que la variable X tome el valor xo

La probabilidad de que la variable X se encuentre entre x 1 y x2 es:

n = 3 extracciones sin reposición.

Relación con la Binomial

Si se extraen n elementos con reposición de la población dicotómica de N

5 Factor de corrección para poblaciones finitas

Dada una variable aleatoria que presenta una distribución

1. El número de elementos de la población es muy

2. El número de extracciones es pequeño, de tal forma

Entonces se puede aproximar mediante la distribución Binomial.

Aproximando por la distribución Binomial:

1 La distribución de Poisson se presenta en forma exacta, con la ocurrencia

Sea el promedio de veces que aparece el suceso A en dicho espacio

3 Sea X el número de veces que aparece un suceso A en un espacio