Clase 4
Clase 4
Clase 4
Estadística Inferencial
Carlos Gaviria?
29 de abril de 2021
Ideas Preliminares.
Idea Informal
Considere seleccionar una muestra de tamaño n, x11 , x21 , · · · , xn1 de una población de interés. Aho-
ra, seleccione otra muestra de tamaño n, x12 , x22 , · · · , xn2 de la misma población. Claramente las
dos muestras son diferentes. Ahora, seleccione m muestras de tamaño n de la misma población:
Claramente todas las muestras son diferentes; esto es, x1i 6= x1j , x2i 6= x2j , · · · , xni 6= xnj para i 6= j.
Ideas Preliminares.
Muestra Aleatoria
Debido a la incertidumbre presente, antes de que los datos estén disponibles, cada observación se
considera como una variable aleatoria y la muestra es representada por X1 , X2 , · · · , Xn . Es decir,
una muestra aleatoria es un conjunto de variables aleatorias.
Definición
Un estadístico es cualquier valor que puede ser calculado a partir de datos muestrales. Un esta-
dístico es una variable aleatoria que es función de una muestra aleatoria.
Definición
Una muestra aleatoria X1 , X2 , · · · , Xn es una muestra aleatoria simple si y sólo si:
1 Las Xi son v.a independientes.
2 Cada Xi tiene la misma distribución de probabilidad.
Teoremas Fundamentales.
Teorema 1.
Si X1 , X2 , · · · , Xn es una muestra aleatoria de una distribución con valor medio µ y desviación
estándar σ, entonces:
1 E(X) = µX = µ.
σ2
2 Var(X) = n
.
σ
3 σX = √
n
.
Teorema 2.
Si X1 , X2 , · · · , Xn es una muestra aleatoria de una distribución normal con valor medio µ y
desviación estándar σ, entonces X distribuye normal con:
1 E(X) = µX = µ.
σ2
2 Var(X) = n
.
σ
3 σX = √
n
.
Teoremas Fundamentales.
Observación
1 Matemáticamente n grande significa n → ∞.
2 A medida que n crece se tiene que X se aproxima más a una distribución normal con media
µ y desviación estándar √σn .
3 Si bien la distribución normal es una distribución ideal en términos prácticos, esta no se
puede dejar de lado, pues es la única que cuenta con el T.L.C.
4 De manera empírica se tiene que el T.L.C funciona bien cuando n > 30. Ahora; si no se da
una buena aproximación con ésta restricción entonces se toma n > 40 y así sucesivamente.
Distribución de X
El estudio de la distribución muestral de X se realiza considerando varios casos, dependiendo del
tamaño muestral, la distribución de la v.a X y del conocimiento de la varianza de X:
1 Caso 1. Si n ∈ N, X ∼ N(µ, σ 2 ) con σ 2 conocida.
2 Caso 2. Si n < 30 y X ∼ N(µ, σ 2 ) con σ 2 desconocida.
3 Caso 3. Si n ≥ 30 y X tiene una distribución con media µ y varianza σ 2 conocida o
desconocida.
Observación
Los casos 1 y 3 están fundamentados en los teoremas 2 y 3. El caso 2 se fundamenta en la
distribución t−student.
Teorema 4
Sea X una v.a. distribuida normalmente con media E(X) = µ y varianza desconocida V(X) =
σ 2 . Si X1 , X2 , · · · , Xn es una m.a de tamaño n (n < 30) de X, entonces el estadístico X satisface:
X−µ
T= ∼ tn−1
√s
n
Razón de Varianzas.
Idea Informal
Considere dos poblaciones de interés. Tome una m.a de tamaño n1 de la población 1 y una m.a
de tamaño n2 de la población 2 y construya los estadísticos S12 a partir de la primera m.a y S22 a
partir de la segunda m.a. La intención es investigar la distribución que sigue la variable aleatoria
S12 /σ12
S22 /σ22
.
Teorema 5
Sea X1 , X2 , Xn una muestra aleatoria de una distribución normal con parámetros µ y σ 2 , entonces
la variable aleatoria:
(Xi − X)2
P
(n − 1)S2 i
=
σ2 σ2
tiene una distribución Ji cuadrada con n − 1 grados de libertad.
Razón de Varianzas.
Teorema 6
Sean S12 y S22 las varianzas muestrales obtenidas a partir de m.a independientes de tamaño n1 y n2
tomadas de poblaciones normales con varianzas σ12 y σ22 , respectivamente. Entonces la variable
aleatoria:
S12 /σ12
S22 /σ22
Tiene una distribución F de Fisher con n1 − 1 grados de libertad para el numerador y n2 − 1
grados de libertad para el denominador.
Ejemplo 1
Si s21 y s22 representan las varianzas de m.a. independientes de tamaño n1 = 26 y n2 = 31, que se
toman de poblaciones normales con varianzas σ12 = 10 y σ22 = 15, respectivamente. Encuentre
S2
P S12 < 2.2 .
2
Diferencia de Medias.
Idea Informal
Considere dos poblaciones de interés. Tome una m.a X1 , X2 , · · · , Xn de la población 1 y una m.a
Y1 , Y2 , · · · , Yn de la población 2 y construya los estadísticos X a partir de la primera m.a y Y a
partir de la segunda m.a. La intención es investigar la distribución que sigue la variable aleatoria
X − Y.
Teorema
Si se toman dos m.a. independientes, de tamaños n1 y n2 procedentes de poblaciones con medias
µ1 y µ2 , y varianzas σ12 y σ22 respectivamente, entonces:
1 E(X − Y) = µ1 − µ2 .
σ12 σ22
2 Var(X − Y) = n1
+ n2
.
Diferencia de Medias.
Diferencia de Medias.
Caso 1
Si n1 ≥ 30 y n2 ≥ 30 y las muestras provienen de una distribución normal o no normal y σ12 y
σ22 son conocidas o desconocidas, entonces:
(X − Y) − (µ1 − µ2 )
Z= r ∼ N(0, 1).
σ12 σ22
n1
+ n2
Si σ12 y σ22 son desconocidas entonces se utiliza el mismo estadístico pero reemplazando las
varianzas poblacionales por las varianzas muestrales S12 y S22 , respectivamente.
Caso 2
Si n1 < 30 y n2 < 30 y las muestras provienen de una distribución normal con σ12 y σ22
conocidas, entonces:
(X − Y) − (µ1 − µ2 )
Z= r ∼ N(0, 1).
σ12 σ22
n1
+ n2
Diferencia de Medias.
Caso 3
Si n1 < 30 y n2 < 30, las muestras provienen de poblaciones normales y σ12 y σ22 son descono-
cidas pero iguales, entonces se usa el estadístico:
(X − Y) − (µ1 − µ2 )
T= r ∼ t(n1 +n2 −1) .
1 1 2
n
+ n
Sp
1 2
Diferencia de Medias.
Caso 4
Si n1 < 30 y n2 < 30, las muestras provienen de poblaciones normales y σ12 y σ22 son descono-
cidas pero diferentes, entonces se usa el estadístico:
(X − Y) − (µ1 − µ2 )
T= r ∼ tν .
S12 S22
n1
+ n2
n1 −1
+ n2 −1
Diferencia de Medias.
Ejemplo 2
Una compañía petrolífera está considerando la posibilidad de introducir un nuevo aditivo en
su gasolina, esperando incrementar el kilometraje medio por litro de gasolina. Se sabe que el
kilometraje medio recorrido con un litro de gasolina sin aditivo es 14.2 km/l y con aditivo es 15.4
km/l. Para tomar la decisión realizan un experimento: los ingenieros del grupo de investigación
prueban 10 automóviles con la gasolina habitual y otros 11 automóviles con la gasolina con el
nuevo aditivo. En cada automóvil se miden los kilómetros recorridos con un litro de combustible,
y se encuentra que la varianza muestral para los automóviles con gasolina sin aditivo es 3.24, y
para los que usaron aditivo es 5.76. Al comparar el kilometraje medio recorrido por litro obtenido
de los automóviles que usaron aditivo y los que no lo usaron ¿Cuál es la probabilidad de que el
hecho de no usar aditivo haga que se disminuya en por lo menos 3.57 el kilometraje medio
muestral recorrido ?
Diferencia de Medias.
Ejemplo 3
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años , mientras que los de
la B tienen una vida media de 6.7 años. Determine la probabilidad de que una muestra aleatoria de
34 tubos de la compañía A tenga una vida promedio de al menos un año más que la de una muestra
aleatoria de 40 tubos de la compañía B, si se encuentra que la desviación estándar muestral de
los tubos de la compañía A es 0.8, y la desviación estándar de los tubos de la compañía B es 0.7.
Proporción.
Proporción Poblacional
Se define por p = NX donde X es el número de individuos u objetos de la población que satisfacen
cierta característica y N es el tamaño de la población.
Proporción Muestral
Se define por bp = nx donde x es el número de individuos u objetos de la muestra que satisfacen
cierta característica y n es el tamaño de la muestra.
Teorema
Cuando se desea estimar una proporción y n ≥ 30, se utiliza el T.L.C y se tiene que:
p̂ − p
Z= q ∼ N(0, 1).
p(1−p)
n
Proporción.
Teorema
De dos poblaciones se toman dos m.a independientes de tamaños n1 ≤ 30 y n2 ≤ 30, y en cada
una de ellas se observa una característica o cualidad. Las proporciones muestrales de elementos
con la característica son p̂1 = nx y p̂2 = ny , de tal manera que:
1 2
1 E(p̂1 − p̂2 ) = p1 − p2 .
p1 (1−p1 ) p2 (1−p2 )
2 Var(p̂1 − p̂2 ) = n1
+ n2
Teorema
Cuando los tamaños de muestra n1 y n2 son grandes se tiene que:
Proporción.
Ejemplo 4
Se supone que el 12 % de la población de un país tiene una segunda residencia. Con el fin de
obtener una información más precisa se toma una m.a. de 250 familias. ¿Cuál es la probabilidad
de que la proporción de familias de la muestra con segunda residencia esté comprendida entre un
10 % y un 15 %?
Ejemplo 5
Se sospecha que el 15 % de los lápices que se venden a una escuela tienen defecto, por lo que
el director esta muy preocupado y le ha solicitado al proveedor que mejore su calidad. Para ello,
la empresa productora implementó un programa de control de calidad al final del cual, se tomó
una m.a. de 125 lápices para verificar la calidad del producto y se encontró que 18 de ellos
presentaban defectos, ¿cuál es la probabilidad de que Se tengan entre 10 % y 14 % de lápices
defectuosos.
Pruebas de normalidad
Para estudiar si una muestra proviene de una población con distribución normal se disponen de
tres herramientas que se listan a continuación:
1 Estadística descriptiva.
2 Gráficos cuantil cuantil (QQplot).
1 qqnorm() junto con qqline().
2 qqPlot().
3 Pruebas de hipótesis.
1 shapiro.test. Shapiro–Wilk.
2 ad.test. Anderson–Darling.
3 cvm.test. Cramer–von Misses.
4 lillie.test. Lilliefors (Kolmogorov–Smirnofv).
5 pearson.test. Pearson chi–square.
6 sf.test. Shapiro–Francia1 .
1
Para 2 a 6 se necesita la libreria nortest.
Carlos Gaviria Estadística Inferencial
Estimación Puntual.
Estimación por Intervalos de Confianza.
Ideas Preliminares.
Recuerde que:
1 Cuando se desea estimar el valor de un parámetro θ a partir de la información de una m.a
X1 , X2 , · · · Xn utilizamos un estimador θ.
b
2 El estimador θb de el parámetro θ es una v.a, por lo tanto tiene una distribución de probabi-
lidad, esperanza, varianza y desviación estándar.
3 Dicho estimador aplicado a una muestra nos proporcionará un valor numérico, que se de-
nomina estimación de θ.
4 La precisión de ese estimador está relacionada con la probabilidad de que θb nos proporcione
un valor próximo a θ.
Ideas Preliminares.
Definición
Se dice que un estimador puntual θb es un estimador insesgado de θ si E(θ)
b = θ para todo valor
b − θ se conoce como el sesgo de θ.
posible de θ. Si θb no es insesgado, entonces E(θ) b
Elección de Estimadores
1 De todos los estimadores de un parámetro θ se elige uno insesgado.
2 Si hay más de un estimador insesgado para θb entonces se elige el de mínima varianza. Esta
propiedad se conoce como eficiencia.
3 b → θ y Var(θ)
Un estimador θb se dice consistente siempre que E(θ) b → 0 cuando n → ∞.
4 El estimador θ es un estimador robusto del parámetro θ si la violación de los supuestos de
b
partida en los que se basa la estimación no altera de manera significativa los resultados que
éste proporciona.
5 Se dice que un estimador es suficiente cuando resume toda la información relevante
contenida en la muestra, de forma que ningún otro estimador pueda proporcionar
información adicional sobre el parámetro desconocido de la población.
6 Se dice que un estimador es invariante cuando el estimador de la función del parámetro
coincide con la función del estimador del parámetro, [f (θ)]∗ = f (θ∗ ).
Definición.
Definición
Sea θ un parámetro de interés y θb un estimador puntual para θ. Una estimación de θ por intervalo,
es un intervalo real de la forma:
(l, u),
donde l y u dependen del valor que toma el estimador θb en una muestra dada y de la distribución
muestral de θ.
b
Observaciones
1 Cada m.a. proporcionará un valor diferente para θb y por lo tanto valores diferentes para l y
para u.
2 El intervalo (l; u) es llamado Intervalo Aleatorio.
3 En general, usando θb y su distribución se pueden determinar l y u, tales que para un valor
0 < α < 1 dado se satisfaga P(l < θ < u) = 1 − α.
4 Para una m.a. particular se obtiene el intervalo (l; u), el cual se espera contenga el verdadero
valor de θ.
Observaciones.
Observaciones
5 l y u son llamados límites de confianza y el valor 1 − α se le llama coeficiente o nivel de
confianza.
6 Cuando se construye un I.C. al (1 − α)100 % para θ, éste se interpreta de la siguiente
manera: Si tuviésemos un número infinito de m.a. de la población, y construyésemos con
cada una un intervalo (l; u), entonces el (1 − α)100 % de dichos intervalos contendría al
verdadero valor del parámetro θ.
7 El intervalo de la forma (l; u) se conoce como intervalo bilateral. Los intervalos (l; +∞) ó
(−∞; u) son llamados intervalos unilaterales.
8 En un I.C. bilateral la longitud u − l es una medida de la calidad de la información obtenida.
El valor θ − l u − θ se conoce como precisión del estimador.
9 Lo ideal es tener I.C. angostos (esto es, con mayor precisión) con una alta confianza.
Observaciones.
Observaciones
10 No es correcto decir la probabilidad de que θ pertenezca al intervalo (l; u) es 1 − α porque
θ no es una v.a. El intervalo es aleatorio ya que sus extremos son funciones de la muestra y
por lo tanto, debemos decir la probabilidad de que el intervalo (l; u) contenga al parámetro
θ es 1 − α.
11 Una vez construido el intervalo a partir de una muestra dada, ya no tiene sentido hablar
de probabilidad. En todo caso, tenemos confianza de que el intervalo contenga a θ. La
confianza está puesta en el método de construcción de los intervalos, que nos asegura que
(1 − α)100 % de las muestras producirán intervalos que contienen a θ.
0.4
Densidad
0.2
α α
0.0
−4 −2 0 2 4
0.4
Densidad
0.2
α α
0.0
−4 −2 0 2 4
Ejemplo 6
La duración de cierto tipo de foco es una v.a. aproximadamente normal con media µ horas y
varianza 625 horas2 . El fabricante afirma que la duración promedio real de sus focos es superior
a las 1010 horas. Para verificar esto se toma una m.a. de 20 focos y se miden sus duraciones.
La duración promedio obtenida en la muestra es de 1014 horas. ¿Es cierta la afirmación del
fabricante? Calcule un I.C. al 98 % para µ.
Ejemplo 7
Un artículo publicado en cierta revista presenta las mediciones de tiempos de combustión residual
(en seg) de especímenes tratados en ropa de dormir para niños. Se seleccionaron 50 especímenes
y se obtuvo un tiempo promedio de 9.8525 seg y una desviación típica de 0.0965 seg. Calcule e
interprete un IC aproximado al 98 % para el tiempo medio real de combustión.
Ejemplo 8.
Las mediciones humanas constituyen una rica área de aplicación de métodos estadísticos. El
artículo A Longitudinal Study of the Development of Elementary School Children’s Private
Speech(Merril-Palmer Q., 1990:443-463 ) reportó sobre un estudio de niños que hablan solos.
Se pensaba que la conversación a solas estaba relacionado con el IQ, dado que este mide la ma-
durez mental y se sabia que la conversación a solas disminuye conforme los estudiantes avanzan
a través de los años de la escuela primaria. El estudió incluyó 33 estudiantes de primer año de
escuela cuyos resultados de IQ se dan a continuación.
Ejemplo 9
Los siguientes datos corresponden al índice de desarrollo psicomotor para niños LBW.
Ejemplo 10
Los siguientes datos corresponden a resultados de la medición de las aptitudes de estudiantes de
los cursos de capacitación en una universidad:
Ejemplo 11
Las pruebas que se utilizan actualmente para los condones son sustitutos de los desafíos que se
enfrentan en uso, incluyendo una prueba de hoyos, una de inflación, una de sello del paquete y
las de dimensiones y calidad del lubricante. Los investigadores agregaron una nueva prueba que
agrega tensión cíclica a un nivel muy por debajo de la rotura y determina el número de ciclos
hasta llegar a la rotura. El número de ciclos hasta la rotura se puede modelar como una v.a normal
con media 1584. la rotura media muestral se obtendrá a partir de una muestra de 16 condones.
0.20
Densidad
0.10
0.00
α α
0 5 10 15
Ji cuadrado
Un intervalo de confianza para σ tiene límites superior e inferior que son las raíces cuadradas de
los límites correspondientes en el intervalo para σ 2 .
0.8
Densidad
0.4
α α
0.0
fα,ν1 ,ν2 : Valor sobre el eje de medición tal que P(F ≥ fα,ν1 ,ν2 ) = α.
f1−α,ν : Valor sobre el eje de medición tal que P(F ≤ f1−α,ν1 ,ν2 ) = α.
σ12
Intervalo de Confianza para σ22
Suponga que se tienen m.a. indendientes, provenientes de dos distribuciones normales con me-
dias y varianzas desconocidas. Si S12 y S22 son las varianzas muestrales, procedentes de las mues-
tras de tamaños n1 y n2 , respectivamente, entonces un I.C. al nivel (1 − α)100 % para la razón
σ12
de las varianzas es σ22
:
!
S12 1 S12
, F
2 (α/2,n2 −1,n1 −1)
S22 F(α/2,n1 −1,n2 −1) S2
Ejemplo 12
Una compañía de taxis está tratando de decidir si comprar la Marca A o la Marca B de neumáticos
para una flota de automóviles. Para estimar la diferencia entre las dos marcas, se llevó a cabo un
experimento con 10 neumáticos de la marca A y 9 de la marca B. Los neumáticos se utilizaron
hasta que se gastaron y se midió la distancia recorrida. Los resultados (expresados en km) son:
Marca A Marca B
X 1 = 36300 X 2 = 38100
S1 = 5000 S2 = 6100
σ12
Halle un I.C. del 95 % para σ22
.
Ejemplo 13
El toxafen es un insecticida que ha sido identificado como contaminante en el ecosistema de los
Grandes Lagos. Para investigar los efectos de la exposición al toxafen en animales, a grupos de
ratas se le suministró toxafen en su dieta. El artículo Reproduction study of Toxaphene in the rat
reporta aumentos de peso (en gramos) de ratas a las que se le suministró una dosis baja (4 ppm)
y de ratas de control cuya diete no incluía el insecticida. La desviación estándar de la muestra de
23 ratas hembra de control fue de 32 gm y de 20 ratas hembra sometidas a dosis bajas fue de 54
σ12
gm. Suponiendo normalidad en las poblaciones de ratas, halle un I.C del 98 % para σ22
.
n1 −1
+ n2 −1
Ejemplo 14
La confederación colombiana de consumidores esta interesada en estudiar la duración de las pilas
E y D, por lo que prueba el número de horas que duran las pilas, tomando una muestra de 21
pilas de cada una con los siguientes resultados:
Pilas E Pilas D
X 1 = 111,16 X 2 = 115,8
S1 = 10 S2 = 15
Ejemplo 15
Un estudio de dos tipos de equipo de fotocopiado muestra que 60 fallas del primer tipo de equipo
tardaron un promedio de 80,7 minutos en ser reparadas, con una desviación estándar de 19,4 mi-
nutos; mientras que, 50 fallas del segundo tipo de equipo tardaron en promedio 88,1 minutos en
repararse con una desviación estándar de 18,8 minutos. Halle un I.C del 98 % para la diferencia
poblacional de medias.
Ejemplo 16
En dos ciudades se llevó a cabo una encuesta sobre el costo de vida para obtener el gasto prome-
dio en alimentación en familias constituidas por cuatro personas. De cada ciudad se seleccionó
aleatoriamente una muestra de 16 familias y se observaron sus gastos semanales en alimentación.
Las medias y las desviaciones estándares muestrales fueron las siguientes:
Muestra 1. Muestra 2.
X 1 = 135 X 2 = 122
S1 = 18 S2 = 10
Si se supone que se muestrearon dos poblaciones independientes con distribución normal cada
una, obtenga un I.C. del 95 % para µ1 −µ2 . ¿Estaría inclinado a concluir que existe una diferencia
real entre µ1 y µ2 ?
Ejemplo 17
Se tomaron dos grupos independientes de estudiantes universitarios que son conocidos por so-
bresalir en matemáticas y para quienes un buen desempeño en matemáticas se consideraba im-
portante. Se asignaron 11 estudiantes a un grupo de control al que simplemente se les pidió que
completaran un examen de matemáticas difícil. Se asignaron 12 estudiantes a una condición de
amenaza, en la que se les dijo que los estudiantes asiáticos generalmente obtuvieron mejores
resultados que otros estudiantes en las pruebas de matemáticas y que el propósito del examen
era ayudar al experimentador a comprender por qué este existe dicha diferencia. Se supone que
simplemente decirles a los estudiantes blancos que los asiáticos mejorar en las pruebas de ma-
temáticas despertaría sentimientos de amenaza estereotipada y disminuiría el rendimiento en los
exámenes. Los datos se dan a continuación:
Grupo de control Grupo en amenaza
4 9 12 8 7 8 7 2
9 13 12 13 6 9 7 10
13 7 6 5 0 10 8
Ejemplo 18
Los siguientes datos corresponden al nivel de exitación sexual en varones heterosexuales ho-
mofóbicos y varones heterosexuales no homofóbicos al presentarse videos de contenido sexual
explícito (contenido homesual y heterosexual).
Homophobic Nonhomophobic
39.1 38.0 14.9 20.7 19.5 32.2 24.0 17.0 35.8 18.0 -1.7 11.1
11.0 20.7 26.4 35.7 26.4 28.8 10.1 16.1 -0.7 14.1 25.9 23.0
33.4 13.7 46.1 13.7 23.0 20.7 20.06 14.1 -1.7 19.0 20.0 30.9
19.5 11.4 24.1 17.2 38.0 10.3 30.9 22.0 6.2 27.9 14.1 33.8
35.7 41.5 18.4 36.8 54.1 11.4 26.9 5.2 13.1 19.0 -15.5
8.7 23.0 14.3 5.3 6.3
Ejemplo 19
Considere un programa de intervención para mujeres abusadas por familiares. El estudio consi-
dera dos grupos: control y tratamiento. Además, el estudio mostró que durante el transcurso del
programa las mujeres subían de peso. Los siguientes datos corresponden a la ganancia de peso
de cada mujer en ambos grupos:
Grupo control Grupo tratamiento
-0.5 3.3 -9.3 11.3 -5.4 0.0 1.7 -9.1 0.7 2.1 -0.1 -1.4
12.3 -1.0 -2.0 -10.6 -10.2 -4.6 -0.7 1.4 -3.5 -0.3 14.9 -3.7
-12.2 -6.7 11.6 2.8 -7.1 0.3 3.5 -0.8 17.1 2.4 -7.6 12.6
6.2 1.8 -0.2 3.7 -9.2 15.9 1.6 1.9 11.7 3.9 6.1 0.1
8.3 -10.2 1.1 15.4 -4.0 -0.7 20.9
Recuerde que:
X
p=
El estimador de p es la v.a b n
, donde X ∼ bin(n, p)
Caso 1. n < 30
r
z2α/2 p(1−b
p) z2α/2
p+ ± zα/2 +
b
2n n 4n2
b
z2α/2
1+ n
Caso 2. n ≥ 30
s s
p(1 − b
p) p(1 − b
p)
p − zα/2
b b
b ,b
p + zα/2
n n
Ejemplo 18
Se recibe un lote grande de artículos proveniente de un proveedor que asegura que el porcentaje
de defectuosos en su proceso de producción es del 1 % o menos. Al seleccionar una m.a. de
200 artículos e inspeccionarlos se encontraron 8 defectuosos. Obtenga un I.C. al 98 % para la
verdadera proporción de artículos defectuosos del proceso de manufactura del fabricante. ¿Qué
puede concluir con respecto a la afirmación del proveedor?
Ejemplo 19
Entre 500 solicitudes de matrimonio, elegidas al azar en 1971, hubo 48 en las cuales las mujeres
eran cuando menos un año mayores que los hombres y entre 400 solicitudes de matrimonio, ele-
gidas al azar en 1977, hubo 68 en las cuales las mujeres eran cuando menos un año mayores que
los hombres. Construya un intervalo de confianza al 98 % para la diferencia entre las proporcio-
nes verdaderas correspondientes de solicitudes de matrimonio en las cuales las mujeres fueron
cuando menos un año mayores que los hombres.
Intervalos de confianza en R
1 t.test. La función t.test se usa para calcular intervalos de confianza para la media y
diferencia de medias, con muestras independientes y dependientes (o pareadas). La función
y sus argumentos son los siguientes:
t.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE,
conf.level = 0.95, ...)
1 Intervalo de confianza para µ.
t.test(x, conf.level=0.90)$conf.int
2 Intervalo de confianza para µ1 − µ2 .
t.test(x, y,
paired=FALSE, var.equal=FALSE,
conf.level = 0.95)$conf.int
σ12
2 Intervalo de confianza para . Se usa la función var.test().
σ22
3 Intervalo de confianza para la proporción y diferencia de proporciones. Se usa prop.test.