Estadistica Ii - Con Lenguaje R
Estadistica Ii - Con Lenguaje R
Estadistica Ii - Con Lenguaje R
datos = c(20, 8, 10.5, 7.3, 10, 5.8, 13, 9.1, 25, 3.6, 4, 9, 12, 14.2, 9.1) #crea una muestra
de valores
Función REP
rep(a; b) # crea un vector con b elementos idénticos al valor a.
Ejemplo
> rep(1:3, 4) # repite la secuencia 1 2 3, 4 veces
[1] 1 2 3 1 2 3 1 2 3 1 2 3
Otras funciones
> abs(-9) # devuelve el valor absoluto
[1] 9
> sequence(c(5,3)) # se ha creado una secuencia del vector 1:5 y del 1:3
[1] 1 2 3 4 5 1 2 3
8.14. Se sabe que la desviación típica de los volúmenes de las botellas de 710 ml de agua
mineral embotellada por una empresa es de 6 ml. Se ha tomado una muestra aleatoria de 90
botellas y se han medido.
a) Halle el factor de fiabilidad de un intervalo de confianza al 92 por ciento de la media
poblacional de los volúmenes.
b) Calcule el error típico de la media.
c) Calcule la amplitud de un intervalo de confianza al 92 por ciento de la media
poblacional de los volúmenes
d) Calcule el intervalo de confianza con un nivel de confianza del 92%, sabiendo que la
media muestral es 42.
SOLUCION:
>sigma<-6
>n<-90
>alfa<-0.08
a) >cuantil<-qnorm(1-alfa/2)
>cuantil
[1] 1.750686
b) >errortipico<-sigma/sqrt(n)
>errortipico
[1] 0.6324555
c) >me<-cuantil*errortipico
>w<-2*me
> w
[1] 2.214462
d) >media<-42
> liminf<-media-qnorm(1-alfa/2)*sigma/sqrt(90)
> liminf
[1] 40.89277
> limsup<-media+qnorm(1-alfa/2)*sigma/sqrt(90)
> limsup
[1] 43.10723
El intervalo de confianza es: [40.89277; 43.10723]
EJEMPLOS:
SOLUCION:
>datos<-c(79, 73, 68, 77, 86, 71, 69)
>alfa<-0.05
> me<-qt(1-alfa/2, 8, lower.tail=T)*sd(datos)/sqrt(7)
>me
[1] 5.574398
>t.test(datos, conf.level=0.95)
data: datos
t = 30.908, df = 6, p-value = 7.617e-08
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
68.79927 80.62931
sample estimates:
mean of x
74.71429
9.12 Una muestra aleatoria de 10 barras energéticas de chocolate de cierta marca tiene, en
promedio, 230 calorias por barra y una desviación estándar de 15 calorías. Construya un
intervalo de confianza del 99% para el contenido medio verdadero de calorías de esta marca
de barras energéticas de chocolate. Suponga que la distribución del contenido calórico es
aproximadamente normal.
SOLUCION:
Como no se cuenta con una muestra de valores, utilizaremos la fórmula del intervalo para este caso, entonces
alfa<-0.01
media<-230
n<-10
s<-15
La función que devuelve los cuantiles de t-Student es:
qt(p, gl, lower.tail=T)
p: vector de valores
gl: grados de libertad
lower.tail: valor de la cola derecha
> alfa<-0.01
> cuantil<-qt(1-alfa/2, 9, lower.tail=T)
> cuantil
[1] 3.249836
> media<-230
> n<-10
> s<-15
> liminf<-media-cuantil*s/sqrt(n)
> liminf
[1] 214.5847
> limsup<-media+cuantil*s/sqrt(n)
> limsup
[1] 245.4153
P[214.58<μ<245.42]=0.99
𝒑̂𝒒
̂ ̂𝒒
𝒑 ̂
̂ − 𝒛𝟏−𝜶⁄𝟐 √
𝑷 [𝒑 ̂ + 𝒛𝟏−𝜶⁄𝟐 √ ] = 𝟏 − 𝜶
<𝑷<𝒑
𝒏 𝒏
EJEMPLOS:
8.39. Suponga que las autoridades sanitarias creen que este año la epidemia de gripe será
menor que durante el mismo periodo del año pasado. Se ha preguntado a los residentes de
una zona metropolitana si esta noticia los disuadiría de vacunarse contra la gripe. Si sólo 40
personas de una muestra aleatoria de 246 declararan que ahora no se vacunarían, estime con
una confianza del 98 por ciento la proporción de todos los residentes de la zona metropolitana
que ahora consideran innecesario vacunarse contra la gripe.
SOLUCION:
>n<-246
>x<-40
>alfa<-0.02
> prop.test(x,n,conf.level=0.98)
SOLUCION:
># De acuerdo al archivo Library existen:
> n<-356
>x<-136
>prop.test(x,n,conf.level=0.90)
1-sample proportions test with continuity correction
𝒂𝒍𝒇𝒂⁄ (𝒏
qchisq(𝟏 − 𝟐, − 𝟏))
EJEMPLO:
9.71W Un fabricante de baterías para automóvil afirma que sus baterías duraran, en
promedio, 3 años con una varianza de 1 año. Suponga que 5 de estas baterías tienen
duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años y con base en esto construya un intervalo de
confianza del 95% para σ2, después decida si la afirmación del fabricante de que σ2 = 1 es
válida. Suponga que la población de duraciones de las baterñias se distribuye de forma
aproximadamente normal.
SOLUCION:
> muestra<-c(1.9, 2.4, 3.0, 3.5, 4.2)
> n<-length(muestra)
> s2<-var(muestra)
> alfa<-0.05
> linf<-(n-1)*s2/qchisq(1-alfa/2,n-1)
> lsup<-(n-1)*s2/qchisq(alfa/2,n-1)
> ic<-c(linf, lsup)
> ic
[1] 0.2925528 6.7297174
El intervalo de confianza al 95% es: [0.293< σ2< 6.729]
9.72W Una muestra aleatoria de 20 estudiantes obtuvo una media de 𝑋̅= 72 y una varianza
de s2=16 en un examen universitario de colocación en matemáticas. Suponga que las
calificaciones se distribuyen normalmente y con base en esto construya un intervalo de
confianza del 98% para σ2.
SOLUCION:
> n<-20
> s2<-16
> alfa<-0.02
> linf<-(n-1)*s2/qchisq(1-alfa/2,n-1)
> lsup<-(n-1)*s2/qchisq(alfa/2,n-1)
> ic<-c(linf, lsup)
> ic
[1] 8.399909 39.828477
9.4. Se elige una muestra aleatoria de 10 pares de viviendas idénticas de una gran ciudad y
se instala un sistema pasivo de calefacción solar en uno de los miembros de cada par. Se
obtienen las facturas totales de combustible (en dólares) de tres meses de invierno de estas
casas que se muestran en la tabla adjunta. Suponiendo que las poblaciones siguen una
distribución normal, halle el intervalo de confianza al 90 por ciento de la diferencia entre las
dos medias poblacionales.
Sin Con Sin Con
Calefacción calefacción calefacción calefacción
Par solar solar Par solar solar
1 485 452 6 386 380
2 423 386 7 426 395
3 515 502 8 473 411
4 425 376 9 454 415
5 653 605 10 496 441
SOLUCION:
> sin<-c(485,423,515,425,653,386,426,473,454,496)
> con<-c(452,386,502,376,605,380,395,411,415,441)
> t.test (sin, con, paired = TRUE, conf.level = 0.90)
Paired t-test
SOLUCION:
> variedad1<-c(38, 23, 35, 41, 44, 29, 37, 31, 38)
> variedad2<-c(45, 25, 31, 38, 50, 33, 36, 40, 43)
> t.test(variedad2, variedad1, paired = TRUE, conf.level = 0.95)
Paired t-test
1 1 1 1
𝑃 [[(𝑋̅1 − 𝑋̅2 ) − 𝑡(𝑛1+𝑛2−2; 2
1−𝛼⁄2) √𝑆𝑃 [ + ] < 𝜇1 − 𝜇2 < (𝑋̅1 − 𝑋̅2 ) + 𝑡(𝑛1+𝑛2−2; 2
1−𝛼⁄2) √𝑆𝑃 [ + ]]
𝑛1 𝑛1 𝑛1 𝑛1
= 1 − 𝛼]