0% encontró este documento útil (0 votos)
1K vistas10 páginas

Examen Final de Estadistica Aplicada

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 10

EXAMEN FINAL DE ESTADISTICA APLICADA

Pregunta 1 (1pto)

De acuerdo al siguiente enunciado, identifique el tipo de muestreo que se utilizó: aleatorio,


sistemático, de conveniencia, estratificado o por conglomerados.

Encuestas de salida. En épocas de elecciones presidenciales, los medios noticiosos organizan


una encuesta de salida, en la que se eligen estaciones de sondeo al azar y se encuesta a todos
los votantes conforme abandonan el lugar.

Solución:

Se utiliza el muestreo por conglomerado, ya que se va a dividir el área de la población en


secciones, y luego se elegirá al azar algunos de estos conglomerados, para después elegir a
todos los miembros de los conglomerados seleccionados.

Pregunta 2 (1pto)

De acuerdo al siguiente enunciado, identifique el tipo de muestreo que se utilizó: aleatorio,


sistemático, de conveniencia, estratificado o por conglomerados.

Puesto de revisión de sobriedad. Adiel Flores fue un observador en un puesto de revisión de


sobriedad de la policía, donde se detenía y entrevistaba a cada quinto conductor.

Solución:

Se utiliza el muestreo sistemático, ya que se elige un punto de partida y luego seleccionamos


cada k- énesimo elemento de la población, en este caso k=5.

Pregunta 3 (2pto)

Construya el intervalo de confianza

Temperatura media corporal. El conjunto de datos 2 del apéndice B incluye 106 temperaturas
corporales, para las cuales media x = 98.20°F y s = 0.62°F. Utilizando los estadísticos de la
muestra, construya un estimado del intervalo de confianza del 99% para la temperatura media
corporal de todos los seres humanos saludables. ¿Los límites del intervalo de confianza
incluyen los 98.6°F? ¿Qué sugiere la muestra acerca del uso de 98.6°F como la temperatura
corporal media?

Solución:

n=106 media(x)=98,20 s=0,62 Z(α/2)=2,275

IC (99 )→98,20−2,275
( √0,62
106 ) ≤ μ ≤ 98,20+2,275
( 0,62
√ 106 )
I C(99 )→ 98,063 ≤ μ ≤ 98,337

Los límites del intervalo de confianza no admiten el valor de 98,6ºF.

Para que el intervalo admita el valor de 98,6ºF, se sugiere que se aumente el nivel de confianza,
para que el intervalo crezca.
Pregunta 4 (2pto)

Prueba de hipótesis. Suponga que se seleccionó una muestra aleatoria simple de una población
distribuida de manera normal, y pruebe la aseveración dada.

Pelotas de béisbol. En pruebas anteriores, se dejaron caer pelotas de béisbol desde una altura
de 24 pies sobre una superficie de concreto; las pelotas rebotaron un promedio de 92.84
pulgadas. En una prueba realizada a una muestra de 40 pelotas nuevas, la altura del rebote
tuvo una media de 92.67 in, con una desviación estándar de 1.79 in (según datos de
Bookhaven National Laboratory y USA Today). Utilice un nivel de significancia de 0.05 para
determinar si existe evidencia suficiente para sustentar la aseveración de que las nuevas
pelotas tienen rebotes con una media distinta a 92.84 in. ¿Parecería que las pelotas son
diferentes?

Solución:

H0 : μ=92,84

H1 : μ≠92,84

Nivel de significancia: α=0,05 Z(α/2)= -1,96

Estadístico:

x́−μ 92,67−92,84
Z= = =−1,015
S /√ n 1,79/ √ 40

Como Z= -1,015 > Z(α/2)= -1,96 , entonces no se rechaza H0.

Con un nivel de significancia del 5%, podemos afirmar que las nuevas pelotas tienen la misma
media en las alturas de rebote que las pelotas antiguas, con un valor de 92,84in.

Pregunta 5 (2pto)

Pruebe la aseveración dada. Identifique la hipótesis nula, la hipótesis alternativa, el estadístico


de prueba, el valor P o el valor (o valores) crítico(s), la conclusión sobre la hipótesis nula y la
conclusión final referente a la aseveración original.

Selección del género para niñas. El Genetics and IVF Institute llevó a cabo un ensayo clínico del
método XSORT, diseñado para incrementar la probabilidad de concebir una niña. El año
pasado, ya habían nacido 325 bebés de padres que utilizaron el método XSORT, y 295 de ellos
fueron niñas. Utilice los datos muestrales con un nivel de significancia de 0.01 para probar la
aseveración de que, con este método, la probabilidad de que un bebé sea niña es mayor que
0.5. ¿Parece que el método funciona?

Solución:

H0 : p=0,5

H1 : p>0,5

Nivel de significancia: : α=0,01 Z(α)= 2,33


P = 295/325 = 0,9077

Estadístico:

P− p 0,9077−0,5
Z= = =14,6998
√ pq/n √(0,5)(0,5)/325

Como Z= 14,6998 > Z(α)= 2,33 , entonces se rechaza H0.

Con un nivel de significancia del 1%, podemos afirmar que la probabilidad de que un bebé sea
niña utilizando el método XSORT es mayor que 0.5, por lo que el método es efectivo.

Pregunta 6 (2pto)

Métodos de encuesta telefónica. En un estudio sobre la exactitud de las encuestas telefónicas,


720 personas se rehusaron a responder cuando formaron parte de los 1720 individuos
incluidos en una encuesta “estándar” de 5 días. En el mismo estudio, 429 personas se
rehusaron a responder cuando formaron parte de los 1640 individuos incluidos en una
encuesta “rigurosa” de 8 semanas. (Los datos se basan en resultados de “Consequences of
Reducing Nonresponse in a National Telephone Survey”, de Keeter et al., Public Opinion
Quarterly, vol. 64, núm. 2). Utilice un nivel de significancia de 0.01 para poner a prueba la
aseveración de que el porcentaje de negativas es menor en la encuesta rigurosa. ¿Al parecer la
encuesta rigurosa produce resultados más exactos?

Solución:

P1 : Individuos incluidos en la encuesta “estándar”.

P2 : Individuos incluidos en la encuesta “rigurosa”.

Hipótesis: H0: p1 - p2=0

H1: p1 – p2>0

Nivel de significancia: α=0,01 Z(α)= 2,33

P1 = 720/1720 = 0,4186 n1=1720

P2 = 429/1640 = 0,2616 n2=1640

720+429
ṕ= =0,34 2
1720+1640
q́=0,658

Estadístico:

( P1−P2)−( p1− p 2) (0, 4186−0, 2616)−0


Z= = =9 ,5894

√ ṕ q́ ṕ q́
+
n1 n 2 √ ( 0,342)(0,658) (0,342)(0,658)
1720
+
1640

Como Z= 9,5894 > Z(α)= 2,33 , entonces se rechaza H0.


Con un nivel de significancia del 1%, podemos afirmar que el porcentaje de negativas es menor
en la encuesta rigurosa, por ende la encuesta rigurosa produce resultados más exatos.

Pregunta 7 (2pto)

Puntuaciones de CI de gemelos separados al nacer. Se obtuvieron las puntuaciones de CI de


gemelos separados al nacer, elegidos al azar. Para 20 de estos gemelos, el coeficiente de
correlación lineal es 0.870 y la ecuación de la recta de regresión es ý =-3.22 + 1.02x, donde x
representa la puntuación de CI del gemelo que nació primero. Asimismo, los 20 valores de x
tienen una media de 104.2 y los 20 valores de y tienen una media de 103.1. ¿Cuál es el mejor
CI predicho de un gemelo que nació en segundo lugar, dado que el gemelo que nació primero
tiene un CI de 110?

Como vemos el coeficiente de correlación positivo alto, con un valor de 0,870, es decir que
cuanto mayor sea la puntuación de CI del gemelo que nació primero, mayor será la puntuación
de CI del gemelo que nació segundo.

Entonces según la recta de regresión, podemos estimar el mejor CI predicho para el gemelo
que nació en segundo lugar, para un valor de x=110:

^y =−3,22+1,02 x=−3,22+1,02(110)=108,98≈ 109

Por lo tanto, el mejor CI predicho de un gemelo que nació en segundo lugar, dado que el
gemelo que nació primero tiene un CI de 110 es de 109 CI.

Pregunta 8 (2.5pto)

A partir de la observación de cinco años de las variables producción industrial (y) en millones
de toneladas y el tiempo (x):

a) Grafique el diagrama de dispersión.


Producción Industrial (millones de toneladas)
35
30.5
30

25
20
20

15
11.25
10
5
5
1.25
0
2010 2011 2012 2013 2014 2015 2016

b) Identifique el mejor modelo matemático (lineal, cuadrático, exponencial, logarítmico o


potencial) que mejor se ajuste a los datos de la tabla. Argumente su respuesta.

Usando Excel, gráficamos los modelos matemáticos con sus respectivas ecuaciones y
coeficiente de determinación.

Modelo lineal
35
30.5
30

25
f(x) = 7.35x - 8.45
R² = 0.97
20
20

15
11.25
10
5
5
1.25
0
0 1 2 3 4 5 6
Modelo cuadrático
35
30.5
30
f(x) = 1.14x^2 + 0.49x - 0.45
25 R² = 1
20
20
15 11.25
10
5
5 1.25
0
0 1 2 3 4 5 6

Modelo exponencial
35
f(x) = 0.82 exp( 0.78 x ) 30.5
30 R² = 0.94

25
20
20

15
11.25
10
5
5
1.25
0
0 1 2 3 4 5 6

Modelo logarítmico
35
30.5
30

25
f(x) = 17.04 ln(x) - 2.72 20
20 R² = 0.84

15
11.25
10
5
5
1.25
0
0 1 2 3 4 5 6
Modelo potencial
35
30.5
30
f(x) = 1.26 x^1.99
R² = 1
25
20
20

15
11.25
10
5
5
1.25
0
0 1 2 3 4 5 6

El mejor modelo matemático será aquel que tenga mayor coeficiente de determinación, en
este caso será el modelo potencial cuyo coeficiente de determinación es 1.

c) Realice una predicción para el año 2017.

Para predecir la producción industrial para el año 2017 usaremos la ecuación potencial:

Para el año 2017, el valor de x sera 7.

y=1,2557(7)1,9902 =60,367

Entonces, para el año 2017 se espera una producción industrial de 60,367 millones de
toneladas.

Pregunta 9 (2.5pto)

Ejercicio y estrés. Se realizó un estudio para investigar los efectos del ejercicio sobre el estrés.
En la siguiente tabla se listan las lecturas de la presión sanguínea sistólica (en mmHg) de
sujetos, antes de iniciar 25 minutos de ejercicio aeróbico en bicicleta y antes de generarles
estrés por medio de una prueba de aritmética y otra de expresión verbal (según datos de
“Sympathoadrenergic Mechanisms in Reduced Hemodynamic Stress Responses after Exercise”,
de Kim Brownley et al., Medicine and Science in Sports and Exercise, vol. 35, núm. 6). Utilice un
nivel de significancia de 0.05 para probar la aseveración de que los diferentes grupos de sujetos
tienen la misma presión sanguínea media. Con base en los resultados, ¿se puede considerar
que los grupos provienen de la misma población?
Solución:

Hipótesis: H0: La media de las presiones sanguíneas no difieren para cada tipo de grupo.

H1: No todas las medias de las presiones sanguíneas en cada tipo de grupo son

iguales.

Nivel de significancia: α=0,05

n=24 k=4 entonces F(k-1;n-k)=F(3;20)=3,1

Hallamos los datos:

SCE=6(105,39−113,72)2+6 (122,11−113,72)2 +6 (111,94−113,72)2 +6(115,44 −113,72)2=875,61

TABLA ANOVA

Fuente de variación Suma de cuadrados g.l Cuadrados medios


Entre grupos SCE=875,61 4-1=3 875,61/3=291,87
Dentro de grupos SCD=2358,61 24-4=20 2358,61/20=117,93
TOTAL SC(total)=3234,22

Hallamos la razón F: Fc= 291,87/117,93 = 2,4749

Como Fc=2,4749< F(3;20)=3,1 , entonces no se rechaza H0.

Con un nivel de significancia del 5%, podemos afirmar que la media de las presiones
sanguíneas no difieren para cada tipo de grupo, por lo tanto podemos decir que provienen de
la misma población,

Pregunta 10 (3 pto)

Un fabricante de triciclos selecciona diariamente al azar 8 armazones y determina la cantidad


de defectos. El número de armazones defectuosos encontrado en los últimos 15 días es: 4; 3; 2;
4; 3; 3; 9; 3; 1; 4; 6; 3; 0; 5; 3. Elabore un diagrama de control para este proceso y determine si
está “bajo control”.

Proporción de
Muestra Nº inspeccionado Nº defectuosos
defectos
1 8 4 0,5
2 8 3 0,375
3 8 2 0,25
4 8 4 0,5
5 8 3 0,375
6 8 3 0,375
7 8 8 1
8 8 3 0,375
9 8 1 0,125
10 8 4 0,5
11 8 6 0,75
12 8 3 0,375
13 8 0 0
14 8 5 0,625
15 8 3 0,375
TOTAL 120 52

ṕ=52/120=0,4333

LCS=0,4333+3
√ 0,4333(1−0,4333)
8
=0,9589

LCI=0,4333−3
√ 0,4333(1−0,4333)
8
=−0,0922
Diagrama de control para las proporciones
1.2
1
1

0.8 0.75
0.63
0.60.5 0.5 0.5
Proporción de defectos 0.38 0.380.38 0.38 0.38 0.38
0.4
0.25
0.2 0.13
0
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
-0.2
Muestras

Se observa que la proporción de defectos de la muetra 7 esta fuera de control estadístico, no


esta bajo control debido a que la proporción de defectos que él muestra es de 1 o 100%, cifra
que se encuentra fuera del límite superior de control.

También podría gustarte