Separata de Estadistica 2020
Separata de Estadistica 2020
Separata de Estadistica 2020
Axiomas de Probabilidad
1. Para todo evento A, 0 P (A) 1
2. P (S) = 1
3. Si A y B son eventos mutuamente exclusivos, entonces
P (A U B) = P (A) + P (B)
4. Si A1, A2,…, es una serie de eventos mutuamente exclusivas, entonces
P (A1 U A2,…) = P (A1) + P (A2) +…
Teorema 1: Si es el conjunto vacío, entonces P () = 0
Teorema 2: SI AC es el complemento de un evento A, entonces
P (AC) = 1 – P (A)
Teorema 3: Si A y B son dos eventos A B
P (A B) = P (A) + P (B) - P (A B)
Probabilidad condicional:
Sea E un evento arbitrario de un espacio muestral S con P(E) > 0. La probabilidad de
que un evento A sucede una vez que E haya sucedido o, en otras palabras. La
probabilidad condicional de A dado E, escrito P (A/E), se define como sigue:
1
Teorema 4: P (E A) = P (E) . P(A/E) , si A depende de E
Independencia:
; K = 0 , 1 , 2 , … , n.
es el coeficiente binomial
2
EJERCICIOS DE PROBABILIDAD
1) Una clase consta de 10 hombres y 20 mujeres de los cuales la mitad de los
hombres y la mitad de las mujeres tienen los ojos castaños. Hallar la
probabilidad de que una persona escogida al azar sea un hombre o tenga los ojos
castaños.
2) Una clase está formada por 5 estudiantes de primero, 4 de segundo, 8 de
penúltimo y 3 de último año. Se escoge un estudiante al azar para representar la
clase. Hallar la probabilidad de que el estudiante sea, (i) de segundo, (II) de
último año, (iii) de penúltimo o de último año.
3) De las 10 niñas de una clase, 3 tiene ojos azules. Si se escogen dos niñas al azar,
¿Cuál es la probabilidad de que, (i) las dos tengan ojos azules? (ii) ninguna tenga
ojos azules (iii) una por lo menos tenga ojos azules?.
4) Tres tornillos y tres tuercas están en una caja. Si se escogen dos piezas al azar,
hallar la probabilidad de sacar un tornillo y una tuerca.
5) Una clase consta de 6 niñas y 10 niños. Si se escoge al azar un comité de 3,
hallar la probabilidad de, (i) seleccionar tres niños, (ii) seleccionar exactamente
2 niños (iii) seleccionar por los menos un niño (iv) seleccionar exactamente 2
niñas.
6) Tres niños y 3 niñas se sientan en fila. Hallar la probabilidad de que, (i) las tres
niñas se sienten juntas, (ii) los niños y las niñas se sienten alternados.
7) Una urna contiene 13 fichas, de las cuales, 6 fichas están numeradas con 15,
cuatro numeradas con 10 y tres numeradas con 5. Si de esta urna se escogen 3
fichas al azar y a la vez calcular la probabilidad de que:
a. Al menos dos de ellas tengan el mismo número.
b. La suma de las tres fichas sea 30.
8) En cierta facultad, 25% de los estudiantes perdieron matemáticas, 15% perdieron
química y 10% perdieron las dos. Se selecciona un estudiante al azar.
(i) Si perdió química ¿Cuál es la probabilidad de que perdió matemáticas?
(ii) Si perdió matemáticas, ¿Cuál es la probabilidad de que perdió química?
(iii) ¿ Cuál es la probabilidad de que perdió matemática o química?
3
9) Tres máquinas A, B y C producen respectivamente 60%, 30% y 10% del número
total de artículos de una fábrica. Los porcentajes de desperfectos de producción
de estas máquinas son respectivamente 2%, 3% y 4%. Seleccionado un artículo
al azar resultó defectuoso. Hallar la probabilidad de que el artículo hubiera sido
producido por la máquina C.
10) En cierta facultad, 4% de los hombres y 1% de las mujeres tienen más de 6 pies
de estatura. Además, 60% de los estudiantes son mujeres. Ahora bien si se
selecciona al azar un estudiante y es más alto que 6 pies, ¿Cuál es la
probabilidad que el estudiante sea hombre?
11) Un lote contiene 12 artículos de los cuales 4 están defectuosos. Se sacan del lote
tres artículos al azar uno tras otro. Encuentre la probabilidad de que los 3
artículos no estén defectuosos.
12) Una clase de 16 hombres y 24 mujeres, de los cuales la mitad de los hombres y
la mitad de las mujeres tienen ojos cafés. Encuentre la probabilidad de que una
persona seleccionada al azar sea un hombre o tenga ojos cafés.
13) El 70% de los alumnos de un Instituto privado son mujeres, y el 20% de ellas
son solteras. Por otro lado, él 40% de lo varones son solteros. Se elegí al azar un
alumno del Instituto. ¿Cuál es la probabilidad de que será soltero?.
14) Los profesores de la Universidad Privada San Juan Bautista, sé clasifican de la
siguiente manera: 15% tienen doctorado; 60% maestría y el 25%tienen
licenciatura. Él 60% de los doctores, 80% de los maestritas y 25% de los
licenciados son varones. Se elige al azar a un profesor y resulta ser mujer. ¿Cuál
es la probabilidad que sea doctora?.
15) Supongamos que se echan dos dados al mismo tiempo ¿Cuál es la probabilidad
de no obtener un doble?
16) Se echa un dado perfecto. Demuestre que la probabilidad de obtener un número
par o un número divisible por 3 es 2/3.
17) Supongamos que una rifa consiste de 1000 boletos. En esta rifa un boleto se
premia con $500,dos con $250,cinco con $100,cien con $5,y los demás no se
premian .Si se adquiere un boleto de la rifa, calcular la probabilidad de:
a) ganar alguno de los premios
b) ganar a lo mas $ 100
c) no ganar premio alguno.
4
18) Un club consiste de ciento cincuenta miembros. Del total, 3/5 son hombres y 2/3
son profesionales. Además, 1/3 de las mujeres son no profesionales.
5
Se elige al azar un socio del club.
a) Calcular la probabilidad de que sea hombre y profesional.
b) Calcular la probabilidad de que sea hombre, dado que es profesional.
19) Las probabilidades de que los socios A y B sean elegidos presidente de su club
son respectivamente 0,4 y 0,6.Las probabilidades de que se aumenten las cuotas
mensuales de los socios son de 0,9 se sale elegido A y de 0,2 si sale elegido B.
A) ¿Cuál es la probabilidad de que haya un aumento en las cuotas mensuales
de los socio?.
B) Si se aumenta la cuota mensual, ¿Cómo se modifican las probabilidades
de que salgan elegidos los socios A y B?.
20) Se sabe que el 30% de las lavadoras de cierta compañía requiere servicio cuando
están todavía en garantía, en tanto que sólo 10% de las secadoras necesitan ese
servicio. Si alguien compra una lavadora y una secadora hechas por esta
compañía.
a. ¿Cuál es la probabilidad de que ambas máquinas necesitan servicio
dentro de garantía?
b. ¿Cuál es la probabilidad de que ninguna de las dos maquinas necesiten
servicio dentro de garantía?
21) Supongamos que el 60% de la clase de primer año de una universidad son
mujeres. Además, supongamos que el 25% de los hombres y el 10% de mujeres
de la clase están estudiando matemáticas. Se elige al azar un estudiante de
primer año. Halle la probabilidad de que:
a. El estudiante éste estudiando matemáticas.
b. Si el estudiante esta estudiando matemáticas determinar la probabilidad
de que el estudiante sea mujer.
6
23) En una empresa comercial trabajan 8 hombres y 18 mujeres, de las cuáles la
mitad de los hombres y la mitad de las mujeres han nacido en Lima. Hallar la
probabilidad de que un trabajador elegido al azar sea hombre o que haya nacido
en Lima.
25) El equipo A tiene probabilidad de 2/3 de ganar, siempre que éste juegue.
Suponga que A juega 4 veces. Encuentre la probabilidad de que A gane más de
la mitad de sus juegos.
26) Suponga que el 20% de los artículos producidos por una fábrica están
defectuosos. Suponga que se seleccionan 4 artículos al azar. Encuentre la
probabilidad de que:
a. 2 estén defectuosos,
b. 3 estén defectuosos,
c. ninguno estén defectuosos.
a. 2 ganen?
b. 2 pierden?
c. por lo menos dos pierden?
d. como máximo 6 ganen?
e. 6 pierdan el semestre?
7
28) Se sabe que una manufactura de cierto articulo, uno de cada diez resulta
defectuoso. ¿Cuál es la probabilidad de que una muestra aleatoria de cuatro
artículos contenga:
a. Ninguno defectuoso?
b. Exactamente uno defectuoso?
c. Exactamente dos defectuosos?
d. No más de dos defectuosas?
29) Según los registros universitarios, fracasan el 5% de los alumnos de cierto curso.
¿Cuál es la probabilidad de que de 6 estudiantes seleccionados al azar, que
hayan seguido dicho curso, menos de 3 hayan fracasado?
2 (X – 1) 1<X<2
f(x) =
0
33) La altura promedio de las mujeres en el grupo de primer año de una institución
de enseñanza superior es de 162, 5 centímetros con una desviación estándar de
6,9 centímetros. ¿Hay alguna razón para creer que existe un cambio en la altura
promedio si una muestra aleatoria de 50 mujeres del grupo actual tiene una
altura promedio de 165,2 centímetros?
8
34) Las calificaciones de un grupo de estudiantes en su reporte del medio año (X) y
en los exámenes finales (y) fueron las siguientes:
X 77 50 71 72 81 94 96 99 67
Y 82 66 78 34 47 85 99 99 68
35) Se lanza una moneda de tal forma que una casa tiene la posibilidad de ocurrir
dos veces más que una cruz. Si la moneda se lanza 3 veces al aire, ¿Cuál es la
probabilidad de obtener 2 cruces y 1 cara?
9
DISTRIBUCIÓN NORMAL
x
µ
2
1 1 x
y e
2 2 ………………… (1)
PROPIEDADES DE LA DISTRIBUCIONES
NORMALES
10
DISTRIBUCIÓN NORMAL ESTÁNDAR
11
Si la variable aleatoria X tiene distribución normal entonces, la variable
aleatoria estándar tiene distribución normal N(0,1).
En efecto, la variable estándar Z tiene media igual a cero y varianza igual a uno, esto es,
E(Z)=0 y var (Z)=1.
Sea X1, X2, …, Xn una muestra aleatoria de tamaño n escogida de una población f(x)
con media y con varianza 2 si es la media muestral, entonces, E ( )=
a)
b)
12
c) Se deduce el teorema del límite central escribiendo
NOTAS:
1. La varianza de la media:
de muestra n 2.
13
DIAGRAMA DE FLUJO PARA CALCULAR EL ERROR ESTÁNDAR DE LA MEDIA
Comienzo
Use
¿Es la población Si
infinita? x
n
No
¿Se muestrea Si
con reemplazo?
No
¿Es Si
N ≥ 20n?
Use
No Nn
x
n N 1
14
FUNCIÓN DE DENSIDAD NORMAL
15
MUESTREO DE UNA POBLACIÓN NORMAL
Estadístico
Nota:
Error de estimación:
E=
N tamaño de la población. E=
Estadístico t
Estadístico: Z
16
EJERCICIOS DE DISTRIBUCIÓN MUESTRALES
1. En una población normal, con media 72,1 y desviación estándar 3,1, encuentre la
probabilidad de que en una muestra de 90 observaciones, la media sea menor
que 71,7.
3. Ciertos tubos fabricados por una compañía tienen una duración media de 900
horas y una desviación típica de 70 horas. Hallar la probabilidad, al seleccionar
al azar 36 tubos, de que tengan una duración media entre 870 y 925 horas.
6. En cierta facultad de una universidad de Lima 1/6 de los alumnos son mujeres.
Si se extrae una muestra aleatoria de 200 estudiantes de la facultad ¿Cuál es la
probabilidad de que el 20 % o más sean mujeres?
17
FORMULAS PARA HALLAR EL TAMAÑO DE LA MUESTRA:
………….. si p = q = 0,5
n→ Tamaño de la muestra
N → Tamaño de la población
p→ proporción de la muestra
P→ proporción de la población
σ→ Desviación estándar de la población
→ Media de la muestra
→ Media de la población
E→ Error de Estimación.
18
EJERCICIOS DE MUESTREO
1. ¿Qué tamaño de muestra es necesario, si se considera una confianza del 90%
para la proporción de la población, y el error es del 8%?.
2. Entre los estudiantes de cierta universidad privada, se desea tomar una muestra
aleatoria para estimar la proporción de alumnos que utilizan la biblioteca. El
error debe conservarse en un 4%, con un riesgo del 0,045. ¿Cuál es el tamaño de
la muestra, si la universidad tiene 3200 alumnos matriculados?.
3. En un barrio residencial se espera que el 60% de las familias tengan vehículo
propio. Se desea hacer una investigación para estimar la proporción de familias
propietarias de vehículo, con un intervalo de confianza cuya amplitud no sea
mayor de 0,03, y con nivel de confianza del 95,5%. Determinar el tamaño de la
muestra.
4. Una universidad desea ofrecer una nueva carrera profesional; para ello debe
calcular la proporción de alumnos del último año de Secundaria que piensa
estudiar dicha carrera. ¿Qué tamaño, debe tener la muestra si su estimación debe
estar a 0,03 del valor verdadero, con 95% de confianza?.
a) El año anterior el 20% de los alumnos encuestados se inclinaba por una carrera
similar.
b) El número de alumnos que cursan el último semestre en la ciudad donde se
realiza la investigación es de 6000.
5. Una organización grande de maestros quiere estimar el porcentaje de sus
miembros que están a favor de un contrato colectivo, asegurándose que el error
de estimación será a lo más del 1,5% con un nivel de confianza del 95 por
ciento.
a) Si no se dispone de una estimación previa de p, ¿Cuál debe ser el tamaño de la
muestra?.
b) Si una muestra preliminar de 200 maestros indicó que el 65% estaba a favor del
contrato colectivo, ¿Cuántos maestros más deberán entrevistarse?
6. El total de tiempo que un doctor dedica a sus pacientes tiene una desviación
estándar de aproximadamente 7,8 minutos. Si queremos estimar la media del
tiempo que el doctor dedica a sus pacientes, encuentre el tamaño de muestra
necesario para tener un 88% de confianza en que la media verdadera difiera
menos de 2,5 minutos de la estimada.
19
INTERVALOS DE CONFIANZA PARA MEDIAS (n ≥ 30)
p + q =1
20
EJEMPLOS
1. Una muestra de 100 votantes elegidos al azar entre todos los de un barrio,
indicaba que el 45 % de ellos estaban a favor de un candidato. Hallar los límites
de confianza del 95 %.
Solución:
1,00 0,99 1,01 1,00 0,98 0,99 0,99 1,02 1,01 1,09
21
Estime con un 90% de confianza los límites de la media ().
Solución:
2E 0,10
9 1,83
Solución:
8.11
-20,11
-20,11 8,11
22
2
2
99 %
0,005 0,005
-2,705 2,705
23
4. El director de una editorial de textos para secundaria, debe decidir sobre la
publicación de un texto, siempre que las preferencias entre los colegios privados
y públicos, sean iguales. Selecciona dos muestras de tamaño 10 y 18
respectivamente, encontrando aceptación de 6 y 10 colegios. De acuerdo a estos
resultados fijar limites de confianza del 90% para la diferencia.
Solución:
n2 = 18
g1 = n1 + n2 – 2
p1 = 0,60 p2 = 0,56 g1 = 26
I.C.
=
=
=
=
-0,29 (P1 – P2) 0,37 2E 0,10
26 1,706
-1,706 0 1,706
24
EJERCICIOS DE INTERVALOS DE CONFIANZA
1.- De una remesa, de la cual se tomo una muestra de 200 artículos, se encontró que
20 de ellos eran defectuosos. Con una confianza del 95%, calcular el error de la
muestra.
3.- Se selecciona una muestra aleatoria de familias para estimar el ingreso promedio
diario. El error debe estar en el rango de $2000,con un riesgo de 0,045.,De que
tamaño debe ser seleccionada la muestra?. La desviación estándar ha sido
calculada en $8000.
4.- Suponga que la estatura media de los hombres tiene una desviación estándar de
2,48 centímetros. Se miden 100 estudiantes, hombres, elegidos aleatoriamente, y
se obtiene una estatura media de 168,52 centímetros. Determine los límites de
confianza del 99% para la estatura media de los hombres de esta universidad.
5.- Una investigación efectuada a 400 familias de clase media revelo que en la
realización de fiestas familiares, un 62% prefería el aguardiente a cualquier otra
clase de licor. Determine los límites de confianza del 99%.
Obténgase un intervalo de confianza del 95% para estimar el peso neto medio de
los frascos de café instantáneo.
25
HIPÓTESIS NULA Y ALTERNATIVA
Definición:
Se denomina hipótesis nula y se representa por H0, a la hipótesis que es aceptada
provisionalmente como verdadera y cuya validez será sometida a comprobación
experimental. Los resultados experimentales nos permitirán seguir aceptándola como
verdadera o si, por el contrario, debemos rechazarla como tal.
Toda la hipótesis nula va acompañada de otra hipótesis alternativa.
Definición.
Se denomina hipótesis alternativa y se representa por H1 o por Ha, a la hipótesis
que se acepta en caso de que la hipótesis nula H 0 sea rechazada. La hipótesis alternativa
Ha, es una suposición contraria a la hipótesis nula.
ERRORES TIPO I Y TIPO II, Y NIVEL DE SIGNIFICACIÓN
Definición: Se denomina error tipo 1, al error que se comete al rechazar una hipótesis
nula H0 cuando ésta realmente es verdadera.
Definición: Se denomina error Tipo II, al error que se comete al aceptar una hipótesis
nula H0 cuando en realidad es falsa.
Definición. Se denomina nivel de significación de una prueba de hipótesis a la
probabilidad de cometer un error de tipo 1.
26
PRUEBA BILATERAL O DE DOS COLAS
Ej.: Z=
27
PRUEBA UNILATERAL DE COLA A LA DERECHA
Ej.: Z=
28
PRUEBA UNILATERAL DE COLA A LA IZQUIERDA
Ej.: Z=
29
Ejemplos:
1. Supongamos que una persona quiere tener desconectado su teléfono, si el
promedio de llamadas que hace al día es menor de 12. Elige aleatoriamente 10
días y anota el número de llamadas, así:
4 6 8 2 12 20 22 10 12 4
Utilizando = 0,05, ¿Debería retirar el teléfono?
Solución
1° Como el parámetro de interés es la media o promedio, fijemos la
hipótesis nula y la alternativa:
HO: ≥ 12
Ha: < 12
2º El nivel de significación es = 0,05
3º Como la muestra es pequeña n = 10, y no se conoce la varianza de la
población, se usa la distribución t-student. luego la estadística de prueba
es:
usando la tabla de la t.
30
6° Toma Decisión
Como tc € Z.A. por lo tanto al nivel de significación del 5%, no debería
desconectarse el teléfono.
µ = 78
µ = 78
Z.A. Z.R.
2,33
Unilateral
Derecha
31
6º Tomar la decisión
Zc Z. A. Luego
Se acepta Ho
2º Nivel de Significación
= 0,01
32
4º Tomar la decisión
Se acepta la hipótesis de que el 80% de estudiantes tienen ingreso
mensual superior a S/.. 650 al nivel 1%.
33
Solución:
Estudiantes x y d=y–x (d – d) (d – d)2
1 80 84 +4 1 1
2 50 56 +6 3 9
3 78 81 +3 0 0
4 90 92 +2 -1 1
5 75 76 +1 -2 4
6 70 75 +5 2 4
7 62 72 + 10 7 49
8 90 87 -3 -6 36
9 95 93 -2 -5 25
10 68 72 4 1 1
d = + 30 130
34
Media de diferencia:
1. Ho : d 0
Ha : d > 0
2. = 0.05
3.
4.
5.
35
5. Se compararon los métodos de enseñanza de estadística, A y 8, con dos grupos
aleatorios de estudiantes. Al término de la instrucción experimental, cada grupo
presentó el mismo examen de conocimiento; las calificaciones de cada uno son
muestras aleatorias de dos poblaciones normales con varianzas iguales.
Encuentre el valor del estadístico t y sus grados de libertad asociadas si
suponemos, 1 = 2.
36
Calcule con = 0,05 si 1 2.
Solución:
1) Formulación de las hipótesis
Hp : 1 = 2.
Ha : 1 2.
3) El estadístico t es:
37
Sp = 3,31
Tc = 5,93
6) Toma decisión:
38
EJERCICIOS DE ESTADÍSTICA INFERENCIAL
1. Una organización grande de maestros quiere estimar el porcentaje de sus
miembros que están a favor de un contrato colectivo, asegurándose que el error
de estimación será a lo más del 1,5 % con un nivel de confianza del 95 por
ciento.
a) Si no se dispone de una estimación previa de p, ¿cuál debe ser el tamaño
de la muestra?
b) Si una muestra preliminar de 200 maestros indicó que 65 % estaba a
favor del contrato colectivo, ¿Cuántos maestros más deberán
entrevistarse?,
3. Suponga que la estatura media de los varones tiene una desviación estándar de
2,48 centímetros. Se miden 100 estudiantes, varones, elegidos aleatoriamente y
se obtiene una estatura media de 168,52 centímetros. Determine los límites de
confianza del 99 % para la estatura media de los varones de esta universidad.
4. Una muestra de 100 votantes elegidos al azar entre todos de un barrio, indicaba
que el 45% de ellos estaban a favor de un candidato. Hallar los limites de
confianza del 95%, para toda la población de dicho barrio.
39
6. Se someten a una prueba 28 alumnos de un curso de estadística, para determinar
las diferencias de rendimiento entre hombres y mujeres. Las 18 mujeres tienen
un puntaje medio de 15 con una desviación estándar de 4 y los 10 hombres, una
media de 12 con una desviación estándar de 2.
¿Cuáles son los límites de confianza del 99% para la diferencia entre los
puntajes medios de los hombres y las mujeres?
0 2 1 1 2
Utilizando = 0,05, ¿Debería retirar el teléfono?
40
A un nivel de significación del 5%, ¿hay alguna relación entre sexo y la
aprobación de curso?
11. Un Jefe de Personal está dispuesto a contratar una secretaria para ocupar un
puesto a menos que ella corneta más de 8 equivocaciones por página
mecanografiada. Se elige una muestra aleatoria de 5 páginas de las escritas por la
aspirante. Las equivocaciones por página son: 18, 14, 10, 2 y 6. Utilizando =
0,01. ¿ Qué decisión se debe tomar?.
12. Suponga que la estatura media de los hombres tiene una desviación estándar de
3,2 centímetros. Se miden 64 estudiantes, hombres elegidos aleatoriamente, y se
obtiene una estatura media de 168 centímetros. Determine los límites de
confianza del 99 % para la estatura media de los hombres de esta Universidad.
13. ¿Qué tamaño deberá tener una muestra para estimar dentro del 3 %, la
proporción de mujeres casadas que van periódicamente a consulta ginecológica,
en una población de 5000 mujeres y una seguridad del 95 %?.
14. Un Jefe de Personal está dispuesto a contratar una secretaria para ocupar un
puesto a menos que ella corneta más de 8 equivocaciones por página
mecanografiada. Se elige una muestra aleatoria de 5 páginas de las escritas por la
aspirante. Las equivocaciones por página son: 18, 14, 10, 2 y 6. Utilizando
= 0,05. ¿Qué decisión se debe tomar?
15. Suponga que la estatura media de los hombres tiene una desviación estándar de 9
centímetros. Se miden 81 estudiantes, hombres elegidos aleatoriamente, y se
obtiene una estatura media de 170 centímetros. Determine los límites de
confianza del 97% para la estatura media de los hombres de esta Universidad.
16. Qué tamaño deberá tener una muestra para estimar dentro del 4%, la proporción
de mujeres casadas que van periódicamente a consulta ginecológica, en una
población de 10000 mujeres y una seguridad del 89,9 %?.
41
17 Un Jefe de Personal está dispuesto a contratar una secretaria para ocupar un
puesto a menos que ella corneta más de 12 equivocaciones por página
mecanografiada. Se elige una muestra aleatoria de 10 páginas de las escritas por
la aspirante. Las equivocaciones por página son: 12, 14, 10, 8, 15 , 5, 7, 13, 10 y
6. Utilizando = 0,05. ¿ Qué decisión se debe tomar?.
18. Suponga que la estatura media de los hombres tiene una varianza de 9
centímetros. Se miden 49 estudiantes, hombres elegidos aleatoriamente, y se
obtiene una estatura media de 165 centímetros. Determine los límites de
confianza del 75,8 % para la estatura media de los hombres de esta Universidad.
19. ¿Qué tamaño deberá tener una muestra para estimar dentro del 2,5 %, la
proporción de mujeres casadas que van periódicamente a consulta ginecológica,
en una población de 20000 mujeres y una seguridad del 99,8 %?.
42
23. Con referencia a la tabla:
43
ELECCIÓN DEL ENSAYO ESTADÍSTICO ADECUADO PARA
SI Utilizar prueba de Z
¿Se conoce
?
SI
NO Utilizar prueba de Z
¿Es n> 30?
SI Utilizar prueba de Z
NO
¿Se conoce
?
SI
NO Utilizar prueba de t
44
Si a, b1 y b2 son las incógnitas para resolver hay que hallar las ecuaciones normales.
…………………….. (i)
…………(ii)
…………(iii)
Para solucionar obliga a la aplicación del algebra matricial o al manejo de algunos paquetes
estadísticos que contienen programas de regresión (SPSS o MINITAB)
45
EJERCICIOS DE REGRESIÓN LINEAL MÚLTIPLE
8 6 50
Vendedor A B C D E F G H
Cantidad de ventas en ($ 1000) (Y) 9 6 4 3 3 5 8 2
Años de experiencia en ventas (X1) 6 5 3 1 4 3 6 2
Calificaciones en prueba de Inteligencia (X2) 3 2 2 1 1 3 3 1
Calcular:
a) La ecuación de Regresión Múltiple.
b) La desviación estándar de regresión.
c) El coeficiente de determinación y el coeficiente de correlación.
REGRESIÓN Y CORRELACIÓN
46
CALCULO DE LOS PARÁMETROS: a y b
Y = an + bX
XY = a X + b X2
Nota:
Escribir y* = a + bx significa que y* es un valor estimado de Y. El error e estaria dado
por: e = y - y*, entonces el valor real de Y es:
Y = a + bx + e
Ejemplo
Supongamos que se quiere estimar la relación entre ingreso y consumo, para el efecto se
eligió un muestra de 6 familias.
47
i. Resolver las ecuaciones normales como un sistema de ecuaciones
simultáneas, por el método de sumas y restas.
Y = an + bX
X Y = a X + b X2 …………………..(I)
Cuadro N° 01
INGRESO Y CONSUMO DE UNA MUESTRA DE 6 FAMILIAS
INGRESO CONSUMO
XY X2 Y2
X Y
35 30 1050 1225 900
40 35 1 400 1 600 1 225
38 30 1140 1444 900
55 50 2750 3025 2500
42 35 1470 1764 1225
60 50 3000 3600 2500
270 230 10810 12658 9250
X Y XY X2 Y2
48
reemplazando valores de las sumatorias:
Y* = -2,4142 + 0,9055 X
Regresión Lineal
49
……. coeficiente de regresión cuando X es V. i.
… La varianza residual.
TOTAL n-1
50
….. Varianza de b
…. Desviación estándar de b.
Coeficiente de Correlación
r2 = Coeficiente determinación.
1 - r2 = Coeficiente de no determinación
51
v. Coeficiente de correlación:
El coeficiente de correlación, es el estadígrafo que expresa o mide el grado de
asociación o afinidad entre las variables relacionadas, se denota por “r” y se
define como:
Ejemplo:
Un coeficiente de correlación basado en una muestra de tamaño 18 resultó ser
0,32. ¿Puede concluirse a un nivel de significación del 0,05 que el coeficiente de
correlación poblacional es apreciable mayor que cero?
Solución: Datos: r = 0,32 n = 12 = 0,05
1) Hp : p 0
5)
Ha : p > 0
tc = 1,35
2) = 0,05
6) tc Z. A
3)
Aceptamos la Hp
p>0 p 0
p0
4)
52
EJERCICIOS DE REGRESIÓN Y CORRELACIÓN
Estudiante A B C D E F
X: horas de estudio 1 2 4 4 7 12
Y: calificación 71 71 74 80 80 86
Se pide:
A. Un diagrama de dispersión para los datos.
B. Encuentre la ecuación de la recta de regresión.
Y=a+bX
C. Dibuje una gráfica de la recta de regresión en el diagrama de dispersión.
D. Determine Y cuando X = 10
E. Calcular el valor del coeficiente de correlación de Pearson (r).
F. Construir una tabla de resumen de ANOVA para los datos.
G. Calcular la varianza residual.
N° de solicitantes (x) 25 6 10 12 25 36
N° de libros vendidos (y) 13 4 8 7 20 18
53
El gerente de la compañía desea saber:
Semanas 1 2 3 4 5 6
Altura de plantas 2,45 2,60 2,78 3,05 3,40 3,47
X 5 8 8 12 7 18 13 5 8 12
Y 0 10 18 20 8 20 16 5 6 6
54
6. Para poder utilizar los resultados de un examen de aptitud para la contratación de
personal obrero, en una fábrica se tomó esta prueba de aptitud y se determinó la
productividad en 10 obreros seleccionados al azar. Los resultados fueron:
Aptitud (X) 12 17 20 13 8 9 11 13 19 10
Productividad (Y) 40 42 32 20 20 7 24 20 40 30
55
Nº de solicitantes (x) 20 8 10 12 30 25
Nº de libros vendidos (y) 13 4 8 6 16 12
a. ¿Cuál será el cambio que se presentará en las ventas, ocasionadas por los
cambios que se presentan en el número de solicitantes?
h. Asuma que los datos son tomados según el modelo al azar, hallar r y determine
su significación estadística.
56
9. Con los siguientes datos:
Se pide:
a. Calcular el coeficiente de correlación.
b. Estimar el valor de
Cuando X = 20 y establecer los límites de confianza del 95%.
10. En una regresión lineal simple, el valor estimado del coeficiente de regresión
11. Se toman aleatoriamente 18 estudiantes del III semestre del I.S.T.P. "José Pardo",
de la especialidad de Computación e Informática y se advierte correlación de - 0,4
entre el ingreso familiar y las horas por semanas dedicadas a ver televisión. ¿A nivel
de significación de 0,01; hay correlación negativa importante para todos los
estudiantes?
57
12. La talla y el peso de cinco varones son como sigue:
Talla (pulgadas) 64 68 70 72 74
58
REGRESIÓN Y
CORRELACIÓN MÚLTIPLE
Cuando se trabaja con más de dos variables independientes, relacionadas entre sí, el
análisis de regresión recibe el nombre de regresión múltiple. El grado de relación que
puede hacer entre estas variables es cuantificado mediante el cálculo del coeficiente de
correlación múltiple.
59
3. Suponga que una compañía grande de productos para el consumidor desea medir
la efectividad de varios tipos de medios de publicidad para promover sus productos.
Específicamente se van a considerar dos medios de publicidad: publicidad en radio y
televisión y publicidad en periódicos (Incluyendo el costo de los cupones de descuento).
Se seleccionó una muestra de 4 unidades con poblaciones más o menos iguales para el
periodo de prueba de un mes. Se asigna un nivel de gasto específico a cada ciudad en
radio y televisión, y en periódicos. Se registraron las ventas de productos (con miles de
dólares) y los niveles de gasto durante el mes de prueba con los siguientes resultados.
4. Suponga que una compañía grande de productos para el consumidor desea medir
la efectividad de varios tipos de medios de publicidad para promover sus
productos. Específicamente se van a considerar dos medios de publicidad:
publicidad en radio y televisión y publicidad en periódicos (Incluyendo el costo
de los cupones de descuento). Se selecciona una muestra de 10 unidades con
poblaciones más o menos iguales para el periodo de prueba de un mes. Se asigna
un nivel de gasto específico a cada ciudad en radio y televisión, y en periódicos.
Se registraron las ventas de productos (con miles de dólares) y los niveles de
gasto durante el mes de prueba con los siguientes resultados.
60
Publicidad en radio y Publicidad en
Ventas (miles
Ciudad televisión Periódicos
de soles)
(Miles de soles) (Miles de soles)
1 6 2 50
2 8 3 60
3 10 7 70
4 8 3 80
5 12 5 100
6 14 6 120
7 8 3 60
8 6 3 80
9 10 4 90
10 10 4 110
Se pide:
a) Establezca la ecuación de regresión múltiple.
b) Interprete el significado de las pendientes en este problema.
c) Pronostique las ventas promedio para una ciudad donde la publicidad de
radio y televisión es de 20 000 nuevos soles y en periódicos de 20 000
nuevos soles.
d) Calcule el coeficiente de determinación múltiple e interprete su
significado.
e) Calcule r2 ajustada.
f) Calcular el error estándar de estimación múltiple.
61
SERIES CRONOLÓGICAS
El interés por estas series radica en que son útiles en muchos trabajos en los que el
tiempo juega un papel preponderante, lo cual ocurre en múltiples aspectos de la
Administración, Economía y muchas otras disciplinas.
Es decir, estudia el comportamiento de una variable (y) a lo largo del tiempo (t). Las
unidades de tiempo más usadas son por lo general de un año, un trimestre, un mes, etc.,
Se elegirán las más adecuadas para el estudio que trate de llevarse a cabo.
Dentro de estas unidades de tiempo, algunas tienen duración constante (horas, días,
etc.), pero otras son variables (meses, años, etc.). Este carácter variable puede influir en
los resultados de algunos estudios, y debe tenerse en cuenta al elegir las unidades de
tiempo.
62
Ejemplo:
1. Un ejemplo de serie cronológica es el comportamiento de las ventas mensuales
de un producto A.
Meses (1989) En Feb Mar Abr May Jun Jul Ag Set Oct Nov Dic
Miles de soles 2750 1382 2425 5673 6842 3285 2850 2950 2540 5025 6352 325
63
2. La gráfica de una serie cronológica es una gráfica de línea, la cual se construye
sobre un sistema de ejes coordenados. En el eje horizontal se ubica la variable
independiente tiempo (años, meses, días, etc.), en el eje vertical los valores de la
variable dependiente Y (ventas, producción, etc.). La Fig. representa la gráfica
de la serie.
EJEMPLO
Los siguientes son ejemplos de series cronológicas de este tipo:
El stock de una fábrica el último día de cada mes. Los meses no tienen la misma
duración, por tanto estas mediciones no están rigurosamente escalonadas.
Las temperaturas registradas por un termómetro a lo largo de un día tomados cada hora.
Observaciones escalonadas.
64
Movimientos Estacionales;
Movimientos cíclicos;
Movimientos irregulares
TENDENCIA SECULAR:
Se entiendo por tendencia secular un movimiento suave, regular y de largo plazo, de las
series estadísticas. Con este movimiento se intenta encontrar la dirección general o
tendencia del gráfico de la serie en el tiempo, considerando para ello unidades grandes
de tiempo.
y y
x x
En general, este movimiento vendrá representado por una recta, la dirección puede ser
ascendente, descendente o constante, ver la figura. También podrá representarse por
curvas (parabólicas, exponencial, etc.).
Ejemplo: La variación del precio de los artículos a lo largo de los años ofrece una clara
tendencia de alza.
MOVIMIENTOS CÍCLICOS
65
Se estudian también en movimientos de larga duración, y representan las oscilaciones a
lo largo de una recta de tendencia. Estas oscilaciones reflejadas en los períodos de larga
duración constituyen los ciclos de la serie, y pueden ser o no periódicos. Serán
periódicos cuando en el intervalo de tiempo que sigue a uno considerado, la serie
recorre un camino análogo. En general, un movimiento se considera cíclico sí su
periodo tiene un intervalo de tiempo no inferior a un año.
Ejemplo : Los ciclos de depresión económica en los países se representan cada cierto
numero de años.
MOVIMIENTOS ESTACIONALES
Ejemplo:
66
Si se representa por y a la serie considerada, por T a la tendencia, por C a los
movimientos cíclicos ,por E a los movimiento estacionales y por I a los movimientos
irregulares, hay fundamentalmente dos técnicas para la definición de Y.
Y = f(T,C,E,I)
En la mayoría de los casos no resulta nada simple, en una serie cronológica, distinguir
entre componentes.
Se pide:
a) Estimar la producción para el 2008 ajustando una recta (tomando como
origen a 1989)
b) Estimar la producción para el 2003 ajustando una recta (trabajar con
cambio de origen)
c) Estimar el mismo año y utilizar el mismo sistema del punto (b) pero
agregando el año 1996 = 600
67
NÚMERO ÍNDICE:
Un número índice es una medida estadística diseñada para mostrar los cambios en una
variable o un grupo de variables relacionadas con respecto al tiempo, situación
geográfica u otra característica, como renta, profesión, etc.
PRECIOS RELATIVOS
• Uno de los ejemplos más sencillos de número índice es un precio relativo, que es
la razón del precio de un bien determinado en un periodo dado a su precio en
otro periodo llamado periodo base.
68
o brevemente 120, omitiendo el signo % como se hace frecuentemente en
literatura estadísticas Este resultado significa sencillamente que en 1960 el
precio de la leche fue el 120 % del que tenía en 1955, es decir, se incrementó en
un 20 %.
Ejemplo 2: Tomando 1960 como año base y 1955 como el año dado en el
Ejemplo 1, se tiene
Esto significa que en 1955 el precio de la leche fue el 83 1/3 % del de 1960, es
decir, decreció en un: 16 2/13 %
Nótese que el precio relativo para un periodo dado con respecto al mismo
periodo es siempre el 100%. En particular, el precio relativo correspondiente al
periodo base es siempre 100. Esto, a veces, se emplea para la notación
estadística escribiendo, por ejemplo, 1955 = 100, para indicar que el año 1955 se
toma como periodo base.
69
3. Propiedad cíclica o circular: Pa/b Pb/c Pc/a = 1
Pa/b Pb/c Pc/d Pd/a = 1, etc.
VALOR RELATIVO
• Si p es el precio de un bien durante un periodo y q es la cantidad o volumen
producido, vendido, etc., durante ese periodo, entonces pq se llama valor total.
Así si son vendidos 1 000 cuartos de leche a 30 centavos cada uno, el valor total
será (0,30)(1 000) = $ 300.
• Si p0 y q0 denotan el precio y cantidad de un bien durante un periodo base
mientras que pn y qn , denotan el precio y la cantidad correspondiente durante un
periodo dado, los valores totales durante estos periodos vienen dados por vo y vn,
respectivamente, y se define
70
METODO DE AGREGACION SIMPLE:
• En este método de cálculo de un índice de precios se expresa el total de los
precios de bienes en el año dado como porcentaje del total de los precios de
bienes en el año base. En símbolos, se tiene
año base
dado
3. Índice de Valor
71
EJERCICIOS DE NÚMERO ÍNDICE
1. Los precios medios en dólares de carbón por tonelada corta (2000 libras) de
venta al por menor en Lima, durante los años 1953 — 1958, se dan en la
Tabla 1.
a) Tomando 1953 como base, hallar los precios relativos correspondientes a
los años 1956 y 1958.
b) Tomando 1956 como base, hallar los precios relativos correspondientes a
todos los años dados.
c) Tomando 1953 — 1955 como base, hallar los precios relativos
correspondientes a todos los años dados.
Tabla 1
AÑO 1953 1954 1955 1956 1957 1958
Precio medio de carbón
por menor (dólares por 14,95 14,94 15,10 15,65 16,28 16,53
tonelada corta)
72
2. En la tabla 2 se da la producción de trigo en millones de fanegas en Arequipa
durante los años 1950 — 1958. Reducir los datos a cantidades relativos tomando
como base (a) 1955 y (b) 1950 — 1953.
Tabla 2
AÑO 1950 1951 1952 1953 1954 1955 1956 1957 1958
Producción de trigo
(millones de 1019 988 1306 1173 984 935 1004 951 1462
fanegas)
3. La cantidad relativa de 1958 con 1949 como base es 105, mientras que la
cantidad relativa de 1958 con 1953 como base es 140. Hallar la cantidad relativa
de 1953 con 1949 como base.
5. Los enlaces relativos de precios en 1956 — 1960 son 125, 120, 135, 150 y 175,
respectivamente. (a) Hallar el precio relativo para 1957 con 1955 como base (b)
Hallar la Cadena de enlaces relativos a 1956 como base.
73