0% encontró este documento útil (0 votos)
129 vistas73 páginas

Separata de Estadistica 2020

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1/ 73

INTRODUCCIÓN A LA PROBABILIDAD

La probabilidad p de un evento A se definió como sigue:

Si A puede ocurrir de h manera entre un total de n igualmente posibles, entonces

El conjunto S de todas los resultados posibles de un experimento dado se llama el


espacio muestral.

Axiomas de Probabilidad
1. Para todo evento A, 0  P (A)  1
2. P (S) = 1
3. Si A y B son eventos mutuamente exclusivos, entonces
P (A U B) = P (A) + P (B)
4. Si A1, A2,…, es una serie de eventos mutuamente exclusivas, entonces
P (A1 U A2,…) = P (A1) + P (A2) +…
Teorema 1: Si  es el conjunto vacío, entonces P () = 0
Teorema 2: SI AC es el complemento de un evento A, entonces
P (AC) = 1 – P (A) 
Teorema 3: Si A y B son dos eventos  A  B  
P (A  B) = P (A) + P (B) - P (A  B)

Probabilidad condicional:
Sea E un evento arbitrario de un espacio muestral S con P(E) > 0. La probabilidad de
que un evento A sucede una vez que E haya sucedido o, en otras palabras. La
probabilidad condicional de A dado E, escrito P (A/E), se define como sigue:

1
Teorema 4: P (E  A) = P (E) . P(A/E) , si A depende de E

Teorema 5: (regla de la probabilidad total) Si K eventos A 1 , A2,… Ak, constituyen una


participación del espacio muestral S, entonces, para cualquier evento B en S,

Teorema de Bayes 6: Supóngase que A1 y A2,…, An es una partición S y que B es


cualquier evento de S tal que P (B) > 0. Entonces para cualquier i.

Independencia:

Se dice que un evento B es Independiente de un evento A si la probabilidad de que B


suceda no está influenciada por A haya o no sucedido.
P (A  B) = P (A) . P (B)
Distribución Binominal:
Consideramos pruebas repetidas e independientes de un experimento con dos
resultados; llamamos uno de los resultados favorables (p éxito) y el otro desfavorable (q
fracaso).Si y solo si p+q=1.

Teorema 6: La probabilidad de K éxitos exactamente en n pruebas repetidas se


denota y expresa por:

; K = 0 , 1 , 2 , … , n.

es el coeficiente binomial

Propiedades de la distribución binomial.


1. E (x) =  = np
2. Var (x) = 2 = npq
3. =

2
EJERCICIOS DE PROBABILIDAD
1) Una clase consta de 10 hombres y 20 mujeres de los cuales la mitad de los
hombres y la mitad de las mujeres tienen los ojos castaños. Hallar la
probabilidad de que una persona escogida al azar sea un hombre o tenga los ojos
castaños.
2) Una clase está formada por 5 estudiantes de primero, 4 de segundo, 8 de
penúltimo y 3 de último año. Se escoge un estudiante al azar para representar la
clase. Hallar la probabilidad de que el estudiante sea, (i) de segundo, (II) de
último año, (iii) de penúltimo o de último año.
3) De las 10 niñas de una clase, 3 tiene ojos azules. Si se escogen dos niñas al azar,
¿Cuál es la probabilidad de que, (i) las dos tengan ojos azules? (ii) ninguna tenga
ojos azules (iii) una por lo menos tenga ojos azules?.
4) Tres tornillos y tres tuercas están en una caja. Si se escogen dos piezas al azar,
hallar la probabilidad de sacar un tornillo y una tuerca.
5) Una clase consta de 6 niñas y 10 niños. Si se escoge al azar un comité de 3,
hallar la probabilidad de, (i) seleccionar tres niños, (ii) seleccionar exactamente
2 niños (iii) seleccionar por los menos un niño (iv) seleccionar exactamente 2
niñas.
6) Tres niños y 3 niñas se sientan en fila. Hallar la probabilidad de que, (i) las tres
niñas se sienten juntas, (ii) los niños y las niñas se sienten alternados.
7) Una urna contiene 13 fichas, de las cuales, 6 fichas están numeradas con 15,
cuatro numeradas con 10 y tres numeradas con 5. Si de esta urna se escogen 3
fichas al azar y a la vez calcular la probabilidad de que:
a. Al menos dos de ellas tengan el mismo número.
b. La suma de las tres fichas sea 30.
8) En cierta facultad, 25% de los estudiantes perdieron matemáticas, 15% perdieron
química y 10% perdieron las dos. Se selecciona un estudiante al azar.
(i) Si perdió química ¿Cuál es la probabilidad de que perdió matemáticas?
(ii) Si perdió matemáticas, ¿Cuál es la probabilidad de que perdió química?
(iii) ¿ Cuál es la probabilidad de que perdió matemática o química?

3
9) Tres máquinas A, B y C producen respectivamente 60%, 30% y 10% del número
total de artículos de una fábrica. Los porcentajes de desperfectos de producción
de estas máquinas son respectivamente 2%, 3% y 4%. Seleccionado un artículo
al azar resultó defectuoso. Hallar la probabilidad de que el artículo hubiera sido
producido por la máquina C.
10) En cierta facultad, 4% de los hombres y 1% de las mujeres tienen más de 6 pies
de estatura. Además, 60% de los estudiantes son mujeres. Ahora bien si se
selecciona al azar un estudiante y es más alto que 6 pies, ¿Cuál es la
probabilidad que el estudiante sea hombre?
11) Un lote contiene 12 artículos de los cuales 4 están defectuosos. Se sacan del lote
tres artículos al azar uno tras otro. Encuentre la probabilidad de que los 3
artículos no estén defectuosos.
12) Una clase de 16 hombres y 24 mujeres, de los cuales la mitad de los hombres y
la mitad de las mujeres tienen ojos cafés. Encuentre la probabilidad de que una
persona seleccionada al azar sea un hombre o tenga ojos cafés.
13) El 70% de los alumnos de un Instituto privado son mujeres, y el 20% de ellas
son solteras. Por otro lado, él 40% de lo varones son solteros. Se elegí al azar un
alumno del Instituto. ¿Cuál es la probabilidad de que será soltero?.
14) Los profesores de la Universidad Privada San Juan Bautista, sé clasifican de la
siguiente manera: 15% tienen doctorado; 60% maestría y el 25%tienen
licenciatura. Él 60% de los doctores, 80% de los maestritas y 25% de los
licenciados son varones. Se elige al azar a un profesor y resulta ser mujer. ¿Cuál
es la probabilidad que sea doctora?.
15) Supongamos que se echan dos dados al mismo tiempo ¿Cuál es la probabilidad
de no obtener un doble?
16) Se echa un dado perfecto. Demuestre que la probabilidad de obtener un número
par o un número divisible por 3 es 2/3.
17) Supongamos que una rifa consiste de 1000 boletos. En esta rifa un boleto se
premia con $500,dos con $250,cinco con $100,cien con $5,y los demás no se
premian .Si se adquiere un boleto de la rifa, calcular la probabilidad de:
a) ganar alguno de los premios
b) ganar a lo mas $ 100
c) no ganar premio alguno.

4
18) Un club consiste de ciento cincuenta miembros. Del total, 3/5 son hombres y 2/3
son profesionales. Además, 1/3 de las mujeres son no profesionales.

5
Se elige al azar un socio del club.
a) Calcular la probabilidad de que sea hombre y profesional.
b) Calcular la probabilidad de que sea hombre, dado que es profesional.

19) Las probabilidades de que los socios A y B sean elegidos presidente de su club
son respectivamente 0,4 y 0,6.Las probabilidades de que se aumenten las cuotas
mensuales de los socios son de 0,9 se sale elegido A y de 0,2 si sale elegido B.
A) ¿Cuál es la probabilidad de que haya un aumento en las cuotas mensuales
de los socio?.
B) Si se aumenta la cuota mensual, ¿Cómo se modifican las probabilidades
de que salgan elegidos los socios A y B?.
20) Se sabe que el 30% de las lavadoras de cierta compañía requiere servicio cuando
están todavía en garantía, en tanto que sólo 10% de las secadoras necesitan ese
servicio. Si alguien compra una lavadora y una secadora hechas por esta
compañía.
a. ¿Cuál es la probabilidad de que ambas máquinas necesitan servicio
dentro de garantía?
b. ¿Cuál es la probabilidad de que ninguna de las dos maquinas necesiten
servicio dentro de garantía?

21) Supongamos que el 60% de la clase de primer año de una universidad son
mujeres. Además, supongamos que el 25% de los hombres y el 10% de mujeres
de la clase están estudiando matemáticas. Se elige al azar un estudiante de
primer año. Halle la probabilidad de que:
a. El estudiante éste estudiando matemáticas.
b. Si el estudiante esta estudiando matemáticas determinar la probabilidad
de que el estudiante sea mujer.

22) En un curso que está formando por 10 administradores, 30 ingenieros y 10


contadores; 3 administradores, 10 ingenieros y 5 contadores obtuvieron notas
sobresalientes. Si se escoge al azar un estudiante del curso y se observa que
obtuvo nota sobresaliente, ¿cuál es la probabilidad de que sea contador?

6
23) En una empresa comercial trabajan 8 hombres y 18 mujeres, de las cuáles la
mitad de los hombres y la mitad de las mujeres han nacido en Lima. Hallar la
probabilidad de que un trabajador elegido al azar sea hombre o que haya nacido
en Lima.

24) Tres máquinas A, B y C producen respectivamente 40% , 25% y 35% del


número total de artículos de una fábrica. Los porcentajes de desperfectos de
producción de esta máquinas son respectivamente 2% , 3% y 4%. Seleccionado
un artículo al azar resultó defectuoso. Halle la probabilidad de que el artículo
hubiera sido producido por la máquina C.

25) El equipo A tiene probabilidad de 2/3 de ganar, siempre que éste juegue.
Suponga que A juega 4 veces. Encuentre la probabilidad de que A gane más de
la mitad de sus juegos.

26) Suponga que el 20% de los artículos producidos por una fábrica están
defectuosos. Suponga que se seleccionan 4 artículos al azar. Encuentre la
probabilidad de que:

a. 2 estén defectuosos,
b. 3 estén defectuosos,
c. ninguno estén defectuosos.

27) En una facultad, la probabilidad de que un alumno apruebe el semestre es de


80%.Si consideramos 8 alumnos. ¿Cuál es la probabilidad de que:

a. 2 ganen?
b. 2 pierden?
c. por lo menos dos pierden?
d. como máximo 6 ganen?
e. 6 pierdan el semestre?

7
28) Se sabe que una manufactura de cierto articulo, uno de cada diez resulta
defectuoso. ¿Cuál es la probabilidad de que una muestra aleatoria de cuatro
artículos contenga:

a. Ninguno defectuoso?
b. Exactamente uno defectuoso?
c. Exactamente dos defectuosos?
d. No más de dos defectuosas?

29) Según los registros universitarios, fracasan el 5% de los alumnos de cierto curso.
¿Cuál es la probabilidad de que de 6 estudiantes seleccionados al azar, que
hayan seguido dicho curso, menos de 3 hayan fracasado?

30) Para el examen de microeconomía la calificación promedio es de 14 la


desviación estándar de 5 se desea desaprobar al 30 % de los examinados ¿Cuál
debe ser la calificación máxima desaprobatoria?

31) Un libro de 400 páginas tiene 400 errores de impresión distribuida


aleatoriamente. ¿Cuál es la probabilidad de que una páginas observada contenga
por lo menos 2 errores?

32) La demanda semanal de Pepsi, en miles de litros, en miles de litros, de una


cadena local de tiendas, es una variable aleatoria continua X que tiene la
densidad de probabilidad:

2 (X – 1) 1<X<2
f(x) =
0

Encuentre la media y la varianza de X

33) La altura promedio de las mujeres en el grupo de primer año de una institución
de enseñanza superior es de 162, 5 centímetros con una desviación estándar de
6,9 centímetros. ¿Hay alguna razón para creer que existe un cambio en la altura
promedio si una muestra aleatoria de 50 mujeres del grupo actual tiene una
altura promedio de 165,2 centímetros?

8
34) Las calificaciones de un grupo de estudiantes en su reporte del medio año (X) y
en los exámenes finales (y) fueron las siguientes:
X 77 50 71 72 81 94 96 99 67
Y 82 66 78 34 47 85 99 99 68

a) Estime la calificación del examen final de un estudiante que obtuvo una


calificación de 85 en el reporte de medio año.
b) Determine un intervalo de confianza del 95 % para β

35) Se lanza una moneda de tal forma que una casa tiene la posibilidad de ocurrir
dos veces más que una cruz. Si la moneda se lanza 3 veces al aire, ¿Cuál es la
probabilidad de obtener 2 cruces y 1 cara?

9
DISTRIBUCIÓN NORMAL

x
µ

2
1 1  x 
y e  
 2 2    ………………… (1)

µ = Representa la media de la población


 = Es la desviación estándar de la población
e @ 2,718
p @ 3,1416 y X es cualquier número real.

PROPIEDADES DE LA DISTRIBUCIONES
NORMALES

1. Una distribución normal tiene forma de campana.


2. El área bajo una curva normal y sobre el eje X es siempre igual a 1.
3. La media se localiza en el centro de la distribución y la curva normal es
simétrica con respecto a la línea perpendicular, al eje horizontal en el
valor de la media.
4. La media, la mediana y la moda coinciden.
5. Una curva para una distribución normal nunca toca al eje horizontal.

10
DISTRIBUCIÓN NORMAL ESTÁNDAR

11
Si la variable aleatoria X tiene distribución normal entonces, la variable
aleatoria estándar tiene distribución normal N(0,1).

En efecto, la variable estándar Z tiene media igual a cero y varianza igual a uno, esto es,
E(Z)=0 y var (Z)=1.

Al sustituir en la ecuación (1) vemos que la función de la densidad de

probabilidad para una variable aleatoria normal estándar Z es:

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Sea X1, X2, …, Xn una muestra aleatoria de tamaño n escogida de una población f(x)
con media  y con varianza 2 si es la media muestral, entonces, E ( )=

Para n suficientemente grande, la variedad aleatoria,

Tiene distribución aproximadamente normal N (0,1)


Por la definición de Muestra aleatoria, las variables aleatorias X 1, X2, …, Xn, son
independientes e idénticamente distribuidas con E (Xi) =  y con Var (Xi) = 2
entonces:

a)

b)

12
c) Se deduce el teorema del límite central escribiendo

NOTAS:

1. La varianza de la media:

Es válida, si el muestreo es con o sin reemplazo en una población

infinita, o es con reemplazo en una población finita de tamaño N.


Si el muestreo es sin reemplazo en una población finita de tamaño N, entonces,
la varianza de la distribución de es:

El coeficiente se denomina factor de corrección para población finita.

Observar que cuando N → ∞ el factor de corrección tiende a uno.

2. Si la muestra aleatoria es escogida de una población normal N (µ, 2), entonces,

la distribución de es exactamente normal , para cualquier tamaño

de muestra n  2.

3. La aproximación de a la normal es buena si n  30, sin importar

si la población es discreta o continua.

4. La desviación estándar de una estadística es conocida como error estándar.

13
DIAGRAMA DE FLUJO PARA CALCULAR EL ERROR ESTÁNDAR DE LA MEDIA

Comienzo

Use
¿Es la población Si 
infinita? x 
n

No

¿Se muestrea Si
con reemplazo?

No

¿Es Si
N ≥ 20n?

Use
No  Nn
x 
n N 1

14
FUNCIÓN DE DENSIDAD NORMAL

1. En un examen la nota media fue de 70 y la desviación estándar 10. El profesor


da a todos los estudiantes con notas de 61 a 79 la calificación C. Hubo 24
alumnos con C. Si se supone que las calificaciones siguen una distribución
normal, ¿Cuántos alumnos se examinaron?
2. Un profesor califica un 10% de los exámenes con A; 20% con B; 40% con C;
20% con D y 10% con F. Se obtiene 68 como promedio en un examen: Si el
límite entre C y B es de 78 en ese examen y si las calificaciones están
normalmente distribuidas, ¿Cuál es la desviación estándar del curso?
3. La estatura de un número de estudiantes está distribuida normalmente con una
media de 168,50 centímetros. Si un 12% mide por lo menos 171,20 centímetros,
¿Cuál es la desviación estándar de esta distribución?
4. En un examen 13% del curso obtuvo una calificación de A; 20% de B; 48% de
C; 10% de D y 9% de E. La calificación C incluye desde 55 a 79 puntos. En el
supuesto de una distribución normal, ¿Cuál es la media y la desviación estándar
de las calificaciones?
5. Se sabe que la duración de las conversaciones telefónicas en una oficina tiene
una distribución normal, cuya media es 4 y desviación estándar de 2 minutos,
¿Cuál es la probabilidad de que una conversación dure más de 5 minutos?..
6. A partir de la distribución Normal, calcular la probabilidad de un suceso, cuya
variable estandarizada (Z) está comprendida entre los siguientes valores:
a) Entre Z = 0 y Z =1,2 b) Entre Z = 0,80 y Z =1,94
c) Entre Z = -2,30 y Z = -0,82 d) Que Z sea menor que —1,96 o mayor
que 1,96.
7. Si las estaturas de 10 000 alumnos Universitarios tienen una distribución
Normal, con media de 169 centímetros y desviación estándar de 2,5 centímetros.
a) ¿Cuántos alumnos tendrán por lo menos 172 centímetros?
b) ¿Cuál es el Intervalo que Incluye al 75% central de alumnos?

15
MUESTREO DE UNA POBLACIÓN NORMAL

Estadístico

Error estándar de la media para muestras grandes (o de poblaciones pequeñas con


reemplazo)

  Desviación estándar de la población.


n  tamaño de la muestra.
Error estándar de la media cuando las muestras se toman sin reemplazo (población
finita).

Nota:
Error de estimación:
E=
N  tamaño de la población. E=

Estadístico t 

S  desviación estándar de la muestra


Error máximo de estimación para muestras grandes.

Error máximo de estimación para muestras pequeñas.

Estadístico: Z 

Error estándar de la proporción muestral.

Error estándar de la proporción muestral para muestras pequeñas.

16
EJERCICIOS DE DISTRIBUCIÓN MUESTRALES

1. En una población normal, con media 72,1 y desviación estándar 3,1, encuentre la
probabilidad de que en una muestra de 90 observaciones, la media sea menor
que 71,7.

2. Si los pesos individuales de las personas que viajan en avión se distribuyen


normalmente con una media de 68 kilos y desviación típica de 3,5 kilos, ¿cuál es
la probabilidad de que un Boeing 707 con 81 pasajeros pese más de 5700 Kilos?

3. Ciertos tubos fabricados por una compañía tienen una duración media de 900
horas y una desviación típica de 70 horas. Hallar la probabilidad, al seleccionar
al azar 36 tubos, de que tengan una duración media entre 870 y 925 horas.

4. En una universidad el promedio de calificación, en exámenes de admisión, ha


sido de 3,5 con una desviación típica de 1. ¿Cuál es la probabilidad, si el examen
lo presentan 36 estudiantes, de que obtengan un promedio mayor de 3,7?

5. Para elegir presidente de un sindicato, un candidato obtuvo el 46 % de los votos.


Determinar la probabilidad de que entre 200, elegidos al azar, de un total de
1000 afiliados, se obtenga la mayoría de votos para dicho candidato.

6. En cierta facultad de una universidad de Lima 1/6 de los alumnos son mujeres.
Si se extrae una muestra aleatoria de 200 estudiantes de la facultad ¿Cuál es la
probabilidad de que el 20 % o más sean mujeres?

7. Se sabe que el 25 % de los estudiantes de un colegio usan anteojos ¿Cuál es la


probabilidad de que 8 o menos usen anteojos en una muestra de 36 estudiantes?

17
FORMULAS PARA HALLAR EL TAMAÑO DE LA MUESTRA:

I. ………… si la población es Infinita

II. ……… si la población es finita

III. ………….. si la población es infinita.

………….. si p = q = 0,5

IV. ………… si la población es finita.

n→ Tamaño de la muestra
N → Tamaño de la población
p→ proporción de la muestra
P→ proporción de la población
σ→ Desviación estándar de la población
→ Media de la muestra
→ Media de la población
E→ Error de Estimación.

18
EJERCICIOS DE MUESTREO
1. ¿Qué tamaño de muestra es necesario, si se considera una confianza del 90%
para la proporción de la población, y el error es del 8%?.
2. Entre los estudiantes de cierta universidad privada, se desea tomar una muestra
aleatoria para estimar la proporción de alumnos que utilizan la biblioteca. El
error debe conservarse en un 4%, con un riesgo del 0,045. ¿Cuál es el tamaño de
la muestra, si la universidad tiene 3200 alumnos matriculados?.
3. En un barrio residencial se espera que el 60% de las familias tengan vehículo
propio. Se desea hacer una investigación para estimar la proporción de familias
propietarias de vehículo, con un intervalo de confianza cuya amplitud no sea
mayor de 0,03, y con nivel de confianza del 95,5%. Determinar el tamaño de la
muestra.
4. Una universidad desea ofrecer una nueva carrera profesional; para ello debe
calcular la proporción de alumnos del último año de Secundaria que piensa
estudiar dicha carrera. ¿Qué tamaño, debe tener la muestra si su estimación debe
estar a 0,03 del valor verdadero, con 95% de confianza?.
a) El año anterior el 20% de los alumnos encuestados se inclinaba por una carrera
similar.
b) El número de alumnos que cursan el último semestre en la ciudad donde se
realiza la investigación es de 6000.
5. Una organización grande de maestros quiere estimar el porcentaje de sus
miembros que están a favor de un contrato colectivo, asegurándose que el error
de estimación será a lo más del 1,5% con un nivel de confianza del 95 por
ciento.
a) Si no se dispone de una estimación previa de p, ¿Cuál debe ser el tamaño de la
muestra?.
b) Si una muestra preliminar de 200 maestros indicó que el 65% estaba a favor del
contrato colectivo, ¿Cuántos maestros más deberán entrevistarse?
6. El total de tiempo que un doctor dedica a sus pacientes tiene una desviación
estándar de aproximadamente 7,8 minutos. Si queremos estimar la media del
tiempo que el doctor dedica a sus pacientes, encuentre el tamaño de muestra
necesario para tener un 88% de confianza en que la media verdadera difiera
menos de 2,5 minutos de la estimada.

19
INTERVALOS DE CONFIANZA PARA MEDIAS (n ≥ 30)

En el caso de muestreo en una población infinita o si el muestreo es con


reemplazamiento en una población finita.

Si el muestreo es sin reemplazamiento en una población finita de tamaño N.

En general, la desviación típica poblacional es desconocida, de modo que para


obtener los límites de confianza anteriores, se utiliza la estimación muestral S.
Intervalos de confianza para Medias. (n <30)

INTERVALOS DE CONFIANZA PARA PROPORCIONES

Para el caso de muestreo en una población infinita o con reemplazamiento en la


población finita.

p + q =1

Si el muestreo es sin reemplazamiento en una población finita de tamaño N.

20
EJEMPLOS
1. Una muestra de 100 votantes elegidos al azar entre todos los de un barrio,
indicaba que el 45 % de ellos estaban a favor de un candidato. Hallar los límites
de confianza del 95 %.
Solución:

0,35 < P < 0,55

2. Un fabricante de metros metálicos, con el fin de controlar la exactitud de los


mismo, Tomó una muestra de 10 y los medio con todo presión. Las medidas
obtenidas en metros fueron:

1,00 0,99 1,01 1,00 0,98 0,99 0,99 1,02 1,01 1,09

21
Estime con un 90% de confianza los límites de la media ().
Solución:
2E 0,10

9 1,83

1 – 0,007 <  < 1 + 0,007


0,993 <  < 1,007

3. 45 alumnos de un curso de estadística, se someten a una prueba para determinar


las diferencias de rendimiento entre hombres y mujeres. Las 20 mujeres tienen
un puntaje medio de 60 con una desviación estándar de 19 y los 25 hombres, una
media de 66 con una desviación estándar de 16. ¿Cuáles son los limites de
confianza del 99% para la diferencia entre los puntajes medios de los hombres y
las mujeres?

Solución:

n1 = 20 n2 = 25 = 60 = 66 =19 =16  = 0.01

8.11

-20,11

-20,11   8,11

22

 2
2
99 %
0,005 0,005

-2,705 2,705

23
4. El director de una editorial de textos para secundaria, debe decidir sobre la
publicación de un texto, siempre que las preferencias entre los colegios privados
y públicos, sean iguales. Selecciona dos muestras de tamaño 10 y 18
respectivamente, encontrando aceptación de 6 y 10 colegios. De acuerdo a estos
resultados fijar limites de confianza del 90% para la diferencia.

Solución:
n2 = 18

g1 = n1 + n2 – 2

p1 = 0,60 p2 = 0,56 g1 = 26

I.C.

=
=
=
=
-0,29  (P1 – P2)  0,37 2E 0,10

26 1,706

-1,706 0 1,706

24
EJERCICIOS DE INTERVALOS DE CONFIANZA
1.- De una remesa, de la cual se tomo una muestra de 200 artículos, se encontró que
20 de ellos eran defectuosos. Con una confianza del 95%, calcular el error de la
muestra.

2.- Qué tamaño de muestra es necesario, si se considera una confianza del 90 %


para la proporción de la población, y el error de estimación es del 8 %?.

3.- Se selecciona una muestra aleatoria de familias para estimar el ingreso promedio
diario. El error debe estar en el rango de $2000,con un riesgo de 0,045.,De que
tamaño debe ser seleccionada la muestra?. La desviación estándar ha sido
calculada en $8000.

4.- Suponga que la estatura media de los hombres tiene una desviación estándar de
2,48 centímetros. Se miden 100 estudiantes, hombres, elegidos aleatoriamente, y
se obtiene una estatura media de 168,52 centímetros. Determine los límites de
confianza del 99% para la estatura media de los hombres de esta universidad.

5.- Una investigación efectuada a 400 familias de clase media revelo que en la
realización de fiestas familiares, un 62% prefería el aguardiente a cualquier otra
clase de licor. Determine los límites de confianza del 99%.

6.- Una muestra de 9 frascos de café instantáneo, seleccionados de un proceso de


producción, dio los siguientes valores para el contenido, medido en gramos:
285 291 265 270 279 288 290 279 284

Obténgase un intervalo de confianza del 95% para estimar el peso neto medio de
los frascos de café instantáneo.

25
HIPÓTESIS NULA Y ALTERNATIVA
Definición:
Se denomina hipótesis nula y se representa por H0, a la hipótesis que es aceptada
provisionalmente como verdadera y cuya validez será sometida a comprobación
experimental. Los resultados experimentales nos permitirán seguir aceptándola como
verdadera o si, por el contrario, debemos rechazarla como tal.
Toda la hipótesis nula va acompañada de otra hipótesis alternativa.
Definición.
Se denomina hipótesis alternativa y se representa por H1 o por Ha, a la hipótesis
que se acepta en caso de que la hipótesis nula H 0 sea rechazada. La hipótesis alternativa
Ha, es una suposición contraria a la hipótesis nula.
ERRORES TIPO I Y TIPO II, Y NIVEL DE SIGNIFICACIÓN
Definición: Se denomina error tipo 1, al error que se comete al rechazar una hipótesis
nula H0 cuando ésta realmente es verdadera.
Definición: Se denomina error Tipo II, al error que se comete al aceptar una hipótesis
nula H0 cuando en realidad es falsa.
Definición. Se denomina nivel de significación de una prueba de hipótesis a la
probabilidad de cometer un error de tipo 1.

PROCEDIMIENTO DE LA PRUEBA DE HIPÓTESIS


Previamente debe formularse el problema estadístico, determinar la variable en
estudio y el método estadístico adecuado para la solución del problema. El
procedimiento general de la prueba de una hipótesis de parámetro O se resume en los
siguientes pasos:
1. Formular la hipótesis nula H0:  = 0 y la hipótesis alternativa adecuada
Ha:  ≠ 0 = ó Ha :   0 ; Ha :  > 0
2. Especificar el tamaño  del nivel de significación. ()
3. Seleccionar la estadística apropiada a usar en la prueba.
4. Establecer la regla de decisión, determinado la región crítica de la prueba.
5. Calcular el valor del estadístico de la prueba a partir de los datos de la muestra.
6. Tomar la decisión de rechazar la hipótesis H0 si el valor del estadístico de la
prueba está en la región crítica. En caso contrarío, no rechazar H0.

26
PRUEBA BILATERAL O DE DOS COLAS

Procedimiento de la Prueba de Hipótesis.

1. Formular la hipótesis nula:


Ho :  = o
Ha :  ≠ o

2. Especificar el tamaño del nivel de significación. Ej.  = 0,05.

3. Seleccionar la estadística apropiada a usar en la prueba.

Ej.: Z=

4. Establecer la regla de decisión, determinando la región crítica de la prueba.


Ej.  = 0,05.
Z.A.= Zona de Aceptación
Z.R.= Zona de Rechazo

Z.R. – 1,96 Z.A. 1,96 Z.R.

5. Calcular el Valor del estadístico de la prueba a partir de los datos de la muestra.


Ej.: Z = 1.40

6. Tomar la decisión: para el ejemplo Z  Z.A. Luego aceptamos la Ho. y


rechazamos la Ha.

27
PRUEBA UNILATERAL DE COLA A LA DERECHA

Procedimiento de la Prueba de Hipótesis.

1. Formular la hipótesis nula:


Ho :  = o
Ha :  > o
2. Especificar el tamaño del nivel de significación. Ej.:  = 0,05.
3. Seleccionar la estadística apropiada a usar en la prueba.

Ej.: Z=

4. Establecer la regla de decisión, determinando la región crítica de la prueba.


Ej.  = 0,05.
Z.A.= Zona de Aceptación
Z.R.= Zona de Rechazo

Z.A. 1,645 Z.R.

5. Calcular el Valor estadístico de la prueba a partir de los datos de la muestra.


Ej.: Z = 1,70.

6. Tomar la decisión: para el ejemplo Z  Z. R.


Luego aceptamos la Ha y rechazamos la Ho.

28
PRUEBA UNILATERAL DE COLA A LA IZQUIERDA

Procedimiento de la Prueba de Hipótesis.

1. Formular la hipótesis nula:


Ho :  = o
Ha :  < o

2. Especificar el tamaño del nivel de significación. Ej.:  = 0,05.

3. Seleccionar la estadística apropiada a usar en la prueba.

Ej.: Z=

4. Establecer la regla de decisión, determinando la región crítica de la prueba.


Ej.  = 0,05.
Z.A.= Zona de Aceptación
Z.R.= Zona de Rechazo

Z.R. – 1,645 Z.A.

5. Calcular el Valor del estadístico de la prueba a partir de los datos de la muestra.


Ej.: Z = 1,4

6. Tomar la decisión: para el ejemplo Z  Z.A.


Luego aceptamos la Ho. y rechazamos la Ha.

29
Ejemplos:
1. Supongamos que una persona quiere tener desconectado su teléfono, si el
promedio de llamadas que hace al día es menor de 12. Elige aleatoriamente 10
días y anota el número de llamadas, así:
4 6 8 2 12 20 22 10 12 4
Utilizando  = 0,05, ¿Debería retirar el teléfono?
Solución
1° Como el parámetro de interés es la media o promedio, fijemos la
hipótesis nula y la alternativa:
HO:  ≥ 12
Ha:  < 12
2º El nivel de significación es  = 0,05
3º Como la muestra es pequeña n = 10, y no se conoce la varianza de la
población, se usa la distribución t-student. luego la estadística de prueba
es:

usando la tabla de la t.

4º Determinando la región de aceptación y de rechazo:

5° Calculando el estadístico de prueba tenemos:


Xi (Xi - )2
4 36
6 16
8 4
2 64
12 4
20 100
22 144
10 0
12 4
4 36
Tc = -0.94

30
6° Toma Decisión
Como tc € Z.A. por lo tanto al nivel de significación del 5%, no debería
desconectarse el teléfono.

2. Un profesor examina a su curso; sabe por experiencia que proporciona un


rendimiento con calificación de 78.
Su curso actual es de 35 alumnos, tomada como muestra, obtiene una media de
82 y desviación típica de 21. ¿Acierta al suponer que es un curso superior?.
Nivel de significación del 1%.
1º Formulación de Hipótesis
HO:  = 78
Ha:  > 78
2º Nivel de Significación
 = 0,01
3º Seleccionar la estadística apropiada a usar en la prueba

4º Establecer la regla de prueba. decisión determinando la región crítica de


la prueba.

µ = 78
µ = 78

Z.A. Z.R.
2,33
Unilateral
Derecha

5º Calcular el valor del estadístico de la prueba

31
6º Tomar la decisión
Zc  Z. A. Luego
Se acepta Ho

3. El Ministro de Educación de un país asegura que el 80% de los estudiantes


universitarios tienen un ingreso mensual para su sostenimiento, superior a
S/. 650; usted quiere refutar al ministro con un nivel de confianza del 99% y para
hacerlo toma una muestra de 300 estudiantes, encontrando 231 con ingresos
mayores a S/. 650. ¿tiene razón el señor ministro?
Solución
1º Formulación de Hipótesis
HO: P = 0.80
Ha: P ≠ 0.80

2º Nivel de Significación
 = 0,01

3º Seleccionar la estadística apropiada a usar en la prueba

Establecer la regla de decisión determinando la región crítica de la


prueba.

Calcular el valor del estadístico de la prueba

32
4º Tomar la decisión
Se acepta la hipótesis de que el 80% de estudiantes tienen ingreso
mensual superior a S/.. 650 al nivel 1%.

4. Una muestra aleatoria de 10 estudiantes se somete a una prueba de cálculo, y


reciben las calificaciones (x). Después se efectúan una sesión de repaso de
álgebra y se repite el mismo examen (y). A nivel de significación de 0,05. ¿las
calificaciones son mejores en el segundo examen?
Estudiantes Examen 1 Examen 2
(x) (y)
1 80 84
2 50 56
3 78 81
4 90 92
5 75 76
6 70 75
7 62 72
8 90 87
9 95 93
10 68 72

33
Solución:
Estudiantes x y d=y–x (d – d) (d – d)2
1 80 84 +4 1 1
2 50 56 +6 3 9
3 78 81 +3 0 0
4 90 92 +2 -1 1
5 75 76 +1 -2 4
6 70 75 +5 2 4
7 62 72 + 10 7 49
8 90 87 -3 -6 36
9 95 93 -2 -5 25
10 68 72 4 1 1
 d = + 30 130

34
Media de diferencia:

Desviación estándar de diferencias

1. Ho : d  0
Ha : d > 0
2.  = 0.05

3.

4.

5.

6. Si tc  Z.R. se rechaza Ho, hay diferencia importante en las calificaciones


de las dos pruebas. Sin embargo, ello no demuestra que esta diferencia
haya dependido del repaso de álgebra. Pudiera resultar, por ejemplo, de
que se aprendió fundándose en las equivocaciones cometidas en el primer
examen.

35
5. Se compararon los métodos de enseñanza de estadística, A y 8, con dos grupos
aleatorios de estudiantes. Al término de la instrucción experimental, cada grupo
presentó el mismo examen de conocimiento; las calificaciones de cada uno son
muestras aleatorias de dos poblaciones normales con varianzas iguales.
Encuentre el valor del estadístico t y sus grados de libertad asociadas si
suponemos, 1 = 2.

Método de enseñanza A Método de enseñanza B


n1 = 16 N2 = 12

36
Calcule con  = 0,05 si 1  2.

Solución:
1) Formulación de las hipótesis

Hp : 1 = 2.
Ha : 1  2.

2) Nivel de significación  = 0,05

3) El estadístico t es:

4) Los valores críticos de tt (t tabulado en la tabla de t)

1 < 2. 1 = 2. 1 > 2.

Z.R. -2,06 Z.A. 2,06 Z.R.

5) El valor del estadístico t es:

37
Sp = 3,31

Tc = 5,93

6) Toma decisión:

Tc  Z.R  Aceptamos Ha con la condición 1 > 2 con un error del 5 %

38
EJERCICIOS DE ESTADÍSTICA INFERENCIAL
1. Una organización grande de maestros quiere estimar el porcentaje de sus
miembros que están a favor de un contrato colectivo, asegurándose que el error
de estimación será a lo más del 1,5 % con un nivel de confianza del 95 por
ciento.
a) Si no se dispone de una estimación previa de p, ¿cuál debe ser el tamaño
de la muestra?
b) Si una muestra preliminar de 200 maestros indicó que 65 % estaba a
favor del contrato colectivo, ¿Cuántos maestros más deberán
entrevistarse?,

2. Una muestra aleatoria de 50 abogados indicó que el promedio del tiempo de


experiencia en el litigio es de 9,6 años con desviación estándar de 4,4. ¿cuántos
abogados más deben incluirse en la muestra para tener un 99 % de confianza en
que el verdadero tiempo de experiencia en el trabajo no difiere más de 6 meses
de la media muestral de experiencia?

3. Suponga que la estatura media de los varones tiene una desviación estándar de
2,48 centímetros. Se miden 100 estudiantes, varones, elegidos aleatoriamente y
se obtiene una estatura media de 168,52 centímetros. Determine los límites de
confianza del 99 % para la estatura media de los varones de esta universidad.

4. Una muestra de 100 votantes elegidos al azar entre todos de un barrio, indicaba
que el 45% de ellos estaban a favor de un candidato. Hallar los limites de
confianza del 95%, para toda la población de dicho barrio.

5. En un barrio de la ciudad se efectúa un muestreo para determinar la proporción


de familias que poseen un televisor a colores. La muestra de tamaño 80 indica
que 52 tienen televisión a colores.
Establecer un intervalo de confianza de 95% para estimar la proporción de
familias que poseen televisor a colores.

39
6. Se someten a una prueba 28 alumnos de un curso de estadística, para determinar
las diferencias de rendimiento entre hombres y mujeres. Las 18 mujeres tienen
un puntaje medio de 15 con una desviación estándar de 4 y los 10 hombres, una
media de 12 con una desviación estándar de 2.
¿Cuáles son los límites de confianza del 99% para la diferencia entre los
puntajes medios de los hombres y las mujeres?

7. La altura media de 50 estudiantes de un colegio que tomaban parte en las


pruebas atléticas fue de 68,2 pulgadas con desviación típica de 2,5 pulgadas,
mientras que 50 estudiantes que no mostraban interés .en tal participación tenían
una altura media de 67,5 pulgadas con desviación típica de 2,8 pulgadas.
Ensayar la hipótesis de que los estudiantes que participan en las pruebas atléticas
son más altos que los otros. Al nivel de significación del 0,05.

8. Supongamos que una persona quiere tener desconectado su teléfono, si el


promedio de llamadas que hace al día es menor de 2. Elige aleatoriamente 5 días
y anota el número de llamadas, así:

0 2 1 1 2
Utilizando  = 0,05, ¿Debería retirar el teléfono?

9. El archivista de la UNE compara la calificación promedio de estudiantes casados


y solteros. Descubre que 100 estudiantes casados, elegidos aleatoriamente,
tienen calificación promedio de 2,85, con desviación estándar de 0,4 en tanto
que una muestra aleatoria de 100 estudiantes solteros tiene calificación promedio
de 2,73, con desviación estándar de 0,3. A nivel de significación de 0,10 ¿Los
estudiantes casados tienen mayor promedio de calificación?.

10. Se toma una muestra de 220 estudiantes de la Facultad de Educación y se


clasifican de acuerdo a las calificaciones y sexo, como sigue:
Calificación Hombres Mujeres
Aprueban 110 80
Reprueban 20 10

40
A un nivel de significación del 5%, ¿hay alguna relación entre sexo y la
aprobación de curso?
11. Un Jefe de Personal está dispuesto a contratar una secretaria para ocupar un
puesto a menos que ella corneta más de 8 equivocaciones por página
mecanografiada. Se elige una muestra aleatoria de 5 páginas de las escritas por la
aspirante. Las equivocaciones por página son: 18, 14, 10, 2 y 6. Utilizando  =
0,01. ¿ Qué decisión se debe tomar?.

12. Suponga que la estatura media de los hombres tiene una desviación estándar de
3,2 centímetros. Se miden 64 estudiantes, hombres elegidos aleatoriamente, y se
obtiene una estatura media de 168 centímetros. Determine los límites de
confianza del 99 % para la estatura media de los hombres de esta Universidad.

13. ¿Qué tamaño deberá tener una muestra para estimar dentro del 3 %, la
proporción de mujeres casadas que van periódicamente a consulta ginecológica,
en una población de 5000 mujeres y una seguridad del 95 %?.

14. Un Jefe de Personal está dispuesto a contratar una secretaria para ocupar un
puesto a menos que ella corneta más de 8 equivocaciones por página
mecanografiada. Se elige una muestra aleatoria de 5 páginas de las escritas por la
aspirante. Las equivocaciones por página son: 18, 14, 10, 2 y 6. Utilizando 
= 0,05. ¿Qué decisión se debe tomar?

15. Suponga que la estatura media de los hombres tiene una desviación estándar de 9
centímetros. Se miden 81 estudiantes, hombres elegidos aleatoriamente, y se
obtiene una estatura media de 170 centímetros. Determine los límites de
confianza del 97% para la estatura media de los hombres de esta Universidad.

16. Qué tamaño deberá tener una muestra para estimar dentro del 4%, la proporción
de mujeres casadas que van periódicamente a consulta ginecológica, en una
población de 10000 mujeres y una seguridad del 89,9 %?.

41
17 Un Jefe de Personal está dispuesto a contratar una secretaria para ocupar un
puesto a menos que ella corneta más de 12 equivocaciones por página
mecanografiada. Se elige una muestra aleatoria de 10 páginas de las escritas por
la aspirante. Las equivocaciones por página son: 12, 14, 10, 8, 15 , 5, 7, 13, 10 y
6. Utilizando  = 0,05. ¿ Qué decisión se debe tomar?.

18. Suponga que la estatura media de los hombres tiene una varianza de 9
centímetros. Se miden 49 estudiantes, hombres elegidos aleatoriamente, y se
obtiene una estatura media de 165 centímetros. Determine los límites de
confianza del 75,8 % para la estatura media de los hombres de esta Universidad.

19. ¿Qué tamaño deberá tener una muestra para estimar dentro del 2,5 %, la
proporción de mujeres casadas que van periódicamente a consulta ginecológica,
en una población de 20000 mujeres y una seguridad del 99,8 %?.

20. Un candidato político esta planeando su estrategia de campaña y quiere


determinar que tan conocido es. En una muestra aleatoria de 6000 de los 50000
votantes registrados en el país, 2400 manifestaron reconocer el nombre del
candidato.
Construya un intervalo del 94,76% de confianza para la verdadera proporción de
votantes en el país que están familiarizados con ese candidato.

21. El fabricante de una patente médica sostiene que la misma tiene un 90 % de


efectividad en el alivio de una alergia, por un periodo de 8 horas. En una muestra
de 200 individuos que tienen la alergia la medicina suministrada alivió a 160
personas. Determinar si la aseveración de fabricante es cierta. Si se toma el nivel
de significación del 0,01.

22. El I.Q. (Coeficiente de Inteligencia) de 16 estudiantes de una zona de una ciudad


dio una media de 107 con una variancia de 100, mientras que el I.Q. de 14
estudiantes de otra zona de la ciudad dio una media de 112 con una desviación
típica de 8. ¿Hay diferencia significativa entre el I.Q. de los dos grupos al nivel
de significación del (a) 0,01 y (b) 0,05?

42
23. Con referencia a la tabla:

Calificación en el primer examen (X) 6 5 8 8 6 4 9


Calificación en el segundo examen (Y) 8 7 7 10 5 6 8

a) Hallar el coeficiente de Correlación lineal entre las variables X, Y


b) Hallar el error típico del coeficiente de regresión.
c) Encontrar un intervalo de confianza de 99 por 100 para β.

43
ELECCIÓN DEL ENSAYO ESTADÍSTICO ADECUADO PARA 

SI Utilizar prueba de Z
¿Se conoce
?
SI
NO Utilizar prueba de Z
¿Es n> 30?
SI Utilizar prueba de Z
NO
¿Se conoce
?
SI
NO Utilizar prueba de t

¿Se sabe que la


población es
normal? SI Utilizar prueba de Z (por el
teorema central del límite)
¿Se conoce
?
NO
SI NO Utilizar prueba de Z (por el
teorema central del límite)
¿Es n> 30?
Utilizar una prueba no paramétrica.
SI
NO
¿Se conoce
?
Utilizar una prueba no paramétrica.
NO

44
Si a, b1 y b2 son las incógnitas para resolver hay que hallar las ecuaciones normales.
…………………….. (i)

…………(ii)

…………(iii)

Para solucionar obliga a la aplicación del algebra matricial o al manejo de algunos paquetes
estadísticos que contienen programas de regresión (SPSS o MINITAB)

45
EJERCICIOS DE REGRESIÓN LINEAL MÚLTIPLE

1. Supongamos que el ingreso familiar de un artículo depende de sus ingresos y del


precio. A fin de determinar una función de demanda para este artículo se
encuesto a 5 familias obteniendo los datos indicados en el cuadro:
CONSUMO PRECIOS ($) INGRESOS ( $)
Y X Z
5 3 15
6 8 20
8 6 30
3 7 40

8 6 50

a. Determinar la línea de regresión ingresos múltiple del consumo (Y),


precios (X) e (Z) de las 5 familias.
b. Si el artículo vale $ 15 y tiene un ingreso de $ 60, ¿cuánto consume?

2. La tabla muestran las cantidades de ventas (Y) hechas por un grupo de 8


vendedores durante con periodo dado, los años de experiencia en ventas (X1) y
las calificaciones de una prueba de inteligencia (X2) de cada vendedor.

Vendedor A B C D E F G H
Cantidad de ventas en ($ 1000) (Y) 9 6 4 3 3 5 8 2
Años de experiencia en ventas (X1) 6 5 3 1 4 3 6 2
Calificaciones en prueba de Inteligencia (X2) 3 2 2 1 1 3 3 1

Calcular:
a) La ecuación de Regresión Múltiple.
b) La desviación estándar de regresión.
c) El coeficiente de determinación y el coeficiente de correlación.

REGRESIÓN Y CORRELACIÓN

46
CALCULO DE LOS PARÁMETROS: a y b

Dada la ecuación de la recta


Y* = a + bX

los parámetros a y b se calculan a partir de las Ecuaciones Normales

 Y = an + bX
 XY = a  X + b X2

donde las sumatorias se obtienen a partir de los datos (X,Y).

Nota:
Escribir y* = a + bx significa que y* es un valor estimado de Y. El error e estaria dado
por: e = y - y*, entonces el valor real de Y es:

Y = a + bx + e
Ejemplo
Supongamos que se quiere estimar la relación entre ingreso y consumo, para el efecto se
eligió un muestra de 6 familias.

Dados los datos, se define la variable dependiente (Y = Consumo) y la variable


independiente (X = Ingreso), luego se construye el Cuadro N° 01, donde están los
valores que participan en las ecuaciones normales.

Los valores de a y b se pueden calcular utilizando cualquiera de los tres siguientes


métodos.

47
i. Resolver las ecuaciones normales como un sistema de ecuaciones
simultáneas, por el método de sumas y restas.
 Y = an + bX
 X Y = a  X + b  X2 …………………..(I)

Cuadro N° 01
INGRESO Y CONSUMO DE UNA MUESTRA DE 6 FAMILIAS
INGRESO CONSUMO
XY X2 Y2
X Y
35 30 1050 1225 900
40 35 1 400 1 600 1 225
38 30 1140 1444 900
55 50 2750 3025 2500
42 35 1470 1764 1225
60 50 3000 3600 2500
270 230 10810 12658 9250
X Y  XY  X2  Y2

reemplazando el valor de las sumatorias, ecuación I se tiene:


230 = 6 a + 270 b b = 0,9055
10810 = 270 a + 12658 b a = -2,4142

Entonces, la recta de regresión es: Y* = -2,4142 + 0,9055 X

ii. También la aplicación directa de fórmulas para a y b deducidas de las


ecuaciones normales:

48
reemplazando valores de las sumatorias:

iii. Luego la recta de regresión es:

Y* = -2,4142 + 0,9055 X

Nota: En la ecuación de la recta Y* = a + b X el coeficiente “b” de la variable


X, se llama el coeficiente de regresión o pendiente de la recta. Considerando el
signo de este coeficiente se tiene:
1) Si b es positivo (b > 0), entonces existe una relación lineal positiva o
directa es decir X ↑ Y ↑ ó X ↓ Y ↓.
2) Si b es negativo (b < 0) se tiene una relación lineal negativa o inversa, es
decir X ↑ Y ↓ ó X ↓ Y ↑.

iv. Error estándar de Estimación


Llamado también desviación estándar de regresión, es una medida de
esparcimiento alrededor de una línea de regresión. Es la desviación estándar de
los valores observado y son respecto a los valores Y* estimados por la línea de
regresión.

Varianza Residual Y sobre X

Regresión Lineal

49
……. coeficiente de regresión cuando X es V. i.

……. Ecuación de regresión lineal simple cuando X es V.i.

… La varianza residual.

Análisis de variancia de la Regresión Lineal

Fuentes g.l. S.C. C.M. F


Debido a la 1
regresión
ERROR n–2

TOTAL n-1

50
….. Varianza de b

…. Desviación estándar de b.

…. La varianza de la línea de regresión

Coeficiente de Correlación
r2 = Coeficiente determinación.
1 - r2 = Coeficiente de no determinación

Ecuación de la regresión lineal simple cuando Y es V.i.

Coeficiente de regresión cuando Y es la V.i.

51
v. Coeficiente de correlación:
El coeficiente de correlación, es el estadígrafo que expresa o mide el grado de
asociación o afinidad entre las variables relacionadas, se denota por “r” y se
define como:

Ejemplo:
Un coeficiente de correlación basado en una muestra de tamaño 18 resultó ser
0,32. ¿Puede concluirse a un nivel de significación del 0,05 que el coeficiente de
correlación poblacional es apreciable mayor que cero?
Solución: Datos: r = 0,32 n = 12  = 0,05
1) Hp : p  0
5)
Ha : p > 0
tc = 1,35
2)  = 0,05
6) tc  Z. A
3)
Aceptamos la Hp

p>0 p  0
p0
4)

Z.A. 1,75 Z.R.

52
EJERCICIOS DE REGRESIÓN Y CORRELACIÓN

1. Considere la colección adjunta de datos pareados. Representan el número de


horas de estudio (x) y la calificación recibida (y) en un examen para una muestra de
seis estudiantes.

Estudiante A B C D E F
X: horas de estudio 1 2 4 4 7 12
Y: calificación 71 71 74 80 80 86

Se pide:
A. Un diagrama de dispersión para los datos.
B. Encuentre la ecuación de la recta de regresión.
Y=a+bX
C. Dibuje una gráfica de la recta de regresión en el diagrama de dispersión.
D. Determine Y cuando X = 10
E. Calcular el valor del coeficiente de correlación de Pearson (r).
F. Construir una tabla de resumen de ANOVA para los datos.
G. Calcular la varianza residual.

2. Una compañía vendedora de libros desea realizar mejoras en su organización tal


como realizar con tiempo sus pedidos, distribuir mejor su personal, ampliar su local,
etc. Para el efecto, lleva a cabo un estudio a fin de establecer la relación existente
entre el número de personas que solicitan información de los libros (x) y el número
de libros vendidos (y). Siguiendo las recomendaciones del estadístico, se registra el
número de personas que solicitan información de los libros en una semana (x) y el
número de libros vendidas en la semana siguiente (y). Los resultados obtenidos
fueron los siguientes:

N° de solicitantes (x) 25 6 10 12 25 36
N° de libros vendidos (y) 13 4 8 7 20 18

53
El gerente de la compañía desea saber:

a) Determine los puntos (x, y) en un eje cartesiano.


b) ¿Cuál será el cambio que se presentará en las ventas, ocasionadas por los
cambios que se presentan en el número de solicitantes?
c) ¿Cuántos libros venderá la compañía en una semana, si en la semana anterior
ocho personas solicitaron información?
d) ¿Cuántos libros venderá la compañía si se incrementa el número de solicitantes a
un total de 25?
e) Calcular la suma de cuadrados de la regresión, la varianza residual y presentar
los resultados en un cuadro de análisis de varianza de la regresión.
f) Asuma que los datos son tomados según el modelo al azar, hallar r y determine
su significación estadística.

3. En un experimento de maíz las alturas promedios de plantas tomadas después de


30 días de la floración fueron:

Semanas 1 2 3 4 5 6
Altura de plantas 2,45 2,60 2,78 3,05 3,40 3,47

4. En un curso universitario las notas de 10 estudiantes en un primer paso, X, y en


el examen final, Y, fueron:

X 5 8 8 12 7 18 13 5 8 12
Y 0 10 18 20 8 20 16 5 6 6

5. Los siguientes datos corresponden a los ingresos y al consumo mensual de seis


personas.

Ingreso (X) 5,120 4,730 4,570 4,900 4,310 4,370


Consumo (Y) 4,990 4,560 4,380 4,700 4,160 4,180

54
6. Para poder utilizar los resultados de un examen de aptitud para la contratación de
personal obrero, en una fábrica se tomó esta prueba de aptitud y se determinó la
productividad en 10 obreros seleccionados al azar. Los resultados fueron:

Aptitud (X) 12 17 20 13 8 9 11 13 19 10
Productividad (Y) 40 42 32 20 20 7 24 20 40 30

Para cada uno de los ejercicios (del 3 al 6):

a. Determine los puntos (X, Y) en un eje cartesiano.


b. Determine la línea de regresión y trácela en el eje cartesiano.
c. Determine el Cuadro de Análisis de Variancia de la Regresión, realice la
prueba de significación y establezca sus conclusiones.
d. Halle I.C. ( ) con = 0,01
e. Establezca una prueba de hipótesis referente a y realice la prueba
estadística con = 0,05. ¿Cuáles son sus conclusiones?
f. Halle el I.C.  Y.X  para

g. Establezca una prueba de hipótesis referente a  Y.X i para un valor particular


de X 1, realice la prueba estadística con = 0,05. ¿Cuáles son sus
conclusiones?
h. Halle el para
i. Asuma que los datos son tomados según el modelo al azar, halle r y
determine su significación estadística.

7. Una compañía vendedora de libros desea realizar mejoras en su organización tal


como realizar con tiempo sus pedidos, distribuir mejor su personal, ampliar su local,
etc. Para el efecto, lleva a cabo un estudio a fin de establecer la relación existente
entre el número de personas que solicitan información de los libros (x) y el número
de libros vendidos (y). Siguiendo las recomendaciones del estadístico, se registra el
número de personas que solicitan información de los libros en una semana (x) y el
número de libros vendidas en la semana siguiente (y). Los resultados obtenidos
fueron los siguientes:

55
Nº de solicitantes (x) 20 8 10 12 30 25
Nº de libros vendidos (y) 13 4 8 6 16 12

El gerente de la compañía desea saber:

a. ¿Cuál será el cambio que se presentará en las ventas, ocasionadas por los
cambios que se presentan en el número de solicitantes?

b. ¿Cuántos libros venderá la compañía en una semana, si en la semana anterior


ocho personas solicitaron información?

c. ¿Cuántos libros venderá la compañía si se incrementa el número de solicitantes a


un total de 40?

d. Calcular la suma de cuadrados de la regresión, la varianza residual y presentar


los resultados en un cuadro de análisis de varianza de la regresión.

e. Hallar la varianza de b y el intervalo de confianza de . Si  = 0,05.

f. Realizar la prueba de hipótesis de  = 0 y la gerencia establece un nivel de


probabilidad de  = 0,05. ¿Cuáles son sus conclusiones?

h. Asuma que los datos son tomados según el modelo al azar, hallar r y determine
su significación estadística.

i. Realizar la Prueba de Hipótesis de  = 0 y la gerencia establece un nivel de


probabilidad de  = 0,01. ¿Cuáles son sus conclusiones?

j. Halle el para Xi = 8 con .

k. Establezca una prueba de hipótesis referente a = 10 para un valor

particular de Xi = 8 y realice la prueba estadística con  = 0,05. ¿Cuáles son sus


conclusiones?

8. En una muestra de 42 pares de valores de X y Y se obtiene un coeficiente de


correlación de 0,22. ¿Indica esto una correlación significativa con base en un nivel
de significación del 5%?

56
9. Con los siguientes datos:

Se pide:
a. Calcular el coeficiente de correlación.

b. Estimar el valor de
Cuando X = 20 y establecer los límites de confianza del 95%.

c. Determinar el porcentaje de varianza que quedó sin explicar.

10. En una regresión lineal simple, el valor estimado del coeficiente de regresión

byx = 2,5 cms. Sb = 0,8

a. Establecer un intervalo de confianza del 95% para el verdadero parámetro de


byx, si n=25,

b. Probar al nivel del 5% el coeficiente de regresión.

11. Se toman aleatoriamente 18 estudiantes del III semestre del I.S.T.P. "José Pardo",
de la especialidad de Computación e Informática y se advierte correlación de - 0,4
entre el ingreso familiar y las horas por semanas dedicadas a ver televisión. ¿A nivel
de significación de 0,01; hay correlación negativa importante para todos los
estudiantes?

57
12. La talla y el peso de cinco varones son como sigue:

Talla (pulgadas) 64 68 70 72 74

Peso (libras) 160 170 180 190 195

a. ¿Qué peso predice para un varón con talla de 69 pulgadas?


b. ¿Qué talla predice para un varón que pesa 185 libras?
c. Probar Ho:  = 2,5; Ha:   2,5  = 0,05.

d. Encontrar un intervalo de confianza del 99% para .

58
REGRESIÓN Y
CORRELACIÓN MÚLTIPLE

Cuando se trabaja con más de dos variables independientes, relacionadas entre sí, el
análisis de regresión recibe el nombre de regresión múltiple. El grado de relación que
puede hacer entre estas variables es cuantificado mediante el cálculo del coeficiente de
correlación múltiple.

La ecuación de regresión múltiple con tres variables es:


……………..(1)

59
3. Suponga que una compañía grande de productos para el consumidor desea medir
la efectividad de varios tipos de medios de publicidad para promover sus productos.
Específicamente se van a considerar dos medios de publicidad: publicidad en radio y
televisión y publicidad en periódicos (Incluyendo el costo de los cupones de descuento).
Se seleccionó una muestra de 4 unidades con poblaciones más o menos iguales para el
periodo de prueba de un mes. Se asigna un nivel de gasto específico a cada ciudad en
radio y televisión, y en periódicos. Se registraron las ventas de productos (con miles de
dólares) y los niveles de gasto durante el mes de prueba con los siguientes resultados.

Publicidad en radio Publicidad en


Ventas (miles de
Ciudad y televisión (miles periódicos (miles de
dólares)
de dólares) dólares)
1 3 5 2
2 6 4 4
3 4 1 1
4 3 2 1

Con base en los resultados obtenidos:


a) Establezca la ecuación de regresión múltiple.
b) Interprete el significado de las pendientes en este problema.
c) Pronostique las ventas promedio para una ciudad donde la publicidad de
radio y televisión es de 2 000 dólares y en periódicos de 4 000 dólares.
d) Calcule el coeficiente de determinación múltiples e interprete su
significado.

4. Suponga que una compañía grande de productos para el consumidor desea medir
la efectividad de varios tipos de medios de publicidad para promover sus
productos. Específicamente se van a considerar dos medios de publicidad:
publicidad en radio y televisión y publicidad en periódicos (Incluyendo el costo
de los cupones de descuento). Se selecciona una muestra de 10 unidades con
poblaciones más o menos iguales para el periodo de prueba de un mes. Se asigna
un nivel de gasto específico a cada ciudad en radio y televisión, y en periódicos.
Se registraron las ventas de productos (con miles de dólares) y los niveles de
gasto durante el mes de prueba con los siguientes resultados.

60
Publicidad en radio y Publicidad en
Ventas (miles
Ciudad televisión Periódicos
de soles)
(Miles de soles) (Miles de soles)
1 6 2 50
2 8 3 60
3 10 7 70
4 8 3 80
5 12 5 100
6 14 6 120
7 8 3 60
8 6 3 80
9 10 4 90
10 10 4 110

Se pide:
a) Establezca la ecuación de regresión múltiple.
b) Interprete el significado de las pendientes en este problema.
c) Pronostique las ventas promedio para una ciudad donde la publicidad de
radio y televisión es de 20 000 nuevos soles y en periódicos de 20 000
nuevos soles.
d) Calcule el coeficiente de determinación múltiple e interprete su
significado.
e) Calcule r2 ajustada.
f) Calcular el error estándar de estimación múltiple.

61
SERIES CRONOLÓGICAS

Series estadísticas en general. Dentro de estas series estadísticas merecen especial


atención aquellas que tienen como uno de sus variables el tiempo. Ya hemos
mencionado también que cuando uno de los caracteres cuantitativos es el tiempo la serie
estadística se llama serie cronológica, el segundo carácter puede ser cualitativo o
cuantitativo.

El interés por estas series radica en que son útiles en muchos trabajos en los que el
tiempo juega un papel preponderante, lo cual ocurre en múltiples aspectos de la
Administración, Economía y muchas otras disciplinas.

CONCEPTO Y TIPOS DE SERIES CRONOLÓGICAS

Se llama serie cronológica o temporal a aquella sucesión de observaciones en la que


alguno de sus caracteres se mide en unidades de tiempo.

El tiempo corno sabemos es una característica cuantitativa y el resto de los caracteres de


la serie pueden ser cualitativos o cuantitativos.
Una serie de tiempo o cronológica, trata una cantidad variable dependiente y corno del
tiempo t. Esto se escribe,
y = F(t)

Es decir, estudia el comportamiento de una variable (y) a lo largo del tiempo (t). Las
unidades de tiempo más usadas son por lo general de un año, un trimestre, un mes, etc.,
Se elegirán las más adecuadas para el estudio que trate de llevarse a cabo.

Dentro de estas unidades de tiempo, algunas tienen duración constante (horas, días,
etc.), pero otras son variables (meses, años, etc.). Este carácter variable puede influir en
los resultados de algunos estudios, y debe tenerse en cuenta al elegir las unidades de
tiempo.

62
Ejemplo:
1. Un ejemplo de serie cronológica es el comportamiento de las ventas mensuales
de un producto A.

Meses (1989) En Feb Mar Abr May Jun Jul Ag Set Oct Nov Dic
Miles de soles 2750 1382 2425 5673 6842 3285 2850 2950 2540 5025 6352 325

63
2. La gráfica de una serie cronológica es una gráfica de línea, la cual se construye
sobre un sistema de ejes coordenados. En el eje horizontal se ubica la variable
independiente tiempo (años, meses, días, etc.), en el eje vertical los valores de la
variable dependiente Y (ventas, producción, etc.). La Fig. representa la gráfica
de la serie.

Gráfica de la serie cronológica del comportamiento de las ventas del prod. A


Y
X

Tipos de series cronológicas


La variable principal de una serie cronológica es el tiempo.

EJEMPLO
Los siguientes son ejemplos de series cronológicas de este tipo:
El stock de una fábrica el último día de cada mes. Los meses no tienen la misma
duración, por tanto estas mediciones no están rigurosamente escalonadas.
Las temperaturas registradas por un termómetro a lo largo de un día tomados cada hora.
Observaciones escalonadas.

Los movimientos o variaciones de las series cronológicas se agrupan en cuatro


Categorías:
 Tendencia secular;

64
 Movimientos Estacionales;
 Movimientos cíclicos;
 Movimientos irregulares

TENDENCIA SECULAR:

Se entiendo por tendencia secular un movimiento suave, regular y de largo plazo, de las
series estadísticas. Con este movimiento se intenta encontrar la dirección general o
tendencia del gráfico de la serie en el tiempo, considerando para ello unidades grandes
de tiempo.

y y

x x

En general, este movimiento vendrá representado por una recta, la dirección puede ser
ascendente, descendente o constante, ver la figura. También podrá representarse por
curvas (parabólicas, exponencial, etc.).

Ejemplo: La variación del precio de los artículos a lo largo de los años ofrece una clara
tendencia de alza.
MOVIMIENTOS CÍCLICOS

65
Se estudian también en movimientos de larga duración, y representan las oscilaciones a
lo largo de una recta de tendencia. Estas oscilaciones reflejadas en los períodos de larga
duración constituyen los ciclos de la serie, y pueden ser o no periódicos. Serán
periódicos cuando en el intervalo de tiempo que sigue a uno considerado, la serie
recorre un camino análogo. En general, un movimiento se considera cíclico sí su
periodo tiene un intervalo de tiempo no inferior a un año.

Ejemplo : Los ciclos de depresión económica en los países se representan cada cierto
numero de años.

MOVIMIENTOS ESTACIONALES

Estos movimientos representan, durante años sucesivos, la evolución de la serie de cada


período de tiempo dentro de cada año. Una buena parte de las series cronológicas siguen
normas idénticas durante estos períodos de tiempo, y su gráfico tiene un aspecto muy
similar al de años anteriores sucesivos.

Ejemplo:

- La variación de precios de los productos agrícolas.


- Los incrementos en las ventas en el mes de Diciembre.

MOVIMIENTOS IRREGULARES O AL AZAR:


Son movimientos que suelen presentarse en una unidad de tiempo dado y que las alteran
la serie de un modo apreciable. Estos movimientos son esporádicos, y suelen ser:
debidos a sucesos aislados e imprevisibles o accidentales, tales como los terremotos, las
guerras, inundaciones, catástrofes, huelgas, etc. Aunque estos hechos producen
variaciones en la serie que solo duran un intervalo de tiempo corto, las consecuencias
pueden ser tan grandes que pueden alterar otros movimientos de la serie; podrían
originar un nuevo ciclo, variar la curva de tendencia, etc.
Ejemplo: La producción de maíz sufre una alteración debido a las Inundaciones de
1983.
ANÁLISIS DE LAS SERIES CRONOLÓGICAS

66
Si se representa por y a la serie considerada, por T a la tendencia, por C a los
movimientos cíclicos ,por E a los movimiento estacionales y por I a los movimientos
irregulares, hay fundamentalmente dos técnicas para la definición de Y.

1. Y=T+C+E+ I, descomposición por suma


2. Y = TCEI, descomposición por producto

En general, se puede presentar a Y como una función de tales Componentes.

Y = f(T,C,E,I)

En la mayoría de los casos no resulta nada simple, en una serie cronológica, distinguir
entre componentes.

EJERCICIOS DE SERIES CRONOLÓGICOS

1. Con los siguientes datos:


AÑOS 1989 1990 1991 1992 1993 1994 1995
PRODUCCIÓN 360 383 337 390 406 459 480

Se pide:
a) Estimar la producción para el 2008 ajustando una recta (tomando como
origen a 1989)
b) Estimar la producción para el 2003 ajustando una recta (trabajar con
cambio de origen)
c) Estimar el mismo año y utilizar el mismo sistema del punto (b) pero
agregando el año 1996 = 600

67
NÚMERO ÍNDICE:

Un número índice es una medida estadística diseñada para mostrar los cambios en una
variable o un grupo de variables relacionadas con respecto al tiempo, situación
geográfica u otra característica, como renta, profesión, etc.

APLICACIONES DE LOS NUMEROS INDICE:

• Comparar el coste de alimentos u otros costes de vida en una ciudad durante un


año con los del año anterior, o se puede comparar la producción de acero durante
un año determinado en una parte del país con la habida en otra parte.

• Así, se tienen índices de salarios, índices de producción, índices de desempleo y


muchos otros. Quizá el mas conocida sea el índice de coste de vida o índice de
precios de consumo

PRECIOS RELATIVOS

• Uno de los ejemplos más sencillos de número índice es un precio relativo, que es
la razón del precio de un bien determinado en un periodo dado a su precio en
otro periodo llamado periodo base.

y generalmente se expresa como porcentaje multiplicando por 100.

Ejemplo 1: Supóngase qué los precios de consumo de un cuarto de leche en los


años 1955 y 1960 fueron 25 y 30 centavos, respectivamente. Tomando 1955
como año base y 1960 como el año dado, se tiene

68
o brevemente 120, omitiendo el signo % como se hace frecuentemente en
literatura estadísticas Este resultado significa sencillamente que en 1960 el
precio de la leche fue el 120 % del que tenía en 1955, es decir, se incrementó en
un 20 %.

Ejemplo 2: Tomando 1960 como año base y 1955 como el año dado en el
Ejemplo 1, se tiene

Esto significa que en 1955 el precio de la leche fue el 83 1/3 % del de 1960, es
decir, decreció en un: 16 2/13 %
Nótese que el precio relativo para un periodo dado con respecto al mismo
periodo es siempre el 100%. En particular, el precio relativo correspondiente al
periodo base es siempre 100. Esto, a veces, se emplea para la notación
estadística escribiendo, por ejemplo, 1955 = 100, para indicar que el año 1955 se
toma como periodo base.

PROPIEDADES DE LOS PRECIOS RELATIVOS:


Si pa’ , pb’ , pc’ ,. • denotan los precios en los períodos a, b, c, ... respectiva mente,
existen las siguientes propiedades para los precios relativos. Deducidas directamente de
las definiciones.

1. Propiedad de identidad Pa/a = 1


Esta simplemente declara que el precio relativo para un periodo dado con
respecto al mismo periodo es 1 ó 100 %

2. Propiedad del tiempo inverso. Pa/b Pb/a = 1 ó Pa/b =

Esta declara que cuando dos períodos se intercambian, sus correspondientes


precios relativos son recíprocos entre sí. Véase los ejemplos anteriores 1 .y 2.

69
3. Propiedad cíclica o circular: Pa/b Pb/c Pc/a = 1
Pa/b Pb/c Pc/d Pd/a = 1, etc.

4. Propiedad cíclica o circular modificada Pa/b Pb/c = Pa/c


Pa/b Pb/c Pc/d = Pa/d, etc.

CANTIDAD O VOLUMEN RELATIVOS

• En lugar de comparar precios de un bien, se puede estar interesado en comparar


cantidades o volúmenes del bien, tales como cantidad o volumen de producción,
consumo, exportación, etc. En tales casos, se habla de cantidad relativa o
volumen relativo. Para mayor sencillez, como en el caso de precios, se supone
que las cantidades son constantes dentro de cualquier periodo. Si no lo fuesen,
podría tomarse una apropiada media para el periodo y hacer válido el supuesto.

• Si q0 denota la cantidad o volumen de un bien producido, consumido, exportado,


etc., durante un periodo base, mientras que qn denota la correspondiente cantidad
producida, consumida, exportada, etc., durante un periodo dado, se define

VALOR RELATIVO
• Si p es el precio de un bien durante un periodo y q es la cantidad o volumen
producido, vendido, etc., durante ese periodo, entonces pq se llama valor total.
Así si son vendidos 1 000 cuartos de leche a 30 centavos cada uno, el valor total
será (0,30)(1 000) = $ 300.
• Si p0 y q0 denotan el precio y cantidad de un bien durante un periodo base
mientras que pn y qn , denotan el precio y la cantidad correspondiente durante un
periodo dado, los valores totales durante estos periodos vienen dados por vo y vn,
respectivamente, y se define

70
METODO DE AGREGACION SIMPLE:
• En este método de cálculo de un índice de precios se expresa el total de los
precios de bienes en el año dado como porcentaje del total de los precios de
bienes en el año base. En símbolos, se tiene

Donde  PO = suma de todos los precios de bienes en el año base


 Pn = suma de los precios de bienes correspondientes en el año dado.

METODO DE MEDIA DE RELATIVOS SIMPLE

• En este método existen varias posibilidades dependiendo del procedimiento


empleado para promediar los precios relativos, tal como la media aritmética,
media geométrica, media armónica, mediana, etc. Por ejemplo, utilizando la
media aritmética, se tendría

Donde  Pn /PO = suma de todos los precios relativos de bienes


N = Número de precios relativos de bienes empleados.

1. Índice de laspeyres o método del año base.


Índice de precios de agregación ponderada con pesos de las cantidades del

año base

2. Índice de Paasche o método del año dado.


Índice de precios de agregación ponderada con pesos de cantidades del año

dado

3. Índice de Valor

71
EJERCICIOS DE NÚMERO ÍNDICE
1. Los precios medios en dólares de carbón por tonelada corta (2000 libras) de
venta al por menor en Lima, durante los años 1953 — 1958, se dan en la
Tabla 1.
a) Tomando 1953 como base, hallar los precios relativos correspondientes a
los años 1956 y 1958.
b) Tomando 1956 como base, hallar los precios relativos correspondientes a
todos los años dados.
c) Tomando 1953 — 1955 como base, hallar los precios relativos
correspondientes a todos los años dados.
Tabla 1
AÑO 1953 1954 1955 1956 1957 1958
Precio medio de carbón
por menor (dólares por 14,95 14,94 15,10 15,65 16,28 16,53
tonelada corta)

72
2. En la tabla 2 se da la producción de trigo en millones de fanegas en Arequipa
durante los años 1950 — 1958. Reducir los datos a cantidades relativos tomando
como base (a) 1955 y (b) 1950 — 1953.
Tabla 2
AÑO 1950 1951 1952 1953 1954 1955 1956 1957 1958
Producción de trigo
(millones de 1019 988 1306 1173 984 935 1004 951 1462
fanegas)

3. La cantidad relativa de 1958 con 1949 como base es 105, mientras que la
cantidad relativa de 1958 con 1953 como base es 140. Hallar la cantidad relativa
de 1953 con 1949 como base.

4. Una compañía espera que sus ventas de un bien se incrementen en un 50% en el


próximo año. ¿En qué porcentaje deberá incrementarse el precio de venta para
que el ingreso total se doble?

5. Los enlaces relativos de precios en 1956 — 1960 son 125, 120, 135, 150 y 175,
respectivamente. (a) Hallar el precio relativo para 1957 con 1955 como base (b)
Hallar la Cadena de enlaces relativos a 1956 como base.

73

También podría gustarte