Ertwy T RTG

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 126

Facultad de Ingeniería y Gestión

Escuela de Ingeniería de Sistemas


Asignatura: Estadística Aplicada

Conceptos básicos
Myrna Manco Caycho

Basado en Córdova Zamora. Estadística Descriptiva e Inferencial

Universidad Tecnológica
Universidad Tecnológica de de Lima
Lima Sur –Sur – UNTELS
UNTELS 2021. 2021. 04RG-2021-UNTELS-VPA
Todos
Todoslos
losderechos reservados
derechos reservados 04RG-2021-UNTELS-VPA
Estadística Aplicada

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

Contenido
• I UNIDAD:
Distribuciones muestrales y estimaciones.
• II UNIDAD:
Prueba de hipótesis paramétrica.
• III UNIDAD:
Introducción a los diseños experimentales y
correlación.
• IV UNIDAD:
Series de tiempo y Regresión lineal múltiple.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

Bibliografía virtual

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

Ebooks de la biblioteca Untels

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

¿Qué son los


modelos de
distribuciones?
¿Cuál es la
diferencia
entre la
¿Qué es una estadística
variable descriptiva y la
aleatoria? inferencia
estadística?

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

LOGRO DE CLASE

Al finalizar la sesión, el
estudiante reconoce la
importancia de la inferencia
estadística.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

pnorm(400,600,100)
pnorm(-2)
0.02275013

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
Propiedad reproductiva de la distribución normal

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Distribución Ji-cuadrado

Características: Si X es una variable aleatoria con


distribución Ji cuadrado, con r grados de libertad,
entonces:

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Propiedades distribución ꭕ2 – Distribución muestral de la varianza

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejercicios

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Distribución t-Student

William Gosset (1876 - 1937)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Propiedad distribución t-Student

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejercicios distribución t-Student

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejercicios distribución t-Student

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Distribución F-Fisher

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Propiedades de la distribución F-Fisher

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejercicios distribución F

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

Inferencia estadística

Tomado de De La Torre y Accostupa

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadística Aplicada

Población
“… Conjunto de todas las observaciones (resultados) posibles que
puede tomar una variable aleatoria X. Según ésta definición, la
distribución de la población es la distribución de la variable
aleatoria X … la población será discreta o continua según sea X”
(*), luego diremos que conocemos una población si conocemos la
distribución F(X) de la variable aleatoria X o las funciones de
cuantía o densidad f(x) de la v.a. X y también conocemos los
parámetros poblacionales correspondientes.
(*)Tomado de Rufino Moya/ Gregorio Saravia “Probabilidades e Inferencia Estadística”)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Muestra aleatoria

“La muestra aleatoria de una v.a. X, con cuantía o densidad f, de


tamaño n, es un conjunto de n valores x , x , ..., x
1 2 n

de las variables aleatorias X 1 , X 2 , ..., X n


respectivamente; donde X 1 , X 2 , ..., X n
son v.a. independientes que se distribuyen idénticamente (i.i.d)
con cuantía o densidad común f.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejercicio: Depósito en un banco

Los depósitos en Nuevo Banco (X) durante el mes de marzo último está
normalmente distribuidos con media S/. 5000 y σ=800 soles. Si se
selecciona una muestra aleatoria (m.a.) de 20 depósitos referentes al mes
de marzo, calcular:
a) ¿Cuál es la probabilidad de que el quinto
depósito sea de a lo más S/. 6500?
b) ¿Cuál es la probabilidad de que la suma
total de los 20 depósitos exceda a S/.
90000?
c) Suponga que un depósito que sobrepase los
7000 ingresa a un sorteo, ¿cuál es la
probabilidad de que ningún depósito, en el
grupo de los 20, ingrese al sorteo?

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejercicio: Depósito en un banco

Los depósitos en Nuevo Banco (X) durante el mes de marzo último está
normalmente distribuidos con media S/. 5000 y σ=800 soles. Si se
selecciona una muestra aleatoria (m.a.) de 20 depósitos referentes al mes
de marzo, calcular:
a) ¿Cuál es la probabilidad de que el quinto
depósito sea de a lo más S/. 6500?

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejercicio: Depósito en un banco

Los depósitos en Nuevo Banco (X) durante el mes de marzo último está
normalmente distribuidos con media S/. 5000 y σ=800 soles. Si se
selecciona una muestra aleatoria (m.a.) de 20 depósitos referentes al mes
de marzo, calcular:
a) ¿?
b) ¿Cuál es la probabilidad de que la suma total de los 20 depósitos
exceda a S/. 90000?

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejercicio para desarrollar: Depósito en un banco

Los depósitos en Nuevo Banco (X) durante el mes de marzo último está
normalmente distribuidos con media S/. 5000 y σ=800 soles. Si se
selecciona una muestra aleatoria (m.a.) de 20 depósitos referentes al mes
de marzo, calcular:

c) Suponga que un depósito que sobrepase los 7000 ingresa a un sorteo,


¿cuál es la probabilidad de que ningún depósito, en el grupo de los 20,
ingrese al sorteo?

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Trabajo aplicativo – Se presenta en la semana 9

Hoja de presentación (Nombres de todos los integrantes. No se aceptará


agregar después de presentado el trabajo)
1. Breve descripción del fenómeno a estudiar
2. Antecedentes (mínimo 3)
3. Enuncie el problema en forma interrogativa y objetivos tanto general
como específicos
4. Enuncie la hipótesis de investigación
5. Formule la hipótesis estadística
6. Determine su población, método de muestreo y tamaño de muestra
7. Recolecte los datos
8. Realice un estudio descriptivo.
9. Verifique la hipótesis de investigación, incluya el estadístico utilizado
10. Interprete y discuta los resultados
11. Obtenga conclusiones mediante el método del p-valor y mediante el
método del valor crítico.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Mg. Myrna Manco Caycho

[email protected]

Universidad Tecnológica
Universidad Tecnológica de de Lima
Lima Sur –Sur – UNTELS
UNTELS 2021. 2021. 04RG-2021-UNTELS-VPA
04RG-2021-UNTELS-VPA
Todos
Todoslos
losderechos reservados
derechos reservados
Facultad de Ingeniería y Gestión
Escuela de Ingeniería de Sistemas

2. Teoremas fundamentales
Myrna Manco Caycho
[email protected]

Universidad Tecnológica
Universidad Tecnológica de de Lima
Lima Sur –Sur – UNTELS
UNTELS 2021. 2021. 04RG-2021-UNTELS-VPA
Todos
Todoslos
losderechos reservados
derechos reservados 04RG-2021-UNTELS-VPA
¿Cuáles son los ¿Qué son las
teoremas distribuciones
fundamentales de muestrales?
la inferencia
estadística?

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
LOGRO DE CLASE

Al finalizar la sesión, el estudiante


reconoce la importancia de los
teoremas fundamentales de la
inferencia estadística.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ley de los Grandes Números
“Las frecuencias relativas de los resultados de un cierto
experimento aleatorio, tienden a estabilizarse en cierto número,
que es precisamente la probabilidad, cuando el experimento se
realiza muchas veces”.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Teorema central del límite

Sea X una variable aleatoria con cualquier


distribución, tal que E[X] = µ y V[X] = σ2 y 𝑥ҧ la
media de una muestra de tamaño n, entonces
su suma es asintóticamente normal.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Estadístico y estimador

• Un estadístico es cualquier función de las


observaciones de una muestra aleatoria. Así es una
variable aleatoria
f ( X 1 , X 2 ,, X n )

• Un estimador de un parámetro q es cualquier función


de la muestra
qˆ = f ( X 1 , X 2 ,, X n )

que conduce a la obtención de valores aproximados de


q.
Se trata de un estadístico que sirve para estimar q.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Distribución de la media muestral
Teorema 1: Sea X una población con media  y
varianza finita 2, y sea X , X ,..., X una m.a. 1 2 n

extraída de la población X. Entonces, si


1 n
x =  xi
tenemos n i =1

E[ ] = 
2 
Var( )= n Error estándar de la media muestral =
n

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Corolario 1
Si X 1 , X 2 , ..., X n es una m.a. extraída de una población
N (  ,  ) y si
n
1
x=
n
 x
i =1
i

  
Entonces x  N   , 
 n
Como consecuencia de este resultado,
x−
z=  N (0,1)

n

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Teorema 2
Sea X una población con media  y varianza
finita 2, y sea X 1 , X 2 ,..., X n una m.a.
extraída, sin reemplazamiento, de la
población X. Entonces, si 1 n
x =  xi
Tenemos n i =1

 2  N −n
E[ ] =  y Var( ) =  
n  N −1 

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Corolario 2
Si X 1 , X 2 ,..., X n es una m.a. extraída de una
población N (  ,  ) finita de tamaño N y si
1 n
x =  xi
n i =1

  N −n 
x  N   , 
Entonces  n N − 1 

Como consecuencia de x−


z=  N (0,1)
 N −n
este resultado, tenemos n N −1

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Consecuencias del Teorema central del Límite

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Distribución muestral de la proporción

Sea  la proporción poblacional de elementos que presentan


cierta característica. La v.a. X que toma valor 1 si el
elemento presenta la característica y 0 si no, sigue
distribución de Bernoulli de parámetro .

nºelementos con la característica en la muestra σ𝑛𝑖=1 𝑋𝑖


𝑝ҧ = =
tamaño muestra 𝑛

𝜋(1 − 𝜋)
E[𝑝]ҧ = 𝜋 ; Var[𝑝]ҧ =
𝑛

Si n>30 y n(1−)>5, podemos aplicar la aproximación del TCL

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Una v.a. X tiene distribución normal, con media
100, y desviación estándar 20. Si es la media
muestral de 16 elementos extraídos de esa
población, calcule P(90< <110). ¿Su resultado
está apoyado en el teorema central del límite?

R. 0.95450

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Duración de focos
Una empresa eléctrica fabrica focos
que tienen una duración que se
distribuye aproximadamente en
forma normal, con media de 800
horas y desviación estándar de 40
horas. Encuentre la probabilidad
de que una muestra aleatoria de
16 focos tenga una vida promedio
de menos de 775 horas.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Peso de los equipajes
Una compañía aérea sabe que el equipaje de sus
pasajeros tiene como media 25 kg. con una desviación
estándar de 6 kg. Se toma una m.a. de 50 pasajeros.
a) La probabilidad de que el peso del equipaje de uno de
estos pasajeros sea superior a 26 kg.
b) Hallar la probabilidad de que el peso medio de los
equipajes de los 50 pasajeros sea superior a 26 kg.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Número de llantas
En determinada ciudad grande 1/3 de las familias no tienen
automóvil, 1/3 tiene uno, 1/6 tiene dos, 1/12 tiene tres y
1/12 tiene cuatro automóvil. Cada automóvil tiene cinco
llantas. Sea X la variable aleatoria que representa el
número de llantas por familia. Se toma una muestra
aleatoria de 100 familias. Determinar
P[ < 5]

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Cargamento de pilas
▪ Un fabricante de radios recibe semanalmente un cargamento de 100,000 pilas de
6 voltios. Para decidir si acepta o rechaza el cargamento, utiliza la siguiente regla
de muestreo: mide la vida útil de 36 pilas de cada cargamento. Si la media de la
muestra es de 50 o más horas acepta el cargamento y en caso contrario, lo
rechaza.

❑¿Cuál es la probabilidad de aceptar un cargamento que tiene una vida útil
media de 49 horas y una desviación estándar de 3 horas?
❑¿Cuál es la probabilidad de rechazar un cargamento que tiene una vida útil
media de 50.5 y una desviación estándar de 3 horas?
❑¿Cuál es la probabilidad de rechazar un cargamento que tiene una vida útil
media de 50 horas? ¿Cuál de aceptarlo?

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
0.158655254

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
• Si de una gran población con =1/3 se
extrae una muestra al azar de 180
unidades. Calcular:
a)  P y  P

b) la probabilidad que 50/180 < P < 70/180.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Muestreo

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
¿Por qué es necesario el muestreo?
✓ El costo de estudiar a todos los elementos de una
población con frecuencia es prohibitivo.
✓La idoneidad de los resultados de Ia muestra.
✓Ponerse en contacto con toda Ia población supondría
mucho tiempo.
✓La naturaleza destructiva de ciertas pruebas.
✓La imposibilidad física de verificar todos los elementos de
Ia población.

Características de una buena muestra


 Debería ser “representativo”
 Debería tener un tamaño apropiado
 Esta formado por miembros “seleccionados” de
la población (individuos, unidades
experimentales).
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
Técnicas de muestreo
MUESTREO DE CONVENIENCIA.
En sus procesos intervienen opiniones y
criterios personales del investigador. MUESTREO POR JUICIO U
No No se conoce la probabilidad de OPINION.
probabilístico selección de las unidades.
MUESTREO POR
No se pueden extrapolar los resultados a CUOTAS.
la población.
MUESTREO DE BOLA DE
NIEVE.

Muestreo aleatorio simple

Cada elemento del universo debe tener la Muestreo aleatorio Sistemático


misma probabilidad de ser elegido en la
Probabilístico muestra.
Muestreo aleatorio Estratificado
Dicha probabilidad puede ser medida.

Muestreo aleatorio por Conglomerados

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Muestreo aleatorio simple

Es un procedimiento por el cual todos y cada uno de los


elementos de la población tienen una oportunidad igual e
independiente de ser incluidos en la muestra. Es eficiente si la
población no es grande y heterogénea. Es sencillo desde el
punto de vista teórico; sin embargo, es demasiado costoso
cuando la población es muy grande.

Ejemplo: Una empresa tiene 120 trabajadores y se quiere


extraer una muestra aleatoria simple de 30 trabajadores. Para
ello se numeran los trabajadores del 1 al 120, se sortean 30
números de entre los 120. Entonces, la muestra estará
formada por los 30 trabajadores a los que les correspondan los
números obtenidos.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
• El muestreo aleatorio evita la preferencia o inclinación a incluir en
la muestra, determinadas observaciones que son de conveniencia.
Es eficiente si la población no es grande y heterogénea. Para
diseñar una muestra aleatoria simple es indispensable contar con
un marco de referencia, es decir, la lista de las unidades, que
resulta de la información previamente disponible, respecto a la
población sobre la cual se basan los esquemas particulares de
muestreo.
• El muestreo aleatorio simple es importante porque muchos de los
diseños muestrales más elaborados usan este tipo de muestreo en
algunos aspectos.
• Ventajas - Sencillo y de fácil comprensión. - Cálculo rápido de
medias y varianzas. - Se basa en la teoría estadística, y por tanto
existen paquetes informáticos para analizar los datos.
• Desventaja - Requiere que se posea de antemano un listado
completo de toda la población, lo cual es muy difícil y costoso.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
• Muestreo aleatorio simple sin reposición.
• Muestreo aleatorio simple con reposición:
• Los muestreos sin reposición y con reposición se diferencian si la
población de la que extraemos la muestra es pequeña. En
cambio, cuando es grande, (y aún más cuando es infinita),
pueden considerarse prácticamente iguales ya que las
repeticiones son muy improbables.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Muestreo aleatorio sistemático

El muestreo sistemático consiste en elegir el primer individuo al azar


y el resto de manera sistemática, cada k-ésimo elemento. Con el
muestreo sistemático se logra mayor eficiencia si las unidades que
se hallan próximas tienen mayor uniformidad que las unidades que
se encuentran alejadas entre sí.
El muestreo Sistemático es especialmente útil en auditorías, cuando
la información relevante se registra en forma ordenada, como en la
memoria de una computadora o en un archivo de tarjetas.
Ejemplo: Si se necesita estimar el porcentaje de descarte por
defectos o daños de insectos en una exportadora, una forma práctica
de hacerlo consiste en seleccionar fruta en la línea de embalaje
(correa transportadora) a intervalos de tiempo iguales hasta
conseguir el número adecuado de frutos.
En este tipo de muestreo se corre el riesgo de obtener muestras
sesgadas cuando existen periodicidades dentro de la población.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
Muestreo aleatorio estratificado

• Se aplica cuando en la población existen claramente


identificados dos o más subpoblaciones o estratos para el
estudio a realizar y se requiere asegurar una muestra con
una cantidad de individuos de cada estrato en relación al
tamaño de éste. Por lo general, en cada estrato se realiza
un muestreo aleatorio simple.
• Ejemplos de estratos son:
• Clases socioeconómicas (A, B, C, D, E)
• Sexo (hombres, mujeres)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
ESTRATOS

Homogéneos en su interior; diferentes entre sí en propiedades y


tamaño

Administración
Ingeniería de Empresas
Electrónica

Ing. De
Sistemas
Ing. Ambiental

Los estratos más grandes tienen mayor probabilidad de ser representados

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
CONGLOMERADOS
Mesa Electoral
1 Grupo 1A
Mesa Electoral
2 Grupo 5C

Mesa Electoral
Grupo 2A
MesaGrupo
Electoral 4
3B
3
Heterogéneos en su interior; diferentes entre sí en propiedades
y tamaño. Ejm: bloques de viviendas, los municipios, etc.
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
32
Todos los derechos reservados
Muestreo por etapas

• Se seleccionan unidades de muestreo (primarias). De


ellas se seleccionan una muestra de cada unidad
(unidades de muestreo secundario) y así sucesivamente.
En cada etapa se puede utilizar el tipo de muestreo que
se desee (aleatorio simple, estratificado o sistemático).

• Ejemplo: En primer lugar se puede seleccionar una calle,


en segundo lugar se selecciona la manzana, luego el
edificio y finalmente la vivienda.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Tamaño de muestra para estudios piloto

Babbie recomienda incluir entre 30 y 50 participantes, los


cuales deben poseer los atributos que se desean medir en la
población objetivo.

Babbie E. Fundamentos de la investigación social. 3a edición.


México: Thomson editores; 2000. p. 232-256.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Tamaño de muestra para estimar una media

2
𝑍(1−𝛼) 𝜎
2
a. Población infinita y varianza conocida: 𝑛=
𝐸0

𝑁𝑍(1−𝛼) 2 𝜎 2
b. Población finita de tamaño N: 2
𝑛=
𝐸0 𝑁 − 1 + 𝑍(1−𝛼) 2 𝜎 2
2
2

Donde:
σ: Desviación estándar de la población
Eo: máximo error de estimación
N: Tamaño de la población
𝑍(1−𝛼) cuantil asociado a la seguridad o confianza deseada (1-)100%
2

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
El tiempo de conexión a internet de los alumnos de cierta universidad sigue
una distribución normal con desviación típica de 15 minutos. Para estimar la
media del tiempo de conexión, se quiere calcular un intervalo de confianza
que tenga una amplitud menor o igual a 6 minutos, con un nivel de confianza
del 95%. Determina cuál es el tamaño mínimo de la muestra que es
necesario observar.
X:Tiempo de conexión de un estudiante (minutos) - POBLACIÓN
Parámetro: Media del tiempo de conexión (mu)
2
𝑍(1−𝛼) 𝜎
2
𝑛=
𝐸0

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
El tiempo de conexión a internet de los alumnos de cierta universidad sigue
una distribución normal con desviación típica de 15 minutos. Para estimar la
media del tiempo de conexión, se quiere calcular un intervalo de confianza
que tenga una amplitud menor o igual a 6 minutos, con un nivel de confianza
del 95%. Determina cuál es el tamaño mínimo de la muestra que es
necesario observar.

library(samplingbook)
sample.size.mean(e = 3, S = 15, level = 0.95)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Se sabe que la desviación típica del peso de los individuos de
una población es 6 kg. Calcula el tamaño de la muestra que se
ha de considerar para, con un nivel de confianza
del 98%, estimar el peso medio de los individuos de la
población con un error inferior a 1kg. Se sabe que la población
tiene 1000 individuos.

library(samplingbook)
sample.size.mean(e = 1, S = 6, N=1000, level = 0.98)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Un estudiante de Administración pública desea determinar Ia cantidad media que
ganan los miembros de los concejos de ciudades.
El error para estimar Ia media es menor de 100 dólares, con un nivel de confianza
de 95%. El estudiante encontró un informe del Departamento del Trabajo de
Estados Unidos que estimó que Ia desviación estándar es de 1,000 dólares.

¿Cuál es el tamaño requerido de Ia muestra?

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Tamaño de muestra para estimar una proporción

2
a. Población infinita o muestreo con 𝑍(1−𝛼)
2
reposición: 𝑛 = 𝑝. (1 − 𝑝)
𝐸

Nota: Si no se conoce el valor de p, usar p=0.5 en la fórmula


anterior.

b. Población finita de tamaño N y el


muestreo es sin reposición: 𝑍2 𝛼 𝑝 1−𝑝 𝑁
1−2
𝑛=
𝑁−1 𝐸2 + 𝑍2 𝛼 𝑝 1 − 𝑝
1− 2

Donde:
p: proporción esperada
E: máximo error de estimación
N: Tamaño de la población
𝑍(1−𝛼) cuantil asociado a la seguridad o confianza deseada (1-)100%
2

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Para estimar la proporción de familias de una determinada ciudad que
poseen microondas, se quiere utilizar una muestra aleatoria de tamaño n.
Calcular el valor mínimo de n para garantizar que, a un nivel de confianza
del 97%, el error en la estimación sea menor que 0.05. Una encuesta
realizada en la temporada anterior indicó que el 20% de las familias de
esa ciudad poseían microondas.

library(samplingbook)
sample.size.prop(e = 0.05, P = 0.20, level = 0.97)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Para estimar la proporción de habitantes de una ciudad que poseen
ordenador personal se toma una muestra de tamaño n. Calcula el valor
mínimo de n para garantizar, con un nivel de confianza del 94%, que el error
de estimación no supera el 2%. (Como se desconoce la proporción, se hará
a partir del caso más desfavorable, que será 0,5).

library(samplingbook)
sample.size.prop(e = 0.02, P = 0.50, level = 0.94)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
De una población de 5000 baterías se quiere seleccionar una muestra aleatoria
simple sin reemplazo, con el objeto de analizar su calidad. Por estudios anteriores,
se sabe que la proporción de baterías defectuosas es de un 10% Se desea tener un
error máximo de muestreo de 0.02 a un nivel de confianza del 95%, ¿qué tamaño de
muestra cumple con estos requisitos? R. 738

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Una financiera desea estimar a partir de una muestra aleatoria de sus numerosos
tarjetahabientes, que proporción de estos clientes planean hacer una compra con
tarjeta de crédito el mes siguiente.
a) ¿De qué tamaño debería ser la muestra para tener una confianza de 80%
que el error al estimar dicha proporción sea menor que 0.04? R. n=257
clientes
b) Justifique el valor de la proporción escogido por usted para los cálculos
efectuados anteriormente.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Facultad de Ingeniería y Gestión
Escuela de Ingeniería de Sistemas

3. Estimación puntual e
interválica

Mg. Myrna Manco Caycho

Universidad Tecnológica
Universidad Tecnológica de de Lima
Lima Sur –Sur – UNTELS
UNTELS 2021. 2021. 04RG-2021-UNTELS-VPA
Todos
Todoslos
losderechos reservados
derechos reservados 04RG-2021-UNTELS-VPA
2

¿Es posible determinar si la distancia


entre caras opuestas (S) de la cabeza
hexagonal de un tornillo cumple con
los requisitos que exige la norma?

Medidas de tolerancia para la


caracterización de la cabeza
hexagonal ANSI

Tomado de:
Felipe & Zuluaga
https://repository.javeriana.edu.c
o/bitstream/handle/10554/7386/t
esis419.pdf?sequence=1

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
LOGRO DE CLASE

Al finalizar la clase, el estudiante


realiza estimaciones puntuales e
interválicas para la media y la
proporción de una población.

• Myrna Manco C.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
4

µ: Promedio
Población de Interés: X σ: Desviación 160
Histograma de la Poblacion
Estimación
estándar
140

120
interválica
100

Frecuencia
80

60

40

20

0
-4 -2 0 2 4
Clases

ഥ−μ
𝑿
Z= ~N(0,1)
σ/ n

Muestreo Distribución
Histogramamuestral de
de la Muestra
16

14

(𝑿𝟏 , 𝑿𝟐 , … , 𝑿𝒏 ) 12
Frecuencia

10

8
σ 𝑿𝒊 Estimador
6
ഥ=
𝑿
4

2
𝒏
Tamaño de la muestra: n 0
-4 -2 0 2 4
Clases

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
6

Intervalo de confianza para la Media (Método de la cantidad pivotal)


Caso: Varianza conocida

Sea la cantidad pivotal:


ഥ −μ
𝑿
𝐐= ≈ N(0,1)
σ/ n

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
7

Error de estimación:

Tamaño de muestra para la estimación de la media:

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Cantidad pivotal e intervalos de confianza para la
media poblacional

Tamaño de muestra

Población infinita:
Inicio 2
𝑍(1−𝛼)𝜎
2
CASO 1 𝑛=
𝐸0

Si
¿La varianza
poblacional σ2
𝜎 𝜎
𝑋−𝑍 1−𝛼ൗ2 ; 𝑋+𝑍 1−𝛼ൗ2
es conocida? 𝑛 𝑛

No Muestreo sin reposición y


población finita de tamaño N:

𝑁𝑍(1−𝛼) 2 𝜎 2
2
CASO 2 𝑛=
𝐸0 𝑁 − 1 + 𝑍(1−𝛼) 2 𝜎 2
2
2
𝑆 𝑆
𝑋−𝑡 𝑛−1;1−𝛼ൗ2 ; 𝑋+𝑡 𝑛−1;1−𝛼ൗ2
𝑛 𝑛

Fin

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
9

Una máquina de empaquetar bolsas de café está regulada para embalar bolsas cuyos
pesos se distribuyen normalmente con media 500 gramos. Supongamos que la máquina
está desregulada y deseamos conocer el verdadero promedio µ. Una m.a. de 35
paquetes produce un media de 485 gramos y una desviación estándar de 10 gramos.
Hallar el intervalo de confianza de 95% para la verdadera media poblacional.

X: Peso de una bolsa de café (gramos)


Parámetro de interés: Peso promedio de TODAS las bolsas de café
(mu)

𝑆 𝑆
𝑋−𝑡 𝑛−1;1−𝛼ൗ2 ; 𝑋+𝑡 𝑛−1;1−𝛼ൗ2
𝑛 𝑛
=3.43512

El verdadero peso promedio de las bolsas de café se encuentra entre 481.6 y 488.4 gramos, con un
nivel de confianza de 95%
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
Se desea estimar la velocidad media en una calle con un límite teórico de 50km por
hora. Con un radar oculto, se observa que la velocidad media de una muestra de 25
coches fue de 58km/hora. Si la desviación típica (estándar) de la velocidad en esta
calle es de 6km/hora, calcular un intervalo de 90% de confianza para la verdadera
velocidad media.

𝜎 𝜎
𝑋−𝑍 1−𝛼ൗ2 ; 𝑋+𝑍 1−𝛼ൗ2
𝑛 𝑛

Se estima que la verdadera velocidad media en esta calle se encuentra entre


56.03km/hora y 59.97km/hora, con un nivel de confianza de 90%

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejercicios

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Las tiendas Pelican

Las tiendas Pelican, una división de National Clothing, es una cadena de tiendas de
ropa para mujer que tiene sucursales por todo Estados Unidos. Hace poco la tienda
realizó una promoción en la que envió cupones de descuento a todos los clientes de
otras tiendas de National Clothing. Los datos obtenidos en una muestra aleatoria de
100 pagos con tarjeta de crédito en las tiendas Pelican durante la promoción se
presentan en el archivo titulado Pelican1 (Archivo adjunto). El modo de pago
Propietary card se refiere a pagos realizados usando una tarjeta de crédito de
National Clothing. A los clientes que hicieron compras usando un cupón de
descuento se les denomina aquí promocionales y a quienes hicieron sus compras
sin emplear cupón de descuento se les denomina regulares. Como a los clientes de
las tiendas Pelican no se les enviaron cupones promocionales, los directivos
consideran que las ventas hechas a quienes presentaron un cupón de descuento
son ventas que de otro modo no se hubieran hecho. Es claro que Pelican espera
que los clientes promocionales continúen comprando con ellos. La variable
Artículos: El número total de artículos comprados, Ventas netas: Cantidad total
cargada a la tarjeta de crédito Los directivos de Pelican desean emplear estos datos
muestrales para tener información acerca de sus clientes y para evaluar la
promoción utilizando los cupones de descuento.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejemplo 3: Obtener un intervalo de confianza del 95% para la
venta neta media de todos los clientes. Suponga que la varianza
poblacional para la venta neta es 14 dólares2 .

###### Estimación por intervalos

### Cargar el conjunto de datos

library(openxlsx)
Pelican <- read.xlsx("C:/Users/Usuario/Desktop/Pelican1.xlsx")
head(Pelican)
attach(Pelican)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
library(TeachingDemos)
z.test(Venta_neta, stdev = sqrt(14), conf.level = 0.95)

One Sample z-test

data: Venta_neta
z = 207.4, n = 100.00000, Std. Dev. = 3.74166,
Std. Dev. of the sample mean = 0.37417, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
76.86715 78.33385
sample estimates:
mean of Venta_neta
77.6005

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejemplo 4: Obtener un intervalo de confianza del 93% para la venta neta
media de los clientes mujeres. Suponga que la varianza poblacional
para la venta neta es 5 dólares2 .

z.test(Venta_neta[Sexo == "Femenino"], stdev = sqrt(5), conf.level = 0.93)

One Sample z-test

data: Venta_neta[Sexo == "Femenino"]


z = 341.53, n = 93.00000, Std. Dev. = 2.23607,
Std. Dev. of the sample mean = 0.23187, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
93 percent confidence interval:
78.76966 79.60991
sample estimates:
mean of Venta_neta[Sexo == "Femenino"]
79.18978

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejemplo 5: Obtener un intervalo de confianza del 91% para la Edad media.
Se desconoce la varianza poblacional.

### Caso 2: Intervalo de confianza para la media con varianza poblacional


desconocida

library(TeachingDemos)
t.test(Edad, conf.level = 0.91)

One Sample t-test

data: Edad
t = 34.773, df = 99, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
91 percent confidence interval:
40.95881 45.20119
sample estimates:
mean of x
43.08

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Ejemplo 6: Obtener un intervalo de confianza del 98% para la edad
media de los clientes Regulares. Se desconoce la varianza poblacional
de le edad de los clientes.

t.test(Edad[Tipo_cliente == "Regular"], conf.level = 0.98)

One Sample t-test

data: Edad[Tipo_cliente == "Regular"]


t = 18.297, df = 29, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
98 percent confidence interval:
36.92559 48.40774
sample estimates:
mean of x
42.66667

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Facultad de Ingeniería y Gestión
Asignatura: Estadística Aplicada

4. Intervalo de confianza para la


proporción, diferencia de medias y
de proporciones

Mg. Myrna Manco Caycho

Universidad Tecnológica
Universidad Tecnológica de de Lima
Lima Sur –Sur – UNTELS
UNTELS 2021. 2021. 04RG-2021-UNTELS-VPA
Todos
Todoslos
losderechos reservados
derechos reservados 04RG-2021-UNTELS-VPA
Aplicación del teorema central del límite a la distribución
Bernoulli

Sea la variable aleatoria X~B(1,) con esperanza µ = E(X) =  y


varianza σ2 = Var(X) = (1-)

Si se seleccionan muestras de tamaño n, con n→ , la distribución


de la PROPORCIÓN muestral es:
𝑛
1
𝑝 = ෍ 𝑋𝑖
𝑛
𝑖=1

E 𝑝 =𝜋 𝜋(1 − 𝜋) 𝜋(1 − 𝜋)
𝑉𝑎𝑟 𝑝 = 𝜎𝑝 =
𝑛 𝑛

𝑝−𝜋
𝑧= ≈ 𝑁(0,1)
𝜋(1 − 𝜋)
𝑛

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Intervalo de confianza para 

Se desea estimar la proporción poblacional ; esto equivale a encontrar dos


valores a y b tales que   <a; b>, con una confianza de (1-)100%.
Si n≥ 30, por el T.C.L. se puede usar la distribución normal estándar y se
encuentra el siguiente intervalo de confianza:

p:proporción
𝑝 1−𝑝 𝑝 (1 − 𝑝) muestral
𝜋 ∈ 𝑝−𝑍 1−𝛼ൗ2 ;𝑝 + 𝑍 1−𝛼ൗ2
𝑛 𝑛

Tamaño de muestra
2
a. Población infinita o muestreo con 𝑍(1−𝛼) Nota: Si no se conoce el valor de p, usar
2 p=0.5 en la fórmula anterior.
reposición: 𝑛 = 𝑝. (1 − 𝑝)
𝐸

𝑍2 𝛼 𝑝 1−𝑝 𝑁
b. Población finita de tamaño N y el muestreo es sin reposición: 1−2
𝑛=
𝑁−1 𝐸2 + 𝑍2 𝛼 𝑝 1 − 𝑝
1− 2

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
De 1000 estudiantes seleccionados al azar, 823 están a favor de una Ley
contra el maltrato animal. Construya un intervalo de confianza del 95% para
el porcentaje de estudiantes a favor de dicha Ley.
Variable: X: Decisión del estudiante de estar a favor/en contra de la Ley
contra el maltrato animal
“a favor”: evento éxito
Parámetro: pi= Porcentaje de estudiantes que están a favor de dicha ley

𝑝 1−𝑝
𝑝∓𝑍 1−𝛼ൗ2
𝑛

p=823/1000 = 0.823
n=1000

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
#Intervalo de confianza para la proporción
p<-823/1000
n<-1000

E0<-qnorm(0.975)*sqrt(p*(1-p)/n)

#Límite inferior
p-E0

#Límite superior
p+E0

#Usando función
library(binom)
binom.confint(823, n=1000, conf.level=0.95,
methods="asymptotic")

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Del archivo Pelican, obtener un intervalo de confianza del 90% para
la proporción de los clientes mujeres.

𝑝 1−𝑝
𝑝∓𝑍 1−𝛼ൗ2
𝑛

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Del archivo Pelican, obtener un intervalo de confianza del 90% para
la proporción de los clientes mujeres.
### Cargar el conjunto de datos

library(openxlsx)
Pelican <-
read.xlsx("C:/Users/Usuario/Desktop/Pelican1.xlsx")
head(Pelican)
attach(Pelican)

table(Sexo)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Obtener un intervalo de confianza del 92% para la proporción
de clientes de sexo femenino de entre los que pagaron con la
tarjeta Proprietary Card.
### Cargar el conjunto de datos
library(openxlsx)
Pelican <-
read.xlsx("C:/Users/Usuario/Desktop/Pelican1.xlsx")
head(Pelican)
attach(Pelican)

table(Sexo, Modo_pago)
addmargins(table(Sexo, Modo_pago))

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
Golfistas

Un estudio encuestó a 900 golfistas para conocer su opinión acerca de


cómo se les trataba en un curso de golf. En el estudio s encontró que
396 golfistas estaban satisfechas con la disponibilidad de horarios de
salida. Construya un intervalo de confianza del 96% para la el
porcentaje de golfistas satisfechos con el horario

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Se hizo un estudio con 611 oficinistas para investigar su atención al
teléfono, el estudio registraba la frecuencia con que contestaban el
teléfono y la frecuencia con que dejaban que la llamada pase al buzón de
voz. De estos oficinistas, 281 indicaron contestar siempre las llamadas y
no utilizar el buzón de voz.

a. Dé la estimación puntual de la proporción poblacional de oficinistas


que siempre responden el teléfono.
b. A 90% de confianza, ¿cuál es el margen de error?
c. Dé el intervalo de 90% de confianza para la proporción de la población
de oficinistas que siempre contestan el teléfono.

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Job satisfaction

Una empresa de recursos humanos, realizó un estudio con 1100 empleados


de empresas medianas y grandes para determinar qué tan insatisfechos
estaban con sus trabajos. En el archivo JobSatisfaction se muestran datos
representativos.
Un “Sí” como respuesta indica que al empleado le desagrada mucho su
empleo actual.

a. Dé la estimación puntual de la proporción poblacional de empleados a


quienes les disgusta mucho su empleo actual.
b. A 95% de confianza, ¿cuál es el margen de error?
c. ¿Cuál es el intervalo de confianza de 95% para la proporción de la
población de empleados a quienes les desagrada mucho su empleo actual?

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Intervalo de confianza para la diferencia de medias

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Cantidad pivotal para diferencia de medias

Inicio

¿Poblaciones ¿Se conocen


independiente las varianzas
s? de las
poblaciones?

¿Las varianzas
poblacionales
son iguales?

Fin

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Intervalo de Confianza para diferencia de medias
CASO I: Varianzas conocidas (1 −  2 )

Supongamos poblaciones normales e independientes

  22 
(
 X 1 − X 2  z )  12
+ 
 2 n1 n2 

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Intervalo de Confianza para diferencia de medias
( 1 −  2 )
CASO II: Varianzas desconocidas pero iguales

Supuesto: Poblaciones independientes y Normales

 1 
(
 X 1 − X 2  t ( ,n + n − 2 )S P ) 1
+ 
n1 n2 
 2 1 2

(n1 − 1)S1 2
+ (n 2 − 1)S 2
2

Sp = Estimador de la
2
varianza
n1 + n 2 − 2

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Intervalo de Confianza para diferencia de
medias (1 −  2 )
CASO III: Varianzas desconocidas y distintas
1   2
2 2

Supuesto poblaciones normales e independientes


 S2 
( )
2 2
S1
 X 1 − X 2  t ( ,v ) +   S12 S 2 2 
2

 2 n1 n2 
  + 
v=  2
n 1 n 2 
2
 S12   S22 
Siendo “v” grados de libertad    
 n   n 
(redondeado)  1  + 2 
n1 − 1 n2 − 1
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
Intervalo de Confianza para diferencia de medias
(1 −  2 )
CASO IV: Poblaciones relacionadas n<30
Supuesto: Poblaciones Normales
𝑆𝐷
𝐷±𝑡 𝛼ൗ ,𝑛−1
2 𝑛

D : Media de las diferencias


t ( ,n −1) : Valor teórico de la distribución t
2

S D : Desviación estándar de las diferencias

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
 1 
( )
 X 1 − X 2  t ( ,n + n − 2 )S P
1
+ 
n1 n2 
 2 1 2

(n1 − 1)S1 2 + (n2 − 1)S 2 2


Sp =
2

n1 + n 2 − 2

1.338276

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA
Todos los derechos reservados
Capacitación de empleados

Se desea saber si hay diferencia significativa entre el rendimiento en las ventas del
personal que recibe capacitación en marketing digital y aquellos a los que no se les
imparte. Se tomó una muestra aleatoria de 60 vendedores adiestrados obteniéndose
un índice de rendimiento promedio de 7,35. Por otra parte, se seleccionaron 80
vendedores no capacitados resultando con un índice de rendimiento promedio de
6,85. De registros anteriores se sabe que la desviación estándar de aquellos que
reciben la capacitación es 1,2 y de aquellos que no lo reciben es de 1,5. Realice la
estimación correspondiente con un nivel de confianza de 96% y concluya en términos
del problema.
Poblaciones independientes? Si
  22 
Se conocen las varianzas poblacionales? Si ( )
 X 1 − X 2  z
 12
+ 
 2 n1 n2 
CASO I

### Caso 1: Varianzas poblacionales conocidas


### Datos resumidos

library(BSDA)
zsum.test(mean.x = 7.35, sigma.x = 1.2, n.x = 60, mean.y = 6.85, sigma.y = 1.5, n.y = 80,
conf.level = 0.96)

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Two-sample z-Test

data: Summarized x and y


z = 2.19, p-value = 0.02852
alternative hypothesis: true difference in means is not equal to 0
96 percent confidence interval:
0.03111064 0.96888936
sample estimates:
mean of x mean of y
7.35 6.85 Two-sample z-Test

  22 
(
 X 1 − X 2  z )  12
+ 
 2 n1 n2 

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Sean los siguientes datos relativos a salarios mensuales de los trabajadores de dos
empresas (en miles de unidades monetarias u.m.):

Empresa 1: 1.52, 2.65, 1.32, 1.73, 1.91, 0.80, 0.96, 1.53, 2.79
Empresa 2: 2.20, 1.56, 1.72, 1.34, 0.87, 1.98, 2.13

Si se verifica la normalidad para ambas poblaciones, construya un intervalo de


confianza al 90% para la diferencia de medias. Suponga que las varianzas son
desconocidas pero iguales.

Poblaciones independientes? Si
Las varianzas poblacionales se conocen? No
Las varianzas poblacionales son iguales? Si
 1 
( )
 X 1 − X 2  t ( ,n + n − 2 )S P
1
+ 
n1 n2 
 2 1 2

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Emp1<-c(1.52, 2.65, 1.32, 1.73, 1.91, 0.80, 0.96, 1.53, 2.79)
Emp2<-c(2.20, 1.56, 1.72, 1.34, 0.87, 1.98, 2.13)

### Caso 2: Varianzas poblacionales desconocidas e iguales


library(TeachingDemos)
t.test(Emp1, Emp2, var.equal = TRUE, conf.level = 0.90)
Two Sample t-test

data: Emp1 and Emp2


t = 0.014162, df = 14, p-value = 0.9889
alternative hypothesis: true difference in means is not equal to 0
90 percent confidence interval:
-0.5287265 0.5372980
sample estimates:
mean of x mean of y
1.690000 1.685714

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Sean los siguientes datos relativos a salarios mensuales de los trabajadores
de dos empresas (en miles de unidades monetarias u.m.):

Empresa 1: 1.52, 2.65, 1.32, 1.73, 1.91, 0.80, 0.96, 1.53, 2.79
Empresa 2: 2.20, 1.56, 1.72, 1.34, 0.87, 1.98, 2.13

Si se verifica la normalidad para ambas poblaciones, construya un intervalo


de confianza al 90% para la diferencia de medias. Suponga que las varianzas
son desconocidas y distintas.

 S2 
( )
2 2
S1
 X 1 − X 2  t ( ,v ) + 
 2 n1 n2 

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
### Caso 3: Varianzas poblacionales desconocidas y distintas
library(TeachingDemos)
t.test(Emp1, Emp2, var.equal = FALSE, conf.level = 0.90)

Welch Two Sample t-test

data: Emp1 and Emp2


t = 0.01483, df = 13.892, p-value = 0.9884
alternative hypothesis: true difference in means is not equal to 0
90 percent confidence interval:
-0.5049870 0.5135585
sample estimates:
mean of x mean of y
1.690000 1.685714

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Control de malezas

Un investigador esta interesado en determinar si el control de malezas puede


incrementar los rendimientos de trigo. Con tal propósito estableció en 10 localidades 2
parcelas similares en condiciones para la vida de las plantas, superficie terrestre,
características topográficas, historia de los usos del suelo, etc. En una de las parcelas se
realizó el control de malezas y en la otra no, encontrando los resultados adjuntos.
Realice la estimación respectiva a un nivel de confianza del 98%. Suponga que el
rendimiento se distribuye normalmente.

Rendimientos en t/ha
Localidad Con control sin control
1 4.0 2.4
2 5.2 1.7
3 5.7 2.7
4 4.2 2.5
𝑆𝐷 5 4.8 2.2
𝐷±𝑡 𝛼ൗ ,𝑛−1 6 3.9 2.3
2 𝑛 7 4.1 2.5
8 3.0 1.7
9 4.6 2.1
10 6.8 4.9

1.6 3.5 3.0 1.7 2.6 1.6 1.6 1.3 2.5 1.9

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
Con.CO <- c(4,5.2,5.7,4.2,4.8,3.9,4.1,3,4.6,6.8)
Sin.CO <- c(2.4,1.7,2.7,2.5,2.2,2.3,2.5,1.7,2.1,4.9)
library(TeachingDemos)
t.test(Con.CO, Sin.CO, paired = TRUE, conf.level = 0.98)

Paired t-test

data: Con.CO and Sin.CO


t = 9.2609, df = 9, p-value = 6.754e-06
alternative hypothesis: true difference in means is not equal to 0
98 percent confidence interval:
1.481069 2.778931
sample estimates:
mean of the differences
2.13

Universidad Tecnológica de Lima Sur – UNTELS 2021. 04RG-2021-UNTELS-VPA


Todos los derechos reservados
UNIVERSIDAD NACIONAL TECNOLÓGICA DE LIMA SUR

EVIDENCIA 2: PRÁCTICA CALIFICADA DE ESTADÍSTICA APLICADA 2022-I (lunes)

Apellidos y Nombres:…………………………………………………………..….………………..

1. (1p) Si X ~ Chi-cuadrado con 12 grados de libertad, hallar la P(X> 16) escriba su respuesta redondeando a
cuatro decimales. Use el punto como separador decimal.

Respuesta: 1-pchisq(16,12) = 0.1912361 = 0.1912

2. (2p) En el archivo Pelican, obtenga el intervalo de confianza del 98% para la edad media de los clientes
mujeres, si se sabe que la varianza poblacional para la edad es 5 años 2. El límite superior es: (Redondee a
4 decimales)

library(openxlsx)
Pelican <- read.xlsx("C:/Users/Usuario/Desktop/Pelican1.xlsx")
head(Pelican)
attach(Pelican)

library(TeachingDemos)
z.test(Edad[Sexo=="Femenino"], stdev = sqrt(5), conf.level = 0.98)

Respuesta: 43.7437

3. (2p) Un ingeniero desea estimar al 98% de confianza, la temperatura media de fusión de cierto material de
fierro. Para ello toma una muestra aleatoria de este material y se obtiene como temperatura de fusión los
siguientes resultados (en °C): 1060, 1260, 1380, 1200 y 1145. Escriba el máximo error de estimación.

fusion<-c(1060, 1260, 1380, 1200, 1145)


t.test(fusion, conf.level = 0.98)

One Sample t-test

Mg. Myrna Manco Caycho


UNIVERSIDAD NACIONAL TECNOLÓGICA DE LIMA SUR

data: fusion
t = 22.408, df = 4, p-value = 2.348e-05
alternative hypothesis: true mean is not equal to 0
98 percent confidence interval:
1006.838 1411.162
sample estimates:
mean of x
1209

Eo = 1411.162-1209 = 202.162

4. (2p) Se ha encontrado que 25 de 250 smartphones producidos por la empresa A son defectuosos,
suponiendo que el muestreo es aleatorio, determine una estimación interválica al 90% para la proporción de
smartphones defectuosos. El límite superior es:

library(binom)
binom.confint(25, n=250, conf.level=0.90, methods="asymptotic")

method x n mean lower upper


asymptotic 25 250 0.1 0.0687911 0.1312089

Respuesta: 0.131

5. (2p) El dueño de un restaurante ha instalado una máquina dispensadora de bebidas. La máquina está
diseñada para servir 530 ml de líquido en el vaso. El dueño sospecha que la máquina podría estar sirviendo
líquido en exceso en los vasos y por lo tanto deberá llamar a un técnico. Se decide tomar una muestra
aleatoria de 30 vasos servidos por esta máquina. El error tipo I es:

a) Decidir erróneamente que la proporción del líquido servido es menor que 530 ml
b) Decidir erróneamente que la proporción del líquido servido es mayor que 530 ml
c) Decidir erróneamente que el contenido promedio del líquido servido es menor que 530 ml
d) Decidir erróneamente que el contenido promedio del líquido servido es mayor que 530 ml
e) Decidir erróneamente que el contenido promedio del líquido servido es igual a 530 ml

Ho: μ = 530
H1: μ > 530

Decidir erróneamente que el contenido promedio del líquido servido es mayor que 530 ml (D)

Ranking de universidades
Se comparan los números promedios de referencias de los artículos publicados por dos universidades
para elaborar un ranking. Se sabe que la distribución de las referencias en ambas universidades es
normal. Al seleccionar una muestra aleatoria de cada grupo se obtuvieron los siguientes resultados:

Mg. Myrna Manco Caycho


UNIVERSIDAD NACIONAL TECNOLÓGICA DE LIMA SUR

Universidad A: 71-19-31-26-65-74-60-60-25-45-7-45-28-44, y de la Universidad B: 29-12-13-21-57-43-


36-48-38-67 ¿Se puede decir que las varianzas son iguales? Utilice α= 0.03

6. (1p) Considerando a la Universidad A como población 1 y a la Universidad B como población 2, la hipótesis


estadística es:

Unilateral derecha
Unilateral izquierda
Bilateral

Respuesta: Bilateral

7. (2p) Escriba el valor del estadístico de prueba .

A<-c(71,19,31,26,65,74,60,60,25,45,7,45,28,44)
B<-c(29,12,13,21,57,43,36,48,38,67)
var.test(A, B, ratio = 1, alternative = "two.sided")

F test to compare two variances

data: A and B
F = 1.3188, num df = 13, denom df = 9, p-value = 0.6899
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.3442728 4.3678087
sample estimates:
ratio of variances
1.31877

Valor del estadístico de prueba: 1.3188 redondeando = 1.32

8. (1p) Escriba el p-valor (Redondee a 3 decimales)

p-value = 0.6899 = 0.690

9. (1p) Se puede concluir que:

a) No existe diferencia significativa entre las varianzas


b) Existe diferencia significativa entre las varianzas
c) No existe diferencia significativa entre las varianzas, con un nivel de significancia de 3%
d) Existe diferencia significativa entre las varianzas, con un nivel de significancia de 3%

Varianza muestral de la UnivA = 436.132


Varianza muestral de la UnivB = 330.711

Hipótesis nula Varianza(UnivA) / Varianza(UnivB) = 1


Mg. Myrna Manco Caycho
UNIVERSIDAD NACIONAL TECNOLÓGICA DE LIMA SUR

Hipótesis alterna Varianza(UnivA) / Varianza(UnivB) ≠ 1

Como el p-valor = 0.690 > = 0.03 se decide no rechazar Ho.


Por tanto, no existen diferencia significativa entre las varianzas, con un nivel de significancia de 3% (LETRA C)

10. (1p) Un evaluador sugiere que la universidad A está en mejor posición. ¿Está usted de acuerdo?
Utilice α= 0.03. Considerando a la Universidad A como población 1 y a la Universidad B como población
2, para esta sospecha, la hipótesis estadística es:

Unilateral derecha de diferencia de proporciones


Unilateral izquierda de diferencia de proporciones
Bilateral de diferencia de medias
Unilateral derecha de diferencia de medias
Unilateral izquierda de diferencia de medias

Hipótesis:
Ho: μ (UnivA) = μ (UnivB)
H1: μ (UnivA) > μ (UnivB)

Unilateral derecha de diferencia de medias

11. (1p) Para esta segunda hipótesis mencione los grados de libertad del estadístico de prueba

El estadístico de contraste es t-Student con GL = n1 + n2 - 2 = 14 + 10 – 2 = 22

12. (1p) El valor experimental (Redondeado a tres decimales)

Valor experimental = 0.787

13. (2p) El punto crítico (Redondeado a tres decimales)

qt(0.97,22) = 1.982911 = 1.983

Mg. Myrna Manco Caycho


UNIVERSIDAD NACIONAL TECNOLÓGICA DE LIMA SUR

14. (1p) Conclusión

Valor p = 0.220
Decisión: No rechazar Ho
Conclusión: No hay suficiente evidencia muestral para afirmar que la universidad A está en una mejor posición, por
lo tanto, ambas universidades tienen la misma calidad en el indicador promedio de referencias de las
publicaciones, con un nivel de significancia α= 0.03

Mg. Myrna Manco Caycho

También podría gustarte