Trabajo de Investigación FINALIZADO - Estadistica Emperesarial - MOD III

1
“AÑO DE LA UNIDAD, LA PAZ Y EL DESARROLLO"
FACULTAD DE INGENIERÍA INDUSTRIAL, SISTEMAS E INFORMÁTICA
ESCUELA PROFESIONAL DE INGENIERIA INDUSTRIAL
TÍTULO
TRABAJO DE INVESTIGACIÓN
ESTUDIANTES
Barrientos Rojas, Félix Martín
Cámara Rodríguez, Paolo Alexander
Morales Jara, Johan Dennis
Sánchez Albornoz, Anamalú del Carmen
DOCENTE
Ing. AMADO SOTELO, JULIO FABIAN
HUACHO – PERÚ
2023
2
INDICE
1 INTRODUCCIÓN ........................................................................................................................ 5
2 CAPÍTULO I: Marco Teórico ....................................................................................................... 6
2.1 La estadística ......................................................................................................................... 6

2.1.1 La estadística descriptiva............................................................................................... 6
2.1.1 La estadística inferencial ............................................................................................... 6
2.1 Medidas de tendencia central ................................................................................................ 6
2.1.1 Media aritmética o media .............................................................................................. 7
2.1.2 Media geométrica .......................................................................................................... 7
2.1.3 Media armónica ............................................................................................................. 7
2.1.4 Mediana......................................................................................................................... 7
2.1.5 Moda ............................................................................................................................. 7
2.2 Medidas de dispersión ........................................................................................................... 7
2.3 Índices Asimetría .................................................................................................................. 8
2.4 Curtosis ................................................................................................................................. 9
2.5 Cuantiles ............................................................................................................................... 9
2.6 Teorema de Chebyshev ......................................................................................................... 9
2.7 Muestreo ............................................................................................................................. 10
2.7.1 Tipos de muestro ......................................................................................................... 10
2.8 Tamaño de la muestra ......................................................................................................... 12
2.8.1 Determinación del tamaño de la muestra ..................................................................... 12
2.8.2 Procedimiento para determinar el tamaño de la muestra ............................................. 13
2.9 Modelos de distribución de probabilidad continua .............................................................. 13
2.9.1 Variable Aleatoria ....................................................................................................... 13
2.9.2 Tipos de variable aleatoria .......................................................................................... 14
2.10 Modelos de distribución de probabilidad continua .............................................................. 14
2.10.1 Distribución normal .................................................................................................... 14
2.10.2 Normal Estándar.......................................................................................................... 15
2.10.3 Distribución de student................................................................................................ 15
2.10.4 Distribución Chi-cuadrada .......................................................................................... 16
2.10.5 Distribución de Fisher-Snedecor ................................................................................. 16
2.11 Distribuciones muestrales ................................................................................................... 17
2.11.1 Inferencia estadística: .................................................................................................. 17
2.11.2 Proporciones de población y muestra .......................................................................... 17
2.11.3 Distribución muestral .................................................................................................. 18
3
2.11.4 Estimadores ................................................................................................................. 18

2.11.5 Parámetro .................................................................................................................... 19
2.11.6 Estadístico ................................................................................................................... 19
2.12 Estimación en poblaciones Normales N (µ, 𝝈𝟐) ................................................................. 19
2.12.1 Estimación de la media µ. ........................................................................................... 19
2.12.2 Estimación de la varianza 𝝈𝟐 ...................................................................................... 21
2.12.3 Estimación por intervalos de confianza ....................................................................... 22
2.13 Intervalos de confianza para la proporción p ....................................................................... 23
2.14 Intervalos de confianza para la media µ .............................................................................. 24
2.15 Intervalo de confianza para la varianza y desviación estándar ............................................ 25
3 CAPÍTULO II: Método ............................................................................................................... 27
3.1 Población y muestra ............................................................................................................ 27

3.1.1 Población..................................................................................................................... 27
3.1.2 Muestra ....................................................................................................................... 27
3.2 Métodos y técnicas de recolección de datos ........................................................................ 27
3.2.1 Instrumentos para la recolección de datos ................................................................... 28
3.3 Métodos, técnicas de procesamiento y análisis de datos ..................................................... 28
4 CAPÍTULO III: Determinación del tamaño de la muestra .......................................................... 29
5 CAPÍTULO IV: Resultados ........................................................................................................ 30
5.1 Medidas de tendencia central: ............................................................................................. 33

5.2 Medidas de dispersión: ........................................................................................................ 33
5.3 Asimetría y Curtosis: .......................................................................................................... 34
5.4 Cuantiles ............................................................................................................................. 34
5.5 Observación del Teorema de Chebyshev: ........................................................................... 36
5.6 Distribución normal estándar: ............................................................................................. 36
5.7 Intervalo de confianza para la media: .................................................................................. 39
5.8 Intervalo de confianza para la diferencia de medias: ........................................................... 42
5.9 Intervalo de confianza para la proporción: .......................................................................... 47
5.10 Intervalo de confianza para la diferencia de proporciones: ................................................. 49
5.11 Intervalo de confianza para la varianza: .............................................................................. 51
5.12 Intervalo de confianza para la desviación estándar: ............................................................ 53
5.13 Prueba de Hipótesis para la media....................................................................................... 54
5.14 Prueba de Hipótesis para la diferencia de medias ................................................................ 57
5.15 Prueba de Hipótesis para la proporción ............................................................................... 60
5.16 Prueba de Hipótesis para la diferencia de proporciones ...................................................... 62
4
5.17 Prueba de Hipótesis para la varianza ................................................................................... 65

5.18 Prueba de Hipótesis para la desviación estándar ................................................................. 65
5.19 Prueba de Bondad de Ajuste con frecuencias esperadas iguales ......................................... 66
5.20 Prueba de Bondad de Ajuste con frecuencias esperadas desiguales .................................... 67
5.21 Prueba de rachas ................................................................................................................. 69
5.22 Prueba de signo ................................................................................................................... 70
5.23 Prueba de Rangos con signo de Wilcoxon .......................................................................... 72
5.24 Prueba U de Mann-Whitney................................................................................................ 74
6 BIBLIOGRAFÍA ........................................................................................................................ 77
7 ANEXOS .................................................................................................................................... 77
5
1 INTRODUCCIÓN
El presente trabajo de investigación, trabajará con los datos de la papa las cuales son
vendidas en la bodega ‘Viki’, la población requerida serán 100 papas. De esta población,
hallaremos la muestra representativa, luego de ello procedemos a hallar los pesos de cada
papa. Cada dato proporcionado será llevado a cálculos estadísticos para llegar a resultados
que nos brinden la información necesaria según sean nuestros intereses dentro de este trabajo
de investigación.
Como ya sabemos, la Estadística es una rama de las matemáticas que nos permite
recopilar, analizar, interpretar y representar datos pudiendo ser de una población o muestra,
según sea indicado con la finalidad de obtener inferencias basadas en el cálculos de
probabilidad, siendo a la vez sujeta a estimaciones concretas que nos permitan llegar a una
medida adecuada y coherente con los datos analizados y estudiados para luego de ello
describir comportamientos, tomar buenas decisiones, obtener conclusiones y dar
recomendaciones para la mejora de la Bodega “Viki”.

6
2 CAPÍTULO I: Marco Teórico
2.1 La estadística
La Estadística es la ciencia cuyo objetivo es recopilar información cuantitativa
concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis
de estos datos podemos obtener unos significados precisos o unas previsiones para el futuro.
‘’La estadística, en general, es la ciencia que trata de la recopilación, organización,
presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de
decisión más efectiva’’ (Muñoz, 2004, pág. 3).
La estadística para su estudio se ha dividido en dos grandes ramas:
2.1.1 La estadística descriptiva
Esta se define como: ‘’La parte de la estadística que permite analizar todo un
conjunto de datos, de los cuales se extraen conclusiones valederas, únicamente para
ese conjunto’’ (Salazar Pinto & Del Castillo Galarza, 2017, pág. 14).
2.1.1 La estadística inferencial
‘’En esta rama de la estadística, lo que se pretende es obtener conclusiones
generales de una determinada población, mediante el estudio de una muestra
representativa sacada de ella’’ (Salazar Pinto & Del Castillo Galarza, 2017, pág. 14).
2.1 Medidas de tendencia central
‘’La medida de tendencia central, es un valor que se encuentra en el centro o en la
mitad de un conjunto de datos’’ (Triola, 2018, pág. 2).
Las principales medidas de tendencia central son:

7
2.1.1 Media aritmética o media
Es el valor que resulta de dividir la suma de todos los valores entre el número
de datos considerados.
2.1.2 Media geométrica
La media geométrica de n valores positivos, se define como la raíz enésima
del producto de estos n valores.
2.1.3 Media armónica
La media armónica de n valores no nulos, se define como el recíproco de la
media aritmética de los recíprocos de esos n valores.
2.1.4 Mediana
Medida de tendencia central que implica el valor que está en medio, cuando
los valores originales de los datos se presentan en orden de magnitud creciente o
decreciente.
2.1.5 Moda
Valor que ocurre con mayor frecuencia.
• Cuando dos valores ocurren con la misma frecuencia y esta es la más
alta, ambos valores son modas. El conjunto de datos es bimodal.
• Cuando más de dos valores ocurren con la misma frecuencia, se dice
multimodal.
2.2 Medidas de dispersión
Las medidas de dispersión son números que indican si una variable se
mueve mucho, poco, más o menos que otra. La razón de ser de este tipo de
medidas es conocer de manera resumida una característica de la variable
estudiada. En este sentido, deben acompañar a las medidas de tendencia

8
central. Juntas, ofrecen información de un sólo vistazo que luego podremos
utilizar para comparar y, si fuera preciso, tomar decisiones (Lopéz, 2019, pág.
1).
Las principales medidas de dispersión son:
➢ Rango o recorrido
Es la diferencia entre sus valores máximo y mínimo.
➢ Desviación estándar
Medida de variación de los valores con respecto a la media. Es un tipo de
desviación promedio de los valores, con respecto a la media.
➢ Varianza
Medida de variación igual al cuadrado de la desviación estándar.
➢ Coeficiente de variación
Es una medida de dispersión relativa (libre de unidades de medidas), que se
define como la desviación estándar dividida por la media aritmética.
2.3 Índices Asimetría
Se dice que una distribución de frecuencias es simétrica, si los intervalos equidistantes
del intervalo central tienen iguales frecuencias. Si la distribución es simétrica, entonces, la
media, la mediana y la moda coinciden. En contraposición, si estos 3 promedios no coinciden
la distribución tiene que ser asimétrica.
✓ Si la distribución de los datos es simétrica, As= 0, en este caso se cumple que: x = Me
= Mo
✓ Si As ≠ 0, la distribución es asimétrica.
✓ Es asimétrica positiva o sesgada a la derecha, si As > 0, en este caso: Mo < Me < x
✓ Es asimétrica negativa o sesgada a la izquierda si As < 0, en este caso: x < Me < Mo

9
2.4 Curtosis
La curtosis es la propiedad de una distribución de frecuencias por la cual se compara
la dispersión de los datos observados cercanos al valor central con la dispersión de los datos
cercanos a ambos extremos de la distribución.
✓ Si la distribución es normal K tiende a 0.
✓ Si K tiende a 0,5, es leptocúrtica.
✓ Si K tiende a -0,5, es Platicúrtica.
2.5 Cuantiles
Un cuantil es aquel punto que divide la función de distribución de una
variable aleatoria en intervalos regulares, por tanto, no es más que una técnica
estadística para separar los datos de una distribución. Eso sí, debe cumplirse
que los grupos sean iguales. Por eso, existen diversos tipos de cuantil, como
veremos más adelante, en función del número de particiones que hacen (Rus
Arias, 2021).
➢ Cuartiles
Divide los valores ordenados en 4 partes iguales; son 3.
➢ Deciles
➢ Percentiles
2.6 Teorema de Chebyshev
La desigualdad de Chebyshev es un teorema utilizado en estadística que proporciona
una estimación conservadora (intervalo de confianza). “La probabilidad de que cualquier

10
variable aleatoria con varianza finita tome un valor dentro de k desviaciones estándar de la
media es de al menos 1-1/k2”.
2.7 Muestreo
El muestreo es la actividad por la cual se toman ciertas muestras de una población de
elementos de los cuales vamos a asumir ciertos criterios de decisión, es importante porque a
través de él podemos hacer análisis de situaciones de una empresa o de algún campo de la
sociedad.
Para que los estudios tengan la validez y confiabilidad es necesario que tal
subconjunto de datos, o muestra, posea algunas características específicas que permitan, al
final, generalizar los resultados hacia la población en total. Esas características tienen que ver
principalmente con el tamaño de la muestra y con la manera de obtenerla.
2.7.1 Tipos de muestro
2.7.1.1 Muestreo no pirobalística
Los elementos de la muestra son seleccionados por procedimientos al
azar o con probabilidades conocidas de selección. Por lo tanto, es imposible
determinar el grado de representatividad de la muestra.
Dentro de los tipos de muestreo no Probabilístico, podemos mencionar
los siguientes:
➢ Muestreo por juicio, selección experta o selección intencional
El investigador toma la muestra seleccionada los elementos que a él
le parecen representativos o típicos de la población, por lo que depende del
criterio del investigador.
➢ Muestreo por conveniencia

11
Basado en la comodidad del investigador, porque se cuenta con dicha
información o acceso un grupo de individuos. Se usa en los casos en no es
posible seleccionar los elementos, y deben sacarse conclusiones con los
elementos que estén disponibles.
➢ Muestreo de cuota
Se utiliza en estudios de opinión de mercado. Los enumeradores,
reciben instrucciones de obtener cuotas específicas a partir de las cuales se
constituye una muestra relativamente proporcional a la población.
➢ Muestreo bola de nieve
Consiste en identificar sujetos que se incluirán en la muestra a partir de
los propios entrevistados. Partiendo de una pequeña cantidad de individuos
que cumplen los requisitos necesarios estos sirven como localizadores de otros
con características análogas. Su aplicabilidad, está mayoritariamente en
estudios con poblaciones de difícil ubicación y/o identificación.
2.7.1.2 Muestreo probabilístico, aleatorio o estocástico
Los elementos de la muestra son seleccionados siguiendo un
procedimiento que brinde a cada uno de los elementos de la población una
probabilidad conocida de ser incluidos en la muestra.
➢ Muestreo aleatorio simple
Cada uno de los elementos de la muestra, se selecciona
aleatoriamente uno por uno y todos los elementos de la población tienen la
misma probabilidad de ser incluidos en la muestra.
➢ Muestreo aleatorio estratificado

12
Una muestra aleatoria estratificada es la obtenida mediante la
separación de los elementos de la población en grupos, llamados estratos y la
selección posterior de una muestra irrestrictamente aleatoria simple en cada
estrato.
➢ Muestreo aleatorio sistemático
Consiste en seleccionar un punto de partida aleatorio, escogiendo
después cada k-ésimo elemento en la lista.
➢ Muestreo aleatorio por conglomerado
Útil cuando la población se encuentra dispersa. La selección de la
muestra puede requerir varias etapas.
2.8 Tamaño de la muestra
2.8.1 Determinación del tamaño de la muestra
Determinar el tamaño de una muestra, es calcular el número de unidades a
incluir en la muestra.
El cálculo del tamaño de la muestra no es una simple operación
aritmética que nos proporcione un valor. Es una función matemática, por lo
tanto, el cambio de una variable, necesariamente se acompaña del cambio de
la otra considerada en la ecuación. Permite una mejor aproximación al número
que se requiere, ajustando a su vez el poder estadístico con otros parámetros
(García, Reding, & López, 2013).
➢ Conceptos previos requeridos
i. Población
13
La población es el conjunto de personas, objetos, eventos,
situaciones y casos que concuerdan con determinadas especificaciones
o características en un periodo, y espacio determinado. Se designa con
“N”.
ii. Muestra
La muestra o unidad muestral es la unidad básica que contiene
los elementos de aquella población que estamos seleccionando. Se
designa con “n”
2.8.2 Procedimiento para determinar el tamaño de la muestra
1. Determinar si el tamaño de la población (N) es infinita o finita.
• Si N no se conoce o N ≥ 100000 ===> Se considera población infinita.
• Si N es conocido, N < 100000 ===> Se considera población finita.
2. Determinar si el estudio o los datos a obtener serán de proporciones o
medias (existe una fórmula para proporciones y otra fórmula para medias).
3. Calcular el tamaño preliminar de muestra (no).
4. Calcular el tamaño final de muestra o muestra ajustada (n).
2.9 Modelos de distribución de probabilidad continua
2.9.1 Variable Aleatoria
Es una función que asocia a cada resultado del espacio muestral (Ω) un
número real.
Notación:
X: Variable aleatoria (v.a.)
x: Valor de la v.a.
14
X= {(w, x) /wεΩ, X(w)=x, xε [R}
2.9.2 Tipos de variable aleatoria
✓ Variable aleatoria discreta
- Aquella que toma valores de un conjunto numerable.
✓ Variable aleatoria continua
- Aquella que toma valores de un conjunto infinito no numerable.
- Puede suponer un valor en cualquier punto fraccionario de un intervalo
especificado.
2.10 Modelos de distribución de probabilidad continua
Entre los principales modelos de distribución de probabilidad continua tenemos:
2.10.1 Distribución normal
Es la distribución continua de probabilidad más importante, por la frecuencia
con que se encuentra y por sus aplicaciones teóricas, es conocida también como
gaussiana o de Laplace – Gauss.
Características:
✓ Tiene la forma de una campana (campana de Gauss)
✓ Es una distribución simétrica.
✓ Utiliza la v.a. X
✓ El área bajo la curva vale 1
✓ La media, mediana y moda son iguales.
✓ La media μ y desviación estándar σ asumen cualquier valor.
✓ Es asintótica al eje de las abscisas.

15
2.10.2 Normal Estándar
La distribución normal estándar llamada también distribución Z, es la que nos
permite reducir cualquier distribución normal al formato de la normal estándar, tiene
una media y desviación estándar únicas, cuyos valores son cero y uno
respectivamente.
Características:
✓ Tiene la forma de una campana
✓ Utiliza la v.a. Z
✓ La media, mediana y moda son iguales.
✓ La media μ=0 y desviación estándar σ=1.
2.10.3 Distribución de student
La distribución t o distribución t de student, es una distribución de
probabilidad continua, que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño.
Características:
✓ Tiene la forma de una campana.
✓ Utiliza la v.a. T.
✓ El área bajo la curva vale 1.
✓ Utiliza los llamados grados de libertad (g). g=n-1
✓ La media μ=0 y la desviación estándar σ asume cualquier valor.

16
2.10.4 Distribución Chi-cuadrada
La variable aleatoria Chi-cuadrada (x2) está definida por la suma de los
cuadrados de los n valores zi:
𝑥 2 = 𝑧12 + 𝑧22 + 𝑧32 + ⋯ + 𝑧𝑛2
𝐹 (𝑥 2 ) = 𝑝(0 ≤ 𝑥 2 ≤ 𝑥02 )𝑔
𝐹 (𝑥 2 ) = 𝑥 2 (𝑝; 𝑔)
Características
✓ Es una distribución asimétrica con sesgo positivo.
✓ Utiliza la v.a. X2
✓ Utiliza los llamados grados de libertad (g).
g=n-1
✓ Los valores de X2 son mayores o iguales que 0.
✓ La forma de una distribución X2 depende de g.
2.10.5 Distribución de Fisher-Snedecor
La distribución F o distribución de Fisher-Snedecor, es una distribución de
probabilidad continua, con V1=(n1-1) grados de libertad en el numerador y V2=(n2-
1) grados de libertad en el denominador. Se utiliza en las pruebas estadísticas de
Análisis de Varianza y los diseños experimentales.
Características:
✓ Es una distribución asimétrica con sesgo positivo.
✓ Utiliza la v.a. F
17
✓ Utiliza dos tipos de grados de libertad:
V1= (n1-1): g.l. numerador
V2= (n2-1): g.l. denominador
✓ Los valores de F son mayores o iguales que 0.
2.11 Distribuciones muestrales
2.11.1 Inferencia estadística:
- Predecir y pronosticar valores de parámetros de población.
- Probar hipótesis sobre valores de parámetros poblacionales.
- Tomar decisiones.
- Hacer generalizaciones sobre las características de una población.
- Sobre la base de las observaciones de una muestra, una parte de una
población.
2.11.2 Proporciones de población y muestra
2.11.2.1 La proporción de población (π)
Es igual al número de elementos de la población que pertenecen a la
categoría de interés, dividido por el número total de elementos de la población.
Figura 1
Proporciones de población
2.11.2.2 La proporción de la muestra (p)
Es el número de elementos de la muestra que pertenecen a la categoría
de interés, dividido por el tamaño de la muestra.

18
Figura 2
La proporción de la muestra
2.11.3 Distribución muestral
La distribución muestral de una estadística, es la distribución de probabilidad
de todos los valores posibles que la estadística puede asumir, cuando se calcula a
partir de muestras aleatorias del mismo tamaño, extraídas de una población específica.
La distribución muestral de 𝑋̅ es la distribución de probabilidad de todos los
valores posibles que puede asumir la variable aleatoria cuando se toma una muestra de
tamaño n de una población específica.
2.11.4 Estimadores
Un estimador es un estadístico (esto es, una función de la muestra) usado para
estimar un parámetro desconocido de la población.
Para cada parámetro pueden existir varios estimadores diferentes.
❑ Propiedades de los buenos estimadores
Los buenos estimadores cumplen 4 propiedades o requisitos:
✓ Ausencia de sesgo
✓ Consistencia
✓ Eficiencia
✓ Suficiencia
19
2.11.5 Parámetro
Características de la población, como la media y la varianza o desviación típica, en la

distribución normal o la probabilidad de éxito en la Binomial son parámetros. Si conocemos
su valor o si somos capaces de aproximarlo con suficiente precisión, podremos responder a
cualquier pregunta sobre la distribución.
2.11.6 Estadístico
Cualquier función de la muestra. Por ejemplo, la media o la varianza muestrales son

estadísticos.
2.12 Estimación en poblaciones Normales N (µ, 𝝈𝟐 )
Una v.a. X ∼ N (µ, 𝜎 2 ) queda caracterizada por dos parámetros: la media µ y
la varianza 𝜎 2 (o la desviación típica σ). A continuación, introduciremos los
estimadores para estos parámetros y sus distribuciones en el muestreo. Es importante
resaltar que tanto para la estimación de µ como de 𝜎 2 , debemos tener en cuenta el
efecto del tamaño muestral y, además, al estimar la media, también debemos ver si la
varianza poblacional es conocida o desconocida.
2.12.1 Estimación de la media µ.
Supongamos que disponemos de 𝑋1 , …, 𝑋𝑛 una m.a.s. de X ∼ N (µ, 𝜎 2 ). La

1
media poblacional µ se puede estimar con la media muestral 𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 , cuya
𝑛
distribución en el muestreo también es Normal:
𝜎2
𝑋̅~𝑁(𝜇, )
𝑛
Además, dado que tenemos una Normal, podríamos tipificarla y obtener una N
(0, 1):
𝑋̅ − 𝜇
~𝑁(0,1)
𝜎/√𝜇
20
La distribución es consecuencia de que la suma de variables Normales es
también una variable Normal. Este resultado es válido si la varianza poblacional 𝜎 2 es
conocida. Esta distribución se puede interpretar de la siguiente forma:
• X se distribuye simétricamente (ya que su distribución es Normal) alrededor de su
media, que es E(X) = µ la media poblacional o teórica.
• El tamaño muestral aparece dividiendo en la varianza, con lo que, al aumentar n, la
distribución de X se concentra más alrededor de µ, como se puede observar en la
Figura 42. Los histogramas y las correspondientes densidades normales, están
centrados en la media real de la población de la población, pero se puede apreciar
que la concentración alrededor de este valor aumenta con el tamaño muestral.
• Error típico: la media muestral X es un estimador simétrico para µ, por lo que
podemos calcular su error típico, que viene dado por:
𝜎
𝐸𝑇(𝑋̅) =
√𝑛
A partir de 500 muestras de tamaño n = 20, n = 100, n = 500. Distribución
normal de media µ = 5 y varianza 1/n.
Si la varianza 𝜎 2 es desconocida no podemos utilizar la distribución obtenida,
y debemos substituir 𝜎 2 por un estimador. La varianza 𝜎 2 puede ser estimada por la
varianza muestral:
𝑛
1
𝑆 = ∑(𝑋𝑖 − 𝑋̅)2
2
𝑛
𝑖=1
o por la cuasi varianza:
𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅ )2
𝑛−1
𝑖=1
21
Estos estimadores se verán con más detalle en la siguiente sección. Entonces,
si queremos estimar la media µ a partir de una m.a.s. 𝑋1 , …, 𝑋𝑛 y no conocemos la
varianza, en la expresión substituimos 𝜎 2 (equivalentemente, σ) por un estimador de
la siguiente manera:
𝑋̅ − 𝜇 𝑋̅ − 𝜇 𝑡 𝑠𝑖 𝑛 ≤ 30
= ~ { 𝑛−1
𝑠/√𝑛 − 1 𝑆/√𝑛 𝑁 0,1)𝑠𝑖 𝑛 > 30
(
donde 𝑡𝑛−1 denota una distribución T-Student, con (n − 1) grados de libertad.
Esta distribución es simétrica y se aproxima a la N (0, 1) para n suficientemente
grande (véase Figura 43). Al igual que en el caso anterior (con varianza conocida),
seguimos teniendo un estimador simétrico, pero el error típico vendrá ahora dado por:
𝑠 𝑆
𝐸𝑇 (𝑋̅) = =
√𝑛 − 1 √𝑛
En resumen, cuando queremos estimar la media µ en una población Normal,
debemos distinguir los siguientes casos:
𝑋̅ −𝜇
1. Si la varianza 𝜎 2 es conocida, entonces: 𝜎/ ~𝑁(0,1)
√𝑛
𝑋̅ −𝜇 𝑋̅ −𝜇
2. Si la varianza 𝜎 2 es desconocida y n > 30: 𝑠/ = 𝑆/ ~𝑁(0,1)
√ 𝑛−1 √𝑛
𝑋̅ −𝜇 𝑋̅ −𝜇
3. Si la varianza 𝜎 2 es desconocida y n ≤ 30: = ~𝑡𝑛−1
𝑠/√𝑛−1 𝑆/√𝑛
2.12.2 Estimación de la varianza 𝝈𝟐
En la estimación de la media se hace necesario utilizar un estimador de la
varianza 𝜎 2 , en caso de que esta no sea conocida. Para ello podemos utilizar la
varianza muestral 𝑠 2 o la cuasi varianza muestral 𝑆 2 . Es fácil ver la relación entre
ellas, ya que:
22
𝑛−1 𝑛
𝑠2 = 𝑛
𝑆 2 , o bien 𝑆 2 = 𝑛−1 𝑠 2
Estos dos estimadores sólo se distinguen en su denominador, y para n grande,
no hay diferencias importantes entre ellos. Como la varianza muestral o la cuasi
varianza proporcionarán valores (aleatorios) positivos, su distribución tendrá como
soporte [0, ∞). Esta distribución será la distribución Chi-cuadrado χ 2 (distribución ji-
cuadrado). Si 𝑋1 , …, 𝑋𝑛 es una m.a.s. de variables normales con varianza σ 2,
entonces:
𝑛𝑠 2 2 (𝑛−1)𝑆2 2
𝜎2
~𝑋𝑛−1 , o bien 𝜎2
~𝑋𝑛−1 ,
2
donde 𝑋𝑛−1 es una distribución Chi-cuadrado con (n − 1) grados de libertad.
Esta distribución es asimétrica y con soporte la semirrecta real positiva, como puede
verse en la Figura 44. Esta distribución es necesaria cuando el tamaño de la muestra
es pequeño. Para n suficientemente grande, podemos aproximar una distribución 𝑋𝑛2
(Chi-cuadrado con n grados de libertad) por una N (n, 2n).
2.12.3 Estimación por intervalos de confianza
En algunas ocasiones, no sólo estamos interesados en dar una estimación
puntual del valor del parámetro desconocido, y el objetivo se centra en obtener un
rango de valores entre los que se encuentre el parámetro de la distribución con una
cierta probabilidad, es decir, un intervalo de confianza. Construiremos intervalos de
confianza para la proporción p en la distribución Binomial y para la media µ en la
distribución Normal. Los estimadores que hemos introducido para la proporción y la
media (𝑝̂ y X, respectivamente) son simétricos y podemos calcular o aproximar su
error típico. La fórmula general para el cálculo de intervalos de confianza será:
Estimador ± Cuantil · ET (Estimador)

23
De este modo, obtendremos intervalos de confianza centrados en el estimador,
y cuya amplitud vendrá determinada por su error típico (donde interviene el tamaño
de la muestra) y por el cuantil de la distribución correspondiente, que estará
relacionado con la cobertura del intervalo.
2.13 Intervalos de confianza para la proporción p
Consideremos 𝑝̂ , proporción muestral, como estimador de p. A partir de la
ecuación podemos construir un intervalo de confianza de nivel (cobertura) (1 − α)
para p:
𝑝̂(1−𝑝̂) 𝑝̂(1−𝑝̂) 𝑝̂(1−𝑝̂)

𝑝̂ ± 𝑧1−𝑎/2 √ o bien (𝑝̂ − 𝑧1−𝑎 √ , 𝑝̂ + 𝑧1−𝑎/2 √ )
𝑛 2 𝑛 𝑛
𝑝̂(1−𝑝̂)
En este caso, el error típico se aproxima por √ y, dado que 𝑝̂ tiene una
𝑛
distribución Normal, consideramos los cuantiles de una N(0, 1). En concreto, para los
intervalos de confianza usuales, se tiene:
𝑝̂(1−𝑝̂)
• IC para p al 90 %: 𝑝̂ ± 1.64√
𝑛
𝑝̂(1−𝑝̂)
• IC para p al 95 %: pˆ ± 1.96√ 𝑛
𝑝̂(1−𝑝̂)
• IC para p al 99 %: pˆ ± 2.57√ 𝑛
ya que para una cobertura 1 − α = 0.9 = 90 % (α = 0.1), el cuantil z1−α/2 =
1.64. Del mismo modo, para una cobertura del 1 − α = 0.95 = 95 % (α = 0.05) el
cuantil es 𝑧1−𝑎/2 = 1.96 y para una cobertura del 1 − α = 0.99 = 99 % (α = 0.01) el
cuantil es 𝑧1−𝑎/2 = 2.57.

24
2.14 Intervalos de confianza para la media µ
Sea X ∼ N (µ, 𝜎 2 ) y consideremos 𝑋1 , …, 𝑋𝑛 una m.a.s. de X. Si estamos
interesados en obtener intervalos de confianza para la media µ, tendremos que tener
en cuenta las siguientes situaciones:
• La varianza 𝜎 2 es conocida.
En ese caso, el IC para µ viene dado por:
𝜎
𝑋̅ ± 𝑧1−𝑎/2
√𝑛
donde 𝑧1−𝑎/2 es el cuantil de una N (0, 1) que tomará valores 1.64 para
cobertura del 90 %, 1.96 para cobertura del 95 % y 2.57 para cobertura del 99 % (al
igual que en los intervalos para la proporción que vimos en la sección anterior).
• La varianza 𝜎 2 es desconocida, pero n es grande.
Cuando la varianza no es conocida, la distribución de la media X es una T-
Student, que para tamaño muestral n ≥ 30 se puede aproximar por una N (0, 1). En
este caso, se debe aproximar el error típico obteniendo el siguiente intervalo de
confianza:
𝑠 𝑆
𝑋̅ ± 𝑧1−𝑎/2 o bien 𝑋̅ ± 𝑧1−𝑎/2
√𝑛−1 √𝑛
donde nuevamente 𝑧1−𝑎/2 es el cuantil de una N (0, 1).
• La varianza 𝜎 2 es desconocida y n es pequeño.
En este caso, debemos considerar los cuantiles de la distribución T-Student,
quedando el intervalo de confianza como:

25
𝑠 𝑆
𝑋̅ ± 𝑡𝑛−1,1−𝑎/2 , o bien 𝑋̅ ± 𝑡𝑛−1,1−𝑎/2
√𝑛−1 √𝑛
donde 𝑡𝑛−1,1−𝑎/2 son los correspondientes cuantiles de una distribución T-
Student con (n − 1) grados de libertad. Estos cuantiles están tabulados. En el caso de
los intervalos de confianza para µ, se puede observar que, para un nivel de
significación fijo, a mayor varianza, mayor longitud del intervalo. El efecto contrario
se produce a medida que aumenta el tamaño muestral. En ese caso, se reduce la
longitud del intervalo. Cuando no conocemos la varianza, obtenemos también
intervalos más amplios que en el caso de 𝜎 2 conocida, ya que los cuantiles de la
distribución t son más extremos que para la N (0, 1)
2.15 Intervalo de confianza para la varianza y desviación estándar
La varianza muestral (S2) es un estimador insesgado y de varianza mínima de la
varianza de la población normal (σ2 ). Sin embargo, la desviación estándar (S) es un
estimador sesgado de σ. El sesgo se reduce rápidamente al aumentar el tamaño de la
muestra (n).
El intervalo de confianza para σ2 se basa en el hecho de que:
[(n − 1) ∗ 𝑆 2 ]
σ2
tiene una distribución de chi-cuadrado con n-1 grados de libertad. La distribución de
chi-cuadrado, al igual que t, depende de sólo un parámetro denominado grados de
libertad, el cual sólo toma valores positivos. La distribución de X2 presenta una
asimetría positiva por cuanto su cola derecha tiende a infinito.
La expresión probabilística que origina el intervalo de confianza es:

26
Los intervalos calculados en esta sección y en las anteriores corresponden a un nivel
de confianza de 1-α y en todos los casos hemos decidido excluir un área
correspondiente a α/2 en ambas colas de la distribución. En el caso de la distribución
normal estandarizada (Z) y la distribución “t” utilizamos intervalos simétricos porque
tienen una amplitud mínima, comparados con intervalos asimétricos para un mismo
nivel de confianza.
Un evento equivalente al anterior puede obtenerse extrayendo la raíz cuadrada de los
tres términos:
El intervalo anterior corresponde a la desviación estándar poblacional y su nivel de
confianza es 1-α. Para calcular un intervalo específico para σ2 solo tenemos que
sustituir S3 por S20. Recuerde que el cálculo del IC para la desviación estándar asume
que los datos provienen de una distribución normal y a diferencia del IC para la
media, en este caso una violación a este supuesto se traduce en un IC sesgado.

27
3 CAPÍTULO II: Método
3.1 Población y muestra
3.1.1 Población
La población que se necesitaba tenía que ser de una misma especie, en este caso
consideramos el usar los tubérculos, por el cual optamos la papa.
La recopilación de datos, se realizó en la bodega “Viki”. La población que se

considero fue de “100” papas, de los cuales con ayuda de una balanza se tomó los pesos de
cada uno de estos
3.1.2 Muestra
En la muestra nos permitirá realizar un estudio viable y creíble el cual nos permite
seleccionar las unidades de la población de cuales se requirió la información, en este caso las
papas de la bodega “Viki”, donde utilizaremos el muestreo probabilístico que nos dice que
cada elemento de la población tiene la misma oportunidad de ser seleccionados y definido
para las características de la población.
3.2 Métodos y técnicas de recolección de datos
Para este trabajo de investigación, se utilizó los siguientes métodos y técnicas de
recolección de información.
Observación Experimental o Participante: Esta técnica es la que más se utilizó para
nuestro trabajo de investigación, donde elabora datos en condiciones relativamente
controladas por el investigador, particularmente porque éste puede manipular la o las
variables, es decir que hemos recopilados la información a través del instrumento la hoja o
ficha de registro de datos.

28
3.2.1 Instrumentos para la recolección de datos
3.2.1.1 Balanza
Con ayuda de este instrumento, cuando ya se tenía la cantidad de
muestra de la papa, se procedió a hacer uso de esta para así saber con la mayor
exactitud posible el peso de cada una de las papas
3.2.1.2 Lapiceros
Fueron uno de los objetos muy necesarios para hacer las anotaciones
respectivas de los pesos de las papas que se pudo encontrar en la bodega ‘Viki’
durante la semana que se fue a recopilar los datos.
3.2.1.3 Hojas
En esta hoja se plasmó los pesos que tenían cada una de las papas que
se usaron como población en nuestro trabajo de investigación y que fueron
útiles para posteriormente hacerle su análisis respectivo.
3.3 Métodos, técnicas de procesamiento y análisis de datos
Este trabajo de estudio se llevó a cabo en base a la Observación experimental o
Participante donde nosotros hemos recopilado la información a través del instrumento la hoja
donde registramos los datos.
Posteriormente, nos enfocamos en el objeto de estudio donde recolectamos la
información general respecto a ello, nuestro objeto de estudio es la papa. Durante la
realización de nuestro estudio, en la parte de análisis se consideró mucho el uso de los
programas proporcionados por el ingeniero (ACZEL).

29
Los datos fueron vaciados en uno de los programas y como resultados nos iba dando
la media, la moda, la mediana, la varianza, la desviación estándar, y muchos más datos lo
cuales fueron usados para la elaboración de este trabajo. Gracias a estos fue que se realizó de
una manera más sistemática y poco menos complicada, a diferencia de realizarlo a mano
todos los cálculos.
Además, en el transcurso de las semanas mientras íbamos avanzando con el desarrollo
del proyecto, nos guiamos del desarrollo de las clases del curso de Estadística Empresarial,
para ver si lo que íbamos desarrollando iba por buen camino y también la manera de cómo es
que deberíamos interpretar los resultados obtenidos.
4 CAPÍTULO III: Determinación del tamaño de la muestra
Para ello identificamos que se trabajará con una población finita cuando N < 100000
y presentaremos las siguientes tablas de información:
Tabla 1
Porcentaje
Población objetiva Cantidad
(%)
Papa de la bodega ‘VIKI’ 100 100
100 100
Tabla 2
Datos
Nivel de Confianza 95%
Representa las unidades de valor de la Dist.
1,960
Normal Estándar (z)
Proporción de éxito (p) 0.5
Proporción de no éxito (q) 0.5
Margen de error (E) 7%
Tamaño de la población (N) 100
Desviación Estándar (𝜎) 10,5498626
30
➢ Determinación del tamaño preliminar de la muestra (n0):
Cuando: N < 100000, para una población finita.
Fórmula:
𝑧 2 ∗𝑁∗𝑠2
n0: [𝐸 2 (𝑁−1)+𝑧2 ∗𝑠2]
n0: 66,44
➢ Determinación del tamaño final de la muestra (n):
Fórmula:
𝑛0
n: 𝑛
[1+ 0]
𝑁
n: 39,92
➢ El tamaño de muestra a ser aplicado es: 40
5 CAPÍTULO IV: Resultados
Tabla 3
Datos de los pesos de las papas en gramos
N° PESO(g)
1 145
2 140
3 150
4 165
5 162
6 170
7 155
8 160
31
9 168
10 152
11 144
12 168
13 151
14 150
15 157
16 165
17 170
18 166
19 159
20 164
21 160
22 160
23 144
24 140
25 168
26 151
27 150
28 157
29 165
30 170
31 166
32 159
33 149
34 124
35 176
36 181
37 178
38 136
39 157
40 134
41 140
42 148
43 168
44 151
45 150
46 157
47 165
32
48 170
49 166
50 159
51 164
52 160
53 160
54 144
55 140
56 168
57 151
58 150
59 157
60 165
61 170
62 145
63 140
64 150
65 165
66 162
67 170
68 155
69 160
70 168
71 152
72 144
73 168
74 151
75 150
76 157
77 165
78 170
79 166
80 159
81 164
82 160
83 160
84 144
85 140
86 151
33
87 150
88 157
89 165
90 170
91 166
92 159
93 164
94 160
95 160
96 144
97 140
98 151
99 150
100 157
Nota: los datos mostrados corresponden a los pesos en gramos de las papas de la bodega ‘Viki’ del
06 de mayo del 2023, de una población de 100 papas, la muestra es de 40 unidades de papas.
5.1 Medidas de tendencia central:
❖ Media: 156,98g
Es el valor promedio en gramos de los 40 papas, que resulta de dividir la suma del
peso de las papas en gramos entre la cantidad de papas consideradas.
❖ Mediana: 159g
Esto quiere decir, que el 50% del peso de las papas es menor o igual a 159g, ya que es
quien divide en 2 partes iguales.
❖ Moda: 160g, es el dato del peso de las papas que ocurre con mayor frecuencia, se
repite más.
5.2 Medidas de dispersión:
❖ Varianza: 112.4238384
❖ Desviación estándar: 10.60301082

34
❖ Coeficiente de variación: 0.067543705lo hallamos al dividir la desviación estándar
sobre la media (S/x̄).
❖ Rango: 57
❖ IQR: 15
5.3 Asimetría y Curtosis:
❖ Asimetría (As): -0.409181564 (Es asimetría negativa)
❖ Curtosis (K): -0.069021171 Es Platicúrtica (donde existe una gran concentración de
los valores entorno a su media), y “k” tiende a -0,5.
5.4 Cuantiles
a) Cuartiles (Qi):
❖ 1er Cuartil: 150
❖ Mediana: 159
❖ 3er Cuartil: 165
❖ IQR: 15
b) Deciles (Di):
Para hallar los valores de los deciles, colocamos los datos de los pesos de las
papas en orden de manera ascendente.
➢ Datos no agrupados y n es par:
𝐾(𝑛)
𝑫𝑲 =
10
➢ Datos no agrupados y n es impar:
𝐾(𝑛 + 1)
𝑫𝑲 =
10
35
En este caso n: Es 40 es par.
❖ Hallando D1:
1(40)
𝐷1 = = 4 = 140
10
❖ Hallando D2:
2(40)
𝐷2 = = 8 = 145
10
❖ Hallando D3:
3(40)
𝐷3 = = 12 = 150
10
❖ Hallando D4:
4(40)
𝐷4 = = 16 = 155
10
❖ Hallando D5:
5(40)
𝐷5 = = 20 = 159
10
❖ Hallando D6:
6(40)
𝐷6 = = 24 = 160
10
❖ Hallando D7:
7(40)
𝐷7 = = 28 = 165
10
❖ Hallando D8:
8(40)
𝐷8 = = 32 = 168
10
❖ Hallando D9:
9(40)
𝐷9 = = 36 = 170
10
36
c) Percentiles (Pi):
❖ P10: 143,6≈ 144
❖ P65: 162,7≈ 163
❖ P90: 170
Otros datos:
❖ Suma: 15698286
❖ Cantidad: 100
❖ Máximo valor: 181
❖ Mínimo valor: 124
5.5 Observación del Teorema de Chebyshev:
❖ Puntos de datos dentro de 1,5 desviación estándar de la media: 87
❖ Fuera de: 100
❖ Cuál es: 87,00%
❖ Mínimo predicho por el teorema de Chebyshev: 55,56%
❖ Mínimo predicho por la regla empírica: 86,64%
5.6 Distribución normal estándar:
Los pesos de las papas se distribuyen normalmente con una media de 157,15 gramos
y una desviación estándar de 12,55 gramos.
Entonces nos es posible responder a las siguientes preguntas:
Datos:
• 𝜇 = 157,15 𝑔
• 𝜎 = 12,55 𝑔
37
a) ¿Cuál es el porcentaje de papas cuyos pesos están entre 157,15 y 165 gramos?
𝑝(157,15 ≤ 𝑥 ≤ 165)
Estandarizamos con la siguiente fórmula:
𝑥−𝜇
𝑍=
𝜎
Donde:
✓ 𝑥 = 𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
✓ 𝜇 = 𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
✓ 𝜎 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
✓ 𝑍 = 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
Solución:
157,15−157,15
• 𝑍= =0
12,55
165−157,15
• 𝑍= = 0,63
12,55
Entonces:
𝑝(157,15 ≤ 𝑥 ≤ 165) = 𝑝(0 ≤ 𝑧 ≤ 0,63) = 𝑝(𝑧 ≤ 0,63) − 0,5

38
0,7357 − 0,5 = 0,2357 = 23,53%
Interpretación:
El porcentaje de papas cuyos pesos están entre 157,15 y 165 gramos es de 23,53%.
b) ¿Cuál es la probabilidad de que una papa cualquiera no sea mayor de 145 gramos?
Solución:
𝑝(𝑥 ≤ 145)
Estandarizamos:
𝑥−𝜇
𝑍=
𝜎
145 − 157,15
𝑍= = −0,97
12,55
Entonces:
𝑝(𝑥 ≤ 145) = 𝑝(𝑧 ≤ −0,97) = 0,1660 = 16,60%
Interpretación:
El porcentaje de la probabilidad de que una papa cualquiera no sea mayor de 145
gramos es de 16.60%.
39
c) ¿Cuál es la probabilidad de que una papa tenga entre 140 y 160 gramos?
Solución:
𝑥−𝜇
𝑍=
𝜎
140−157,15
• 𝑍= = −1,37
12,55
160−157,15
• 𝑍= = 0,23
12,55
-1,37 0,23
𝑝(140 ≤ 𝑥 ≤ 160) = 𝑝(−1,37 ≤ 𝑧 ≤ 0,23) = 𝑝(𝑧 ≤ 0,23) − 𝑝(𝑧 ≤ −1,37)
𝑝(𝑧 ≤ 0,23) − 𝑝(𝑧 ≤ −1,37) = 0,58095 − 0,08534 = 0,49561 = 49,561%
Interpretación:
El porcentaje de la probabilidad de que una papa tenga entre 140 y 160 gramos es de
49,561%.
5.7 Intervalo de confianza para la media:
El peso de las papas se distribuye normalmente con una desviación típica de 10,60.
Se toma una muestra aleatoria de 40 papas seleccionadas de la bodega “Viki”, dió los
siguientes valores en gramos:

40
145;140;150;165;162;170;155;160;168;152;144;168;151;150;157;165;170;166;159;164;16
0;160;144;140;168;151;150;157;165;170;166;159;149;124;176;181;178;136;157;134.
a) Estime un intervalo de confianza del 98% para poder apreciar el peso neto medio de
las papas obtenidas de la bodega “Viki”.
Datos:
❑ s = 10,60
❑ n = 40
❑ 1 - α = 98%
❑ n = 40
Solución:
Debido a que la muestra es grande y la desviación estándar poblacional es conocida,
esta situación pertenece al caso I.
El intervalo de confianza para 𝜇 está dado por:

𝜎 𝜎
𝑥̅ − 𝑧0 . ≤ 𝜇 ≤ 𝑥̅ + 𝑧0 .
√𝑛 √𝑛
No se conoce 𝑍0 , 𝜎 𝑦 𝑥̅ :
Hallamos 𝜎 : 𝜎 = 𝑠 = 10,60 por el TLC
Hallamos 𝑥̅ : 157,15
Hallamos 𝑍0 : 2,326
Ahora reemplazamos los datos y resolvemos
2,326 ∗ 10,60 2,326 ∗ 10,60

157,15 − ≤ 𝜇 ≤ 157,15 +
√40 √40
153,25 ≤ 𝜇 ≤ 161,05
Interpretación:
41
Con un 98 % de confianza estimamos que el peso neto medio de las papas de la
bodega “Viki” estarán comprendidos entre 153,25 g y 161,05 g.
b) Considerando que la población está conformada por 100 papas; estime un intervalo de
confianza del 97,5% para apreciar el peso promedio de las papas de toda la población de las
papas.
Datos:
❑ s = 10,60
❑ n = 40
❑ N = 100
❑ 1 - α = 97,5%
❑ n = 40
Solución
El intervalo de confianza para μ está dado por:
𝑆 𝑁−𝑛 𝑆 𝑁−𝑛
𝑥̅ − 𝑍0 ∗ ∗√ ≤ 𝜇 ≤ 𝑥̅ + 𝑍0 ∗ ∗√
√𝑛 𝑁−1 √𝑛 𝑁−1
No se conoce 𝑍0 :
Hallamos 𝑍0 = 2,241
Reemplazamos los datos y resolvemos:
10,60 100 − 40 10,60 100 − 40

157,15 − 2,241 ∗ ∗√ ≤ 𝜇 ≤ 157,15 + 2,241 ∗ ∗√
√40 100 − 1 √40 100 − 1
154,23 ≤ μ ≤ 160,07
42
Interpretación:
Con un 97,5% de confianza estimamos que el promedio de los pesos de todas las
papas de la bodega ‘Viki’ estará comprendido entre 154,23g y 160,07g, cuando el
tamaño de la población es 100.
5.8 Intervalo de confianza para la diferencia de medias:
Para este punto nosotros volvimos a conseguir datos de la bodega ‘Viki’, de una
población de 110 unidades, los datos obtenidos se muestran en la siguiente tabla:
Tabla 3
Datos de los pesos de las papas de la bodega ‘Viki’ en gramos
N° PESO(g)
1 157
2 165
3 170
4 166
5 159
6 164
7 160
8 160
9 144
10 140
11 151
12 150
13 157
14 165
15 170
16 166
17 159
18 164
19 160
20 160
43
21 144
22 140
23 151
24 150
25 157
26 157
27 165
28 170
29 166
30 159
31 166
32 159
33 149
34 124
35 176
36 181
37 178
38 136
39 157
40 134
41 140
42 148
43 168
44 151
45 150
46 157
47 157
48 165
49 170
50 166
51 159
52 166
53 159
54 149
55 124
56 176
57 181
58 178
59 136
44
60 157
61 134
62 140
63 148
64 168
65 151
66 150
67 124
68 176
69 181
70 178
71 136
72 157
73 134
74 140
75 148
76 168
77 151
78 150
79 181
80 178
81 136
82 157
83 134
84 140
85 148
86 168
87 151
88 150
89 178
90 136
91 157
92 134
93 140
94 148
95 168
96 151
97 150
98 150
45
99 150
100 168
101 151
102 150
103 150
104 150
105 150
106 150
107 150
108 150
109 150
110 157
Nota: Los datos mostrados corresponden a los pesos en gramos de las papas de la bodega ‘Viki’
del 31 de mayo del 2023, el tamaño de muestra aplicado es de 46 unidades de papas.
Problema:
Se investigó el peso de las papas de la bodega ‘Viki’ en dos fechas diferentes, para estimar
la diferencia existente en el peso promedio de las papas de la fecha 1 y la fecha 2. De una
muestra aleatoria de 40 papas en la fecha 1, presenta un peso promedio de 155,175 g y una
desviación típica de 11,50 g; en tanto que, de una muestra aleatoria de 46 en la fecha 2,
presenta un peso promedio de155,174 g y una desviación estándar de 12,40 g, ahora
estimaremos estos datos con un 99% de nivel de confianza.
Para la selección aleatoria de ambas muestras, realizamos el muestreo aleatorio con
la ayuda del Excel. Donde vaciamos la base de datos, hacemos uso de la formula aleatorio.
Entre para obtener los resultados de las muestras correspondientes a cada fecha.
Muestra de la fecha 1
46
150 150 166 152 168 160 170

170 168 140 144 144 160 160
134 150 165 151 162 155 159
136 166 159 140 168 165
165 160 124 150 164 150
Muestra de la fecha 2
157 170 151 140 159 150 148 150

140 170 157 136 170 159 159 157
166 148 178 181 151 165 151 136
124 149 165 159 140 166 168 148
157 157 150 168 148 151
Datos:
Fecha 1 Fecha 2
𝑛1 = 40 𝑛2 = 46
𝑥̅1 = 155,175𝑔 𝑥̅2 = 155,174𝑔
𝑆1 = 11,504𝑔 𝑆2 = 12,401𝑔
1 − α = 99% 1 − α = 99%
Solución:
Este problema pertenece al caso I, ya que n es grande.
El intervalo de confianza para 𝜇1 − 𝜇2 está dado por:
𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
(𝑥̅1 − 𝑥̅2 ) − 𝑍0 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑍0 ∗ √ +
𝑛1 𝑛2 𝑛1 𝑛2
Hallamos 𝑍0 , 𝜎1 𝑦 𝜎2 , ya que son desconocidos:

47
Hallamos 𝑍0 = 2,576
• Hallamos 𝜎1 = 𝑆1 = 11,504𝑔 , por el TLC ya que n es grande.
• Hallamos 𝜎2 = 𝑆2 = 12,401𝑔 , por el TLC ya que n es grande.
Ahora Reemplazamos y resolvemos:
2 2
11,504 12,401
(155,175 − 155,174) − 2,576 ∗ √ + ≤ 𝜇1 − 𝜇2
40 46
2 2
11,504 12,401
≤ (155,175 − 155,174) + 2,576 ∗ √ +
40 46
−6,643 ≤ 𝜇1 − 𝜇2 ≤ 6,645
Interpretación:
Con un 99% de confianza estimamos que los pesos promedios de las papas de la
bodega “Viki” de la fecha 1 y fecha 2 estará comprendido entre -6,643 y 6,645,
entonces no hay diferencias de medias. Por lo tanto, podemos afirmar que no hay
diferencias significativas de los pesos promedios de las papas de la fecha 1 y fecha 2.
5.9 Intervalo de confianza para la proporción:
Se realizo una encuesta para estimar la popularidad de la bodega “Viki” de acuerdo
a las papas, para ello de una muestra de 30 personas, se les realizo las siguientes
afirmaciones y se les consulto con cual están de acuerdo:
a) La bodega Viki, está vendiendo las mejores papas de la ciudad.
b) La bodega Viki, no está vendiendo las mejores papas de la ciudad.
c) No opinan
Al finalizar se obtuvo que un total de 20 personas seleccionaron la opción ‘a’, luego nos
solicitan lo siguiente:
48
a) Con un intervalo de confianza del 95%, de la proporción de personas que están de
acuerdo con que la bodega Viki vende las mejores papas de la ciudad:
Datos:
• n = 30
• k = 20
• 1- 𝛼 = 95 %
Solución:
Si el IC:
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑝̂ − 𝑍0 √ ≤ 𝜋 ≤ 𝑝̂ + 𝑍0 √
𝑛 𝑛
Primero hallamos p, z:
• p = k/n = 20/30= 0,6667
• z= 1,96
Reemplazamos:
0,6667(1 − 0,6667)
0,6667 ± 1,96√
30
0,4980 ≤ 𝜋 ≤ 0,8354
49
Con el 95% de nivel de confianza determinamos que la proporción poblacional de las
personas que concuerdan con que “las papas de la bodega Viki son las mejores de la ciudad”
está comprendido entre 49,80% y 83,54%.
b) De acuerdo con lo obtenido con el intervalo de la parte (a), ¿se podría concluir con
que la mayoría (más del 50 %) de las personas está de acuerdo con que “las papas de
la bodega Viki son las mejores de la ciudad”?
Si se podría, porque el porcentaje de las que personas que fueron encuestadas, afirman
que la bodega ‘Viki’ tiene las mejores papas de la ciudad, está comprendida entre el 49,80%
y 83,54%, nos damos cuenta de que es más del 50%.
5.10 Intervalo de confianza para la diferencia de proporciones:
Se desea estimar mediante un intervalo del 95% de confianza la diferencia en la
proporción de las papas que pesan más de 155g de la bodega ‘Viki’ pesadas en la fecha 1
y en la fecha 2; para este propósito se selecciona aleatoriamente de la fecha 1 una muestra
de 42 papas encontrándose en ella 17 papas que pesan más de 155g; en tanto que en una
muestra de 40 papas seleccionadas aleatoriamente de la fecha 2 se encontró que 7 pesan
más de 155g.
Para la selección aleatoria de ambas muestras, realizamos el muestreo aleatorio
semántico. Donde escogimos un punto de partida aleatoria, escogiendo después cada 3-
ésimo elemento de la lista.
Muestra de la fecha 1:
144 176 160 140 158 131 149
181 157 145 160 123 164 149

50
178 142 134 137 158 168 168
141 146 165 136 152 137 139
134 121 145 139 178 180 170
150 144 158 122 146 176 136
179 138 156 154 145 137 141 171
130 135 131 139 144 129 132 150
136 158 141 163 148 137 146 131
147 126 147 138 146 132 133 132
121 127 149 176 140 147 162 128
Datos:
Fecha 1 Fecha 2
𝑛1 = 42 𝑛2 = 40
𝑘1 = 17 𝑘2 = 7
1 − α = 95%
Solución:
El intervalo de confianza para 𝜋1 − 𝜋2 está dado por:

51
𝑝̅1 (1 − 𝑝̅1 ) 𝑝̅2 (1 − 𝑝̅2 )

(𝑝̅1 − 𝑝̅2 ) − 𝑍0 ∗ √ + ≤ 𝜋1 − 𝜋2
𝑛1 𝑛2
𝑝̅1 (1 − 𝑝̅1 ) 𝑝̅2 (1 − 𝑝̅2 )

≤ (𝑝̅1 − 𝑝̅2 ) + 𝑍0 ∗ √ +
𝑛1 𝑛2
Hallamos 𝑍0 , 𝑝̅1 𝑦 𝑝̅2 , ya que son desconocidos:
• 𝑍0 = 1,96
𝑘1 17
• 𝑝̅1 = = = 0,405
𝑛1 42
𝑘 7
• 𝑝̅2 = 𝑛2 = 40 = 0,175
2
Reemplazamos:
0,405(1 − 0,405) 0,175(1 − 0,175)

(0,405 − 0,175) − 1,96 ∗ √ + ≤ 𝜋1 − 𝜋2
42 40
𝑝̅1 (1 − 𝑝̅1 ) 𝑝̅2 (1 − 𝑝̅2 )

≤ (𝑝̅1 − 𝑝̅2 ) + 𝑍0 ∗ √ +
𝑛1 𝑛2
0,041 ≤ 𝜋1 − 𝜋2 ≤ 0,419
Interpretación:
Con un 95% de confianza estimamos que la diferencia de proporciones de las
papas que pesan más de 155g de la bodega ‘Viki’ en la fecha 1 y fecha 2, estará
comprendida entre 4,1% y 41,9%.
5.11 Intervalo de confianza para la varianza:
Se desea estimar mediante un intervalo de confianza del 98%: (a) La varianza
poblacional, del peso de papas que se venden en la bodega ‘Viki’; para ello se elige una
52
muestra aleatoria de 81 papas obteniéndose la siguiente información: un peso promedio
de 154,46 gramos con una desviación estándar de 15,45 gramos.
Datos:
• 1-α=98%
• n=81
• s=15,45’
• x barra= 154,46
Solución:
El IC para varianza poblacional está dado por:
(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
≤𝜎 ≤
𝑋22 𝑋12
Hallamos: 𝑋22 𝑦 𝑋12
𝑋12 = 𝑋 2 (0,01; 49) = 29
𝑋22 = 𝑋 2 (0,99; 49) = 74,9
Reemplazando:
(81 − 1)15,452 2
(81 − 1)15,452
≤𝜎 ≤
74,9 29
254,96 ≤ 𝜎 2 ≤ 658,49
Interpretación:
Con un 98% de confianza, estimamos que la varianza poblacional del peso de
las papas de la bodega ‘Viki’ estará comprendida entre 254,96 𝑔2 y 658,49 𝑔2 .

53
5.12 Intervalo de confianza para la desviación estándar:
Se desea estimar mediante un intervalo de confianza del 98%, la desviación
estándar poblacional, del peso (en gramos) de las papas que se venden en la bodega
Viki, para ello se elige una muestra aleatoria de 81 papas obteniéndose la siguiente
información: un peso promedio de 9599 gramos con una desviación estándar de 15.45
gramos.
Datos:
• 1-α=98%
• n=81
• s=15.45
• x barra= 9599
Solución:
El IC para la desviación estándar poblacional está dado por:
(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
√ ≤ 𝜎 ≤ √
𝑋22 𝑋12
Hallamos: 𝑋22 𝑦 𝑋12
𝑋12 = 𝑋 2 (0,01; 80) = 53,5
𝑋22 = 𝑋 2 (0,99; 80) = 112,3
Reemplazando:
54
(81 − 1)15,452 (81 − 1)15,452

√ ≤𝜎≤ √
112,3 53,5
13.04 ≤ 𝜎 ≤ 18,89
Interpretación:
Con un 98% de confianza, estimamos que la desviación estándar
poblacional del peso de las papas de la bodega estará comprendida entre 13,04 g
y 18,89g.
5.13 Prueba de Hipótesis para la media
Los trabajadores de la bodega ‘Viki’ señalan que en promedio las papas pesan
145g, el dueño de la bodega a juzgar por los reportes de pesos de las papas en meses
anteriores tiene la sospecha de que el peso por papa es superior a lo manifestado por los
trabajadores, para ello toma el tiempo de pesar 33 papas aleatoriamente encontrando un
peso promedio de 148,61g con una desviación estándar de 16,39g. Ayude al dueño de la
bodega ‘Viki’ a tomar la decisión más adecuada.
139 146 181 134 147 123 156 135 142 128 144
168 153 153 165 174 124 139 165 160 139 160
178 150 140 139 146 181 134 147 123 156 135
Datos:
55
✓ 𝜇0 = 145𝑔
✓ 𝜇 > 145𝑔
✓ 𝑛 = 33
✓ 𝑥𝑏𝑎𝑟𝑟𝑎 = 148,61𝑔
✓ 𝑠 = 16,39𝑔
Paso 1: Planteamos la hipótesis
• 𝐻0 : 𝜇 ≤ 145𝑔 (V)
• 𝐻1 : 𝜇 > 145𝑔 (X)
Paso 2: Elegimos el nivel de significancia
𝛼 = 5%
Paso 3: Seleccionamos el estadístico de prueba
• 𝐸𝑙𝑒𝑔𝑖𝑟𝑒𝑚𝑜𝑠 𝑍 (𝑛 𝑒𝑠 𝑔𝑟𝑎𝑛𝑑𝑒)
• 𝐹ó𝑟𝑚𝑢𝑙𝑎 𝑎 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑟:
𝑥̅ − 𝜇0
𝑍𝑐 = 𝜎
√𝑛
• Gráfica
Paso 4: Establecemos el criterio de decisión

56
• 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟á 𝑙𝑎 𝐻0 𝑠𝑖:
𝑍𝑐 > 𝑍𝑡
𝑍𝑡 = 1,645
Además:
𝑝 < 𝛼 = 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0
𝑝 ≥ 𝛼 = 𝐴𝑐𝑒𝑝𝑡𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0
Paso 5: Cálculos
• 𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝜎:
Por TLC:
𝑠 = 𝜎 = 16,39
• 𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝑍𝑐 𝑐𝑜𝑛 𝑙𝑎 𝑓ó𝑟𝑚𝑢𝑙𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟𝑚𝑒𝑛𝑡𝑒 𝑒𝑙𝑒𝑔𝑖𝑑𝑎:
148,61 − 145
𝑍𝑐 =
16,39
√33
𝑍𝑐 = 1,265
Paso 6: Toma de decisión
Como el 𝑍𝑐 cae en la región de aceptación, entonces se acepta la hipótesis nula al
5% de nivel de significancia; es decir que el dueño de la bodega ‘Viki’ no tiene razón al
afirmar que el peso de una papa de su bodega es superior a 145g.

57
5.14 Prueba de Hipótesis para la diferencia de medias
Se desea probar la hipótesis de que existe diferencia en el peso promedio de las
papas de la bodega ‘Viki’ pesadas en la fecha 1 y la fecha 2, respecto a que no hay
diferencia entre ambas líneas. Una muestra aleatoria de 42 papas en la fecha 1 da un peso
promedio de 150,88g y una desviación estándar de 16,57g, en tanto que una muestra
aleatoria de 40 papas en la fecha 2 da un peso promedio de 143,05g y una desviación
estándar de 13,65g. Utilice un nivel de significancia de 0,05.
144 176 160 140 158 131 149
181 157 145 160 123 164 149
178 142 134 137 158 168 168
141 146 165 136 152 137 139
134 121 145 139 178 180 170
150 144 158 122 146 176 136
179 138 156 154 145 137 141 171
130 135 131 139 144 129 132 150
136 158 141 163 148 137 146 131

58
147 126 147 138 146 132 133 132
121 127 149 176 140 147 162 128
Datos:
Fecha 1 Fecha 2
𝑛1 = 42 𝑛2 = 40
𝑥̅1 = 150,88𝑔 𝑥̅2 = 143,05𝑔
𝑠1 = 16,57𝑔 𝑠2 = 13,65𝑔
Solución:
Paso 1: Planteamos las hipótesis
• 𝐻0 : 𝜇1 − 𝜇2 = 0 (X)
• 𝐻1 : 𝜇1 − 𝜇2 ≠ 0 (V)
• α =5%=0,05
• 𝐸𝑙𝑒𝑔𝑖𝑟𝑒𝑚𝑜𝑠 𝑍 (𝑛 𝑒𝑠 𝑔𝑟𝑎𝑛𝑑𝑒)
𝑥̅1 − 𝑥̅2
𝑍𝑐 =
(𝜎1 )2 (𝜎2 )2
√
𝑛1 + 𝑛2
• Gráfica
59
• Se rechazará 𝐻0 si:
𝑍𝑐 < −𝑍𝑡 𝑜 𝑍𝑐 > 𝑍𝑡
−𝑍𝑡 = −1,96 𝑍𝑡 = 1,96
Además:
𝑝 < 𝛼 = 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0
𝑝 ≥ 𝛼 = 𝐴𝑐𝑒𝑝𝑡𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0
Paso 5: Cálculos
• 𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝜎:
Por TLC:
𝜎1 = 𝑠1 = 16,57𝑔
𝜎2 = 𝑠2 = 13,65𝑔
60
• 𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝑍𝑐 𝑐𝑜𝑛 𝑙𝑎 𝑓ó𝑟𝑚𝑢𝑙𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟𝑚𝑒𝑛𝑡𝑒 𝑒𝑙𝑒𝑔𝑖𝑑𝑎:
150,88 − 143,05
𝑍𝑐 =
2 2
√(16,57) + (13,65)
42 40
𝑍𝑐 = 2,340
Como el Zc cae en la región de rechazo, entonces se rechaza la hipótesis nula al 5%
de nivel de significancia; es decir, sí existe diferencia de peso promedio entre las papas de
la bodega ‘Viki’ en la fecha 1 y 2.
5.15 Prueba de Hipótesis para la proporción
El dueño de la bodega ‘Viki’ asegura que el 60% de los clientes que tiene dice que
les gusta la papa que vende, por no variar mucho en los pesos que tiene, para probar esta
aseveración toma una muestra aleatoria de 50 papas y se les pesa teniendo un rango ideal
de entre 121 y 156. Si de las 50 papas ,40 son las que se encuentran en este rango, ¿qué
concluye? use α = 0.05.
Datos:
• n = 50
• K = 40
• 𝜋0 = 60% = 0,60
• ∝= 0,05
Solución:
Paso 1: planteamiento de hipótesis

61
𝐻0 : 𝜋 = 0,60
𝐻1 : 𝜋 ≠ 0,60
∝= 0,05
Elegiremos Z
𝑝 − 𝜋0
𝑍𝑐 =
√𝜋0 (1 − 𝜋0 )
𝑛
Hallamos 𝑍𝑡 :
𝑍𝑡 = 1,96
Se rechazará la 𝐻0 si:
𝑍𝑐 < −𝑍𝑡 𝑜 𝑍𝐶 > 𝑍𝑡
𝑍𝑐 < −1,96 𝑜 𝑍𝐶 > 1,96
Si:
P < ∝ ===> 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑚𝑜𝑠 𝑙𝑎 𝐻0

62
P ≥∝ ====> 𝑎𝑐𝑒𝑝𝑡𝑎𝑚𝑜𝑠 𝑙𝑎 𝐻0
Paso 5: Calculamos
Hallamos p
𝑘 40
𝑝= = = 0,8
𝑛 50
Hallamos 𝑍𝐶
0,8−0,6
𝑍𝑐 = = 2,89
0,6(1−0,6)
√
50
Paso 6 toma de decisión:
Como el Zc cae en la región de rechazo, entonces se rechaza la hipótesis nula al 5% de nivel
de significancia, es decir que 60% de los clientes que tiene, dice que no le gusta las papas.
5.16 Prueba de Hipótesis para la diferencia de proporciones
En una muestra aleatoria de 60 papas de la bodega ‘Viki’, se encontró que 40
papas se encuentran por debajo de un peso de 150 g, pero en otra bodega llamada ‘Rosita’
de una muestra aleatoria de 80 papas, 55 papas se encuentran debajo de un peso de 150 g.
¿Estos datos indican que existe una diferencia en la proporción de las papas que se
encuentran debajo de un peso de 150 g? Utilice α = 0,05
Datos:
• n1: 60
• n2: 80
• k1: 40
• k2: 55
63
• a=5%
𝐻𝑜: 𝜋1 − 𝜋2 = 0
𝐻1: 𝜋1 − 𝜋2 ≠ 0
𝛼 = 5%
Elegiremos Z
𝑃1 − 𝑃2
𝑍𝑐 =
𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
√ +
𝑛1 𝑛2
Zc= -0,25 Zt= 1,96
𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝑍𝑡 : 𝑍𝑡 = 1,96
Se rechazará la H0 si:
𝑍𝑐 < −𝑍𝑡 𝑜 𝑍𝑐 > 𝑍𝑡 P < α ===> Rechazamos la Ho
𝑍𝑐 < −1,96 𝑜 𝑍𝑐 > 1,96 P ≥ α ===> aceptamos la Ho
Paso 5: Cálculos
Hallamos p1 y p2:
𝑘 40
𝑝1 = = = 0,67
𝑛 60
64
𝑘 55
𝑝2 = = = 0,69
𝑛 80
Hallamos Zc
0,67 − 0,69
Zc = = −0,25
√0,67(1 − 0,67) + 0,69(1 − 0,69)
60 80
Como el Zc cae en la región de aceptación, entonces se acepta la hipótesis nula al 5% de
nivel de significancia; es decir que no existe diferencia en la proporción de las papas que se
encuentran debajo de un peso de 150 g.
Utilizando el software aczel:
Comparando con el valor P:

P (0,7939) > α (0,05) ===> Aceptamos la Ho
65
Como el valor 𝑝 > 𝛼, se acepta la hipótesis nula al 5% de nivel de significancia; es decir que
no existe diferencia en la proporción de las papas que se encuentran debajo de un peso de 150
g.
5.17 Prueba de Hipótesis para la varianza
Se supone que los pesos de las papas de la bodega ‘Viki’ están normalmente
distribuidos. Una muestra al azar de 50 papas da una varianza de 219,63 g2 ¿Será
rechazada la hipótesis de que la varianza poblacional es 309,66 g2 a favor de que sea
menor que 309,66 g2 a un nivel de significancia de 0,01? Asuma que los pesos se
distribuyen normalmente.
5.18 Prueba de Hipótesis para la desviación estándar
Se supone que el peso de cierto tipo de papas está normalmente distribuido con una
varianza poblacional de 309,66 g 2. Una muestra al azar de 50 papas da una desviación estándar de
13.58 g. ¿Será rechazada la hipótesis de que la desviación estándar poblacional es 17,60 g a favor
de que sea menor que 15?60 g? utilice un nivel de significancia de 0,05.

66
5.19 Prueba de Bondad de Ajuste con frecuencias esperadas iguales
¿Las ventas de las papas es la misma cantidad en diferentes días?

Es muy común pensar que los fines de semana son los días donde más se compra
papas, ya que son días que muchos lo denominan “días de recado”. Se selecciona
aleatoriamente una muestra de papas vendidas de la tienda Viki. El número de papas
vendidas se lista en la tabla adjunta. Con un nivel de significancia de 0,05, pruebe la
aseveración de que las ventas aumenten con igual frecuencia en los diferentes días.
Día Dom Lun Mar Mie Jue Vie Sab
N° de 24 15 18 22 22 35 38
ventas
Paso 1: Planteamos la Hipótesis

H0: Las ventas de las papas aumentan con igual frecuencia todos los días de la semana
H1: Las ventas de las papas no aumentan con igual frecuencia todos los días de la
semana
α= 0,05 = 5%
Elegiremos X2 y graficamos la distribución, diferenciamos Ra y Rr, ubicamos α
67
X 2c = 9,233
Se rechazará la H0 si: X2 c > X2 t
Paso 5: Cálculos
X2 c = 17.57
Como el X2c cae en la región de rechazo, entonces se rechazará la Hipótesis Nula al
5% de nivel de significancia; es decir las ventas de las papas no aumentan con igual
frecuencia todos los días de la semana
5.20 Prueba de Bondad de Ajuste con frecuencias esperadas desiguales
Las papas deberían de ser de 170 gramos. Usando α = 0.05, ¿diría usted que
los pesos son lo esperado?, si una muestra de 20 papas dio los pesos (en gramos) que
se muestran a continuación:
168 167,5 167,9 168 170 169,1 168 169 167 166
167 168 168,5 169 170 169 168 167 166 169

68
Ho: El patrón actual de ventas no difiere del patrón histórico

H1: El patrón actual de ventas si difiere del patrón histórico
α= 0,05 = 5%
Elegiremos X2
Además, graficamos la distribución, diferenciamos Ra y Rr, ubicamos α

Se rechazará la H0si:
X2c > X2t
Paso 5: Cálculos
Precios N°muertes (fo) pi fe (fo–fe)2/fe

(categorías)
Bajo 15 0,25 12,5 0,5
Intermedio 28 0,50 25,0 0,36
Alto 7 0,25 12,5 2,42
TOTAL 50 1,00 50,0 3,28
Fe= np
fe1=50*0,25=12,5
X2c = 3,28

69
Como el X2c cae en la región de aceptación, entonces se acepta la Ho al 5% de nivel

de significancia; el patrón actual de ventas no difiere del patrón histórico.
5.21 Prueba de rachas
Un cliente al escoger las papas al azar, noto que había escogidos entre las papas tipo 1 (representa con
S) y tipo 2 (representa con I). Que debe concluir el cliente acerca la aleatoriedad de las papas
seleccionadas
IIIISSSSSSIIIIISSSIIIIIIIIIISSSS
Solución:
Ho: La secuencia es aleatoria
H1: La secuencia no es aleatoria
α= 5% (muestras pequeñas: n1≤ 20 y n2 ≤ 20)
Para muestras pequeñas y α= 5%
El estadístico de prueba es el número de rachas G
n1: TIPO 1=== n1= 13
n2: TIPO 2 === n2= 19
Se rechazará la aleatoriedad cuando el número de rachas es:
•Menor o igual al valor crítico más chico de la tabla A-10

70
•Mayor o igual al valor crítico más grande de la tabla A-10
Paso 5: Cálculos
Contamos el número de S y el número de C que existen en los datos.
IIIISSSSSSIIIIISSSIIIIIIIIIISSSS
1aracha 2ª racha 3ª racha 4ª racha 5ª racha 6ª racha
En los datos, se presentan 6 rachas ====> G=6.
Hallamos el valor crítico G en tabla A-10. Valor G más pequeño es 10 y el más grande es 23.
Como el dato G =6 es menor a el valor crítico G (10), entonces se rechaza la aleatoriedad de los datos
al 5% de nivel de significancia. Esto se interpreta de que los datos no son aleatorios.
5.22 Prueba de signo
Un experimento para demostrar la habilidad de contar las papas de la bodega “Viki”, se realiza
dándole una bolsa de papas al operador y este tiene que contarlas en el menor tiempo posible. El
experimento se repite semanalmente, con los tiempos en segundos que se muestran en la tabla adjunta.
Utilice un nivel de significancia de 0,05 y pruebe la hipótesis de que no hay diferencia entre los
tiempos de la primera y segunda prueba.
Variable A B C D E F G H I J K L M N O
Semana 1 75 70 34 31 31 29 65 71 36 45 80 58 46 32 42
Semana 2 29 35 61 78 30 33 54 38 38 39 71 59 37 61 41
Signo de diferencia
Paso 1: H0 = No existe diferencia
H1 = Hay una diferencia

71
Paso 2: Nivel de significancia: α=5%
El estadístico de prueba seleccionado es x (n≤25)
Se rechazará la hipótesis nula si: El estadístico de prueba es menor que o igual a el valor crítico.
Paso 5:
Variable A B C D E F G H I J K L M N O
Semana 1 75 70 34 31 31 29 65 71 36 45 80 58 46 32 42
Semana 2 29 35 61 78 30 33 54 38 38 39 71 59 37 61 41
Signo de diferencia + + - - + - + + - + + - + - +
El estadístico de prueba x es el número de veces que ocurre el signo menos
frecuente.
Entonces x = 6
Determinamos el valor crítico en tabla A-7
n = 15 (número total de signos positivos y negativos)
α = 0,05 (en dos colas)
El valor crítico es = 3
Con un estadístico de prueba x = 6 y un valor crítico de 3, aceptamos la

72
hipótesis nula de no diferencia. Hay suficiente evidencia para sustentar la aceptación de la aseveración
de que la mediana de las diferencias es igual a 3.
5.23 Prueba de Rangos con signo de Wilcoxon
Un experimento para las mediciones de los pesos de las papas en la bodega “Viki” se realiza el 16 de
julio. El experimento del pesado de las papas se repitió una semana después, con los pesos en gramos
que se muestran en la tabla adjunta. Utilice un nivel de significancia de 5% y pruebe la hipótesis de
que no hay diferencia entre los pesos de la primera y segunda pruebas, utilizando la Prueba de
Wilcoxon.
Solución:
• 𝐻0 : No existe diferencia entre los pesos de la primera y segunda muestra.
• 𝐻1 : 𝐸xiste una diferencia entre los pesos de la primera y segunda muestra.
• α =5%=0,05
• 𝐸𝑙𝑒𝑔𝑖𝑟𝑒𝑚𝑜𝑠 𝑇 (𝑛 ≤ 30)

73
Se rechazará 𝐻0 si:
• El estadístico de prueba es menor que o igual a el (los) valor (es) crítico (s).
• El p-valor ≤ α
Paso 5: Cálculos
La suma de los rangos positivos = 91,5
La suma de los rangos negativos = 13,5
===> El estadístico de prueba T es el menor de ellos
T= 13,5
Hallamos el valor crítico en tabla A-8 para n=14
===> El valor crítico es = 21
Como el estadístico de prueba T ≤ criterio de decisión (13,5 ≤ 21), entonces rechazamos la Ho al 5%
de nivel de significancia; es decir Existe una diferencia entre los ´pesos de la primera y segunda
muestra.
74
5.24 Prueba U de Mann-Whitney
La bodega “Viki” contrató a una nueva recepcionista para la atención. La hija del dueño
afirma que existe una diferencia entre las ventas del antiguo recepcionista con la nueva
recepcionista. Para ello se realizó la siguiente prueba: en un total de 6 días ambos se turnarán
al azar 3 días para cada uno. Luego registran la cantidad (kg) de papas vendidas por día.
Aplicando la prueba U de Mann-Whitney ¿Cuál sería la conclusión?
H0 = Existe diferencias en el número de ventas con la nueva recepcionista a comparación del
antiguo recepcionista.
H1 = No existe diferencias en el número de ventas con la nueva recepcionista a comparación
del antiguo recepcionista.
Paso 2: Nivel de significancia:
α=5%
El estadístico de prueba seleccionado es x (n≤25)
𝑈 = 𝑛1 ∗ 𝑛2 – 𝑈’
Se rechazará la hipótesis nula si:
𝐸𝑙 𝑝 − 𝑣𝑎𝑙𝑜𝑟 ≤ 𝛼
Paso 5: Cálculos
75
Ordenamos los datos de menor a mayor, sin perder de vista a que grupo pertenecen:
2 3 4 5 6 7
AR NR AR NR NR AR
Contamos los puntajes NR que le preceden a los puntajes AR.
2 3 4 5 6 7
AR NR AR NR NR AR
1 2 2
Hallamos el valor de U’ (observado).
2 3 4 5 6 7
AR NR AR NR NR AR
U’= 5
1 2 2
Hallamos el p-valor en la Tabla J.

76
Como el p-valor 0,650 es mayor que α=0,05, entonces no hay evidencia para rechazar la hipótesis
nula, entonces la aceptamos al 5% de nivel de significancia; es decir el número de ventas entre ambos
recepcionistas es igual.
77
6 BIBLIOGRAFÍA
• García, J. A., Reding, A., & López, C. (2013). Investigación en Educación Médica.
México D.F: Elsevier México.
• Lopéz, J. F. (15 de Febrero de 2019). Medidas de Dispersión. Obtenido de
Economipedia.com: https://economipedia.com/definiciones/medidas-de-
dispersion.html
• Rus Arias, E. (7 de Enero de 2021). Cuantil. Obtenido de Economipedia.com:
https://economipedia.com/definiciones/cuantil.html
• Salazar Pinto, C., & Del Castillo Galarza, S. (2017). Fundamentos Básicos de la
Estadística. Quito: Sin Editorial.
• Triola, M. F. (2018). Estadística. Ciudad de México: Pearson Educación de México
S.A. DE C.V.
7 ANEXOS
78
Figura 1.- Pesando las papas, una por una.

79
Figura 4.- Uso del programa Aczel

80
Figura 5.- Uso del programa Excel

Trabajo de Investigación FINALIZADO - Estadistica Emperesarial - MOD III

Cargado por

Copyright:

Formatos disponibles

Trabajo de Investigación FINALIZADO - Estadistica Emperesarial - MOD III

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Trabajo de Investigación FINALIZADO - Estadistica Emperesarial - MOD III

Cargado por

Copyright:

Formatos disponibles

1

“AÑO DE LA UNIDAD, LA PAZ Y EL DESARROLLO"

FACULTAD DE INGENIERÍA INDUSTRIAL, SISTEMAS E INFORMÁTICA

ESCUELA PROFESIONAL DE INGENIERIA INDUSTRIAL

Barrientos Rojas, Félix Martín

Cámara Rodríguez, Paolo Alexander

Morales Jara, Johan Dennis

Sánchez Albornoz, Anamalú del Carmen

Ing. AMADO SOTELO, JULIO FABIAN

2 CAPÍTULO I: Marco Teórico ....................................................................................................... 6

2.1 La estadística ......................................................................................................................... 6

2.11.4 Estimadores ................................................................................................................. 18

3.1 Población y muestra ............................................................................................................ 27

5 CAPÍTULO IV: Resultados ........................................................................................................ 30

5.1 Medidas de tendencia central: ............................................................................................. 33

5.17 Prueba de Hipótesis para la varianza ................................................................................... 65

según sea indicado con la finalidad de obtener inferencias basadas en el cálculos de

describir comportamientos, tomar buenas decisiones, obtener conclusiones y dar

recomendaciones para la mejora de la Bodega “Viki”.

2 CAPÍTULO I: Marco Teórico

La Estadística es la ciencia cuyo objetivo es recopilar información cuantitativa

‘’La estadística, en general, es la ciencia que trata de la recopilación, organización,

decisión más efectiva’’ (Muñoz, 2004, pág. 3).

La estadística para su estudio se ha dividido en dos grandes ramas:

2.1.1 La estadística descriptiva

conjunto de datos, de los cuales se extraen conclusiones valederas, únicamente para

2.1.1 La estadística inferencial

‘’En esta rama de la estadística, lo que se pretende es obtener conclusiones

generales de una determinada población, mediante el estudio de una muestra

2.1 Medidas de tendencia central

‘’La medida de tendencia central, es un valor que se encuentra en el centro o en la

mitad de un conjunto de datos’’ (Triola, 2018, pág. 2).

Las principales medidas de tendencia central son:

2.1.1 Media aritmética o media

2.1.2 Media geométrica

La media geométrica de n valores positivos, se define como la raíz enésima

del producto de estos n valores.

2.1.3 Media armónica

La media armónica de n valores no nulos, se define como el recíproco de la

media aritmética de los recíprocos de esos n valores.

los valores originales de los datos se presentan en orden de magnitud creciente o

Valor que ocurre con mayor frecuencia.

• Cuando dos valores ocurren con la misma frecuencia y esta es la más

alta, ambos valores son modas. El conjunto de datos es bimodal.

• Cuando más de dos valores ocurren con la misma frecuencia, se dice

2.2 Medidas de dispersión

Las medidas de dispersión son números que indican si una variable se

medidas es conocer de manera resumida una característica de la variable

estudiada. En este sentido, deben acompañar a las medidas de tendencia

central. Juntas, ofrecen información de un sólo vistazo que luego podremos

Las principales medidas de dispersión son:

Es la diferencia entre sus valores máximo y mínimo.

Medida de variación de los valores con respecto a la media. Es un tipo de

desviación promedio de los valores, con respecto a la media.

Medida de variación igual al cuadrado de la desviación estándar.

define como la desviación estándar dividida por la media aritmética.

2.3 Índices Asimetría

Se dice que una distribución de frecuencias es simétrica, si los intervalos equidistantes

del intervalo central tienen iguales frecuencias. Si la distribución es simétrica, entonces, la