Trabajo de Investigación FINALIZADO - Estadistica Emperesarial - MOD III

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 80

1

“AÑO DE LA UNIDAD, LA PAZ Y EL DESARROLLO"

FACULTAD DE INGENIERÍA INDUSTRIAL, SISTEMAS E INFORMÁTICA

ESCUELA PROFESIONAL DE INGENIERIA INDUSTRIAL

TÍTULO

TRABAJO DE INVESTIGACIÓN

ESTUDIANTES

Barrientos Rojas, Félix Martín

Cámara Rodríguez, Paolo Alexander

Morales Jara, Johan Dennis

Sánchez Albornoz, Anamalú del Carmen

DOCENTE

Ing. AMADO SOTELO, JULIO FABIAN

HUACHO – PERÚ

2023
2

INDICE

1 INTRODUCCIÓN ........................................................................................................................ 5

2 CAPÍTULO I: Marco Teórico ....................................................................................................... 6

2.1 La estadística ......................................................................................................................... 6


2.1.1 La estadística descriptiva............................................................................................... 6
2.1.1 La estadística inferencial ............................................................................................... 6
2.1 Medidas de tendencia central ................................................................................................ 6
2.1.1 Media aritmética o media .............................................................................................. 7
2.1.2 Media geométrica .......................................................................................................... 7
2.1.3 Media armónica ............................................................................................................. 7
2.1.4 Mediana......................................................................................................................... 7
2.1.5 Moda ............................................................................................................................. 7
2.2 Medidas de dispersión ........................................................................................................... 7
2.3 Índices Asimetría .................................................................................................................. 8
2.4 Curtosis ................................................................................................................................. 9
2.5 Cuantiles ............................................................................................................................... 9
2.6 Teorema de Chebyshev ......................................................................................................... 9
2.7 Muestreo ............................................................................................................................. 10
2.7.1 Tipos de muestro ......................................................................................................... 10
2.8 Tamaño de la muestra ......................................................................................................... 12
2.8.1 Determinación del tamaño de la muestra ..................................................................... 12
2.8.2 Procedimiento para determinar el tamaño de la muestra ............................................. 13
2.9 Modelos de distribución de probabilidad continua .............................................................. 13
2.9.1 Variable Aleatoria ....................................................................................................... 13
2.9.2 Tipos de variable aleatoria .......................................................................................... 14
2.10 Modelos de distribución de probabilidad continua .............................................................. 14
2.10.1 Distribución normal .................................................................................................... 14
2.10.2 Normal Estándar.......................................................................................................... 15
2.10.3 Distribución de student................................................................................................ 15
2.10.4 Distribución Chi-cuadrada .......................................................................................... 16
2.10.5 Distribución de Fisher-Snedecor ................................................................................. 16
2.11 Distribuciones muestrales ................................................................................................... 17
2.11.1 Inferencia estadística: .................................................................................................. 17
2.11.2 Proporciones de población y muestra .......................................................................... 17
2.11.3 Distribución muestral .................................................................................................. 18
3

2.11.4 Estimadores ................................................................................................................. 18


2.11.5 Parámetro .................................................................................................................... 19
2.11.6 Estadístico ................................................................................................................... 19
2.12 Estimación en poblaciones Normales N (µ, 𝝈𝟐) ................................................................. 19
2.12.1 Estimación de la media µ. ........................................................................................... 19
2.12.2 Estimación de la varianza 𝝈𝟐 ...................................................................................... 21
2.12.3 Estimación por intervalos de confianza ....................................................................... 22
2.13 Intervalos de confianza para la proporción p ....................................................................... 23
2.14 Intervalos de confianza para la media µ .............................................................................. 24
2.15 Intervalo de confianza para la varianza y desviación estándar ............................................ 25
3 CAPÍTULO II: Método ............................................................................................................... 27

3.1 Población y muestra ............................................................................................................ 27


3.1.1 Población..................................................................................................................... 27
3.1.2 Muestra ....................................................................................................................... 27
3.2 Métodos y técnicas de recolección de datos ........................................................................ 27
3.2.1 Instrumentos para la recolección de datos ................................................................... 28
3.3 Métodos, técnicas de procesamiento y análisis de datos ..................................................... 28
4 CAPÍTULO III: Determinación del tamaño de la muestra .......................................................... 29

5 CAPÍTULO IV: Resultados ........................................................................................................ 30

5.1 Medidas de tendencia central: ............................................................................................. 33


5.2 Medidas de dispersión: ........................................................................................................ 33
5.3 Asimetría y Curtosis: .......................................................................................................... 34
5.4 Cuantiles ............................................................................................................................. 34
5.5 Observación del Teorema de Chebyshev: ........................................................................... 36
5.6 Distribución normal estándar: ............................................................................................. 36
5.7 Intervalo de confianza para la media: .................................................................................. 39
5.8 Intervalo de confianza para la diferencia de medias: ........................................................... 42
5.9 Intervalo de confianza para la proporción: .......................................................................... 47
5.10 Intervalo de confianza para la diferencia de proporciones: ................................................. 49
5.11 Intervalo de confianza para la varianza: .............................................................................. 51
5.12 Intervalo de confianza para la desviación estándar: ............................................................ 53
5.13 Prueba de Hipótesis para la media....................................................................................... 54
5.14 Prueba de Hipótesis para la diferencia de medias ................................................................ 57
5.15 Prueba de Hipótesis para la proporción ............................................................................... 60
5.16 Prueba de Hipótesis para la diferencia de proporciones ...................................................... 62
4

5.17 Prueba de Hipótesis para la varianza ................................................................................... 65


5.18 Prueba de Hipótesis para la desviación estándar ................................................................. 65
5.19 Prueba de Bondad de Ajuste con frecuencias esperadas iguales ......................................... 66
5.20 Prueba de Bondad de Ajuste con frecuencias esperadas desiguales .................................... 67
5.21 Prueba de rachas ................................................................................................................. 69
5.22 Prueba de signo ................................................................................................................... 70
5.23 Prueba de Rangos con signo de Wilcoxon .......................................................................... 72
5.24 Prueba U de Mann-Whitney................................................................................................ 74

6 BIBLIOGRAFÍA ........................................................................................................................ 77

7 ANEXOS .................................................................................................................................... 77
5

1 INTRODUCCIÓN

El presente trabajo de investigación, trabajará con los datos de la papa las cuales son

vendidas en la bodega ‘Viki’, la población requerida serán 100 papas. De esta población,

hallaremos la muestra representativa, luego de ello procedemos a hallar los pesos de cada

papa. Cada dato proporcionado será llevado a cálculos estadísticos para llegar a resultados

que nos brinden la información necesaria según sean nuestros intereses dentro de este trabajo

de investigación.

Como ya sabemos, la Estadística es una rama de las matemáticas que nos permite

recopilar, analizar, interpretar y representar datos pudiendo ser de una población o muestra,

según sea indicado con la finalidad de obtener inferencias basadas en el cálculos de

probabilidad, siendo a la vez sujeta a estimaciones concretas que nos permitan llegar a una

medida adecuada y coherente con los datos analizados y estudiados para luego de ello

describir comportamientos, tomar buenas decisiones, obtener conclusiones y dar

recomendaciones para la mejora de la Bodega “Viki”.


6

2 CAPÍTULO I: Marco Teórico

2.1 La estadística

La Estadística es la ciencia cuyo objetivo es recopilar información cuantitativa

concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis

de estos datos podemos obtener unos significados precisos o unas previsiones para el futuro.

‘’La estadística, en general, es la ciencia que trata de la recopilación, organización,

presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de

decisión más efectiva’’ (Muñoz, 2004, pág. 3).

La estadística para su estudio se ha dividido en dos grandes ramas:

2.1.1 La estadística descriptiva

Esta se define como: ‘’La parte de la estadística que permite analizar todo un

conjunto de datos, de los cuales se extraen conclusiones valederas, únicamente para

ese conjunto’’ (Salazar Pinto & Del Castillo Galarza, 2017, pág. 14).

2.1.1 La estadística inferencial

‘’En esta rama de la estadística, lo que se pretende es obtener conclusiones

generales de una determinada población, mediante el estudio de una muestra

representativa sacada de ella’’ (Salazar Pinto & Del Castillo Galarza, 2017, pág. 14).

2.1 Medidas de tendencia central

‘’La medida de tendencia central, es un valor que se encuentra en el centro o en la

mitad de un conjunto de datos’’ (Triola, 2018, pág. 2).

Las principales medidas de tendencia central son:


7

2.1.1 Media aritmética o media

Es el valor que resulta de dividir la suma de todos los valores entre el número

de datos considerados.

2.1.2 Media geométrica

La media geométrica de n valores positivos, se define como la raíz enésima

del producto de estos n valores.

2.1.3 Media armónica

La media armónica de n valores no nulos, se define como el recíproco de la

media aritmética de los recíprocos de esos n valores.

2.1.4 Mediana

Medida de tendencia central que implica el valor que está en medio, cuando

los valores originales de los datos se presentan en orden de magnitud creciente o

decreciente.

2.1.5 Moda

Valor que ocurre con mayor frecuencia.

• Cuando dos valores ocurren con la misma frecuencia y esta es la más

alta, ambos valores son modas. El conjunto de datos es bimodal.

• Cuando más de dos valores ocurren con la misma frecuencia, se dice

multimodal.

2.2 Medidas de dispersión

Las medidas de dispersión son números que indican si una variable se

mueve mucho, poco, más o menos que otra. La razón de ser de este tipo de

medidas es conocer de manera resumida una característica de la variable

estudiada. En este sentido, deben acompañar a las medidas de tendencia


8

central. Juntas, ofrecen información de un sólo vistazo que luego podremos

utilizar para comparar y, si fuera preciso, tomar decisiones (Lopéz, 2019, pág.

1).

Las principales medidas de dispersión son:

➢ Rango o recorrido

Es la diferencia entre sus valores máximo y mínimo.

➢ Desviación estándar

Medida de variación de los valores con respecto a la media. Es un tipo de

desviación promedio de los valores, con respecto a la media.

➢ Varianza

Medida de variación igual al cuadrado de la desviación estándar.

➢ Coeficiente de variación
Es una medida de dispersión relativa (libre de unidades de medidas), que se

define como la desviación estándar dividida por la media aritmética.

2.3 Índices Asimetría

Se dice que una distribución de frecuencias es simétrica, si los intervalos equidistantes

del intervalo central tienen iguales frecuencias. Si la distribución es simétrica, entonces, la

media, la mediana y la moda coinciden. En contraposición, si estos 3 promedios no coinciden

la distribución tiene que ser asimétrica.

✓ Si la distribución de los datos es simétrica, As= 0, en este caso se cumple que: x = Me

= Mo

✓ Si As ≠ 0, la distribución es asimétrica.

✓ Es asimétrica positiva o sesgada a la derecha, si As > 0, en este caso: Mo < Me < x

✓ Es asimétrica negativa o sesgada a la izquierda si As < 0, en este caso: x < Me < Mo


9

2.4 Curtosis

La curtosis es la propiedad de una distribución de frecuencias por la cual se compara

la dispersión de los datos observados cercanos al valor central con la dispersión de los datos

cercanos a ambos extremos de la distribución.

✓ Si la distribución es normal K tiende a 0.

✓ Si K tiende a 0,5, es leptocúrtica.

✓ Si K tiende a -0,5, es Platicúrtica.

2.5 Cuantiles

Un cuantil es aquel punto que divide la función de distribución de una

variable aleatoria en intervalos regulares, por tanto, no es más que una técnica

estadística para separar los datos de una distribución. Eso sí, debe cumplirse

que los grupos sean iguales. Por eso, existen diversos tipos de cuantil, como

veremos más adelante, en función del número de particiones que hacen (Rus

Arias, 2021).

➢ Cuartiles

Divide los valores ordenados en 4 partes iguales; son 3.

➢ Deciles

Divide los valores ordenados en 10 partes iguales; son 9.

➢ Percentiles

Divide los valores ordenados en 100 partes iguales; son 99.

2.6 Teorema de Chebyshev

La desigualdad de Chebyshev es un teorema utilizado en estadística que proporciona

una estimación conservadora (intervalo de confianza). “La probabilidad de que cualquier


10

variable aleatoria con varianza finita tome un valor dentro de k desviaciones estándar de la

media es de al menos 1-1/k2”.

2.7 Muestreo

El muestreo es la actividad por la cual se toman ciertas muestras de una población de

elementos de los cuales vamos a asumir ciertos criterios de decisión, es importante porque a

través de él podemos hacer análisis de situaciones de una empresa o de algún campo de la

sociedad.

Para que los estudios tengan la validez y confiabilidad es necesario que tal

subconjunto de datos, o muestra, posea algunas características específicas que permitan, al

final, generalizar los resultados hacia la población en total. Esas características tienen que ver

principalmente con el tamaño de la muestra y con la manera de obtenerla.

2.7.1 Tipos de muestro

2.7.1.1 Muestreo no pirobalística

Los elementos de la muestra son seleccionados por procedimientos al

azar o con probabilidades conocidas de selección. Por lo tanto, es imposible

determinar el grado de representatividad de la muestra.

Dentro de los tipos de muestreo no Probabilístico, podemos mencionar

los siguientes:

➢ Muestreo por juicio, selección experta o selección intencional

El investigador toma la muestra seleccionada los elementos que a él

le parecen representativos o típicos de la población, por lo que depende del

criterio del investigador.

➢ Muestreo por conveniencia


11

Basado en la comodidad del investigador, porque se cuenta con dicha

información o acceso un grupo de individuos. Se usa en los casos en no es

posible seleccionar los elementos, y deben sacarse conclusiones con los

elementos que estén disponibles.

➢ Muestreo de cuota

Se utiliza en estudios de opinión de mercado. Los enumeradores,

reciben instrucciones de obtener cuotas específicas a partir de las cuales se

constituye una muestra relativamente proporcional a la población.

➢ Muestreo bola de nieve

Consiste en identificar sujetos que se incluirán en la muestra a partir de

los propios entrevistados. Partiendo de una pequeña cantidad de individuos

que cumplen los requisitos necesarios estos sirven como localizadores de otros

con características análogas. Su aplicabilidad, está mayoritariamente en

estudios con poblaciones de difícil ubicación y/o identificación.

2.7.1.2 Muestreo probabilístico, aleatorio o estocástico

Los elementos de la muestra son seleccionados siguiendo un

procedimiento que brinde a cada uno de los elementos de la población una

probabilidad conocida de ser incluidos en la muestra.

➢ Muestreo aleatorio simple

Cada uno de los elementos de la muestra, se selecciona

aleatoriamente uno por uno y todos los elementos de la población tienen la

misma probabilidad de ser incluidos en la muestra.

➢ Muestreo aleatorio estratificado


12

Una muestra aleatoria estratificada es la obtenida mediante la

separación de los elementos de la población en grupos, llamados estratos y la

selección posterior de una muestra irrestrictamente aleatoria simple en cada

estrato.

➢ Muestreo aleatorio sistemático

Consiste en seleccionar un punto de partida aleatorio, escogiendo

después cada k-ésimo elemento en la lista.

➢ Muestreo aleatorio por conglomerado

Útil cuando la población se encuentra dispersa. La selección de la

muestra puede requerir varias etapas.

2.8 Tamaño de la muestra

2.8.1 Determinación del tamaño de la muestra

Determinar el tamaño de una muestra, es calcular el número de unidades a

incluir en la muestra.

El cálculo del tamaño de la muestra no es una simple operación

aritmética que nos proporcione un valor. Es una función matemática, por lo

tanto, el cambio de una variable, necesariamente se acompaña del cambio de

la otra considerada en la ecuación. Permite una mejor aproximación al número

que se requiere, ajustando a su vez el poder estadístico con otros parámetros

(García, Reding, & López, 2013).

➢ Conceptos previos requeridos

i. Población
13

La población es el conjunto de personas, objetos, eventos,

situaciones y casos que concuerdan con determinadas especificaciones

o características en un periodo, y espacio determinado. Se designa con

“N”.

ii. Muestra

La muestra o unidad muestral es la unidad básica que contiene

los elementos de aquella población que estamos seleccionando. Se

designa con “n”

2.8.2 Procedimiento para determinar el tamaño de la muestra

1. Determinar si el tamaño de la población (N) es infinita o finita.

• Si N no se conoce o N ≥ 100000 ===> Se considera población infinita.

• Si N es conocido, N < 100000 ===> Se considera población finita.

2. Determinar si el estudio o los datos a obtener serán de proporciones o

medias (existe una fórmula para proporciones y otra fórmula para medias).

3. Calcular el tamaño preliminar de muestra (no).

4. Calcular el tamaño final de muestra o muestra ajustada (n).

2.9 Modelos de distribución de probabilidad continua

2.9.1 Variable Aleatoria

Es una función que asocia a cada resultado del espacio muestral (Ω) un

número real.

Notación:

X: Variable aleatoria (v.a.)

x: Valor de la v.a.
14

X= {(w, x) /wεΩ, X(w)=x, xε [R}

2.9.2 Tipos de variable aleatoria

✓ Variable aleatoria discreta

- Aquella que toma valores de un conjunto numerable.

✓ Variable aleatoria continua

- Aquella que toma valores de un conjunto infinito no numerable.

- Puede suponer un valor en cualquier punto fraccionario de un intervalo

especificado.

2.10 Modelos de distribución de probabilidad continua

Entre los principales modelos de distribución de probabilidad continua tenemos:

2.10.1 Distribución normal

Es la distribución continua de probabilidad más importante, por la frecuencia

con que se encuentra y por sus aplicaciones teóricas, es conocida también como

gaussiana o de Laplace – Gauss.

Características:

✓ Tiene la forma de una campana (campana de Gauss)

✓ Es una distribución simétrica.

✓ Utiliza la v.a. X

✓ El área bajo la curva vale 1

✓ La media, mediana y moda son iguales.

✓ La media μ y desviación estándar σ asumen cualquier valor.

✓ Es asintótica al eje de las abscisas.


15

2.10.2 Normal Estándar

La distribución normal estándar llamada también distribución Z, es la que nos

permite reducir cualquier distribución normal al formato de la normal estándar, tiene

una media y desviación estándar únicas, cuyos valores son cero y uno

respectivamente.

Características:

✓ Tiene la forma de una campana

✓ Es una distribución simétrica.

✓ Utiliza la v.a. Z

✓ El área bajo la curva vale 1

✓ La media, mediana y moda son iguales.

✓ La media μ=0 y desviación estándar σ=1.

✓ Es asintótica al eje de las abscisas.

2.10.3 Distribución de student

La distribución t o distribución t de student, es una distribución de

probabilidad continua, que surge del problema de estimar la media de una población

normalmente distribuida cuando el tamaño de la muestra es pequeño.

Características:

✓ Tiene la forma de una campana.

✓ Es una distribución simétrica.

✓ Utiliza la v.a. T.

✓ El área bajo la curva vale 1.

✓ Utiliza los llamados grados de libertad (g). g=n-1

✓ La media μ=0 y la desviación estándar σ asume cualquier valor.


16

✓ Es asintótica al eje de las abscisas.

2.10.4 Distribución Chi-cuadrada

La variable aleatoria Chi-cuadrada (x2) está definida por la suma de los

cuadrados de los n valores zi:

𝑥 2 = 𝑧12 + 𝑧22 + 𝑧32 + ⋯ + 𝑧𝑛2

𝐹 (𝑥 2 ) = 𝑝(0 ≤ 𝑥 2 ≤ 𝑥02 )𝑔

𝐹 (𝑥 2 ) = 𝑥 2 (𝑝; 𝑔)

Características

✓ Es una distribución asimétrica con sesgo positivo.

✓ Utiliza la v.a. X2

✓ El área bajo la curva vale 1

✓ Utiliza los llamados grados de libertad (g).

g=n-1

✓ Los valores de X2 son mayores o iguales que 0.

✓ La forma de una distribución X2 depende de g.

2.10.5 Distribución de Fisher-Snedecor

La distribución F o distribución de Fisher-Snedecor, es una distribución de

probabilidad continua, con V1=(n1-1) grados de libertad en el numerador y V2=(n2-

1) grados de libertad en el denominador. Se utiliza en las pruebas estadísticas de

Análisis de Varianza y los diseños experimentales.

Características:

✓ Es una distribución asimétrica con sesgo positivo.

✓ Utiliza la v.a. F
17

✓ El área bajo la curva vale 1

✓ Utiliza dos tipos de grados de libertad:

V1= (n1-1): g.l. numerador

V2= (n2-1): g.l. denominador

✓ Los valores de F son mayores o iguales que 0.

2.11 Distribuciones muestrales

2.11.1 Inferencia estadística:

- Predecir y pronosticar valores de parámetros de población.

- Probar hipótesis sobre valores de parámetros poblacionales.

- Tomar decisiones.

- Hacer generalizaciones sobre las características de una población.

- Sobre la base de las observaciones de una muestra, una parte de una

población.

2.11.2 Proporciones de población y muestra

2.11.2.1 La proporción de población (π)

Es igual al número de elementos de la población que pertenecen a la

categoría de interés, dividido por el número total de elementos de la población.

Figura 1

Proporciones de población

2.11.2.2 La proporción de la muestra (p)

Es el número de elementos de la muestra que pertenecen a la categoría

de interés, dividido por el tamaño de la muestra.


18

Figura 2

La proporción de la muestra

2.11.3 Distribución muestral

La distribución muestral de una estadística, es la distribución de probabilidad

de todos los valores posibles que la estadística puede asumir, cuando se calcula a

partir de muestras aleatorias del mismo tamaño, extraídas de una población específica.

La distribución muestral de 𝑋̅ es la distribución de probabilidad de todos los

valores posibles que puede asumir la variable aleatoria cuando se toma una muestra de

tamaño n de una población específica.

2.11.4 Estimadores

Un estimador es un estadístico (esto es, una función de la muestra) usado para

estimar un parámetro desconocido de la población.

Para cada parámetro pueden existir varios estimadores diferentes.

❑ Propiedades de los buenos estimadores

Los buenos estimadores cumplen 4 propiedades o requisitos:

✓ Ausencia de sesgo

✓ Consistencia

✓ Eficiencia

✓ Suficiencia
19

2.11.5 Parámetro

Características de la población, como la media y la varianza o desviación típica, en la


distribución normal o la probabilidad de éxito en la Binomial son parámetros. Si conocemos
su valor o si somos capaces de aproximarlo con suficiente precisión, podremos responder a
cualquier pregunta sobre la distribución.

2.11.6 Estadístico

Cualquier función de la muestra. Por ejemplo, la media o la varianza muestrales son


estadísticos.

2.12 Estimación en poblaciones Normales N (µ, 𝝈𝟐 )

Una v.a. X ∼ N (µ, 𝜎 2 ) queda caracterizada por dos parámetros: la media µ y

la varianza 𝜎 2 (o la desviación típica σ). A continuación, introduciremos los

estimadores para estos parámetros y sus distribuciones en el muestreo. Es importante

resaltar que tanto para la estimación de µ como de 𝜎 2 , debemos tener en cuenta el

efecto del tamaño muestral y, además, al estimar la media, también debemos ver si la

varianza poblacional es conocida o desconocida.

2.12.1 Estimación de la media µ.

Supongamos que disponemos de 𝑋1 , …, 𝑋𝑛 una m.a.s. de X ∼ N (µ, 𝜎 2 ). La


1
media poblacional µ se puede estimar con la media muestral 𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 , cuya
𝑛

distribución en el muestreo también es Normal:

𝜎2
𝑋̅~𝑁(𝜇, )
𝑛

Además, dado que tenemos una Normal, podríamos tipificarla y obtener una N

(0, 1):

𝑋̅ − 𝜇
~𝑁(0,1)
𝜎/√𝜇
20

La distribución es consecuencia de que la suma de variables Normales es

también una variable Normal. Este resultado es válido si la varianza poblacional 𝜎 2 es

conocida. Esta distribución se puede interpretar de la siguiente forma:

• X se distribuye simétricamente (ya que su distribución es Normal) alrededor de su

media, que es E(X) = µ la media poblacional o teórica.

• El tamaño muestral aparece dividiendo en la varianza, con lo que, al aumentar n, la

distribución de X se concentra más alrededor de µ, como se puede observar en la

Figura 42. Los histogramas y las correspondientes densidades normales, están

centrados en la media real de la población de la población, pero se puede apreciar

que la concentración alrededor de este valor aumenta con el tamaño muestral.

• Error típico: la media muestral X es un estimador simétrico para µ, por lo que

podemos calcular su error típico, que viene dado por:

𝜎
𝐸𝑇(𝑋̅) =
√𝑛

A partir de 500 muestras de tamaño n = 20, n = 100, n = 500. Distribución

normal de media µ = 5 y varianza 1/n.

Si la varianza 𝜎 2 es desconocida no podemos utilizar la distribución obtenida,

y debemos substituir 𝜎 2 por un estimador. La varianza 𝜎 2 puede ser estimada por la

varianza muestral:

𝑛
1
𝑆 = ∑(𝑋𝑖 − 𝑋̅)2
2
𝑛
𝑖=1

o por la cuasi varianza:

𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅ )2
𝑛−1
𝑖=1
21

Estos estimadores se verán con más detalle en la siguiente sección. Entonces,

si queremos estimar la media µ a partir de una m.a.s. 𝑋1 , …, 𝑋𝑛 y no conocemos la

varianza, en la expresión substituimos 𝜎 2 (equivalentemente, σ) por un estimador de

la siguiente manera:

𝑋̅ − 𝜇 𝑋̅ − 𝜇 𝑡 𝑠𝑖 𝑛 ≤ 30
= ~ { 𝑛−1
𝑠/√𝑛 − 1 𝑆/√𝑛 𝑁 0,1)𝑠𝑖 𝑛 > 30
(

donde 𝑡𝑛−1 denota una distribución T-Student, con (n − 1) grados de libertad.

Esta distribución es simétrica y se aproxima a la N (0, 1) para n suficientemente

grande (véase Figura 43). Al igual que en el caso anterior (con varianza conocida),

seguimos teniendo un estimador simétrico, pero el error típico vendrá ahora dado por:

𝑠 𝑆
𝐸𝑇 (𝑋̅) = =
√𝑛 − 1 √𝑛

En resumen, cuando queremos estimar la media µ en una población Normal,

debemos distinguir los siguientes casos:

𝑋̅ −𝜇
1. Si la varianza 𝜎 2 es conocida, entonces: 𝜎/ ~𝑁(0,1)
√𝑛

𝑋̅ −𝜇 𝑋̅ −𝜇
2. Si la varianza 𝜎 2 es desconocida y n > 30: 𝑠/ = 𝑆/ ~𝑁(0,1)
√ 𝑛−1 √𝑛

𝑋̅ −𝜇 𝑋̅ −𝜇
3. Si la varianza 𝜎 2 es desconocida y n ≤ 30: = ~𝑡𝑛−1
𝑠/√𝑛−1 𝑆/√𝑛

2.12.2 Estimación de la varianza 𝝈𝟐

En la estimación de la media se hace necesario utilizar un estimador de la

varianza 𝜎 2 , en caso de que esta no sea conocida. Para ello podemos utilizar la

varianza muestral 𝑠 2 o la cuasi varianza muestral 𝑆 2 . Es fácil ver la relación entre

ellas, ya que:
22

𝑛−1 𝑛
𝑠2 = 𝑛
𝑆 2 , o bien 𝑆 2 = 𝑛−1 𝑠 2

Estos dos estimadores sólo se distinguen en su denominador, y para n grande,

no hay diferencias importantes entre ellos. Como la varianza muestral o la cuasi

varianza proporcionarán valores (aleatorios) positivos, su distribución tendrá como

soporte [0, ∞). Esta distribución será la distribución Chi-cuadrado χ 2 (distribución ji-

cuadrado). Si 𝑋1 , …, 𝑋𝑛 es una m.a.s. de variables normales con varianza σ 2,

entonces:

𝑛𝑠 2 2 (𝑛−1)𝑆2 2
𝜎2
~𝑋𝑛−1 , o bien 𝜎2
~𝑋𝑛−1 ,

2
donde 𝑋𝑛−1 es una distribución Chi-cuadrado con (n − 1) grados de libertad.

Esta distribución es asimétrica y con soporte la semirrecta real positiva, como puede

verse en la Figura 44. Esta distribución es necesaria cuando el tamaño de la muestra

es pequeño. Para n suficientemente grande, podemos aproximar una distribución 𝑋𝑛2

(Chi-cuadrado con n grados de libertad) por una N (n, 2n).

2.12.3 Estimación por intervalos de confianza

En algunas ocasiones, no sólo estamos interesados en dar una estimación

puntual del valor del parámetro desconocido, y el objetivo se centra en obtener un

rango de valores entre los que se encuentre el parámetro de la distribución con una

cierta probabilidad, es decir, un intervalo de confianza. Construiremos intervalos de

confianza para la proporción p en la distribución Binomial y para la media µ en la

distribución Normal. Los estimadores que hemos introducido para la proporción y la

media (𝑝̂ y X, respectivamente) son simétricos y podemos calcular o aproximar su

error típico. La fórmula general para el cálculo de intervalos de confianza será:

Estimador ± Cuantil · ET (Estimador)


23

De este modo, obtendremos intervalos de confianza centrados en el estimador,

y cuya amplitud vendrá determinada por su error típico (donde interviene el tamaño

de la muestra) y por el cuantil de la distribución correspondiente, que estará

relacionado con la cobertura del intervalo.

2.13 Intervalos de confianza para la proporción p

Consideremos 𝑝̂ , proporción muestral, como estimador de p. A partir de la

ecuación podemos construir un intervalo de confianza de nivel (cobertura) (1 − α)

para p:

𝑝̂(1−𝑝̂) 𝑝̂(1−𝑝̂) 𝑝̂(1−𝑝̂)


𝑝̂ ± 𝑧1−𝑎/2 √ o bien (𝑝̂ − 𝑧1−𝑎 √ , 𝑝̂ + 𝑧1−𝑎/2 √ )
𝑛 2 𝑛 𝑛

𝑝̂(1−𝑝̂)
En este caso, el error típico se aproxima por √ y, dado que 𝑝̂ tiene una
𝑛

distribución Normal, consideramos los cuantiles de una N(0, 1). En concreto, para los

intervalos de confianza usuales, se tiene:

𝑝̂(1−𝑝̂)
• IC para p al 90 %: 𝑝̂ ± 1.64√
𝑛

𝑝̂(1−𝑝̂)
• IC para p al 95 %: pˆ ± 1.96√ 𝑛

𝑝̂(1−𝑝̂)
• IC para p al 99 %: pˆ ± 2.57√ 𝑛

ya que para una cobertura 1 − α = 0.9 = 90 % (α = 0.1), el cuantil z1−α/2 =

1.64. Del mismo modo, para una cobertura del 1 − α = 0.95 = 95 % (α = 0.05) el

cuantil es 𝑧1−𝑎/2 = 1.96 y para una cobertura del 1 − α = 0.99 = 99 % (α = 0.01) el

cuantil es 𝑧1−𝑎/2 = 2.57.


24

2.14 Intervalos de confianza para la media µ

Sea X ∼ N (µ, 𝜎 2 ) y consideremos 𝑋1 , …, 𝑋𝑛 una m.a.s. de X. Si estamos

interesados en obtener intervalos de confianza para la media µ, tendremos que tener

en cuenta las siguientes situaciones:

• La varianza 𝜎 2 es conocida.

En ese caso, el IC para µ viene dado por:

𝜎
𝑋̅ ± 𝑧1−𝑎/2
√𝑛

donde 𝑧1−𝑎/2 es el cuantil de una N (0, 1) que tomará valores 1.64 para

cobertura del 90 %, 1.96 para cobertura del 95 % y 2.57 para cobertura del 99 % (al

igual que en los intervalos para la proporción que vimos en la sección anterior).

• La varianza 𝜎 2 es desconocida, pero n es grande.

Cuando la varianza no es conocida, la distribución de la media X es una T-

Student, que para tamaño muestral n ≥ 30 se puede aproximar por una N (0, 1). En

este caso, se debe aproximar el error típico obteniendo el siguiente intervalo de

confianza:

𝑠 𝑆
𝑋̅ ± 𝑧1−𝑎/2 o bien 𝑋̅ ± 𝑧1−𝑎/2
√𝑛−1 √𝑛

donde nuevamente 𝑧1−𝑎/2 es el cuantil de una N (0, 1).

• La varianza 𝜎 2 es desconocida y n es pequeño.

En este caso, debemos considerar los cuantiles de la distribución T-Student,

quedando el intervalo de confianza como:


25

𝑠 𝑆
𝑋̅ ± 𝑡𝑛−1,1−𝑎/2 , o bien 𝑋̅ ± 𝑡𝑛−1,1−𝑎/2
√𝑛−1 √𝑛

donde 𝑡𝑛−1,1−𝑎/2 son los correspondientes cuantiles de una distribución T-

Student con (n − 1) grados de libertad. Estos cuantiles están tabulados. En el caso de

los intervalos de confianza para µ, se puede observar que, para un nivel de

significación fijo, a mayor varianza, mayor longitud del intervalo. El efecto contrario

se produce a medida que aumenta el tamaño muestral. En ese caso, se reduce la

longitud del intervalo. Cuando no conocemos la varianza, obtenemos también

intervalos más amplios que en el caso de 𝜎 2 conocida, ya que los cuantiles de la

distribución t son más extremos que para la N (0, 1)

2.15 Intervalo de confianza para la varianza y desviación estándar

La varianza muestral (S2) es un estimador insesgado y de varianza mínima de la

varianza de la población normal (σ2 ). Sin embargo, la desviación estándar (S) es un

estimador sesgado de σ. El sesgo se reduce rápidamente al aumentar el tamaño de la

muestra (n).

El intervalo de confianza para σ2 se basa en el hecho de que:

[(n − 1) ∗ 𝑆 2 ]
σ2

tiene una distribución de chi-cuadrado con n-1 grados de libertad. La distribución de

chi-cuadrado, al igual que t, depende de sólo un parámetro denominado grados de

libertad, el cual sólo toma valores positivos. La distribución de X2 presenta una

asimetría positiva por cuanto su cola derecha tiende a infinito.

La expresión probabilística que origina el intervalo de confianza es:


26

Los intervalos calculados en esta sección y en las anteriores corresponden a un nivel

de confianza de 1-α y en todos los casos hemos decidido excluir un área

correspondiente a α/2 en ambas colas de la distribución. En el caso de la distribución

normal estandarizada (Z) y la distribución “t” utilizamos intervalos simétricos porque

tienen una amplitud mínima, comparados con intervalos asimétricos para un mismo

nivel de confianza.

Un evento equivalente al anterior puede obtenerse extrayendo la raíz cuadrada de los

tres términos:

El intervalo anterior corresponde a la desviación estándar poblacional y su nivel de

confianza es 1-α. Para calcular un intervalo específico para σ2 solo tenemos que

sustituir S3 por S20. Recuerde que el cálculo del IC para la desviación estándar asume

que los datos provienen de una distribución normal y a diferencia del IC para la

media, en este caso una violación a este supuesto se traduce en un IC sesgado.


27

3 CAPÍTULO II: Método

3.1 Población y muestra

3.1.1 Población

La población que se necesitaba tenía que ser de una misma especie, en este caso
consideramos el usar los tubérculos, por el cual optamos la papa.

La recopilación de datos, se realizó en la bodega “Viki”. La población que se


considero fue de “100” papas, de los cuales con ayuda de una balanza se tomó los pesos de
cada uno de estos

3.1.2 Muestra

En la muestra nos permitirá realizar un estudio viable y creíble el cual nos permite

seleccionar las unidades de la población de cuales se requirió la información, en este caso las

papas de la bodega “Viki”, donde utilizaremos el muestreo probabilístico que nos dice que

cada elemento de la población tiene la misma oportunidad de ser seleccionados y definido

para las características de la población.

3.2 Métodos y técnicas de recolección de datos

Para este trabajo de investigación, se utilizó los siguientes métodos y técnicas de

recolección de información.

Observación Experimental o Participante: Esta técnica es la que más se utilizó para

nuestro trabajo de investigación, donde elabora datos en condiciones relativamente

controladas por el investigador, particularmente porque éste puede manipular la o las

variables, es decir que hemos recopilados la información a través del instrumento la hoja o

ficha de registro de datos.


28

3.2.1 Instrumentos para la recolección de datos

3.2.1.1 Balanza

Con ayuda de este instrumento, cuando ya se tenía la cantidad de

muestra de la papa, se procedió a hacer uso de esta para así saber con la mayor

exactitud posible el peso de cada una de las papas

3.2.1.2 Lapiceros

Fueron uno de los objetos muy necesarios para hacer las anotaciones

respectivas de los pesos de las papas que se pudo encontrar en la bodega ‘Viki’

durante la semana que se fue a recopilar los datos.

3.2.1.3 Hojas

En esta hoja se plasmó los pesos que tenían cada una de las papas que

se usaron como población en nuestro trabajo de investigación y que fueron

útiles para posteriormente hacerle su análisis respectivo.

3.3 Métodos, técnicas de procesamiento y análisis de datos

Este trabajo de estudio se llevó a cabo en base a la Observación experimental o

Participante donde nosotros hemos recopilado la información a través del instrumento la hoja

donde registramos los datos.

Posteriormente, nos enfocamos en el objeto de estudio donde recolectamos la

información general respecto a ello, nuestro objeto de estudio es la papa. Durante la

realización de nuestro estudio, en la parte de análisis se consideró mucho el uso de los

programas proporcionados por el ingeniero (ACZEL).


29

Los datos fueron vaciados en uno de los programas y como resultados nos iba dando

la media, la moda, la mediana, la varianza, la desviación estándar, y muchos más datos lo

cuales fueron usados para la elaboración de este trabajo. Gracias a estos fue que se realizó de

una manera más sistemática y poco menos complicada, a diferencia de realizarlo a mano

todos los cálculos.

Además, en el transcurso de las semanas mientras íbamos avanzando con el desarrollo

del proyecto, nos guiamos del desarrollo de las clases del curso de Estadística Empresarial,

para ver si lo que íbamos desarrollando iba por buen camino y también la manera de cómo es

que deberíamos interpretar los resultados obtenidos.

4 CAPÍTULO III: Determinación del tamaño de la muestra

Para ello identificamos que se trabajará con una población finita cuando N < 100000

y presentaremos las siguientes tablas de información:

Tabla 1

Porcentaje
Población objetiva Cantidad
(%)
Papa de la bodega ‘VIKI’ 100 100
100 100

Tabla 2

Datos
Nivel de Confianza 95%
Representa las unidades de valor de la Dist.
1,960
Normal Estándar (z)
Proporción de éxito (p) 0.5
Proporción de no éxito (q) 0.5
Margen de error (E) 7%
Tamaño de la población (N) 100
Desviación Estándar (𝜎) 10,5498626
30

➢ Determinación del tamaño preliminar de la muestra (n0):

Cuando: N < 100000, para una población finita.

Fórmula:

𝑧 2 ∗𝑁∗𝑠2
n0: [𝐸 2 (𝑁−1)+𝑧2 ∗𝑠2]

n0: 66,44

➢ Determinación del tamaño final de la muestra (n):

Fórmula:

𝑛0
n: 𝑛
[1+ 0]
𝑁

n: 39,92

➢ El tamaño de muestra a ser aplicado es: 40

5 CAPÍTULO IV: Resultados

Tabla 3

Datos de los pesos de las papas en gramos

N° PESO(g)
1 145
2 140
3 150
4 165
5 162
6 170
7 155
8 160
31

9 168
10 152
11 144
12 168
13 151
14 150
15 157
16 165
17 170
18 166
19 159
20 164
21 160
22 160
23 144
24 140
25 168
26 151
27 150
28 157
29 165
30 170
31 166
32 159
33 149
34 124
35 176
36 181
37 178
38 136
39 157
40 134
41 140
42 148
43 168
44 151
45 150
46 157
47 165
32

48 170
49 166
50 159
51 164
52 160
53 160
54 144
55 140
56 168
57 151
58 150
59 157
60 165
61 170
62 145
63 140
64 150
65 165
66 162
67 170
68 155
69 160
70 168
71 152
72 144
73 168
74 151
75 150
76 157
77 165
78 170
79 166
80 159
81 164
82 160
83 160
84 144
85 140
86 151
33

87 150
88 157
89 165
90 170
91 166
92 159
93 164
94 160
95 160
96 144
97 140
98 151
99 150
100 157

Nota: los datos mostrados corresponden a los pesos en gramos de las papas de la bodega ‘Viki’ del

06 de mayo del 2023, de una población de 100 papas, la muestra es de 40 unidades de papas.

5.1 Medidas de tendencia central:

❖ Media: 156,98g

Es el valor promedio en gramos de los 40 papas, que resulta de dividir la suma del

peso de las papas en gramos entre la cantidad de papas consideradas.

❖ Mediana: 159g

Esto quiere decir, que el 50% del peso de las papas es menor o igual a 159g, ya que es

quien divide en 2 partes iguales.

❖ Moda: 160g, es el dato del peso de las papas que ocurre con mayor frecuencia, se

repite más.

5.2 Medidas de dispersión:

❖ Varianza: 112.4238384

❖ Desviación estándar: 10.60301082


34

❖ Coeficiente de variación: 0.067543705lo hallamos al dividir la desviación estándar

sobre la media (S/x̄).

❖ Rango: 57

❖ IQR: 15

5.3 Asimetría y Curtosis:

❖ Asimetría (As): -0.409181564 (Es asimetría negativa)

❖ Curtosis (K): -0.069021171 Es Platicúrtica (donde existe una gran concentración de

los valores entorno a su media), y “k” tiende a -0,5.

5.4 Cuantiles

a) Cuartiles (Qi):

❖ 1er Cuartil: 150

❖ Mediana: 159

❖ 3er Cuartil: 165

❖ IQR: 15

b) Deciles (Di):

Para hallar los valores de los deciles, colocamos los datos de los pesos de las

papas en orden de manera ascendente.

➢ Datos no agrupados y n es par:

𝐾(𝑛)
𝑫𝑲 =
10

➢ Datos no agrupados y n es impar:

𝐾(𝑛 + 1)
𝑫𝑲 =
10
35

En este caso n: Es 40 es par.

❖ Hallando D1:

1(40)
𝐷1 = = 4 = 140
10

❖ Hallando D2:

2(40)
𝐷2 = = 8 = 145
10

❖ Hallando D3:

3(40)
𝐷3 = = 12 = 150
10

❖ Hallando D4:

4(40)
𝐷4 = = 16 = 155
10

❖ Hallando D5:

5(40)
𝐷5 = = 20 = 159
10

❖ Hallando D6:

6(40)
𝐷6 = = 24 = 160
10

❖ Hallando D7:

7(40)
𝐷7 = = 28 = 165
10

❖ Hallando D8:

8(40)
𝐷8 = = 32 = 168
10

❖ Hallando D9:

9(40)
𝐷9 = = 36 = 170
10
36

c) Percentiles (Pi):

❖ P10: 143,6≈ 144

❖ P65: 162,7≈ 163

❖ P90: 170

Otros datos:

❖ Suma: 15698286

❖ Cantidad: 100

❖ Máximo valor: 181

❖ Mínimo valor: 124

5.5 Observación del Teorema de Chebyshev:

❖ Puntos de datos dentro de 1,5 desviación estándar de la media: 87

❖ Fuera de: 100

❖ Cuál es: 87,00%

❖ Mínimo predicho por el teorema de Chebyshev: 55,56%

❖ Mínimo predicho por la regla empírica: 86,64%

5.6 Distribución normal estándar:

Los pesos de las papas se distribuyen normalmente con una media de 157,15 gramos

y una desviación estándar de 12,55 gramos.

Entonces nos es posible responder a las siguientes preguntas:

Datos:

• 𝜇 = 157,15 𝑔

• 𝜎 = 12,55 𝑔
37

a) ¿Cuál es el porcentaje de papas cuyos pesos están entre 157,15 y 165 gramos?

𝑝(157,15 ≤ 𝑥 ≤ 165)

Estandarizamos con la siguiente fórmula:

𝑥−𝜇
𝑍=
𝜎

Donde:

✓ 𝑥 = 𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙

✓ 𝜇 = 𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙

✓ 𝜎 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟

✓ 𝑍 = 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟

Solución:

157,15−157,15
• 𝑍= =0
12,55

165−157,15
• 𝑍= = 0,63
12,55

Entonces:

𝑝(157,15 ≤ 𝑥 ≤ 165) = 𝑝(0 ≤ 𝑧 ≤ 0,63) = 𝑝(𝑧 ≤ 0,63) − 0,5


38

0,7357 − 0,5 = 0,2357 = 23,53%

Interpretación:

El porcentaje de papas cuyos pesos están entre 157,15 y 165 gramos es de 23,53%.

b) ¿Cuál es la probabilidad de que una papa cualquiera no sea mayor de 145 gramos?

Solución:

𝑝(𝑥 ≤ 145)

Estandarizamos:

𝑥−𝜇
𝑍=
𝜎

145 − 157,15
𝑍= = −0,97
12,55

Entonces:

𝑝(𝑥 ≤ 145) = 𝑝(𝑧 ≤ −0,97) = 0,1660 = 16,60%

Interpretación:

El porcentaje de la probabilidad de que una papa cualquiera no sea mayor de 145

gramos es de 16.60%.
39

c) ¿Cuál es la probabilidad de que una papa tenga entre 140 y 160 gramos?

Solución:

𝑥−𝜇
𝑍=
𝜎

140−157,15
• 𝑍= = −1,37
12,55

160−157,15
• 𝑍= = 0,23
12,55

-1,37 0,23

𝑝(140 ≤ 𝑥 ≤ 160) = 𝑝(−1,37 ≤ 𝑧 ≤ 0,23) = 𝑝(𝑧 ≤ 0,23) − 𝑝(𝑧 ≤ −1,37)

𝑝(𝑧 ≤ 0,23) − 𝑝(𝑧 ≤ −1,37) = 0,58095 − 0,08534 = 0,49561 = 49,561%

Interpretación:

El porcentaje de la probabilidad de que una papa tenga entre 140 y 160 gramos es de

49,561%.

5.7 Intervalo de confianza para la media:

El peso de las papas se distribuye normalmente con una desviación típica de 10,60.

Se toma una muestra aleatoria de 40 papas seleccionadas de la bodega “Viki”, dió los

siguientes valores en gramos:


40

145;140;150;165;162;170;155;160;168;152;144;168;151;150;157;165;170;166;159;164;16

0;160;144;140;168;151;150;157;165;170;166;159;149;124;176;181;178;136;157;134.

a) Estime un intervalo de confianza del 98% para poder apreciar el peso neto medio de

las papas obtenidas de la bodega “Viki”.

Datos:

❑ s = 10,60

❑ n = 40

❑ 1 - α = 98%

❑ n = 40

Solución:

Debido a que la muestra es grande y la desviación estándar poblacional es conocida,

esta situación pertenece al caso I.

El intervalo de confianza para 𝜇 está dado por:


𝜎 𝜎
𝑥̅ − 𝑧0 . ≤ 𝜇 ≤ 𝑥̅ + 𝑧0 .
√𝑛 √𝑛

No se conoce 𝑍0 , 𝜎 𝑦 𝑥̅ :

Hallamos 𝜎 : 𝜎 = 𝑠 = 10,60 por el TLC

Hallamos 𝑥̅ : 157,15

Hallamos 𝑍0 : 2,326

Ahora reemplazamos los datos y resolvemos

2,326 ∗ 10,60 2,326 ∗ 10,60


157,15 − ≤ 𝜇 ≤ 157,15 +
√40 √40

153,25 ≤ 𝜇 ≤ 161,05

Interpretación:
41

Con un 98 % de confianza estimamos que el peso neto medio de las papas de la

bodega “Viki” estarán comprendidos entre 153,25 g y 161,05 g.

b) Considerando que la población está conformada por 100 papas; estime un intervalo de

confianza del 97,5% para apreciar el peso promedio de las papas de toda la población de las

papas.

Datos:

❑ s = 10,60

❑ n = 40

❑ N = 100

❑ 1 - α = 97,5%

❑ n = 40

Solución

El intervalo de confianza para μ está dado por:

𝑆 𝑁−𝑛 𝑆 𝑁−𝑛
𝑥̅ − 𝑍0 ∗ ∗√ ≤ 𝜇 ≤ 𝑥̅ + 𝑍0 ∗ ∗√
√𝑛 𝑁−1 √𝑛 𝑁−1

No se conoce 𝑍0 :

Hallamos 𝑍0 = 2,241

Reemplazamos los datos y resolvemos:

10,60 100 − 40 10,60 100 − 40


157,15 − 2,241 ∗ ∗√ ≤ 𝜇 ≤ 157,15 + 2,241 ∗ ∗√
√40 100 − 1 √40 100 − 1

154,23 ≤ μ ≤ 160,07
42

Interpretación:

Con un 97,5% de confianza estimamos que el promedio de los pesos de todas las

papas de la bodega ‘Viki’ estará comprendido entre 154,23g y 160,07g, cuando el

tamaño de la población es 100.

5.8 Intervalo de confianza para la diferencia de medias:

Para este punto nosotros volvimos a conseguir datos de la bodega ‘Viki’, de una

población de 110 unidades, los datos obtenidos se muestran en la siguiente tabla:

Tabla 3

Datos de los pesos de las papas de la bodega ‘Viki’ en gramos

N° PESO(g)
1 157
2 165
3 170
4 166
5 159
6 164
7 160
8 160
9 144
10 140
11 151
12 150
13 157
14 165
15 170
16 166
17 159
18 164
19 160
20 160
43

21 144
22 140
23 151
24 150
25 157
26 157
27 165
28 170
29 166
30 159
31 166
32 159
33 149
34 124
35 176
36 181
37 178
38 136
39 157
40 134
41 140
42 148
43 168
44 151
45 150
46 157
47 157
48 165
49 170
50 166
51 159
52 166
53 159
54 149
55 124
56 176
57 181
58 178
59 136
44

60 157
61 134
62 140
63 148
64 168
65 151
66 150
67 124
68 176
69 181
70 178
71 136
72 157
73 134
74 140
75 148
76 168
77 151
78 150
79 181
80 178
81 136
82 157
83 134
84 140
85 148
86 168
87 151
88 150
89 178
90 136
91 157
92 134
93 140
94 148
95 168
96 151
97 150
98 150
45

99 150
100 168
101 151
102 150
103 150
104 150
105 150
106 150
107 150
108 150
109 150
110 157

Nota: Los datos mostrados corresponden a los pesos en gramos de las papas de la bodega ‘Viki’

del 31 de mayo del 2023, el tamaño de muestra aplicado es de 46 unidades de papas.

Problema:

Se investigó el peso de las papas de la bodega ‘Viki’ en dos fechas diferentes, para estimar

la diferencia existente en el peso promedio de las papas de la fecha 1 y la fecha 2. De una

muestra aleatoria de 40 papas en la fecha 1, presenta un peso promedio de 155,175 g y una

desviación típica de 11,50 g; en tanto que, de una muestra aleatoria de 46 en la fecha 2,

presenta un peso promedio de155,174 g y una desviación estándar de 12,40 g, ahora

estimaremos estos datos con un 99% de nivel de confianza.

Para la selección aleatoria de ambas muestras, realizamos el muestreo aleatorio con

la ayuda del Excel. Donde vaciamos la base de datos, hacemos uso de la formula aleatorio.

Entre para obtener los resultados de las muestras correspondientes a cada fecha.

Muestra de la fecha 1
46

150 150 166 152 168 160 170


170 168 140 144 144 160 160
134 150 165 151 162 155 159
136 166 159 140 168 165
165 160 124 150 164 150

Muestra de la fecha 2

157 170 151 140 159 150 148 150


140 170 157 136 170 159 159 157
166 148 178 181 151 165 151 136
124 149 165 159 140 166 168 148
157 157 150 168 148 151

Datos:

Fecha 1 Fecha 2

𝑛1 = 40 𝑛2 = 46

𝑥̅1 = 155,175𝑔 𝑥̅2 = 155,174𝑔

𝑆1 = 11,504𝑔 𝑆2 = 12,401𝑔

1 − α = 99% 1 − α = 99%

Solución:

Este problema pertenece al caso I, ya que n es grande.

El intervalo de confianza para 𝜇1 − 𝜇2 está dado por:

𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
(𝑥̅1 − 𝑥̅2 ) − 𝑍0 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑍0 ∗ √ +
𝑛1 𝑛2 𝑛1 𝑛2

Hallamos 𝑍0 , 𝜎1 𝑦 𝜎2 , ya que son desconocidos:


47

Hallamos 𝑍0 = 2,576

• Hallamos 𝜎1 = 𝑆1 = 11,504𝑔 , por el TLC ya que n es grande.

• Hallamos 𝜎2 = 𝑆2 = 12,401𝑔 , por el TLC ya que n es grande.

Ahora Reemplazamos y resolvemos:

2 2
11,504 12,401
(155,175 − 155,174) − 2,576 ∗ √ + ≤ 𝜇1 − 𝜇2
40 46

2 2
11,504 12,401
≤ (155,175 − 155,174) + 2,576 ∗ √ +
40 46

−6,643 ≤ 𝜇1 − 𝜇2 ≤ 6,645

Interpretación:

Con un 99% de confianza estimamos que los pesos promedios de las papas de la

bodega “Viki” de la fecha 1 y fecha 2 estará comprendido entre -6,643 y 6,645,

entonces no hay diferencias de medias. Por lo tanto, podemos afirmar que no hay

diferencias significativas de los pesos promedios de las papas de la fecha 1 y fecha 2.

5.9 Intervalo de confianza para la proporción:

Se realizo una encuesta para estimar la popularidad de la bodega “Viki” de acuerdo

a las papas, para ello de una muestra de 30 personas, se les realizo las siguientes

afirmaciones y se les consulto con cual están de acuerdo:

a) La bodega Viki, está vendiendo las mejores papas de la ciudad.

b) La bodega Viki, no está vendiendo las mejores papas de la ciudad.

c) No opinan

Al finalizar se obtuvo que un total de 20 personas seleccionaron la opción ‘a’, luego nos

solicitan lo siguiente:
48

a) Con un intervalo de confianza del 95%, de la proporción de personas que están de

acuerdo con que la bodega Viki vende las mejores papas de la ciudad:

Datos:

• n = 30

• k = 20

• 1- 𝛼 = 95 %

Solución:

Si el IC:

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑝̂ − 𝑍0 √ ≤ 𝜋 ≤ 𝑝̂ + 𝑍0 √
𝑛 𝑛

Primero hallamos p, z:

• p = k/n = 20/30= 0,6667

• z= 1,96

Reemplazamos:

0,6667(1 − 0,6667)
0,6667 ± 1,96√
30

0,4980 ≤ 𝜋 ≤ 0,8354
49

Con el 95% de nivel de confianza determinamos que la proporción poblacional de las

personas que concuerdan con que “las papas de la bodega Viki son las mejores de la ciudad”

está comprendido entre 49,80% y 83,54%.

b) De acuerdo con lo obtenido con el intervalo de la parte (a), ¿se podría concluir con

que la mayoría (más del 50 %) de las personas está de acuerdo con que “las papas de

la bodega Viki son las mejores de la ciudad”?

Si se podría, porque el porcentaje de las que personas que fueron encuestadas, afirman

que la bodega ‘Viki’ tiene las mejores papas de la ciudad, está comprendida entre el 49,80%

y 83,54%, nos damos cuenta de que es más del 50%.

5.10 Intervalo de confianza para la diferencia de proporciones:

Se desea estimar mediante un intervalo del 95% de confianza la diferencia en la

proporción de las papas que pesan más de 155g de la bodega ‘Viki’ pesadas en la fecha 1

y en la fecha 2; para este propósito se selecciona aleatoriamente de la fecha 1 una muestra

de 42 papas encontrándose en ella 17 papas que pesan más de 155g; en tanto que en una

muestra de 40 papas seleccionadas aleatoriamente de la fecha 2 se encontró que 7 pesan

más de 155g.

Para la selección aleatoria de ambas muestras, realizamos el muestreo aleatorio

semántico. Donde escogimos un punto de partida aleatoria, escogiendo después cada 3-

ésimo elemento de la lista.

Muestra de la fecha 1:

144 176 160 140 158 131 149

181 157 145 160 123 164 149


50

178 142 134 137 158 168 168

141 146 165 136 152 137 139

134 121 145 139 178 180 170

150 144 158 122 146 176 136

Muestra de la fecha 2:

179 138 156 154 145 137 141 171

130 135 131 139 144 129 132 150

136 158 141 163 148 137 146 131

147 126 147 138 146 132 133 132

121 127 149 176 140 147 162 128

Datos:

Fecha 1 Fecha 2

𝑛1 = 42 𝑛2 = 40

𝑘1 = 17 𝑘2 = 7

1 − α = 95%

Solución:

El intervalo de confianza para 𝜋1 − 𝜋2 está dado por:


51

𝑝̅1 (1 − 𝑝̅1 ) 𝑝̅2 (1 − 𝑝̅2 )


(𝑝̅1 − 𝑝̅2 ) − 𝑍0 ∗ √ + ≤ 𝜋1 − 𝜋2
𝑛1 𝑛2

𝑝̅1 (1 − 𝑝̅1 ) 𝑝̅2 (1 − 𝑝̅2 )


≤ (𝑝̅1 − 𝑝̅2 ) + 𝑍0 ∗ √ +
𝑛1 𝑛2

Hallamos 𝑍0 , 𝑝̅1 𝑦 𝑝̅2 , ya que son desconocidos:

• 𝑍0 = 1,96

𝑘1 17
• 𝑝̅1 = = = 0,405
𝑛1 42

𝑘 7
• 𝑝̅2 = 𝑛2 = 40 = 0,175
2

Reemplazamos:

0,405(1 − 0,405) 0,175(1 − 0,175)


(0,405 − 0,175) − 1,96 ∗ √ + ≤ 𝜋1 − 𝜋2
42 40

𝑝̅1 (1 − 𝑝̅1 ) 𝑝̅2 (1 − 𝑝̅2 )


≤ (𝑝̅1 − 𝑝̅2 ) + 𝑍0 ∗ √ +
𝑛1 𝑛2

0,041 ≤ 𝜋1 − 𝜋2 ≤ 0,419

Interpretación:

Con un 95% de confianza estimamos que la diferencia de proporciones de las

papas que pesan más de 155g de la bodega ‘Viki’ en la fecha 1 y fecha 2, estará

comprendida entre 4,1% y 41,9%.

5.11 Intervalo de confianza para la varianza:

Se desea estimar mediante un intervalo de confianza del 98%: (a) La varianza

poblacional, del peso de papas que se venden en la bodega ‘Viki’; para ello se elige una
52

muestra aleatoria de 81 papas obteniéndose la siguiente información: un peso promedio

de 154,46 gramos con una desviación estándar de 15,45 gramos.

Datos:

• 1-α=98%

• n=81

• s=15,45’

• x barra= 154,46

Solución:

El IC para varianza poblacional está dado por:

(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
≤𝜎 ≤
𝑋22 𝑋12

Hallamos: 𝑋22 𝑦 𝑋12

𝑋12 = 𝑋 2 (0,01; 49) = 29

𝑋22 = 𝑋 2 (0,99; 49) = 74,9

Reemplazando:

(81 − 1)15,452 2
(81 − 1)15,452
≤𝜎 ≤
74,9 29

254,96 ≤ 𝜎 2 ≤ 658,49

Interpretación:

Con un 98% de confianza, estimamos que la varianza poblacional del peso de

las papas de la bodega ‘Viki’ estará comprendida entre 254,96 𝑔2 y 658,49 𝑔2 .


53

5.12 Intervalo de confianza para la desviación estándar:

Se desea estimar mediante un intervalo de confianza del 98%, la desviación

estándar poblacional, del peso (en gramos) de las papas que se venden en la bodega

Viki, para ello se elige una muestra aleatoria de 81 papas obteniéndose la siguiente

información: un peso promedio de 9599 gramos con una desviación estándar de 15.45

gramos.

Datos:

• 1-α=98%

• n=81

• s=15.45

• x barra= 9599

Solución:

El IC para la desviación estándar poblacional está dado por:

(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
√ ≤ 𝜎 ≤ √
𝑋22 𝑋12

Hallamos: 𝑋22 𝑦 𝑋12

𝑋12 = 𝑋 2 (0,01; 80) = 53,5

𝑋22 = 𝑋 2 (0,99; 80) = 112,3

Reemplazando:
54

(81 − 1)15,452 (81 − 1)15,452


√ ≤𝜎≤ √
112,3 53,5

13.04 ≤ 𝜎 ≤ 18,89

Interpretación:

Con un 98% de confianza, estimamos que la desviación estándar

poblacional del peso de las papas de la bodega estará comprendida entre 13,04 g

y 18,89g.

5.13 Prueba de Hipótesis para la media

Los trabajadores de la bodega ‘Viki’ señalan que en promedio las papas pesan

145g, el dueño de la bodega a juzgar por los reportes de pesos de las papas en meses

anteriores tiene la sospecha de que el peso por papa es superior a lo manifestado por los

trabajadores, para ello toma el tiempo de pesar 33 papas aleatoriamente encontrando un

peso promedio de 148,61g con una desviación estándar de 16,39g. Ayude al dueño de la

bodega ‘Viki’ a tomar la decisión más adecuada.

Para la selección aleatoria de ambas muestras, realizamos el muestreo aleatorio

semántico. Donde escogimos un punto de partida aleatoria, escogiendo después cada 4-

ésimo elemento de la lista.

139 146 181 134 147 123 156 135 142 128 144

168 153 153 165 174 124 139 165 160 139 160

178 150 140 139 146 181 134 147 123 156 135

Datos:
55

✓ 𝜇0 = 145𝑔

✓ 𝜇 > 145𝑔

✓ 𝑛 = 33

✓ 𝑥𝑏𝑎𝑟𝑟𝑎 = 148,61𝑔

✓ 𝑠 = 16,39𝑔

Paso 1: Planteamos la hipótesis

• 𝐻0 : 𝜇 ≤ 145𝑔 (V)

• 𝐻1 : 𝜇 > 145𝑔 (X)

Paso 2: Elegimos el nivel de significancia

𝛼 = 5%

Paso 3: Seleccionamos el estadístico de prueba

• 𝐸𝑙𝑒𝑔𝑖𝑟𝑒𝑚𝑜𝑠 𝑍 (𝑛 𝑒𝑠 𝑔𝑟𝑎𝑛𝑑𝑒)

• 𝐹ó𝑟𝑚𝑢𝑙𝑎 𝑎 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑟:

𝑥̅ − 𝜇0
𝑍𝑐 = 𝜎
√𝑛

• Gráfica

Paso 4: Establecemos el criterio de decisión


56

• 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟á 𝑙𝑎 𝐻0 𝑠𝑖:

𝑍𝑐 > 𝑍𝑡

𝑍𝑡 = 1,645

Además:

𝑝 < 𝛼 = 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0

𝑝 ≥ 𝛼 = 𝐴𝑐𝑒𝑝𝑡𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0

Paso 5: Cálculos

• 𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝜎:

Por TLC:

𝑠 = 𝜎 = 16,39

• 𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝑍𝑐 𝑐𝑜𝑛 𝑙𝑎 𝑓ó𝑟𝑚𝑢𝑙𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟𝑚𝑒𝑛𝑡𝑒 𝑒𝑙𝑒𝑔𝑖𝑑𝑎:

148,61 − 145
𝑍𝑐 =
16,39
√33

𝑍𝑐 = 1,265

Paso 6: Toma de decisión

Como el 𝑍𝑐 cae en la región de aceptación, entonces se acepta la hipótesis nula al

5% de nivel de significancia; es decir que el dueño de la bodega ‘Viki’ no tiene razón al

afirmar que el peso de una papa de su bodega es superior a 145g.


57

5.14 Prueba de Hipótesis para la diferencia de medias

Se desea probar la hipótesis de que existe diferencia en el peso promedio de las

papas de la bodega ‘Viki’ pesadas en la fecha 1 y la fecha 2, respecto a que no hay

diferencia entre ambas líneas. Una muestra aleatoria de 42 papas en la fecha 1 da un peso

promedio de 150,88g y una desviación estándar de 16,57g, en tanto que una muestra

aleatoria de 40 papas en la fecha 2 da un peso promedio de 143,05g y una desviación

estándar de 13,65g. Utilice un nivel de significancia de 0,05.

Para la selección aleatoria de ambas muestras, realizamos el muestreo aleatorio

semántico. Donde escogimos un punto de partida aleatoria, escogiendo después cada 3-

ésimo elemento de la lista.

Muestra de la fecha 1:

144 176 160 140 158 131 149

181 157 145 160 123 164 149

178 142 134 137 158 168 168

141 146 165 136 152 137 139

134 121 145 139 178 180 170

150 144 158 122 146 176 136

Muestra de la fecha 2:

179 138 156 154 145 137 141 171

130 135 131 139 144 129 132 150

136 158 141 163 148 137 146 131


58

147 126 147 138 146 132 133 132

121 127 149 176 140 147 162 128

Datos:

Fecha 1 Fecha 2

𝑛1 = 42 𝑛2 = 40

𝑥̅1 = 150,88𝑔 𝑥̅2 = 143,05𝑔

𝑠1 = 16,57𝑔 𝑠2 = 13,65𝑔

Solución:

Paso 1: Planteamos las hipótesis

• 𝐻0 : 𝜇1 − 𝜇2 = 0 (X)

• 𝐻1 : 𝜇1 − 𝜇2 ≠ 0 (V)

Paso 2: Elegimos el nivel de significancia

• α =5%=0,05

Paso 3: Seleccionamos el estadístico de prueba

• 𝐸𝑙𝑒𝑔𝑖𝑟𝑒𝑚𝑜𝑠 𝑍 (𝑛 𝑒𝑠 𝑔𝑟𝑎𝑛𝑑𝑒)

• 𝐹ó𝑟𝑚𝑢𝑙𝑎 𝑎 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑟:

𝑥̅1 − 𝑥̅2
𝑍𝑐 =
(𝜎1 )2 (𝜎2 )2

𝑛1 + 𝑛2

• Gráfica
59

Paso 4: Establecemos el criterio de decisión

• Se rechazará 𝐻0 si:

𝑍𝑐 < −𝑍𝑡 𝑜 𝑍𝑐 > 𝑍𝑡

−𝑍𝑡 = −1,96 𝑍𝑡 = 1,96

Además:

𝑝 < 𝛼 = 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0

𝑝 ≥ 𝛼 = 𝐴𝑐𝑒𝑝𝑡𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0

Paso 5: Cálculos

• 𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝜎:

Por TLC:

𝜎1 = 𝑠1 = 16,57𝑔

𝜎2 = 𝑠2 = 13,65𝑔
60

• 𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝑍𝑐 𝑐𝑜𝑛 𝑙𝑎 𝑓ó𝑟𝑚𝑢𝑙𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟𝑚𝑒𝑛𝑡𝑒 𝑒𝑙𝑒𝑔𝑖𝑑𝑎:

150,88 − 143,05
𝑍𝑐 =
2 2
√(16,57) + (13,65)
42 40

𝑍𝑐 = 2,340

Paso 6: Toma de decisión

Como el Zc cae en la región de rechazo, entonces se rechaza la hipótesis nula al 5%

de nivel de significancia; es decir, sí existe diferencia de peso promedio entre las papas de

la bodega ‘Viki’ en la fecha 1 y 2.

5.15 Prueba de Hipótesis para la proporción

El dueño de la bodega ‘Viki’ asegura que el 60% de los clientes que tiene dice que

les gusta la papa que vende, por no variar mucho en los pesos que tiene, para probar esta

aseveración toma una muestra aleatoria de 50 papas y se les pesa teniendo un rango ideal

de entre 121 y 156. Si de las 50 papas ,40 son las que se encuentran en este rango, ¿qué

concluye? use α = 0.05.

Datos:

• n = 50

• K = 40

• 𝜋0 = 60% = 0,60

• ∝= 0,05

Solución:

Paso 1: planteamiento de hipótesis


61

𝐻0 : 𝜋 = 0,60

𝐻1 : 𝜋 ≠ 0,60

Paso 2: Elegimos el nivel de significancia

∝= 0,05

Paso 3: Seleccionamos el estadístico de prueba

Elegiremos Z

𝑝 − 𝜋0
𝑍𝑐 =
√𝜋0 (1 − 𝜋0 )
𝑛

Hallamos 𝑍𝑡 :

𝑍𝑡 = 1,96

Paso 4: Establecemos el criterio de decisión

Se rechazará la 𝐻0 si:

𝑍𝑐 < −𝑍𝑡 𝑜 𝑍𝐶 > 𝑍𝑡

𝑍𝑐 < −1,96 𝑜 𝑍𝐶 > 1,96

Si:

P < ∝ ===> 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑚𝑜𝑠 𝑙𝑎 𝐻0


62

P ≥∝ ====> 𝑎𝑐𝑒𝑝𝑡𝑎𝑚𝑜𝑠 𝑙𝑎 𝐻0

Paso 5: Calculamos

Hallamos p

𝑘 40
𝑝= = = 0,8
𝑛 50

Hallamos 𝑍𝐶

0,8−0,6
𝑍𝑐 = = 2,89
0,6(1−0,6)

50

Paso 6 toma de decisión:

Como el Zc cae en la región de rechazo, entonces se rechaza la hipótesis nula al 5% de nivel

de significancia, es decir que 60% de los clientes que tiene, dice que no le gusta las papas.

5.16 Prueba de Hipótesis para la diferencia de proporciones

En una muestra aleatoria de 60 papas de la bodega ‘Viki’, se encontró que 40

papas se encuentran por debajo de un peso de 150 g, pero en otra bodega llamada ‘Rosita’

de una muestra aleatoria de 80 papas, 55 papas se encuentran debajo de un peso de 150 g.

¿Estos datos indican que existe una diferencia en la proporción de las papas que se

encuentran debajo de un peso de 150 g? Utilice α = 0,05

Datos:

• n1: 60

• n2: 80

• k1: 40

• k2: 55
63

• a=5%

Paso 1: Planteamos las hipótesis

𝐻𝑜: 𝜋1 − 𝜋2 = 0

𝐻1: 𝜋1 − 𝜋2 ≠ 0

Paso 2: Elegimos el nivel de significancia

𝛼 = 5%

Paso 3: Seleccionamos el estadístico de prueba

Elegiremos Z

𝑃1 − 𝑃2
𝑍𝑐 =
𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
√ +
𝑛1 𝑛2
Zc= -0,25 Zt= 1,96

𝐻𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝑍𝑡 : 𝑍𝑡 = 1,96

Paso 4: Establecemos el criterio de decisión

Se rechazará la H0 si:

𝑍𝑐 < −𝑍𝑡 𝑜 𝑍𝑐 > 𝑍𝑡 P < α ===> Rechazamos la Ho

𝑍𝑐 < −1,96 𝑜 𝑍𝑐 > 1,96 P ≥ α ===> aceptamos la Ho

Paso 5: Cálculos

Hallamos p1 y p2:

𝑘 40
𝑝1 = = = 0,67
𝑛 60
64

𝑘 55
𝑝2 = = = 0,69
𝑛 80

Hallamos Zc

0,67 − 0,69
Zc = = −0,25
√0,67(1 − 0,67) + 0,69(1 − 0,69)
60 80

Paso 6: Toma de decisión

Como el Zc cae en la región de aceptación, entonces se acepta la hipótesis nula al 5% de

nivel de significancia; es decir que no existe diferencia en la proporción de las papas que se

encuentran debajo de un peso de 150 g.

Utilizando el software aczel:

Comparando con el valor P:


P (0,7939) > α (0,05) ===> Aceptamos la Ho
65

Paso 6: Toma de decisión

Como el valor 𝑝 > 𝛼, se acepta la hipótesis nula al 5% de nivel de significancia; es decir que

no existe diferencia en la proporción de las papas que se encuentran debajo de un peso de 150

g.

5.17 Prueba de Hipótesis para la varianza

Se supone que los pesos de las papas de la bodega ‘Viki’ están normalmente

distribuidos. Una muestra al azar de 50 papas da una varianza de 219,63 g2 ¿Será

rechazada la hipótesis de que la varianza poblacional es 309,66 g2 a favor de que sea

menor que 309,66 g2 a un nivel de significancia de 0,01? Asuma que los pesos se

distribuyen normalmente.

5.18 Prueba de Hipótesis para la desviación estándar

Se supone que el peso de cierto tipo de papas está normalmente distribuido con una

varianza poblacional de 309,66 g 2. Una muestra al azar de 50 papas da una desviación estándar de

13.58 g. ¿Será rechazada la hipótesis de que la desviación estándar poblacional es 17,60 g a favor

de que sea menor que 15?60 g? utilice un nivel de significancia de 0,05.


66

5.19 Prueba de Bondad de Ajuste con frecuencias esperadas iguales

¿Las ventas de las papas es la misma cantidad en diferentes días?


Es muy común pensar que los fines de semana son los días donde más se compra
papas, ya que son días que muchos lo denominan “días de recado”. Se selecciona
aleatoriamente una muestra de papas vendidas de la tienda Viki. El número de papas
vendidas se lista en la tabla adjunta. Con un nivel de significancia de 0,05, pruebe la
aseveración de que las ventas aumenten con igual frecuencia en los diferentes días.
Día Dom Lun Mar Mie Jue Vie Sab
N° de 24 15 18 22 22 35 38
ventas

Paso 1: Planteamos la Hipótesis


H0: Las ventas de las papas aumentan con igual frecuencia todos los días de la semana
H1: Las ventas de las papas no aumentan con igual frecuencia todos los días de la
semana
Paso 2: Elegimos el nivel de significancia
α= 0,05 = 5%
Paso 3: Seleccionamos el estadístico de prueba
Elegiremos X2 y graficamos la distribución, diferenciamos Ra y Rr, ubicamos α
67

X 2c = 9,233
Paso 4: Establecemos el criterio de decisión
Se rechazará la H0 si: X2 c > X2 t

Paso 5: Cálculos

X2 c = 17.57
Paso 6: Toma de decisión
Como el X2c cae en la región de rechazo, entonces se rechazará la Hipótesis Nula al
5% de nivel de significancia; es decir las ventas de las papas no aumentan con igual
frecuencia todos los días de la semana

5.20 Prueba de Bondad de Ajuste con frecuencias esperadas desiguales

Las papas deberían de ser de 170 gramos. Usando α = 0.05, ¿diría usted que
los pesos son lo esperado?, si una muestra de 20 papas dio los pesos (en gramos) que
se muestran a continuación:

168 167,5 167,9 168 170 169,1 168 169 167 166
167 168 168,5 169 170 169 168 167 166 169

Paso 1: Planteamos las hipótesis


68

Ho: El patrón actual de ventas no difiere del patrón histórico


H1: El patrón actual de ventas si difiere del patrón histórico
Paso 2: Elegimos el nivel de significancia
α= 0,05 = 5%
Paso 3: Seleccionamos el estadístico de prueba
Elegiremos X2
Además, graficamos la distribución, diferenciamos Ra y Rr, ubicamos α

Paso 4: Establecemos el criterio de decisión


Se rechazará la H0si:
X2c > X2t

Paso 5: Cálculos

Precios N°muertes (fo) pi fe (fo–fe)2/fe


(categorías)
Bajo 15 0,25 12,5 0,5
Intermedio 28 0,50 25,0 0,36
Alto 7 0,25 12,5 2,42
TOTAL 50 1,00 50,0 3,28

Fe= np

fe1=50*0,25=12,5

X2c = 3,28

Paso 6: Toma de decisión


69

Como el X2c cae en la región de aceptación, entonces se acepta la Ho al 5% de nivel


de significancia; el patrón actual de ventas no difiere del patrón histórico.

5.21 Prueba de rachas

Un cliente al escoger las papas al azar, noto que había escogidos entre las papas tipo 1 (representa con

S) y tipo 2 (representa con I). Que debe concluir el cliente acerca la aleatoriedad de las papas

seleccionadas

IIIISSSSSSIIIIISSSIIIIIIIIIISSSS

Solución:

Paso 1: Planteamos las hipótesis

Ho: La secuencia es aleatoria

H1: La secuencia no es aleatoria

Paso 2: Elegimos el nivel de significancia

α= 5% (muestras pequeñas: n1≤ 20 y n2 ≤ 20)

Paso 3: Seleccionamos el estadístico de prueba

Para muestras pequeñas y α= 5%

El estadístico de prueba es el número de rachas G

n1: TIPO 1=== n1= 13

n2: TIPO 2 === n2= 19

Paso 4: Establecemos el criterio de decisión

Se rechazará la aleatoriedad cuando el número de rachas es:

•Menor o igual al valor crítico más chico de la tabla A-10


70

•Mayor o igual al valor crítico más grande de la tabla A-10

Paso 5: Cálculos

Contamos el número de S y el número de C que existen en los datos.

IIIISSSSSSIIIIISSSIIIIIIIIIISSSS

1aracha 2ª racha 3ª racha 4ª racha 5ª racha 6ª racha

En los datos, se presentan 6 rachas ====> G=6.

Hallamos el valor crítico G en tabla A-10. Valor G más pequeño es 10 y el más grande es 23.

Paso 6: Toma de decisión

Como el dato G =6 es menor a el valor crítico G (10), entonces se rechaza la aleatoriedad de los datos

al 5% de nivel de significancia. Esto se interpreta de que los datos no son aleatorios.

5.22 Prueba de signo

Un experimento para demostrar la habilidad de contar las papas de la bodega “Viki”, se realiza

dándole una bolsa de papas al operador y este tiene que contarlas en el menor tiempo posible. El

experimento se repite semanalmente, con los tiempos en segundos que se muestran en la tabla adjunta.

Utilice un nivel de significancia de 0,05 y pruebe la hipótesis de que no hay diferencia entre los

tiempos de la primera y segunda prueba.

Variable A B C D E F G H I J K L M N O
Semana 1 75 70 34 31 31 29 65 71 36 45 80 58 46 32 42
Semana 2 29 35 61 78 30 33 54 38 38 39 71 59 37 61 41
Signo de diferencia

Paso 1: H0 = No existe diferencia

H1 = Hay una diferencia


71

Paso 2: Nivel de significancia: α=5%

Paso 3: Seleccionamos el estadístico de prueba

El estadístico de prueba seleccionado es x (n≤25)

Paso 4: Establecemos el criterio de decisión

Se rechazará la hipótesis nula si: El estadístico de prueba es menor que o igual a el valor crítico.

Paso 5:

Variable A B C D E F G H I J K L M N O

Semana 1 75 70 34 31 31 29 65 71 36 45 80 58 46 32 42

Semana 2 29 35 61 78 30 33 54 38 38 39 71 59 37 61 41

Signo de diferencia + + - - + - + + - + + - + - +

El estadístico de prueba x es el número de veces que ocurre el signo menos

frecuente.

Entonces x = 6

Determinamos el valor crítico en tabla A-7

n = 15 (número total de signos positivos y negativos)

α = 0,05 (en dos colas)

El valor crítico es = 3

Paso 6: Toma de decisión

Con un estadístico de prueba x = 6 y un valor crítico de 3, aceptamos la


72

hipótesis nula de no diferencia. Hay suficiente evidencia para sustentar la aceptación de la aseveración

de que la mediana de las diferencias es igual a 3.

5.23 Prueba de Rangos con signo de Wilcoxon

Un experimento para las mediciones de los pesos de las papas en la bodega “Viki” se realiza el 16 de

julio. El experimento del pesado de las papas se repitió una semana después, con los pesos en gramos

que se muestran en la tabla adjunta. Utilice un nivel de significancia de 5% y pruebe la hipótesis de

que no hay diferencia entre los pesos de la primera y segunda pruebas, utilizando la Prueba de

Wilcoxon.

Solución:

Paso 1: Planteamos las hipótesis

• 𝐻0 : No existe diferencia entre los pesos de la primera y segunda muestra.

• 𝐻1 : 𝐸xiste una diferencia entre los pesos de la primera y segunda muestra.

Paso 2: Elegimos el nivel de significancia

• α =5%=0,05

Paso 3: Seleccionamos el estadístico de prueba

• 𝐸𝑙𝑒𝑔𝑖𝑟𝑒𝑚𝑜𝑠 𝑇 (𝑛 ≤ 30)

• 𝐹ó𝑟𝑚𝑢𝑙𝑎 𝑎 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑟:

Paso 4: Establecemos el criterio de decisión


73

Se rechazará 𝐻0 si:

• El estadístico de prueba es menor que o igual a el (los) valor (es) crítico (s).

• El p-valor ≤ α

Paso 5: Cálculos

La suma de los rangos positivos = 91,5

La suma de los rangos negativos = 13,5

===> El estadístico de prueba T es el menor de ellos

T= 13,5

Hallamos el valor crítico en tabla A-8 para n=14

===> El valor crítico es = 21

Paso 6: Toma de decisión

Como el estadístico de prueba T ≤ criterio de decisión (13,5 ≤ 21), entonces rechazamos la Ho al 5%

de nivel de significancia; es decir Existe una diferencia entre los ´pesos de la primera y segunda

muestra.
74

5.24 Prueba U de Mann-Whitney

La bodega “Viki” contrató a una nueva recepcionista para la atención. La hija del dueño

afirma que existe una diferencia entre las ventas del antiguo recepcionista con la nueva

recepcionista. Para ello se realizó la siguiente prueba: en un total de 6 días ambos se turnarán

al azar 3 días para cada uno. Luego registran la cantidad (kg) de papas vendidas por día.

Aplicando la prueba U de Mann-Whitney ¿Cuál sería la conclusión?

Paso 1: Planteamos las hipótesis

H0 = Existe diferencias en el número de ventas con la nueva recepcionista a comparación del

antiguo recepcionista.

H1 = No existe diferencias en el número de ventas con la nueva recepcionista a comparación

del antiguo recepcionista.

Paso 2: Nivel de significancia:

α=5%

Paso 3: Seleccionamos el estadístico de prueba

El estadístico de prueba seleccionado es x (n≤25)

𝑈 = 𝑛1 ∗ 𝑛2 – 𝑈’

Paso 4: Establecemos el criterio de decisión

Se rechazará la hipótesis nula si:

𝐸𝑙 𝑝 − 𝑣𝑎𝑙𝑜𝑟 ≤ 𝛼

Paso 5: Cálculos
75

Ordenamos los datos de menor a mayor, sin perder de vista a que grupo pertenecen:

2 3 4 5 6 7

AR NR AR NR NR AR

Contamos los puntajes NR que le preceden a los puntajes AR.

2 3 4 5 6 7

AR NR AR NR NR AR

1 2 2

Hallamos el valor de U’ (observado).

2 3 4 5 6 7

AR NR AR NR NR AR
U’= 5
1 2 2

Hallamos el p-valor en la Tabla J.


76

Paso 6: Toma de decisión

Como el p-valor 0,650 es mayor que α=0,05, entonces no hay evidencia para rechazar la hipótesis

nula, entonces la aceptamos al 5% de nivel de significancia; es decir el número de ventas entre ambos

recepcionistas es igual.
77

6 BIBLIOGRAFÍA

• García, J. A., Reding, A., & López, C. (2013). Investigación en Educación Médica.

México D.F: Elsevier México.

• Lopéz, J. F. (15 de Febrero de 2019). Medidas de Dispersión. Obtenido de

Economipedia.com: https://economipedia.com/definiciones/medidas-de-

dispersion.html

• Rus Arias, E. (7 de Enero de 2021). Cuantil. Obtenido de Economipedia.com:

https://economipedia.com/definiciones/cuantil.html

• Salazar Pinto, C., & Del Castillo Galarza, S. (2017). Fundamentos Básicos de la

Estadística. Quito: Sin Editorial.

• Triola, M. F. (2018). Estadística. Ciudad de México: Pearson Educación de México

S.A. DE C.V.

7 ANEXOS
78

Figura 1.- Pesando las papas, una por una.


79

Figura 4.- Uso del programa Aczel


80

Figura 5.- Uso del programa Excel

También podría gustarte