1 Estimación de Intervalos de Confianza y Prueba de Hipotesis

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 73

Diseño de Experimentos

Docente: Ivonne Ximena Cerón Salazar, Ph.D.


Overview
• Conceptos básicos
• Estimación de intervalos de confianza
• Teorema de error de la desviación estándar
• Teorema del límite central
• Determinación de intervalos de confianza
• Prueba de hipótesis
• Procedimiento para probar una hipótesis
¿Qué es el diseño de experimentos?
Es una técnica estadística que permite mediante la realización de pruebas
controladas establecer si una o varias variables (factores) influyen sobre una
variable denominada variable de respuesta.

Variables independientes  Factores

Variables dependientes  Variables de respuesta

Facilita la comprensión y el
análisis del efecto de los
factores
Visualización del proceso de diseño de experimentos:
FACTORES CONTROLABLES

Factores o variables Variables


UNIDAD EXPERIMENTAL dependientes o
independientes
variables de
respuesta
Niveles
Ej. diferentes Mediciones
concentraciones FACTORES INCONTROLABLES Ej. Tamaño
Conceptos básicos
• Población:
Un conjunto de elementos acotados em el tiempo que son de interés. Dichos elementos deben tener una característica común y además debe ser
medible.
• Muestra:
Subconjunto de la población representativo.
• Experimento:
Un experimento es un procedimiento mediante el cual se trata de comprobar (confirmar o verificar) una o varias hipótesis relacionadas con un
determinado fenómeno, mediante la manipulación y el estudio de las correlaciones de las variables que presumiblemente son su causa.
En este se consideran todas las variables relevantes que intervienen en el fenómeno, el control de las variables extrañas y la aleatorización de las
restantes. Se persigue un objetivo el cual consiste en excluir explicaciones alternativas en la explicación de los resultados. Este aspecto se conoce
como validez interna del experimento, la cual aumenta cuando el experimento es replicado por otros investigadores y se obtienen los mismos
resultados. Cada repetición del experimento se llama prueba o ensayo.
• Unidad Experimental:
Es la muestra de unidades que es necesario producir en una condición para obtener una medición o dato representativo. Es una unidad a la cual se le
aplica un solo tratamiento (que puede ser una combinación de muchos factores) en una reproducción del experimento.
• Variable respuesta:
Es la característica del producto cuyo valor interesa mejorar mediante el diseño de experimentos. Por ejemplo, en un ensayo se puede probar si un
fármaco nuevo es eficaz para reducir un síntoma determinado de una enfermedad cardiovascular. En este caso, se mide la disminución del síntoma y
esta medición es una variable de respuesta (llamada también variable dependiente). Por el contrario, el nuevo fármaco es la variable independiente, la
cual se prueba para determinar si ha provocado un cambio en la variable dependiente.
• Factores controlables:
Son variables de proceso o características de los materiales experimentales que se pueden fijar en un nivel dado. A los factores controlables
también se les llama variables de entrada, condiciones de proceso, variables de diseño, parámetros del proceso, las x de un proceso factores,
entre ellos están: Producto, precio, plaza o distribución, promoción.
• Factores no controlables:
Son variables que no se pueden controlar durante la operación normal del proceso. Como, por ejemplo: La demanda, el consumidor,
competencia, legislación mercantil, ambiente político, moda.
• Niveles:
Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en observación. Este proceso utiliza diversas
escalas: nominal, ordinal, de intervalo y de razón.
Las variables de las escalas nominal y ordinal se denominan también categóricas, por otra parte, las variables de escala de intervalo o de
razón se denominan variables numéricas. Con los valores de las variables categóricas no tiene sentido o no se puede efectuar operaciones
aritméticas. Con las variables numéricas sí.
• Tratamientos:
Conjunto particular de condiciones experimentales que deben imponerse a una unidad experimental dentro de los confines del diseño
seleccionado.
• Error aleatorio:
Es la variabilidad observada que no se puede explicar por los factores estudiados; y resulta del pequeño efecto de los factores no estudiados
y del error experimental.
• Aleatorización:
Consiste en hacer experimentos en orden aleatorio; este principio aumenta la posibilidad de que el supuesto de independencia de los errores
se cumpla. Asignación al azar de tratamiento a las unidades experimentales. Una suposición frecuente en los modelos estadísticos de diseño
de experimentos en que las observaciones o los errores en ellas están distribuidos independientemente. La aleatorización hace válida esta
suposición.
• Repetición:
Es correr más de una vez un tratamiento o combinación de factores
FACTORES CONTROLABLES
Tipo de fertilización
Riego

Variables Variables
independientes UNIDAD EXPERIMENTAL: dependientes
Proceso de producción
𝑌𝑖 𝑌 𝑖𝑗
Factor 1: 𝜏 𝑖 1. Producción
Temperatura de operación FACTORES INCONTROLABLES 2. Rendimientos
Factor 2: 𝛽 𝑗 Temperatura ambiental
Concentración de ácido (pH) Humedad ambiental

Modelos matemáticos del diseño experimental:


𝑃𝑎𝑟𝑎 𝑢𝑛 𝑓𝑎𝑐𝑡𝑜𝑟 : 𝑌 𝑖 =𝜇+ 𝜏𝑖 + 𝜖
𝑃𝑎𝑟𝑎 𝑑𝑜𝑠 𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠 : 𝑌 𝑖𝑗 =𝜇+ 𝜏𝑖 + 𝛽 𝑗 + ( 𝜏 𝛽 )𝑖𝑗 + 𝜖
Estimación por intervalos de confianza
Población
Obtener una
muestra Muestra

Hacer generalizaciones
sobre la población a
partir de los datos de la
muestra

Inferencia estadística
Población
Muestra

Edad promedio de la muestra


Edad promedio de la
población ??
Inferencia estadística
• El objetivo de las investigaciones estadísticas es hacer inferencias
acerca de la población basadas en la información contenida en las
muestras tomadas aleatoriamente.
• Las poblaciones son “representadas por descripciones numéricas llamadas
parámetros. Ej. Media (µ); desviación estándar (σ)
• La inferencia estadística consiste en hacer inferencia sobre tales parámetros a
partir de estadísticos como los conocidos (, s) calculados a partir de las
observaciones de las muestras
Puntual
Estimación
Por intervalos

Inferencia estadística

Prueba de hipótesis
¿Cuál es la probabilidad de acertar en un punto
específico?

Estimación puntual
¿Cuál es la probabilidad de acertar en una
zona?

Estimación por intervalos


Parámetros y estimadores
• Parámetros (Poblacionales): • Parámetros (Muestrales):
• Media µ • Media
• Varianza σ2 • Varianza s2
• Desviación estándar σ • Desviación estándar s
• Proporción P • Proporción p
• Coeficiente de correlación ρ • Coeficiente de correlación r
• Etc. • Etc.
Error estándar de la media:
Muestra 1

Vida media:
Población 958h Dado que las
muestras se obtienen
al azar, la media en
Muestra 2
cada muestra será
Vida media: distinta debido al azar.
1039h
La desviación
estándar de la media
Muestra 3
es el error estándar
Vida media:
1002h
Inferencia para la media:
• La inferencia para la media aritmética se realiza principalmente mediante
intervalos de confianza y mediante pruebas de hipótesis.

• Al usar una media muestral para estimar el valor de la media poblacional


no se puede esperar que los valores sean iguales.
• Las posibilidades de que el estimador y el parámetro sean diferentes son muy
altas.

• Por eso vamos a emplear intervalos, a los cuales asignaremos una


probabilidad.
Distribución muestral de la media si σ es conocida

• Si se toman muestras aleatorias de n elementos de una población y se


calculan los promedios es de esperar que los valores de las medias no
sean todos iguales
• La diferencias se atribuyen al azar
• A la desviación estándar de las medias muestrales se le conoce como
error estándar de la media
TEOREMA
• Si se extrae una muestra aleatoria de tamaño n de una población que
tiene una media µ y una varianza finita σ2, entonces x es el valor de
una variable aleatoria con µ y desviación estándar σ.

Para muestras tomadas Para muestras tomadas de


de poblaciones infinitas poblaciones finitas de tamaño N


𝝈
𝝈 𝒙= 𝝈 𝑵 −𝒏
√𝒏 𝝈 𝒙=
√𝒏 𝑵 −𝟏
Teorema del límite central
• Si una población tiene media µ y varianza finita σ2, entonces la media
muestral tendrá una distribución normal con media µ y desviación
estándar conforme aumenta el tamaño de la muestra n.

𝒙 −𝝁
𝒛=
𝝈
√𝒏
Es el valor de la variable aleatoria cuya función de distribución se
aproxima a la distribución normal estándar cuando n tiende a infinito.

Al colocar los promedios muestrales en una tabla de frecuencias y hacer el grafico, se ve


que la distribución de las medias es aproximadamente normal, independientemente de
la forma que sea la población, conforme el tamaño de la muestra es mayor.
Estimación para la media
𝐸=|𝑥 − 𝜇|
Cuando se utiliza la media muestral
como estimación de la media
poblacional µ, la probabilidad de
que esta estimación no falle es
como máximo de 1-α

Nivel de confianza: 1-α

Limites de confianza si σ es conocida


𝝈 Cuando n ≥ 30 y σ es conocida
𝒙±𝒁
√𝒏
Ejemplo 1.
• Una máquina de refrescos se ajusta de tal manera que la cantidad despachada tiene desviación
de 15ml. Periódicamente la maquina se revisa tomando una muestra de 40 refresco y calculando
el contenido promedio. La media en la muestra es de 240ml. Calcule los intervalos de confianza
del 95%.
Distribución muestral de la media si σ es desconocida

• Si es la media de una muestra aleatoria de tamaño n extraída de una


población normal que tiene media µ y varianza σ2, entonces:

es el valor de una variable aleatoria con distribución t y


grados de libertad
A medida que la muestra es más grande la
Para usar la distribución t no se requiere distribución t se aproxima a la normal estándar.
conocer σ, pero se debe poder suponer Es decir, σ tiene a 1 cuando n tiende a ∞ y por
razonablemente que la población de lo tanto, gl tienden a ∞.
donde se tomó la muestra es normal
Se considera que la distribución normal
estándar es una buena aproximación a la
distribución t para muestras ≥ 30
• Valores tomados de la tabla t con α=0,01 con una cola son:
• Si n=2, entonces gl=n-1 =1 y 31,82
• Si n=12, entonces gl=n-1 =11 y 2,718
• Si n=22, entonces gl=n-1 =21 y 2,518
• Si n=30, entonces gl=n-1 =29 y 2,462  también Conforme n crece, por
lo tanto gl también
• Valores tomados de la tabla t con α=0,01 con dos colas son: crecen, el valor de t se
• Si n=2, entonces gl=n-1 =1 y 63,66 aproxima al de z
• Si n=12, entonces gl=n-1 =11 y
• Si n=22, entonces gl=n-1 =21 y 2,831
• Si n=30, entonces gl=n-1 =29 y 2,750  también

Limites de confianza si σ es desconocida


𝒔 Cuando n < 30 y σ es desconocida
𝒙±𝒕
√𝒏
Ejemplo 2.
• Se sabe que una muestra de 20 fusibles que fueron sometidos a una sobrecarga del 20% se fundieron en
un tiempo promedio de 10,63 min, con desviación estándar muestral de 2,48 minutos. Determine un
intervalo de confianza del 95% para el promedio verdadero del tiempo de fusión.
Ejemplo 3.
• En una muestra de siete automóviles se prueban las emisiones de óxido de nitrógeno de cada uno
(g/milla) y se obtiene los siguientes resultados:
• 0,06
• 0,11
• 0,16
• 0,15
• 0,14
• 0,08
• 0,15
• Construya el intervalo de confianza del 98% para una cantidad media de emisiones de nitrógeno
para todos los automóviles
Prueba de hipótesis
• Una empresa desea probar si la Vida útil de los bombillos sea de 1000 horas

Al tomar la decisión con base en


datos muestrales se corre el riesgo
de que, por causa del azar, esos
bombillos tengan una vida útil
mayor, o menor que la real (media
poblacional)

La vida media de los bombillos es 1000 horas


Verdadero Falso

El procedimiento para realizar esta evaluación se llama

Prueba de hipótesis
• Hipótesis:
• Es una afirmación o conjetura acerca de un parámetro de
una o mas poblaciones y que esta sujeta a verificación.

• Prueba de hipótesis:
• Es el procedimiento basado en evidencia de la muestra y
la teoría de probabilidades para determinar si la hipótesis
es una afirmación razonable
• Temor de la empresa: Vida media < 1000h
Entonces si se rechaza la hipótesis nula de que:
La vida media de los bombillos es 1000h

• Se estaría tomando por válida la hipótesis alternativa:


La vida media de los bombillos es menor que 1000h

Hipótesis nula: cualquier hipótesis que se desea probar: H0 𝐻 0 : 𝜇=1000

Hipótesis alternativa: es la hipótesis que se acepta cuando 𝐻 1 : 𝜇<1000


la hipótesis nula es rechazada: H1
En la muestra se obtuvo una vida media de 970 horas

¿Se puede concluir que la vida media de los bombillos es menor que
1000h?
Porque esto es así?
Muestra 1

Vida media:
Población 970h Dado que las
muestras se obtienen
al azar, la media en
Muestra 2
cada muestra será
Vida media: distinta debido al azar.
1039h

Debe haber suficiente


Muestra 3
evidencia
Vida media:
1002h
Evidencia suficiente
Error tipo I y Error Tipo II
Que significa estos errores:
Muestra 1
Error tipo I: Consecuencia:
Por causa del azar los bombillos La empresa va a tratar de
Población tienen una vida útil baja y se mejorar un proceso de
rechaza que la vida útil media es producción
de 1000h siendo verdadera esta innecesariamente
970h hipótesis

Muestra 2 Error tipo II:


Consecuencia:
Por causa del azar los
La empresa no va a tratar de
bombillos tienen una vida útil
mejorar un proceso de
muy alta y se acepta que la
producción y van a tener clientes
vida útil media es de 1000h
insatisfechos
siendo falsa esta hipótesis
1039h
A un ingeniero lee en un artículo científico que si aumenta
3°C la temperatura, su producción aumentará el 74% en el
trimestre.
El artículo científico le asegura al ingeniero que la
eficacia de aumentar 3°C en el proceso es tan alto
como el porcentaje de producción nacional.
Si es así, es una gran oportunidad para aumentar su
producción

El ingeniero decide consultar con las empresas


hermanas que han implementado esta condición
de operación en el proceso.
Solo el 60% de revelan que les sirvió.

¿Son estos datos evidencia suficiente para afirmar que su producción aumentará el 74% en
su zona?
¿ o es un porcentaje de error?
Hipótesis:
El 74% de la producción aumenta con aumentar 3°C en el proceso

Hipótesis nula:
La proporción (%) de aumento de la 𝐻 0 : 𝑃=74 %
producción en la zona es igual a 74% al
aplicar la nueva condición de proceso

Hipótesis alternativa:
La proporción (%) de aumento de la 𝐻 1 : 𝑃< 74 %
producción en la zona es menor a 74%
al aplicar la nueva condición de
proceso
Hay que seleccionar un estadístico de prueba
• Es decir, un valor que se emplea para ser contrastado contra
el valor crítico, o sea, un valor determinado por el nivel de
significancia en una distribución de probabilidad apropiada.

• Esto permite establecer una regla para tomar la decisión de


aceptar o rechazar la hipótesis nula.
Pasos para probar una hipótesis
1. Se establece la hipótesis nula y la hipótesis alternativa
2. Se selecciona un nivel de significancia para la prueba
3. Se identifica el estadístico de prueba
4. Se formula una regla para tomar decisiones
5. Se toma una muestra y se llega a una decisión: se acepta o se
rechaza la hipótesis nula
Ejemplo 4.
• Una empresa fabrica focos que tienen una vida útil de 800 horas, con
una desviación estándar de 40 horas.
Al tomar una muestra de 40 focos estos tienen una duración promedio
de 788 horas.
Determine a un nivel de significancia del 5% si la media poblacional de
estos focos es efectivamente 800 horas
• Paso 1. Plantear la hipótesis

• Paso 2. Especificar el nivel de significancia α


• Paso 3. Usar un estadístico de prueba

Con n ≥ 30 y con σ conocida 𝑧𝑐 =


𝑥−𝜇
𝜎
Con n < 30 y con σ conocida √𝑛

𝑥−𝜇
𝑧𝑐 =
Con n ≥ 30 y con σ desconocida 𝑠
√𝑛
𝑥−𝜇
𝑡𝑐 =
Con n < 30 y con σ desconocida 𝑠
√𝑛
• Paso 4. Se especifica un criterio de aceptación o rechazo de la
hipótesis nula según el estadístico de prueba usado en el paso
anterior
Prueba de una cola si:
Prueba de una cola si:
Prueba de dos colas si:
Se puede establecer las siguientes reglas en términos de Z
• Si Se rechaza la H0 y se acepta la H1
• Si Se acepta la H0 y se rechaza la H1
En términos de t seria:
• Si Se rechaza la H0 y se acepta la H1
• Si Se acepta la H0 y se rechaza la H1
• Paso 5. Se acepta o se rechaza la H0 y se toma la decisión.

Se rechaza que µ = 800 y se acepta que H1: µ 800.

Conclusión es que a un nivel de significancia del 5% se rechaza la


hipótesis nula de que la vida media de los focos es de 800 horas y se
considera que existe evidencia estadística para aceptar la hipótesis
alternativa de que la vida útil de los focos es menor de 800 horas
Ejemplo 5. - Prueba de hipótesis en muestras pequeñas

• Una muestra aleatoria de los nabos de arracacha cultivados en la finca


de don Elmer indica que tienen un tamaño de 10, 12, 16, 14, 15, 10,
11 y 13 cm.
En un estudio de calidad poscosecha, se había hecho una estimación
del tamaño promedio y se encontró que era de 10,5cm.

Verifique, a un nivel de significancia del 5% si ese valor se mantiene sin


cambio.
Se concluye que existe evidencia estadística suficiente para afirmar que el tamaño promedio de los nabos de
arracacha es mayor a 10,3cm a un nivel de significancia del 5%
Prueba de hipótesis – diferencia de medias

Muchas veces se debe decidir si


la diferencia entre dos medias
muestrales se puede atribuir al
azar o si en realidad las dos
muestras provienen de
poblaciones con medias Comparar el Comparar dos métodos Comparar dos tipos de
diferentes rendimiento de la ¿Cuál es mas eficiente? solventes
producción de dos
materias primas

Comparar efectividad de un plan


Comparar dos de manejo logístico (antes vs
condiciones después)
socioeconómicas
Se plantea la hipótesis nula como:

La hipótesis alternativa se puede formular como cualquiera de las tres siguientes:


Prueba de una cola si:
Prueba de una cola si:
Prueba de dos colas si:
Siendo una constante determinada con base en muestras aleatorias e independientes de tamaño n1 y n2.
Estadístico de prueba: Se puede establecer las siguientes reglas en términos de Z
• Si Se rechaza la H0 y se acepta la H1
• Si Se acepta la H0 y se rechaza la H1

• En términos de t seria:
Cuando las muestras son • Si
grandes y las varianzas
Se rechaza la H0 y se acepta la H1
poblacionales conocidas. • Si Se acepta la H0 y se rechaza la H1
Cuando las muestras son
pequeñas y se desconocen
las varianzas poblacionales
Ejemplo 6:
Se hizo un estudio sobre el número de productos con imperfectos se obtienen en un
mes de producción de dos empresas. Si 30 operarios de la empresa A promediaron
11,9 productos deficientes con una desviación estándar de 2,1 y 40 operarios de la
empresa B promediaron 8,2 productos deficientes con desviación estándar de 1,8.
Determine a un nivel de significancia del 5%, si la diferencia entre los dos promedios es
de como máximo 3 productos deficientes
Ejemplo 7:
Un ingeniero de producción quiere determinar si hay diferencia significativa entre sus operarios que trabajan en
dos diferentes turnos empacando el producto (500 unidades).
Seleccionó una muestra al azar de 64 operarios del turno 1 y 89 operarios del turno 2. Encontró que los primeros
duraban un promedio de 248 minutos con una desviación estándar de 65min. Los segundos duraban en promedio
195 minutos con una desviación estándar de 48 minutos. ¿Existe diferencia significativa, al 1% de significancia
entre ambas poblaciones?
Ejemplo 8:
• Los datos corresponden a las ventas (en miles de pesos) que
realizaron una muestra de nueve agricultores de una carga de cebolla
en la central de abastos A y una muestra de seis vendedores en otra
central de abastos B del área. Se desea saber a un nivel de
significación del 5% si la diferencia de las ventas promedio de los dos
grupo es significativa.

1 2 3 4 5 6 7 8 9
A 59 68 44 71 63 46 69 54 48
B 50 36 62 52 70 41
Prueba de hipótesis Observaciones pareadas
• Si las poblaciones de donde se toman las muestras no son
independientes, como el caso de los experimentos de “antes” y
“después” y muchas otras situaciones en las que los datos están
naturalmente apareados, se usa la prueba t para la diferencia de los
datos apareados

• La hipótesis nula es
µd promedio poblacional de las diferencias entre las dos poblaciones
: Promedio de la diferencia de las dos muestras
Ejemplo 9.
• En un estudio de afectación de plagas en un cultivo de cacao realizado
mensualmente en 10 fincas donde se implantó un plan de manejo
integrado de plagas, se encontró que el número de frutos perdidos
antes y después del programa fueron los dados en la tabla: ¿Existe
diferencia entre el número de accidentes antes y después del
programa de MIP?
1 2 3 4 5 6 7 8 9 10
Antes 45 73 46 124 33 57 83 34 26 17
Después 36 60 44 118 35 50 77 29 24 18
Ejercicio 10.
• La tabla se muestra las cantidades en ton producidas de 8 empresas
de jugos de naranja antes de recibir una capacitación de buenas
practicas de manufactura y las cantidades producidas luego de la
misma. Pruebe la afirmación al nivel de significancia de 0,05, de que
la capacitación ha sido efectiva
Finca 1 2 3 4 5 6 7 8
Antes 5 8 7 6 9 7 12 8
Después 8 10 7 11 9 12 14 9
Pruebas de hipótesis para la diferencia de
proporciones
• Se trata de comparar dos proporciones
Se plantea la hipótesis nula como:

La hipótesis alternativa se puede formular como cualquiera de las tres siguientes:


Prueba de una cola si: 0
Prueba de una cola si: 0
Prueba de dos colas si: 0
Ejemplo 11.
• De 150 agricultores de Ataco que probaron un nuevo producto
fertilizante, 87 lo calificaron de excelente. De 200 agricultores de
Cajica un una muestra, 123 lo estimaron también de excelente.
Utilizando un nivel de significancia de 0,10 ¿es posible concluir que
hay una diferencia en la proporción de los agricultores de Ataco y
Cajicá que califican al producto como excelente?
Prueba de hipótesis: sobre la media Prueba de hipótesis: diferencia de medias

Cuando las muestras son


grandes y las varianzas
poblacionales conocidas. Cuando las muestras son
pequeñas y se desconocen
𝐻 0 : 𝜇=𝜇 0 las varianzas poblacionales

Prueba de una cola si:


Prueba de una cola si:
Prueba de dos colas si:

Se puede establecer las siguientes reglas en términos de Z


• Si Se rechaza la H0 y se acepta la H1
• Si Se acepta la H0 y se rechaza la H1
En términos de t seria:
• Si Se rechaza la H0 y se acepta la H1
• Si Se acepta la H0 y se rechaza la H1
Prueba de hipótesis Observaciones pareadas Prueba de hipótesis diferencia de proporciones

µd promedio poblacional de las diferencias entre las dos


Prueba de una cola si: 0
poblaciones
: Promedio de la diferencia de las dos muestras Prueba de una cola si: 0
Prueba de dos colas si: 0

Se puede establecer las siguientes reglas en términos de Z


• Si Se rechaza la H0 y se acepta la H1
• Si Se acepta la H0 y se rechaza la H1
En términos de t seria:
• Si Se rechaza la H0 y se acepta la H1
• Si Se acepta la H0 y se rechaza la H1
Infostat -
Infostat - Prueba de hipótesis: sobre la media

1. Planteamiento de la hipótesis, nula


y alternativa
2. Selección de la prueba
En este paso, de acuerdo con las
condiciones del problema, se debe
elegir la prueba que más se ajuste a los
datos del enunciado.
Una vez seleccionada la prueba, se abre
el software Infostat y en la opción de:
Estadísticas, Inferencia basada en una
muestra, escogemos prueba t para una
muestra N<30:
Unilateral a la derecha:
Unilateral a la izquierda:
Bilateral:
4. Decisión
Se comparamos el valor P de la prueba con el nivel de significancia: por ejemplo, para este caso P= 0,0141 y el
nivel de significancia lo que indica que el valor P es mayor que el nivel de significancia, por lo cual Ho se
acepta.
3. Valor p de la prueba de hipótesis
El valor P es la probabilidad de observar un
valor muestral tan extremo o mas que el valor
observado, si la hipótesis nula es verdadera.
• La determinación del valor p no solo da
como resultado una decisión respecto de
H0, sino que brinda la oportunidad de
observar la fuerza de la decisión. Si el valor p es menor que el nivel de significancia, H0 se rechaza.
• Un valor p muy pequeño, indica que existe
Si el valor p es mayor que el nivel de significancia, H0 se acepta
poca probabilidad de que H0 sea
verdadera.
• Por otra parte, un valor p grande, significa
que H0 no se rechaza y que existe poca
probabilidad de que sea falsa.
Ejemplo 12
En un investigación se probo el efecto de dos abonos A y B sobre el crecimiento de
las plantas de café. El estudio se realizó en un invernadero, usando 14 macetas bajo
condiciones experimentales muy homogéneas en cuanto a luz, tipo de suelo,
semillas, etc. Se escogieron al azar 7 macetas y se les aplicó el abono A y a las otras
7 el abono B (dos plantas abonadas con B se perdieron)
Los resultados del crecimiento experimentado, en centímetros fueron:
A: 5, 6, 5, 7, 4, 8, 7
B: 7, 7, 10, 9, 11
Se desea saber si los abonos tienen o no el mismo efecto de crecimiento sobre las
plantas de café a un nivel de significancia de 0,02.
Infostat - Prueba de hipótesis: diferencia de medias

1. Planteamiento de la hipótesis, nula


y alternativa
2. Selección de la prueba
En este paso, de acuerdo con las
condiciones del problema, se debe
elegir la prueba que más se ajuste a los
datos del enunciado.
Una vez seleccionada la prueba, se abre
el software Infostat y en la opción de:
Estadísticas, Inferencia basada en una
muestra, escogemos prueba t para una
muestra N<30:
Variables dependientes o
de respuesta
Se debe seleccionar el
tipo de prueba de
acuerdo a lo planteado
en la hipótesis

El nivel de significancia

Unilateral a la derecha:
Unilateral a la izquierda:
Bilateral:
Si el valor p es menor que el nivel de significancia, H0 se rechaza.

Si el valor p es mayor que el nivel de significancia, H0 se acepta

Como el p-value es menor que 0,02 cae en la región de rechazo, se concluye que hay evidencia
suficiente para rechazar la hipótesis nula
Ejemplo 13
La longitud media de altura de la planta de achira, es de
aproximadamente 40 cm. El ingeniero agrónomo le pide al
estudiante de pasantía medir las alturas de las plantas de achira del
lote de don Cristobal. Los datos obtenidos por el estudiante son:

¿Puede el ingeniero con un nivel de significancia del 1% encontrar


diferencia entre la medida de la altura de las plantas del lote de
don Cristobal con el con el promedio estándar?

También podría gustarte