0% encontró este documento útil (0 votos)
234 vistas13 páginas

Comparacion de Dos Medias de Tratamiento y Diseño de Comparaciones Pareadas

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 13

UNIVERSIDAD DE ORIENTE

VICERECTORADO ACADÉMICO

COORDINACIÓN DE POSTGRADO

MAESTRÍA EN INGENIERÍA DE GAS

MATURÍN/MONAGAS/VENEZUELA

COMPARACIÓN DE DOS MEDIAS DE TRATAMIENTO Y DISEÑO DE


COMPARACIONES PAREADAS

Facilitador: Maestrantes:

M. Sc. Carlos de la Cruz. Ing. José Cedeño

Ing. Darwin Lobo

Marzo, 2021
ÍNDICE

INTRODUCCIÓN ......................................................................................................................... 3
COMPARACIÓN DE DOS MEDIAS DE TRATAMIENTO ......................................................... 4
COMPARACIÓN DE DOS MEDIAS MUÉSTRALES, MUESTRAS INDEPENDIENTES Y
VARIANZAS IGUALES ........................................................................................................... 5
DISEÑO DE COMPARACIONES PAREADAS ........................................................................... 6
EJEMPLOS ...................................................................................................................................... 8
BIBLIOGRAFÍA ......................................................................................................................... 12
ANEXO ....................................................................................................................................... 13

2
INTRODUCCIÓN

Cotidianamente se presentan situaciones en las cuales debemos comparar dos


muestras, ya sea en nuestro ambiente laboral o en cualquier objetivo que nos propongamos,
con el fin de determinar, si podrían existir diferencias o no entre dos poblaciones o
muestras de datos.

Para ser objetivo utilizamos un estadístico de prueba, el cual nos permitirá calcular un
valor calculado y compararlo con un valor teórico, evaluando el comportamiento de ambos
y estableciendo una hipótesis nula o afirmación para determinar si esta se cumple, para ello
necesitamos tener claro un nivel de significancia, generalmente es 5% o 1%.

3
COMPARACIÓN DE DOS MEDIAS DE TRATAMIENTO

Para comparar dos medias de tratamientos debemos tener dos poblaciones cada una
con su media poblacional, se debe extraer una muestra aleatoria de cada población para
probar la hipótesis de que las medias poblacionales están separadas por una cantidad
específica, la cual generalmente es tomada como cero, es decir, que no existe diferencia
entre las dos medias poblacionales o muéstrales, si se da el caso.

Para realizar la comparación de dos medias muéstrales, teniendo en cuenta que son
muestras poblacionales con datos menores que 30, se utiliza el estadístico de prueba “t de
Student”

Ȳ₁ − Ȳ₂
𝑡=
𝑆ӯ₁₋ӯ₂

Dónde;

 Ȳ1: Promedio de la muestra 1


 Ȳ2: Promedio de la muestra 2
 Sӯ₁₋ӯ₂: Desviación estándar entre dos medias aleatorias

“Obsérvese que t se mide la distancia de una variable aleatoria o una media


hipotética en unidades de desviación estándar de la variable aleatoria. Cuando las
distribuciones subyacentes son normales con una varianza común, este estadígrafo se
distribuye como la t Student”
(Steel y Torrie.Bioestadistica 2da edición, 1985).

El cálculo Sӯ₁₋ӯ₂, depende de si:

1. Las dos poblaciones tienen una varianza común “σ²”.


2. Los valores de las σ², o de la σ² común, se estiman o se conocen.
3. Las dos muestras son del mismo tamaño
4. Las observaciones son pareadas.
La elección de una región de rechazo depende de:

1. Nivel de significancia escogida.


2. Tamaño de la muestra.
3. La prueba necesaria, es decir, si es de una cola o de dos colas.
4
COMPARACIÓN DE DOS MEDIAS MUÉSTRALES, MUESTRAS
INDEPENDIENTES Y VARIANZAS IGUALES

Para realizar la comparación de dos medias muéstrales, de muestras independientes


con varianzas iguales, teniendo en cuenta que son muestras poblacionales con datos
menores que 30, se utiliza el estadístico de prueba “t de Student”

Con cada una de estas muestras aleatorias, se desea probar una hipótesis nula la cual
generalmente es la siguiente: H0=Ȳ1-Ȳ2, suponiendo que las poblaciones se distribuyen
normalmente y tienen una varianza común pero desconocida.

El criterio de prueba es el siguiente:

(Ȳ₁ − µ₁) − (Ȳ₂ − µ₂) (𝑌̅₁ − 𝑌̅ ₂) − (µ₁ − µ₂)


𝑡= =
𝑆ӯ₁₋ӯ₂ 𝑆ӯ₁₋ӯ₂

Donde;

 µ₁: Promedio de la población 1


 µ₂: Promedio de la población 2
 Ȳ₁: Promedio de la muestra 1
 Ȳ₂: Promedio de la muestra 2
 Sӯ₁₋ӯ₂: Desviación estándar entre dos medias aleatorias

“El criterio de la prueba, Sӯ₁₋ӯ₂es un estimado de σӯ₁-ӯ₂, sujeto a la variación de


muestreo. Primero estimamos σ2 mediante la combinación de la suma de cuadrados de las
dos muestras y dividimos por los grados de libertad combinados”
(Steel y Torrie. Bioestadistica 2da edición, 1985).

(𝑛₁ − 1)𝑆₁2 + (𝑛₂ − 1)𝑆₂²


𝑆ӯ₁₋ӯ₂2 =
(𝑛₁ − 1) + (𝑛₂ − 1)

Dónde:

 n₁: número de datos de la muestra 1


 n₂: número de datos de la muestra 2
 S₁²: varianza de a muestra 1
 S₂²: varianza de la muestra 2

5
Este es un promedio ponderado de las varianzas muéstrales y es superior al
promedio aritmético, el cual da igual ponderación a las varianzas muéstrales. El
promedio ponderado y el promedio aritmético coinciden cuando las muestras tienen
igual tamaño. (Steel y Torrie. Bioestadistica 2da edición, 1985)

Dependiendo del número de datos presentes en la muestra, se pueden dar dos


casos para determinar Sӯ₁-ӯ₂:

Caso 1: Cuando la cantidad de datos de la muestra 1 es diferente a la cantidad de


datosde la muestra 2 (n₁≠n₂)

1 1
𝑆ӯ₁₋ӯ₂ = √𝑆² ( + )
𝑛₁ 𝑛₂

Caso 2: Cuando la cantidad de datos de la muestra 1 es igual a la cantidad de datos de la


muestra 2 (n₁=n₂=n)

2𝑆²
𝑆ӯ₁₋ӯ₂ = √
𝑛

DISEÑO DE COMPARACIONES PAREADAS

Las observaciones se parean a menudo. Cuando nos referimos a esto es debido a que
se desea comparar una población o muestra con tratamientos diferentes o un antes y un
después de una media de una muestra al aplicar un tratamiento.

“El pareamiento se hace antes de comenzar el experimento con base en


respuestas similares cuando no hay efectos de tratamiento”
(Steel y Torrie. Bioestadistica 2da edición, 1985)

Si los miembros de cada par tienden a ser grandes o pequeños conjuntamente,


entonces puede aumentar la capacidad del experimento para detectar una pequeña
diferencia. La información sobre el pareamiento se usa para eliminar una fuente de varianza
6
extraña que es la que existe de un par a otro. Esto se hace calculando la varianza de las
diferencias en vez de la de los individuos dentro de cada muestra. El número de grados de
libertad en que se basa a estimación de la varianza de las diferencias (S d²) es el número de
pares menos 1 (Steel y Torrie. Bioestadistica 2da edición, 1985)

“Si se va a incrementar la capacidad de un experimento para detectar una


diferencia real, entonces la varianza de diferencias debe ser lo suficiente menor que la
varianza de los individuos (Sd²<2S²), para compensar a perdida de los grados de libertad
debido al pareamiento; para el pareamiento aleatorio (Sd=2S²)”
(Steel y Torrie. Bioestadistica 2da edición, 1985)

Se usa el estadístico de prueba t Student

Ȳ − µ˳
𝑡=
𝑆⁄
√𝑛

Dónde:

 Ȳ: media muestral
 µ˳: valor que se desea probar de la H˳
 S:Desviacion típica de la muestra
 n:número de pares de la diferencia (nd)

H˳:µ=µ˳

đ − µ₀
𝑡=
𝑆𝑑⁄
√𝑛𝑑
Calculando S de la siguiente manera:

𝑛( 2−
[∑𝑛𝑖(Ȳ₁ᵢ − Ȳ₂ᵢ)]²⁄
∑ Ȳ₁ᵢ − Ȳ₂ᵢ ) 𝑛
𝑆=√ 𝑖
𝑛−1

Sustituyendo D por Ȳ:

𝑛 [∑𝑛𝑖=1 𝐷ᵢ]²
√∑𝑖=1 𝐷²ᵢ − ⁄
𝑆𝑑 = 7 𝑛𝑑
𝑛𝑑 − 1
Dónde:

 nd-1: grados de libertad.


 nd: número de diferencias muéstrales pares.

EJEMPLOS

 Ejemplo N°1

*Para muestras pequeñas.

El ingeniero de producción a cargo del pozo PDV-100, el cual es productor de gas


natural reporta diariamente la cantidad de MPCN de gas extraído, de igual manera el
ingeniero a cargo del pozo PDV-101 reporta diariamente la cantidad de MPCN de gas
extraído. Si ambos pozos pertenecen al mismo yacimiento; el ingeniero supervisor desea
probar estadísticamente que la producción de estos dos pozos es igual, usando un nivel de
significancia del 5%.

Día 1 Día 2 Día 3 Día 4 Día 5 Día 6 Día 7 Día 8

PDV-100 4,3 5,0 4,1 5,2 4,7 4,0 4,9 4,3

PDV-101 5,2 4,8 5,3 3,8 4,5 4,1 5,1 4,9

H₀ : (µPDV-100) = (µPDV-101) (µPDV-100) - (µPDV-101) = 0

H₁ : (µPDV-100) ≠ (µPDV-101)
(𝑌̅₁ − 𝑌̅₂) − (µ₁ − µ₂)
𝑡= Ecu. 2
𝑆ӯ₁₋ӯ₂

8
(𝑛₁ − 1)𝑆₁2 + (𝑛₂ − 1)𝑆₂² Ecu. 3
𝑆ӯ₁₋ӯ₂2 =
(𝑛₁ − 1) + (𝑛₂ − 1)

𝑛 [∑𝑛𝑖=1 Ȳᵢ]²⁄
∑ Ȳ²ᵢ − 𝑛
𝑆 = √ 𝑖=1
𝑛−1

gl=𝑛₁+𝑛₂-2

Procedemos a determinar las medias de cada muestra y su desviación estándar:

Ȳpdv-100 = 4,5625

Ȳpdv-101 = 4,7125

1332,25
176,93 − ( )
𝑆𝑝𝑑𝑣 − 100 = √ 8
= 0,4070
8−1

1421,24
179,69 − ( )
𝑆𝑝𝑑𝑣 − 101 = √ 8
= 0,5383
8−1

(8 − 1)0,44702 + (8 − 1)0,5383²
𝑆(ӯ(𝑝𝑑𝑣 − 100) − ӯ(𝑝𝑑𝑣 − 101)) =
(8 − 1) + (8 − 1)

𝑆(ӯ(𝑝𝑑𝑣 − 100) − ӯ(𝑝𝑑𝑣 − 101)) = −0,2448

Procedemos a determinar el estadístico t Student con; Ecu. 2:

(4,5625 − 4,7125) − (0)


𝑡= = −0,6127
0,2448

Luego calculamos los grados de libertad y t Student tabulado con un nivel de


significancia del 5%:
gl
gl=8 + 8 − 2 = 14

α=0,05

t= 2,14

-2,14 -0,6127 0
2,14 t
9
 Ejemplo N°2

*Para muestras pequeñas pareadas.

El ingeniero (A) de producción a cargo del pozo PDV-01, el cual es productor de


gas natural reporta diariamente la cantidad de MPCN de gas extraído, sin embargo en la
planta de tratamiento el ingeniero (B) a cargo, no está de acuerdo con la cantidad de MPCN
de gas reportada que debería recibir del pozo PDV-01 para su tratamiento. Determinar
estadísticamente que la cantidad total de gas extraído llega a la planta de tratamiento, con
un nivel de significancia de 5%.

Día 1 Día 2 Día 3 Día 4 Día 5 Día 6 Día 7 Día 8 Día 9

PDV-01 (A) 3,2 3,4 3,1 3,1 3,3 3,5 3,4 3,2 3,3

PDV-01 (B) 3,0 3,3 3,0 2,8 3,0 3,1 3,1 2,8 2,8

Día 1 Día 2 Día 3 Día 4 Día 5 Día 6 Día 7 Día 8 Día 9

PDV-01 (A) 3,2 3,4 3,1 3,1 3,3 3,5 3,4 3,2 3,3

PDV-01 (B) 3,0 3,3 3,0 2,8 3,0 3,1 3,1 2,8 2,8

Diferencia: 0,2 0,1 0,1 0,3 0,3 0,4 0,3 0,4 0,5

H₀ : µᵃ=µᵇ µᵃ-µᵇ=0

H₁ : µᵃ>µᵇ đ−µ₀
𝑡 = 𝑆𝑑 Ecu. 7

α=0,05 √𝑛𝑑

𝑛 [∑𝑛
𝑖=1 𝐷ᵢ ]²⁄
∑ 𝐷²ᵢ−
𝑆𝑑 = √ 𝑖=1 𝑛𝑑−1 𝑛𝑑
Ecu. 8

10
6,76
0,9 − ( )
𝑆𝑑 = √ 9
= 0,1364
8

0,9 − 0
𝑡= = 6,3541
0,1368

√9

Usando un nivel de significancia de 5%, procedemos a ubicar el t Student tabulado,


para una gráfica con una cola, debido a lo planteado en la H₁ .

gl= np-1 = 9-1 = 8


α=0,05 gl

t=1,86

1,86 6,3541

11
BIBLIOGRAFÍA

Leandro, Gabriel, consutado 21 de Febrero de 2021, hora 18:11. Disponible en:


https://www.youtube.com/watch?v=3hYY8AQpIvo&list=PL2GGpMHLRtp98
8pjm_IIbJ2-ScIKinxny&index=58

Romero, Ana, consultado 22 de Febrero de 2021, Hora: 15:46. Disponible en:


https://es.slideshare.net/AnaRomero3/estadisticatabla-tstudent

Steel y Torrie, 1985, BIOESTADISTICA: PRINCIPIOS Y PROCEDIMIENTOS,


Bogota, Colombia

Tío Estadístico, consultado 03 de Marzo de 2021, hora: 15:34. Disponible en:


https://www.youtube.com/watch?v=3uZ7M97JRO8

Tío Estadístico, consultado 03 de Marzo de 2021, hora: 18:48. Disponible


en:https://www.youtube.com/watch?v=e8WZbDReQm8

Valera, Atanael, consultado 23 de Febrero de 2021, hora: 16:38. Disponible


en:https://www.youtube.com/watch?v=4J0sA7WOdQM

Walpole, Myers, Myers, Sexta edición, Probabilidad y Estadístico para Ingenieros,


Venezuela.

12
ANEXO

13

También podría gustarte