0% encontró este documento útil (0 votos)
156 vistas8 páginas

Elementos de Inferencia Estadística Experimentos Con Uno y Dos Tratamientos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1/ 8

Facultad de Ingeniería

ASIGNATURA

Diseño de Experimento

FACILITADORA

Ing. Smirna Agesta Mota

TEMA

ELEMENTOS DE INFERENCIA ESTADÍSTICA EXPERIMENTOS CON


UNO Y DOS TRATAMIENTOS.

POR

Emmanuel Osorio Villegas

MATRICULA

17-EIIN-2-042

FECHA

01 de septiembre del 2020

Desarrollado como resultado de la investigación de la asignatura.


Diseño de Experimentos de la carrera de Ingeniería Industrial.
Introducción
2.1 Población y muestra, parámetros y estadísticos.
Una población o universo es una colección o totalidad de posibles individuos, especímenes,
objetos o medidas de interés sobre los que se hace un estudio. Las poblaciones pueden ser
finitas o infinitas. Si es finita y pequeña se pueden medir todos los individuos para tener un
conocimiento “exacto” de las características (parámetros) de esa población. Por ejemplo, un
parámetro que podría ser de interés es la proporción p de productos defectuosos, o la media,
m, de alguna variable medida a los productos. Si la población es infinita o grande es
imposible e incosteable medir a todos los individuos, en este caso se tendrá que sacar una
muestra representativa de dicha población, y con base en las características medidas en la
muestra (estadísticos) se podrán hacer afirmaciones acerca de los parámetros de la
población.

Con frecuencia, las poblaciones de interés son los materiales, los productos terminados,
partes o componentes, o algunos de los procesos. En muchos casos estas poblaciones se
pueden suponer infinitas o grandes. Por ejemplo, en empresas con producción en masa no
siempre es posible medir cada pieza de material que llega o las propiedades de cada
producto terminado. Incluso, si la producción no es masiva, conviene imaginar al proceso
como una población infinita o muy grande, debido a que el flujo del proceso no se detiene,
es decir, no existe el último artículo producido mientras la empresa siga operando. En estos
casos los procesos (poblaciones) se estudian mediante muestras de artículos extraídas en
algún punto del proceso.

Un asunto importante será lograr que las muestras sean representativas, en el sentido de que
tengan los aspectos clave que se desean analizar en la población. Una forma de lograr esa
representatividad es diseñar de manera adecuada un muestreo aleatorio (azar), donde la
selección no se haga con algún sesgo en una dirección que favorezca la inclusión de ciertos
elementos en particular, sino que todos los elementos de la población tengan las mismas
oportunidades de ser incluidos en la muestra. Existen varios métodos de muestreo aleatorio,
por ejemplo: el simple, el estratificado, el muestreo sistemático y por conglomerados; cada
uno de ellos logra muestras representativas en función de los objetivos del estudio y de
ciertas circunstancias y características particulares de la población (véase Gutiérrez Pulido,
2005).
2.2 Distribución de probabilidad e inferencia.
La distribución de probabilidad o distribución de una variable aleatoria X relaciona el
conjunto de valores posibles de X (rango de X), con la probabilidad asociada a cada uno de
estos valores y los representa a través de una tabla o por medio de una función planteada
como una fórmula. Por ejemplo, sea la variable aleatoria dada por el estadístico media
muestral, X –, entonces al conocer su distribución de probabilidad podremos saber cuáles
son los valores que puede tomar X – y cuáles son más probables. En otras palabras, la
distribución de probabilidad de la media muestral X – señal qué valores se espera que tome
X –, de acuerdo con los supuestos asumidos. De esta forma, la distribución de probabilidad
hace que lo aleatorio no sea un capricho, y modela (describe, acota) los posibles valores de
un estadístico muestral, con lo que al observar una realización específica de un estadístico
se pueden corroborar o rechazar supuestos (prueba de hipótesis), o bien, hacer estimaciones
poblacionales.

Las distribuciones de probabilidad que más se usan en intervalos de confianza y pruebas de


hipótesis son las distribuciones: normal, T de Student, ji-cuadrada y F. En la figura 2.2 se
representan las formas típicas de estas cuatro distribuciones. La distribución normal está
completamente definida por sus parámetros, que son la media, m, y la desviación estándar.

2.3 Estimación puntual y por intervalos.


Las distribuciones de probabilidad que tienen una variable que representa cierta
característica de una población se definen completamente cuando se conocen sus
parámetros, pero cuando éstos no se conocen, será necesario estimarlos con base en los
datos muestrales para hacer inferencias sobre la población. Por ejemplo, los parámetros de
una distribución normal son la media, m, y la desviación estándar, s, que en caso de
desconocerse será necesario stimarlos a partir de los datos en la muestra.

--Hay dos tipos de estimación: puntual y por intervalo.

-Estimación puntual: Un estimador puntual de un parámetro desconocido es un


estadístico que genera un valor numérico simple, que se utiliza para hacer una estimación
del valor del parámetro desconocido.

-- por intervalos: La estimación puntual de un parámetro se genera a través de un estadístico, y como


el valor de éste es aleatorio porque depende de los elementos que fueron seleccionados en la muestra,
entonces la estimación que se hace sobre el parámetro dependerá y variará de una muestra a otra. De esta
forma, cuando se quiere tener mayor certidumbre sobre el verdadero valor del parámetro poblacional,
será necesario obtener la información sobre qué tan precisa es la estimación puntual. Así, la estimación
puntual dirá poco sobre el parámetro cuando la variación entre una estimación y otra es muy grande.
Una forma de saber qué tan variable es el estimador, consiste en calcular la desviación
estándar o error estándar del estadístico, visto como una variable aleatoria. Por ejemplo,
consideremos la desviación estándar S y la media X – de una muestra de tamaño n. Puesto
que X – es una variable aleatoria, ésta tiene su propia desviación o error estándar, que se
puede estimar mediante !ˆ X = S/ n. Una forma operativa de saber qué tan precisa es la
estimación consiste en calcular un intervalo de confianza que indique un rango “donde
puede estar el parámetro”
con cierto nivel de seguridad o confianza. Construir un intervalo al 100(1 – a)% de
confianza para un parámetro desconocido q, consiste en estimar dos números (estadísticos)
L y U, de manera que la probabilidad de que q se encuentre entre ellos sea 1 – a, es decir,
donde L y U forman el intervalo de confianza buscado [L, U]. La correcta interpretación de
un intervalo de confianza es como sigue: si se obtuvieran 100 muestras independientes de la
misma población o proceso, cada una de tamaño n y para cada muestra se calculará el
intervalo de confianza a 95% para el mismo parámetro, entonces se espera que 95 de los
100 intervalos contengan el verdadero valor de dicho parámetro. En la práctica se obtiene
sólo un intervalo y se dice que el intervalo [L, U] tiene una confianza de 100(1 – a)%; esto
tiene una interpretación constante, en el sentido de que el parámetro estará en el intervalo
100(1 – a)% de las veces que apliquemos el procedimiento.

La longitud del intervalo de confianza es una medida de la precisión de la estimación. De


aquí que es deseable que la longitud de los intervalos sea pequeña y con alto nivel de
confianza. El ancho de los intervalos es mayor a medida que sea mayor la varianza de la
población y el nivel de confianza exigido. El ancho del intervalo es menor si se incrementa
el tamaño de la muestra.

2.4 Conceptos básicos de prueba de hipótesis.


Un estudio experimental o una investigación, por lo general tiene como último objetivo,
responder en forma segura ciertas preguntas y/o tomar decisiones. En este contexto, el
experimentador tiene a priori ciertas creencias o hipótesis que desea comprobar. Por
ejemplo:

• Los tres proveedores del material x tienen el mismo nivel de calidad.


• El porcentaje de este ingrediente afecta el resultado de la mezcla.
• El tiempo de espera de esta operación es de tres horas, en promedio.
• Si aumentamos la cantidad de reactivo se elimina el problema.
A continuación, se describen los conceptos básicos de prueba de hipótesis, es decir, los pasos
fundamentales de cualquier procedimiento de prueba de hipótesis, como son: planteamiento de la
hipótesis, estadístico de prueba y criterio de rechazo.

2.5 Planteamiento de una hipótesis estadística.


Una hipótesis estadística es una afirmación sobre los valores de los parámetros de una
población o proceso, que es susceptible de probarse a partir de la información contenida en
una muestra representativa que es obtenida de la población. Por ejemplo, la afirmación
“este proceso produce menos de 8% de defectuosos” se puede plantear estadísticamente, en
términos de la proporción p desconocida de artículos defectuosos que genera el proceso,
como se hace a continuación.

H0 : p = 0.08 (la proporción de defectuosos es 0.08)


(2.4)
HA : p < 0.08 (la proporción es menor a 0.08)

A la expresión H0 : p = 0.08 se le conoce como hipótesis nula y HA : p < 0.08 se le llama


hipótesis alternativa. El nombre de hipótesis nula se deriva del hecho de que comúnmente
se plantea como una igualdad, lo cual facilita el tener una distribución de probabilidad de
referencia específica. En general, la estrategia a seguir para probar una hipótesis es suponer
que la hipótesis nula es verdadera, y que en caso de ser rechazada por la evidencia que
aportan los datos, se estará aceptando la hipótesis alternativa. Así, en el caso de las
proporciones, la afirmación que se desea probar se aceptará como cierta, sólo en caso de
rechazar la hipótesis nula. Supongamos ahora que la afirmación a probar es “este proceso
produce 8% de defectuosos”. Observe que la afirmación señala que su falsedad se da, tanto
si se observan menos de 8% de defectuosos como si se observan más de 8% de defectuosos.
En este sentido, el planteamiento estadístico debe ser:

H0 : p = 0.08 (la proporción de defectuosos es 0.08)


(2.5)
HA : p " 0.08 (la proporción es diferente a 0.08)

Ahora, lo que se desea concluir es la hipótesis nula. Nótese la diferencia entre las hipótesis
alternativas en las expresiones (2.4) y (2.5). En (2.4) HA se conoce como hipótesis
alternativa de un solo lado (unilateral), ya que la única manera de rechazar H0 es teniendo
valores de la proporción muestral p ˆ significativamente más pequeños que 0.08. Asimismo,
en (2.5) HA se llama hipótesis alternativa de dos lados (bilateral), ya que la evidencia en
contra de H0 se obtiene con valores pequeños o grandes de la proporción muestral p ˆ. Así,
la elección de la hipótesis alternativa en cuanto a si debe ser unilateral o bilateral depende
de la afirmación que se quiera probar.

Otro aspecto importante es la selección del valor del parámetro que especifica la hipótesis
nula, esto es, ¿por qué 0.08 en las hipótesis de las expresiones (2.4) y (2.5)? Este valor se
elige de manera que separe dos situaciones que llevan a tomar diferentes acciones. Por
ejemplo, en la hipótesis dada en (2.4) se eligió 0.08, porque ésta es la proporción de
defectuosos reportada el mes anterior, y después de implementar un programa de mejora se
quiere ver si dio el resultado esperado. En caso de no rechazar H0 se concluiría que el
programa no funcionó y que se deben tomar medidas adicionales para bajar la proporción
de defectuosos.
Conclusión

También podría gustarte