Inv de Los Temas de La Unidad 6

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 28

INSTITUTO TECNOLOGICO SUPERIOR DE

TAMAZUNCHALE

PROBABILIDAD Y ESTADISTICA

NOMBRE DE INTEGRANTES No. Control


ALAN EDUARDO MARTINES MARCOS 22ISC031
ALAN FERNANDO MUNGUIA CONTRERAS 22ISC044
ABRAHAM ITIEL CRUZ HERNANDEZ 22ISC016
RICARDO CESAREO JUAREZ 22ISC046
NOMBRE DE LA ACTIVIDAD:
INVESTIGACION DE LOS TEMAS DE LA UNIDAD 6
AULA: SEMESTRE: TURNO:
E1 2° M
NOMBRE DEL DOCENTE:
ING.SUSANA GONZÁLEZ ZAMUDIO
CARRERA: ING.SISTEMAS COMPUTACIONALES
FECHA:
30/05/23
ESTADÍSTICA APLICADA

Introducción

Se denomina estadística aplicada al área de la estadística que se ocupa de inferir resultados


sobre una población a partir de una o varias muestras. Es la parte de la estadística que se
aplica en cualquier otra rama externa a ella, como la psicología, la medicina, la sociología,
la historia, la biología, la mercadotecnia, etc.

La estadística aplicada se apoya totalmente en la utilización de paquetes estadísticos que


ayudan a resolver problemas de índole estadística, acortando dramáticamente los tiempos
de resolución. Es por esto que los parámetros poblacionales se estiman mediante funciones
denominadas estimadores o estadísticos. La estimación se hace con base en la estimación
estadística y puede ser puntual, por intervalos o de contraste de hipótesis.
6.1 MUESTREO.
Al realizar cualquier investigación social o de mercados, la mayor parte de las veces se
rebasa la capacidad de los investigadores/as para llegar a toda la población o universo de
estudio, por lo que se suele optar por métodos de muestreo que sirvan para acotar ese
universo y así poder realizar la investigación dentro de nuestras posibilidades.

El uso de estos métodos de muestreo, como su propio nombre indica, nos ayuda a obtener
información fiable de la población a partir de una muestra de la que extraer inferencias
estadísticas con un margen de error medido en términos de probabilidades. En otras
palabras, en una investigación por muestreo podremos estudiar el comportamiento y las
opiniones de toda una población analizando únicamente una parte de esta, teniendo en
cuenta que siempre existirá un margen de error a la hora de realizar dichos cálculos.

Definición de muestreo
El muestreo es un proceso o conjunto de métodos para obtener una muestra finita de
una población finita o infinita, con el fin de estimar valores de parámetros o corroborar
hipótesis sobre la forma de una distribución de probabilidades o sobre el valor de un
parámetro de una o más poblaciones.

El muestreo además de ser una ciencia Estadística, es un arte, donde no solo los elementos
se seleccionan al azar con una medida de probabilidad, si no que, además, requiere pericia
por parte de investigador/a en el diseño de la muestra a la hora de determinar:

• La técnica de selección de elementos de investigación.


• La selección de los estimadores apropiados.
• La elección de un tamaño adecuado de la muestra con precisión (margen de error) y
un nivel de confianza aceptable.
• Y el uso de marcos muestrales actualizados.
6.1.1 TIPOS DE MUESTREO.

I. Muestreo aleatorio o probabilístico


Este tipo de muestreo es uno de los más utilizados en las investigaciones. Se comprende
que aquí todos los sujetos o elementos de la población pueden pasar a formar parte de la
muestra, pues tienen la misma probabilidad de ser escogidos.

Dentro de los muestreos probabilísticos podemos encontrar los siguientes tipos:

1. Muestreo aleatorio simple:

En este método de muestreo lo principales es tener una idea clara de cuantos sujetos serán
necesarios para completar el tamaño de la muestra que se va a investigar, pues este consiste
en que a cada sujeto de la población se le debe asignar un número, para que posteriormente
mediante algún sorteo, o generando números aleatorios con ayuda de rifas o algún
ordenador se logre dar a conocer los números de los sujetos seleccionados que serán
tomados como muestra.
2. Muestreo sistemático:

Pues en este método como en el primero, los sujetos que conforman a la población son
enumerados, pero en lugar de dar a conocer los que serán incluidos mediante el azar en
este caso incluyen otra técnica. Posteriormente de que son enumerados, los investigadores
dividen el total de la población que se presenta entre el total de sujetos que requieren para
la muestra.

3. Muestreo estratificado:

Mediante este método de investigación, los investigadores dividen a la población en grupos


o estratos que tengan relación o compartan características similares y posteriormente se
selecciona al azar o aleatoriamente a los sujetos finales de los grupos o estratos formados.
Este método es utilizado para cuando los investigadores pretenden que dentro de la muestra
se encuentren incluidos todos los grupos de interés que puedan representar significancia
para la investigación.

4. Muestreo por Conglomerados:

En este método, la población ya se encuentra dividida en grupos o estratos formados


naturalmente y a partir de estos se toman la cantidad de sujetos que sean necesarios de
cada uno para así formar la muestra. Este es similar al método por estratificación, sin
embargo se facilita más, pues los grupos ya están formados y solo se requieren los datos de
esos elementos que lo integran.

II. Muestreo no aleatorio o no probabilístico


Mediante esta técnica de muestreo, en comparación del muestreo probabilístico las muestras
no se recogen por medio de procesos donde a los sujetos se les brinden las mismas
posibilidades de ser seleccionados.

Dentro de esta técnica existen cuatro tipos de muestreos:

1. Muestreo por cuotas:

Mediante este método los investigadores se encargan de incluir en la muestra solo a un


grupo determinado de sujetos que cumplen con ciertos requisitos o condiciones específicas.
2. Muestreo intencional o de conveniencia:

Mediante este método, el investigador se encarga de elegir de acuerdo a sus propios criterios
o alcances a los sujetos que formaran parte de la muestra.

3. Muestreo por bola de nieve:

En este método se hace contacto con algún sujeto en específico y este se encargara de
buscar a otros sujetos o nuevos participantes consecutivamente. Haciéndolo de esta forma
hasta cumplir con el tamaño de muestra o cantidad de sujetos que se necesitan.

4. Muestreo discrecional:

Mediante este método, se aplica una técnica parecida a la del método intencional, pues el
investigador recluta a los sujetos según sus criterios; pero en este caso, los busca de acuerdo
a lo que piensen que estos sujetos puedan aportar a la investigación.

6.1.3. DISTRIBUCIÓN MUESTRAL DE LA MEDIA.

Si tenemos una muestra aleatoria de una población N(, ), se sabe (Teorema del límite
central) que la fdp de la media muestral es también normal con media  y varianza 2/n. Esto
es exacto para poblaciones normales y aproximado (buena aproximación con n>30) para

poblaciones cualesquiera. Es decir es el error típico, o error estándar de la media.

¿Cómo usamos esto en nuestro problema de estimación?


1º problema: No hay tablas para cualquier normal, sólo para la normal =0 y =1 (la
llamada z); pero haciendo la transformación (llamada tipificación)
una normal de media  y desviación  se transforma en una z.

Llamando z al valor de una


variable normal tipificada que deja
a su derecha un área bajo la curva
de , es decir, que la probabilidad
que la variable sea mayor que ese
valor es (estos son los valores
que ofrece la tabla de la normal)

podremos construir intervalos de la


forma

para los que la probabilidad es 1 - .

Teniendo en cuenta la simetría de la normal y manipulando algebraícamente

que también se puede escribir

o, haciendo énfasis en que es el error estándar de la media,


6.1.4 DISTRIBUCIÓN MUESTRAL DE UNA PROPORCIÓN.

Cuando en una población procedemos a estudiar una característica con sólo dos posibles
valores (éxito/fracaso), entonces la población sigue una distribución binomial. Cada muestra
de la población tiene un porcentaje de individuos que tiene esta característica. p es la
proporción de éxito de esta variable aleatoria de la población. La proporción de fracaso es q
=1–p

Sean todas las muestras de tamaño n de la población. Cada muestra tiene una proporción
de individuos con esa característica.

La distribución asociada a la variable aleatoria que une cada muestra con su proporción se
llama distribución muestral de proporciones.

Como, para poblaciones grandes, la binomial se aproxima a la normal, la distribución


muestral de proporciones también sigue una distribución normal:

si n es suficientemente grande, n ≥ 30, and np ≥ 5, nq ≥ 5

Como generalmente las proporciones de la población son desconocidas, las aproximamos


por las de la muestra.

Ejemplo. Una máquina fabrica piezas de precisión. En su producción habitual fabrica un 3%


de piezas defectuosas. Un cliente recibe una caja de 500 piezas procedentes de la fábrica.

a) ¿Cuál es la probabilidad de que encuentre más del 5% de piezas defectuosas en la caja?

b) ¿Cuál es la probabilidad de que encuentre menos de un 1% de piezas defectuosas?


6.2 ESTIMACIÓN.

Supóngase que se tiene una población en la que se estudia una variable aleatoria X con
distribución conocida y parámetro desconocido (o parámetros desconocidos) y se desea
disminuir el grado de desconocimiento de 0 en f(x;0) , de esta población se extrae una
muestra aleatoria de tamaño :

X1,X2,…..,Xn y se trata de calcular, a partir de los valores muestrales, una función de los
mismos que proporcione un estadístico 0=T (X1,X2,…..,Xn) que le asigne un valor al
parámetro desconocido de la población, de forma que sean lo más cercanos en algún
sentido; a 0 se le llama estimador.
Por ejemplo, una estimación de la media de una determinada característica de una población
de tamaño N podría ser la media de esa misma característica para una muestra de
tamaño n.
La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos
métodos que se usan en función de las características y propósitos del estudio:
• Estimación puntual.
• Método de los momentos.
• Método de la máxima verosimilitud.
• Método de mínimos cuadrados.
• Estimación por intervalos.
• Estimación bayesiana.

6.2.1 ESTIMACIÓN PUNUAL.


El objetivo de la estimación puntual es aproximar el valor del parámetro desconocido (tiempo
medio de ejecución de un algoritmo, altura media de las mujeres de una población, diferencia
del resultado medio entre dos tratamientos médicos, proporción de gente que mejora con un
tratamiento médico…)

Para ello se utiliza la información de la muestra (x1,x2,…,xn), a través de un estimador.

Algunos estimadores frecuentes son:


-Media muestral, para estimar la media teórica de una variable X.
x = x1 + ⋯ + xn
𝑛
-Proporción muestral, para estimar una proporción p:
p = x1 + ⋯ + xn
𝑛
-Varianza muestral: para estimar la varianza teórica de una población, se puede usar la
varianza de una muestra:
S2 = (x1 − ¯x)2 + ⋯ + (xn − ¯x)2
𝑛
y también la llamada
-Cuasi-varianza muestral:
S2n − 1 = (x1 − ¯x)2 + ⋯ + (xn − ¯x)2
𝑛−1

que corresponde a la varianza de la muestra, pero dividiendo por n−1, en lugar de dividir
por n. En el capítulo de estadística descriptiva, ya comentamos que el R, por defecto, al
calcular la desviación típica de una muestra, mediante el comando sd, calcula directamente
la cuasi-varianza y luego obtiene la raiz cuadrada.
La evaluación del estimador sobre la muestra fija da lugar a una estimación puntual.

6.2.2 ESTIMACION POR INTERVALO.

La estimación por intervalos consiste en establecer el intervalo de valores donde es más


probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes
consideraciones:
a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades
de ocurrencia de los estadísticos muestrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.
c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se
establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y
definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se
sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".

Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución
Normal, y resulta:

La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral
son los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se
pueden obtener en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel). Seguidamente generamos una muestra de la
población y obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo alrededor
de la Media muestral, el parámetro poblacional (5.1) está incluido dentro de sus límites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa


razón, la distancia desde m a la Media muestral es la misma que va de la Media muestral a
m. En consecuencia, si hacemos un muestreo con un número grande de muestras
observamos que el 95% de las veces (aproximadamente) el valor de la Media de la
población (m) se encuentra dentro del intervalo definido alrededor de cada uno de los
valores de la Media muestral. El porcentaje de veces que el valor de m se halla dentro
de alguno de los intervalos de confianza es del 95%, y es denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que el % de veces que m se halle
dentro del intervalo sea igual al 99%, la expresión anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral


en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones
informáticas como Excel), y son los valores cuya función de probabilidad es igual a 0.995 y
0.005 respectivamente).

Ejemplo
La siguiente imagen muestra la distribución de las Medias muestrales obtenidas de 100000
muestras aleatorias y los intervalos alrededor de cada una de las Medias obtenidas de diez
de las muestras:

donde ls y le simbolizan los límites superior e inferior del intervalo de confianza al 95%.
Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a 3.7)
incluyen el valor del parámetro dentro sus límites.

6.2.3 INTERVALO DE CONFIANZA PARA UNA MEDIA


l intervalo de confianza para la media es un intervalo que proporciona un rango de valores
admisibles para la media de una población. Es decir, el intervalo de confianza para la media
nos da un valor máximo y un valor mínimo entre los cuales se encuentra el valor de la media
de una población con un margen de error.

Por ejemplo, si el intervalo de confianza del 95% para la media de una población es (6,10),
significa que el 95% de veces la media poblacional estará entre 6 y 10.

Por lo tanto, el intervalo de confianza para la media se usa para estimar dos valores entre
los cuales se encuentra la media de una población. Así pues, el intervalo de confianza para
la media resulta muy útil para aproximar el promedio de una población cuando se
desconocen todos sus valores.

Fórmula del intervalo de confianza para la media

Partiendo de que el proceso de tipificación de una variable se hace de la siguiente manera:

El intervalo de confianza para la media se calcula sumando y restando a la media muestral


el valor de Zα/2 multiplicado por la desviación típica (σ) y dividido por la raíz cuadrada del
tamaño de la muestra (n). Por lo tanto, la fórmula para calcular el intervalo de confianza para
la media es la siguiente:

Para tamaños muestrales grandes y un nivel de confianza del 95% el valor crítico es
Zα/2=1,96 y para un nivel de confianza del 99% el valor crítico es Zα/2=2,576.

La fórmula anterior se utiliza cuando la varianza de la población es conocida. No obstante,


si la varianza de la población es desconocida, que es el caso más frecuente, el intervalo de
confianza para la media se calcula con la siguiente fórmula:

Donde:
• es la media de la muestra.
• es el valor de la distribución t de Student de n-1 grados de libertad con una
probabilidad de α/2.
• es la desviación típica de la muestra.
• es el tamaño de la muestra.

6.2.4 INTERVALO DE CONFIAZA DE CONFIANZA PARA UN


PROPORCION.
La razón para crear un intervalo de confianza para una proporción es capturar nuestra
incertidumbre al estimar una proporción de población.

Por ejemplo, supongamos que queremos estimar la proporción de personas en un


determinado condado que están a favor de una determinada ley. Dado que hay miles de
residentes en el condado, sería demasiado costoso y llevaría mucho tiempo preguntar a
cada residente sobre su postura sobre la ley.

En cambio, podríamos seleccionar una muestra aleatoria simple de residentes y preguntar a


cada uno si apoyan o no la ley:
Dado que seleccionamos una muestra aleatoria de residentes, no hay garantía de que la
proporción de residentes en la muestra que están a favor de la ley coincida exactamente con
la proporción de residentes en todo el condado que están a favor de la ley. Entonces, para
capturar esta incertidumbre, podemos crear un intervalo de confianza que contenga un rango
de valores que probablemente contengan la verdadera proporción de residentes que están
a favor de la ley en todo el condado.

Intervalo de confianza para una proporción: fórmula

Usamos la siguiente fórmula para calcular un intervalo de confianza para una proporción de
población:

Intervalo de confianza = p +/- z * (√ p (1-p) / n )

dónde:

• p: proporción de la muestra
• z: el valor z elegido
• n: tamaño de la muestra
El valor z que utilizará depende del nivel de confianza que elija. La siguiente tabla muestra
el valor z que corresponde a las opciones de nivel de confianza más populares:

Nivel de confianza valor z


0,90 1.645

0,95 1,96

0,99 2,58
Tenga en cuenta que los niveles de confianza más altos corresponden a valores z más
grandes, lo que conduce a intervalos de confianza más amplios. Esto significa que, por
ejemplo, un intervalo de confianza del 95% será más amplio que un intervalo de confianza
del 90% para el mismo conjunto de datos.

6.3 PRUEBA DE HIPOTESIS


Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar una
afirmación acerca de una población dependiendo de la evidencia proporcionada por una
muestra de datos.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis
nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo
general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La
hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero de
acuerdo con la evidencia proporcionada por los datos de la muestra.
Con base en los datos de muestra, la prueba determina si se puede rechazar la hipótesis
nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor que el nivel de
significancia (denotado como α o alfa), entonces puede rechazar la hipótesis nula.
Un error común de percepción es que las pruebas estadísticas de hipótesis están diseñadas
para seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar una prueba de
hipótesis, establecemos la hipótesis nula como lo que queremos desaprobar. Puesto que
establecemos el nivel de significancia para que sea pequeño antes del análisis (por lo
general, un valor de 0.05 funciona adecuadamente), cuando rechazamos la hipótesis nula,
tenemos prueba estadística de que la alternativa es verdadera. En cambio, si no podemos
rechazar la hipótesis nula, no tenemos prueba estadística de que la hipótesis nula sea
verdadera.a.

Se puede describir formalmente los pasos a seguir:

Formular la hipótesis y su alternativa. Normalmente la hipótesis de trabajo (por


ejemplo, tal tratamiento es mejor que el control o tal procedimiento tiene menos
morbilidad) es contrastada con una hipótesis estadística que supone que no existe
tal efecto o tal diferencia. La razón para hacer esto es que se puede calcular de
antemano la distribución de probabilidades asociadas con tal situación. Esta
hipótesis se conoce con el nombre de hipótesis nula que se abrevia como
H0 (Nullus: Nula, falto de valor y fuerza para obligar o tener efecto). La expresión
matemática es H0: 1= 2. La hipótesis alternativa es que el efecto sí existe,
que es distinto de cero, y que en algunos casos se puede especificar el signo de esa
diferencia. Normalmente corresponde a la hipótesis de trabajo, se abrevia como H 1 y
tiene tres alternativas: µ 1≠ µ 2, µ 1< µ 2 o bien µ 1> µ 2.

Elegir la prueba estadística apropiada de acuerdo al diseño experimental, el tipo de


datos y el número de grupos que se comparan. La cifra que resulta de usar la
prueba (aplicar la o las fórmulas) en los datos recolectados se conoce como el
estadístico del test en cuestión: z; estadístico t o de Student, la r de Pearson, F del
análisis de varianza, 2. La distribución del estadístico puede ser calculada de
antemano cuando la H0 es verdadera y por lo tanto conocer los valores que
delimitarán distintas porciones del área bajo la curva de esa distribución; éstas se
conocen como distribuciones de muestreo. Vale la pena decir aquí, y lo reiteraremos
luego, que las pruebas de hipótesis en ningún caso prueban la veracidad de la
hipótesis alternativa o de trabajo, limitándose a decir que no hay suficiente evidencia
para rechazar la hipótesis nula basándose en un nivel preestablecido de
probabilidades.

Elegir el nivel de significación α de la prueba, el límite para rechazar H0. En general,


se acepta α = 0,01 ó 0,05, cifras que implican un 1%, o un 5% respectivamente, de
posibilidades de equivocarse cuando se rechaza H0, de decir que hay una diferencia
cuando en realidad no la hay. Este es el llamado error tipo I.

Calcular el valor de P. Esta es la probabilidad de obtener los resultados observados


u otros más extremos si la H0 es verdadera, cifra que es determinada por el área de
la distribución que queda más allá del valor calculado.

Si p es menor que α, rechazar H0 y aceptar la alternativa; en caso contrario, se


acepta la hipótesis nula. El conjunto de valores que resultarían en el rechazo de
H0 – calculados conociendo la prueba usada, α y el número de observaciones – se
conoce con el nombre de región crítica (Figura 1). Este punto puede refrasearse así:
se rechaza la H0 si el estadístico cae en la región crítica. En los apéndices de los
textos de estadística aparecen tablas con la distribución de estos estadísticos,
dando el valor de p y donde el tamaño de la muestra se considera en los grados de
libertad.

1.
Figura 1 Distribución de un estadístico, en este caso z, y decisión entre la hipótesis nula o
su alternativa. En blanco, área de aceptación y sombreada área crítica de rechazo de la
H0. En A, se destaca el área crítica en un extremo o cola de la distribución correspondiente
a p = 0,05; en B, las áreas se distribuyen por mitades en los dos extremos o colas. Es
aparente que se necesita un valor menor del estadístico para rechazar H0 cuando se trata
sólo de un extremo.

Como se evalúa el estadístico calculando la probabilidad de observar el valor encontrado u


otro más extremo, el valor de P constituye la cola de la distribución. Este concepto es
importante pues permite entender qué significa un test de una cola o de dos colas. Si la
hipótesis de trabajo implica que existe una diferencia, sin especificar la dirección de esa
diferencia ( 1 ≠ µ 2) debe usarse una prueba de dos colas. Si se es capaz de especificar
de antemano el signo de ella (µ 1 < 2 o bien µ 1> µ 2), se puede y se debe usar una
prueba de una cola. El punto es importante pues el área crítica es mayor en este último
caso lo que equivale a decir que se puede rechazar con un valor menor del estadístico.
Como veremos luego, esto equivale a aumentar la potencia de la prueba en cuestió n.

6.3.1 ERRORES TIPO 1 Y 2

Ninguna prueba de hipótesis es 100% cierta. Puesto que la prueba se basa en


probabilidades, siempre existe la posibilidad de llegar a una conclusión incorrecta. Cuando
usted realiza una prueba de hipótesis, puede cometer dos tipos de error: tipo I y tipo II. Los
riesgos de estos dos errores están inversamente relacionados y se determinan según el
nivel de significancia y la potencia de la prueba. Por lo tanto, usted debe determinar qué
error tiene consecuencias más graves para su situación antes de definir los riesgos.
Error de tipo I

Si usted rechaza la hipótesis nula cuando es verdadera, comete un error de tipo I. La


probabilidad de cometer un error de tipo I es α, que es el nivel de significancia que usted
establece para su prueba de hipótesis. Un α de 0.05 indica que usted está dispuesto a
aceptar una probabilidad de 5% de estar equivocado al rechazar la hipótesis nula. Para
reducir este riesgo, debe utilizar un valor menor para α. Sin embargo, usar un valor menor
para alfa significa que usted tendrá menos probabilidad de detectar una diferencia si esta
realmente existe.

Error de tipo II

Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La
probabilidad de cometer un error de tipo II es β, que depende de la potencia de la prueba.
Puede reducir el riesgo de cometer un error de tipo II al asegurarse de que la prueba tenga
suficiente potencia. Para ello, asegúrese de que el tamaño de la muestra sea lo
suficientemente grande como para detectar una diferencia práctica cuando esta realmente
exista.

La probabilidad de rechazar la hipótesis nula cuando es falsa es igual a 1–β. Este valor es
la potencia de la prueba.

Verdad acerca de la población

Decisión basada H0 es verdadera H0 es falsa


en la muestra

No rechazar H0 Decisión correcta (probabilidad = 1 Error tipo II - no rechazar


- α) H0 cuando es falsa (probabilidad
= β)

Rechazar H0 Error tipo I - rechazar H0 cuando Decisión correcta (probabilidad =


es verdadera (probabilidad = α) 1 - β)

6.3.2 PASOS PARA REALIZAR UNA PRUEBA DE HIPOTISIS


puede seguir seis pasos básicos para configurar y realizar correctamente una prueba de
hipótesis. Por ejemplo, el gerente de una fábrica de tuberías desea determinar si el diámetro
promedio de los tubos es diferente de 5 cm. El gerente sigue los pasos básicos para realizar
una prueba de hipótesis.
NOTA
Debe determinar los criterios para la prueba y el tamaño de muestra necesario antes de
recolectar los datos.
Especificar las hipótesis.
⚫ En primer lugar, el gerente formula las hipótesis. La hipótesis nula es: la media de la
población de todos los tubos es igual a 5 cm. Formalmente, esto se escribe como: H0: μ
=5

Luego, el gerente elige entre las siguientes hipótesis alternativas:

Condición que se probará Hipótesis alternativa

La media de la población es menor que el objetivo. unilateral: μ < 5

La media de la población es mayor que el objetivo. unilateral: μ > 5

La media de la población es diferente del objetivo. bilateral: μ ≠ 5

Como tiene que asegurarse de que los tubos no sean más grandes ni más pequeños de
5 cm, el gerente elige la hipótesis alternativa bilateral, que indica que la media de la población
de todos los tubos no es igual a 5 cm. Formalmente, esto se escribe como H1: μ ≠ 5

⚫ Elegir un nivel de significancia (también denominado alfa o α). El gerente selecciona un


nivel de significancia de 0.05, que es el nivel de significancia más utilizado.

⚫ Determinar la potencia y el tamaño de la muestra para la prueba. El gerente utiliza un


cálculo de potencia y tamaño de la muestra para determinar cuántos tubos tiene que
medir para tener una buena probabilidad de detectar una diferencia de 0.1 cm o más con
respecto al diámetro objetivo.

⚫ Recolectar los datos. Recoge una muestra de tubos y mide los diámetros.
Comparar el valor p de la prueba con el nivel de significancia.
Después de realizar la prueba de hipótesis, el gerente obtiene un valor p de 0.004. El valor p
es menor que el nivel de significancia de 0.05.

⚫ Decidir si rechazar o no rechazar la hipótesis nula.


El gerente rechaza la hipótesis nula y concluye que el diámetro medio de todos los tubos no
es igual a 5 cm.

6.3.3 PRUEBA DE HIPOTESIS PARA UNA MEDIA


En vez de estimar el valor de un parámetro, aveces se debe decidir si una afirmación
relativa a un parámetro es verdadera o falsa. Es decir, probar una hipótesis relativa a un
parámetro. Se realiza
una prueba de hipótesis cuando se desea probar una afirmación realizada acerca de un
parámetro o
parámetros de una población.
Una hipótesis es un enunciado acerca delvalor de un parámetro (media, proporción,
etc.).
Prueba de Hipótesis es un procedimiento basado en evidencia muestral (estadístico) y en
la
teoría de probabilidad (distribución muestral del estadístico) para determinar si una
hipótesis es
razonable y no debe rechazarse, o si es irrazonable y debe ser rechazada.
La hipótesis de que el parámetro de la población es igual a un valor determinado se conoce
como
hipótesis nula. Una hipótesis nula es siempre una de status quo o de no diferencia.

En toda prueba de hipótesis se presentan 3 casos


de zonas críticas o llamadas también
zonas de rechazo de la hipótesis nula, estos
casos son los siguientes:
En toda prueba de hipótesis se pueden cometer 2
tipos de errores:
6.3.4 PRUEBA DE HIPOTESIS PARA UNA POBLACION
acional.
Este tipo de prueba, también conocida la Prueba Z para una proporción poblacional, se utiliza
para una variable cualitativa X que representa el estado de algo, por ejemplo, defectuoso y
no defectuoso, vendido o no vendido etc, y de la cual se quiere demostrar una hipótesis con
la proporción de determinada categoría de una variable (El estadístico de prueba está dado
por:

En donde:
n: Tamaño de la muestra
x: Cantidad de elementos de la muestra que cumplen con el criterio deseado
p0: Proporción a probar
Se supone que x tiene distribución binomial (lo que significa que solo puede tener dos
posibles resultados, por ejemplo defectuoso o no defectuoso) y n es un tamaño relativamente
grande.
Las hipótesis son las siguientes:
Prueba de dos colas:
H0: p=p0
H1: p≠p0
Pruebas de una cola
H0: p=p0
H1: p>p0
H0: p=p0
H1: p<p0
Es decir, se quiere verificar si el valor de una cierta proporción poblacional p es igual a p0
Los criterios de rechazo de H0 son los siguientes:
Si es de dos colas se rechaza H0 si |z0|>z(α/2)
Si H1: p>p0 se rechaza H0 si z0>zα
Si H1: p
CONCLUSIONES

La estadística aplicada es una disciplina invaluable que proporciona herramientas y técnicas


para analizar datos, extraer conclusiones significativas y respaldar la toma de decisiones
informadas. A través del análisis de datos, la inferencia estadística y el modelado, la
estadística aplicada permite comprender patrones, identificar tendencias, realizar
predicciones y evaluar la significancia de los resultados. Su aplicación se extiende a una
amplia gama de campos, desde la investigación científica hasta los negocios y las políticas
públicas, brindando una base sólida para el avance del conocimiento y el logro de mejores
resultados en diversas áreas de estudio y sectores de la sociedad. En un mundo impulsado
por los datos, la estadística aplicada se vuelve esencial para obtener información valiosa y
tomar decisiones fundamentadas en un entorno cada vez más complejo y competitivo.
RICARDO CESAREO JUAREZ
La estadística aplicada proporciona un marco sólido para el análisis de datos y la toma de
decisiones fundamentadas. A través del uso de técnicas estadísticas y matemáticas, la
estadística aplicada nos permite comprender y sacar conclusiones significativas a partir de
conjuntos de datos. Al utilizar métodos como el análisis descriptivo, la inferencia estadística
y el modelado, podemos identificar patrones, hacer predicciones y evaluar la fiabilidad de los
resultados. La aplicación de la estadística en diversos campos, desde la investigación
científica hasta los negocios y la planificación de políticas, demuestra su versatilidad y
relevancia en la sociedad actual. En última instancia, la estadística aplicada nos permite
aprovechar al máximo la información disponible, tomar decisiones más informadas y mejorar
la toma de decisiones en una amplia gama de situaciones.
ALAN EDUARDO MARTINEZ MARCO
La estadística aplicada desempeña un papel crucial en la era de la información y los datos.
Permite transformar datos en conocimiento y brinda las herramientas necesarias para
comprender y tomar decisiones basadas en evidencia. A través del análisis estadístico,
podemos descubrir patrones ocultos, identificar tendencias emergentes y realizar
proyecciones futuras. La estadística aplicada se aplica en una amplia gama de campos,
desde la medicina hasta las finanzas y la ciencia ambiental, proporcionando una base sólida
para el descubrimiento científico, el desarrollo empresarial y la formulación de políticas
públicas. En un mundo cada vez más impulsado por los datos, la estadística aplicada se ha
convertido en una herramienta indispensable para tomar decisiones informadas y obtener
una comprensión más profunda del mundo que nos rodea.
ALAN FERNADO MUNGIA CONTRERAS
En resumen, la estadística aplicada es una disciplina esencial que nos permite comprender
y tomar decisiones basadas en datos de manera efectiva. A través del análisis estadístico,
podemos explorar y analizar conjuntos de datos para identificar patrones, tendencias y
relaciones significativas. Esto nos ayuda a comprender mejor los fenómenos complejos que
ocurren en diversas áreas, como la investigación científica, la economía, la salud y muchos
otros campos.La estadística aplicada proporciona herramientas y técnicas para resumir y
describir datos, realizar inferencias sobre poblaciones, realizar pronósticos y tomar
decisiones informadas. Al utilizar métodos estadísticos rigurosos, podemos evaluar la
incertidumbre, medir la confiabilidad de los resultados y evaluar la significancia
estadística.Su aplicación en el mundo real es amplia y diversa, ya que se utiliza en la toma
de decisiones empresariales, la planificación de políticas públicas, la investigación científica
y muchos otros contextos. La estadística aplicada nos ayuda a tomar decisiones más
fundamentadas, a comprender la variabilidad inherente a los datos y a minimizar los errores
en la interpretación.
ABRAHAM ITIEL CRUZ HERNADEZ
Referencias

poisson/GaloSánchez,J.R.(n.d.).ModeloEstadística.Proyectodescartes.org.RetrievedApril3,
2023,fromhttps://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProba
bilidadInferencia/VAdiscreta/4_1DistribucionHipergeometrica/index.htmlPerfil,V.T.mi.(n.d.-

a).ESTADISTICADELAPROBABILIDAD.Blogspot.com.RetrievedApril3,2023,fromhttp://esta
distidicadelaprobabilidadachury.blogspot.com/2016/05/unidad-4-distribuciones-de-
probabilidad.htmlPerfil,V.T.mi.(n.d.-

b).ESTADISTICADELAPROBABILIDAD.Blogspot.com.RetrievedApril3,2023,fromhttp://esta
distidicadelaprobabilidadachury.blogspot.com/2016/05/unidad-4-distribuciones-de-
probabilidad.htmlRodó,P.(2019,November5).DistribucióntdeStudent.Economipedia.https://e
conomipedia.com/definiciones/distribucion-t-de-
student.html(N.d.).Sergas.Es.RetrievedApril3,2023,fromhttps://www.sergas.es/Saude-
publica/Documents/1899/Ayuda_Epidat_4_Distribuciones_de_probabilidad_Octubre2014.p
df

Fanny Zapata(15 de diciembre de 2022)Distribución


F:características.https://www.lifeder.com/distribucion-f/

Dagnino S., J. (2014). INFERENCIA ESTADÍSTICA: PRUEBAS DE HIPÓTESIS. Revista


Chilena de Anestesia, 43(2). https://doi.org/10.25237/revchilanestv43n02.10

Ejemplo de cómo realizar una prueba de hipótesis básica. (s/f). Recuperado el 31 de mayo
de 2023, de https://support.minitab.com/es-mx/minitab/20/help-and-how-
to/statistics/basic-statistics/supporting-topics/basics/example-of-a-hypothesis-test/

Estadística, P. y. (2023, enero 3). Intervalo de confianza para la media. Probabilidad y


Estadística. https://www.probabilidadyestadistica.net/intervalo-de-confianza-para-la-
media/

Ibujes, M. O. S. (2012, mayo 22). Pruebas de hipótesis para medias. Monografias.com.


https://www.monografias.com/trabajos91/prueba-hipotesis-medias-excel-y-
winstats/prueba-hipotesis-medias-excel-y-winstats
Intervalo de confianza para una proporción. (2021, mayo 17). Statologos: El sitio web para
que aprendas estadística en Stata, R y Phyton. https://statologos.com/intervalo-de-
confianza-proporcion/

¿Qué son los errores de tipo I y tipo II? (s/f). Recuperado el 31 de mayo de 2023, de
https://support.minitab.com/es-mx/minitab/20/help-and-how-to/statistics/basic-
statistics/supporting-topics/basics/type-i-and-type-ii-error/

ramonalfonso. (2019, abril 30). Prueba de hipótesis para una proporción poblacional. Hay
una luz que nunca se apaga. https://ramonchung.wordpress.com/2019/04/29/prueba-
de-hipotesis-para-una-proporcion-poblacional

También podría gustarte