Distribuciones Continuas de Probabilidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 29

DISTRIBUCIONES CONTINUAS

DE PROBABILIDAD

INTEGRANTES:
Rojas Álvarez Fabio Adhemar
Leaños Luis Alejandro
Lara Ortiz José Carlos
Rojas Molina María Alejandra
Saavedra Rodríguez José Miguel
Sejas Claure Sebastián
Loayza Yepez Krisdaniel Hoguer
Pedraza Álvarez Fabian Moisés
Caero Robles Daniel

DOCENTE: Ing. Carreño Heviavaca Flavio


MATERIA: Métodos Estadísticos
SIGLA: MAT-370 “A”
GRUPO DE EXPOSICIÓN: EXCELENGANTES
Índice
1. Introducción ………………………………………………………………………………………..2
2. Función De Probabilidad ………………………………………………………………………….2
3. Propiedad De Una Función De Probabilidad ……………………………………………………2
4. Función De Densidad ……………………………………………………………………..………3
5. Clasificación De Distribuciones ………………………………………………………….……….3
5.1. Distribución Uniforme ………………………………………………………………….…..…4
5.1.1. Grafica De La Función ………………………………………………………………...4
5.1.2. Formulas ………………………………………………………………………………..4
5.1.3. Distribución Uniforme Estándar ………………………………………………………5

5.2. Distribución Normal ……………………………………………………………………...……6


5.2.1. Área Bajo La Curva ……………………………………………………………………6

5.3. Distribución Logística ………………………………………………………..……………….8


5.3.1. Función Logística ………………………………………………………….…………..8
5.3.2. Función De Distribución ………………………………….………………..…….……9
5.3.3. Ecuación Logística ………………………………………………..…….……………11

5.4. Distribución Beta ……………………………………………………………………….……12


5.4.1. Características ……………………………………………………………….……….12

5.5. Distribución Chi – Cuadrado ………………………………………………………………..13


5.5.1. Grados De Libertad ……………………………………………………..………..…..14

5.6. Distribución F De Fisher-Snedecor …………………………………………..……….…..17


5.6.1. Aplicaciones ………………………………………………………………….……….17
5.6.2. Características …………………………………………………………...….……….17
5.6.3. Funciones ………………………………………………………...…………………..17
5.6.4. Uso De Las Tablas ……………………………….………………………………….19

5.7. Distribución T De Student ………………………………………………………………….21


5.7.1. Representación De La Distribución T De Student …………….…………………21
5.7.2. Aplicación De La T De Student …………………………………………………….23

5.8. Distribución Triangular ………………………………………………………..……………25


5.8.1. Representación De La Distribución T De Student ………………….……………25
5.8.2. Aplicación De La T De Student …………………………………………………….26

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 1
1 Introducción

¿QUÉ ES UNA DISTRIBUCIÓN CONTINUA?


Una distribución continua describe las probabilidades de los posibles valores de una variable
aleatoria continua. Una variable aleatoria continua es una variable aleatoria con un conjunto
de valores posibles (conocido como el rango) que es infinito y no se puede contar.
Variable que toma un valor infinito de valores no numerables. Variable aleatoria que puede
tomar cualquier valor dentro de un intervalo dado de valores.
Las distribuciones continuas son en realidad abstracciones matemáticas, ya que suponen la
existencia de cada valor intermedio posible entre dos números. Es decir, una distribución
continua asume que hay un número infinito de valores entre dos puntos de la distribución
1. FUNCION DE PROBABILIDAD
En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de
probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la
probabilidad de que ocurra un determinado número de eventos durante cierto período de
tiempo.
Representan los valores asociados a punto del espacio muestral de un evento a través de una
función de probabilidad. Permiten entender fácilmente la modelación de los eventos.
Estas funciones reciben el nombre de variable aleatoria.
2. PROPIEDAD DE UNA FUNCION DE PROBABILIDAD
1) Cada una de las probabilidades obtenidas en la función es un número real de 0 a 1.
0 ≤ P(x) 1
2) La suma de todas las probabilidades obtenidas en la función es 1.
Σ P(x)=1
3. FUNCION DE DENSIDAD
Una función de densidad de probabilidad se
constituye de modo que el área bajo su curva
limitada por el eje x sea igual a 1 esto
representado gráficamente se da de la
siguiente forma.
Tenemos la función F(x) delimitada por A y B y
toda el área bajo la curva seria nuestra
probabilidad que estamos buscando.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 2
La función de densidad de probabilidad es positiva a lo largo de todo su dominio y su integral
sobre todo el espacio es de valor unitario.
4. CLASIFICACION DE DISTRIBUCIONES
Las distribuciones continuas de probabilidad se clasifican en 8 las cuales son:
• Distribución Uniforme
• Distribución Normal
• Distribución F de Snedecor
• Distribución Logística
• Distribución Beta
• Distribución CHI – Cuadrado
• Distribución T de Student
• Distribución triangular

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 3
4.1. DISTRIBUCIÓN UNIFORME
Esta es análoga a la distribución uniforme discreta, que asignaba a cada resultado del
experimento aleatorio la misma probabilidad, en este caso la variable a considerar es continua.
Una variable aleatoria tiene una distribución uniforme continua si la probabilidad de que tome
un valor, dentro de un intervalo finito [a,b], es la misma para cualquier subintervalo de igual
longitud.
4.1.1. GRAFICA DE LA FUNCIÓN.
La gráfica de esta función, es un rectángulo, por
ello la distribución uniforme continua se conoce
también como distribución rectangular y es la más
simple de las distribuciones continuas.
4.1.2. FORMULAS:
– Función de densidad

– Distribución

Valores:
– Esperanza

– Varianza

– Función generadora de momentos

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 4
4.1.3. DISTRIBUCIÓN UNIFORME ESTÁNDAR
Esta se genera cuando se limitan los valores del intervalo [a.b] a 0 y 1 respectivamente.
– Esperanza

– Varianza

– Función de probabilidad

– Función de densidad

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 5
4.2. DISTRIBUCIÓN NORMAL
Es un modelo matemático que permite
determinar probabilidades de
ocurrencia para distintos valores de la
variable. Así, para determinar la
probabilidad de encontrar un valor de la
variable que sea igual o inferior a un
cierto valor xi, conociendo el promedio y
la varianza de un conjunto de datos, se
debe reemplazar estos valores (media,
varianza y xi) en la fórmula matemática
del modelo.
Esto significa que, si uno toma al azar un número suficientemente grande de casos y construye
un polígono de frecuencias con alguna variable continua, por ejemplo, peso, masa, presión o
temperatura, se obtendrá una curva de características particulares, llamada distribución
normal. Es la base del análisis estadístico, ya que en ella se sustenta casi toda la inferencia
estadística.

4.2.1. ÁREA BAJO LA CURVA:


Cuando en una situación se estudia una variable que se distribuye de manera normal con una
media diferente de cero o una desviación estándar diferente de 1, se debe utilizar la siguiente
fórmula:
𝑥−µ
𝑧=
𝜎

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 6
Tabla de distribución normal. Una cola, probabilidad dentro del intervalo µ + 𝑧𝜎

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 7
4.3. DISTRIBUCIÓN LOGÍSTICA
Reseña histórica
Pierre François Verhulst (1804-1849) describió por primera vez la curva logística en un trabajo,
publicado en 1845, que versaba sobre las investigaciones matemáticas.
La distribución logística es una distribución de probabilidad continua cuya función de
distribución es la función logística, que aparece en el contexto de la regresión logística y
determinados tipos de redes neuronales.
4.3.1. FUNCIÓN LOGÍSTICA
La función logística, curva logística o curva en forma de S es una función matemática que
aparece en diversos modelos de crecimiento de poblaciones se ha comprobado que las curvas
logísticas predicen con bastante precisión las pautas de crecimiento de una población, siendo
el eje tiempo, Y el eje de tamaño poblacional, finalmente aquí se marcará nuestra capacidad
máxima.
• Parámetros DPL.

Escala: La escala se estima a partir de los datos o


se especifica con base en el conocimiento histórico
del proceso gobiernan el crecimiento de la

Ubicación: El parámetro de ubicación determina la


posición de la distribución de los datos a lo largo del eje
X población.

Para obtener la función de distribución es necesario conocer el valor de escala y el valor de


posición, para una variable aleatoria x
• µ= parámetro de posición
• s= parámetro de escala
• ơ= desviación estándar

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 8
La relación que tiene el parámetro de escala con la desviación estándar es la siguiente:

4.3.2. FUNCIÓN DE DISTRIBUCIÓN


La función de distribución para la distribución logística es la siguiente:

Esta función se la puede simplificar mediante la fórmula de Euler

Dándonos al simplificar la siguiente ecuación con tangente hiperbólica:

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 9
La función de distribución se obtiene al derivar la función de densidad que también se puede
expresar con funciones hiperbólicas.

Recordando la relación que tiene (s) el parámetro de escala con la desviación estándar,
reemplazamos el parámetro de escala generando g(x; µ, ơ)

Ejemplo
El crecimiento relativo anual (%) de la población de un determinado país sigue una distribución
logística de parámetro de posición 1 y de escala 2.
Calcular la probabilidad de que el crecimiento en un año determinado sea superior al 5% y
representar la función de densidad.
Datos y ecuaciones:
• X= Crecimiento relativo anual
• µ=1
• s=1

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 10
• Ahora buscamos la probabilidad de que el crecimiento sea mayor al 5%, P(x ≥ 5)
• Dado que la función de distribución nos indica cómo se va acumulando la distribución
hasta cierto valor de x utilizamos la propiedad del complemento para obtener la
probabilidad deseada

4.3.3. ECUACIÓN LOGÍSTICA


La ecuación logística nos sirve mucho para el cálculo de crecimiento poblacional.
El modelo de la ecuación logística es un modelo transformado a partir del modelo de
crecimiento poblacional. Cuando hablamos de una ecuación que mide dicho crecimiento
pasamos por alto el contexto con el que se trabaja, es decir no tenemos en cuenta si el
crecimiento de la población que estamos midiendo tiene un límite o un efecto disminuyente
Este límite puede ser generado por diferentes causas, por ejemplo, digamos que existe una
pequeña población de conejos en una isla, que irá creciendo y creciendo, este crecimiento
puede ser previsto, pero ¿qué pasará cuando la isla ya no dé abasto? ¿Dejarán de
reproducirse los conejos? ¿Se reproducirán de forma paulatina? ¿Cuánto tiempo debe pasar
para que esto suceda?
La ecuación logística y se ha comprobado qque las curvas logísticas predicen con bastante
precisión las pautas de crecimiento de una población, siendo x el eje de tiempo, Y, el eje de
tamaño poblacional, y finalmente aquí se marca nuestra capacidad máxima de carga.
k: población existente; k>0
p(t): población en cada instante
a: valor de la capacidad máxima

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 11
4.4. DISTRIBUCIÓN BETA
En teoría de la probabilidad y en estadística, la distribución beta es una familia
de distribuciones continuas de probabilidad definidas en el intervalo [0,1] parametrizada por
dos parámetros positivos de forma, denotados por α y β , que aparecen como exponentes de
la variable aleatoria y controlan la forma de la distribución.
La distribución beta es posible para una variable aleatoria continua que toma valores en el
intervalo [0,1], lo que hace muy apropiada para modelar proporciones
Se utiliza normalmente para representar variabilidad en un rango fijo. Puede representar
incertidumbre en la probabilidad de que se produzca un evento.
4.4.1. CARACTERÍSTICAS:
• Campo de variación: 0≤x≤1
• Parámetros:
α: parámetro de forma, α>0
β: parámetro de forma, β>0
• Si y solo si la función de densidad de X está representada por la expresión:

• Donde una función beta es definida por:

• La media y la varianza de una distribución beta en la que los parámetros y son:

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 12
4.5. DISTRIBUCIÓN CHI-CUADRADO
Se utiliza para determinar el
comportamiento de cierta variable y
también cuando se quiere saber si dos
o más variables son independientes
estadísticamente.
Estas pruebas forman parte de la teoría
estadística de decisiones, en la cual se
estudia una población y se toman
decisiones acerca de esta, analizando
una o varias muestras extraídas de ella.
Para ello es preciso hacer ciertas suposiciones con respecto a las variables, llamadas
hipótesis, las cuales pueden ser o no ciertas.
Hay algunas pruebas para contrastar estas conjeturas y determinar cuáles son válidas, dentro
de un cierto margen de confianza, entre ellas la prueba chi-cuadrado, que puede aplicarse
para comparar dos y más poblaciones.
Como veremos, suelen plantearse dos tipos de hipótesis acerca de algún parámetro
poblacional en dos muestras: la hipótesis nula, llamada Ho (las muestras son independientes),
y la hipótesis alternativa, denotada como H1, (las muestras están correlacionadas) que es
contraria de aquella.
¿Cuándo se usa la prueba chi-cuadrado?
La prueba chi cuadrado se aplica a variables que describen cualidades, como por ejemplo
sexo, estado civil, grupo sanguíneo, color de ojos y preferencias de diversos tipos.
La prueba está pensada cuando se desea:
– Comprobar si una distribución es apropiada para describir una variable, lo cual se
denomina bondad del ajuste (describe lo bien que se ajusta un conjunto de
observaciones. Las medidas de bondad en general resumen la discrepancia entre los
valores observados y los valores esperados en el modelo de estudio.). Mediante la
prueba de chi cuadrado se puede saber si hay diferencias significativas entre la
distribución teórica seleccionada y la distribución de frecuencias observada.
– Conocer si dos variables X e Y son independientes desde el punto de vista estadístico.
Esto se conoce como prueba de independencia.
Dado que se aplica a variables cualitativas o categóricas, la prueba chi cuadrado se utiliza
ampliamente en ciencias sociales, administración y medicina.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 13
4.5.1. GRADOS DE LIBERTAD
A medida que aumentan los grados de libertad, la distribución chi-cuadrado tiende a la
normalidad, como se aprecia de la figura.
Para una distribución dada, los grados de libertad se determinan a través de la tabla de
contingencia, que es la tabla donde se registran las frecuencias observadas de las variables.
Si una tabla tiene f filas y c columnas, el valor de k es:
k = (f – 1)⋅ (c – 1)
¿Cómo se calcula la estadística chi-cuadrado?
La estadística chi cuadrado se calcula de la siguiente manera:
– La sumatoria se lleva a cabo desde la primera clase i = 1 hasta la última, que es i =k.
Además:
– fo es una frecuencia observada (proviene de los datos obtenidos).
– fe es la frecuencia esperada o teórica (es necesario calcularla a partir de los datos).
Para aceptar o rechazar la hipótesis nula, se calcula χ2 para los datos observados y se
compara con un valor llamado chi cuadrado crítico, el cual depende de los grados de libertad
k y el nivel de significación α:
X2 crítico = X2k, α
Si por ejemplo queremos realizar la prueba con un nivel de significación del 1 %, entonces α =
0.01, si va a ser con 5% entonces α = 0.05 y así sucesivamente. Se define p, el parámetro de
la distribución, como:
p=1–α
Estos valores de chi cuadrado crítico se determinan mediante tablas que contienen el valor del
área acumulada. Por ejemplo, para k = 1, que representa 1 grado de libertad y α = 0.05, que
equivale a p = 1- 0.05 = 0.95, el valor de X2 es 3.841.
Criterio de aceptación de Ho
El criterio para aceptar Ho es:
– Si 𝜒2 < 𝜒2 crítico se acepta Ho, de lo contrario se rechaza.
Ejemplo de cálculo
En la siguiente aplicación se utilizará la prueba chi cuadrado como prueba de independencia.
Supóngase que los investigadores desean conocer si la preferencia por el café negro está
relacionada con el género de la persona, y especificar la respuesta con un nivel de significancia
de α = 0.05.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 14
Para ello se dispone de una muestra de 100 personas entrevistadas y sus respuestas:

Paso 1
Establecer las hipótesis:
– Ho: el género y la preferencia por el café negro son independientes.
– H1: el gusto por el café negro está relacionado con el género de la persona.
Paso 2
Calcular las frecuencias esperadas para la distribución, para lo cual se requieren los totales
añadidos en la última fila y en la columna de la derecha de la tabla. Cada celda en el recuadro
rojo tiene un valor esperado fe, que se calcula multiplicando el total de su fila F por el total de
su columna C, dividido por el total de la muestra N:
fe = (F x C) /N
Los resultados son los siguientes para cada celda:
– C1: (36 x 47) / 100 = 16.92
– C2: (64 x 47) / 100 = 30.08
– C3: (36 x 53) / 100 = 19.08
– C4: (64 x 53) / 100 = 33.92
Paso 3
Seguidamente hay que calcular el estadístico chi cuadrado para esta distribución, de acuerdo
a la fórmula dada:

Paso 4
Determinar χ2crítico, sabiendo que los datos registrados están en f = 2 filas y c = 2 columnas,
por lo tanto, el número de grados de libertad es:
k = (2-1)⋅(2-1) = 1.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 15
Lo cual significa que debemos buscar en la tabla mostrada arriba el valor de χ2k, α = χ21; 0.05
el cual es:
X2 crítico = 3.841
Paso 5
Comparar los valores y decidir:
X2 = 2.9005
χ2crítico = 3.841
Dado que χ2 < χ2crítico se acepta la hipótesis nula y se concluye que la preferencia por el café
negro no está vinculada con el género de la persona, con un nivel de significación de 5%.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 16
4.6. DISTRIBUCIÓN F DE FISHER-SNEDECOR
Nombrada en honor a Sir Ronald Fisher y George Snedecor, esta distribución no tiene utilidad
en aquellos fenómenos que ocurren a nuestro alrededor.
Se usa en la teoría de las probabilidades, en la estadística. Fundamentalmente en el análisis
de la varianza, técnica que permite detectar la existencia o inexistencia de diferencias
significativas entre muestras diferentes.
Definición. - La Distribución F se define como el cociente entre dos variables aleatorias Chi-
Cuadradas independientes, cada una entre sus correspondientes grados de libertad.
2
𝑋𝑛1 /𝑛1
2
𝑋𝑛2 /𝑛2
4.6.1. APLICACIONES:
• Se usa en situaciones de dos muestras para realizar inferencias acerca de las varianzas
de población. También se aplica a muchos otros tipos de problemas en los cuales están
relacionadas las varianzas muestrales. La distribución f se denomina “distribución de
razón de varianzas”.
• Por medio de esta distribución es posible determinar la probabilidad de ocurrencia de
una razón específica con grados de libertad en muestras de tamaño diferentes.
• Es la distribución más importante en experimentación, pues permite hacer cálculos
sobre varianzas diseminadas determinando si las diferencias mostradas son
significativas y, por lo tanto, atribuibles a cambios importantes en el comportamiento de
las poblaciones en estudio.

4.6.2. CARACTERÍSTICAS:
• Comprende 2 parámetros: grados de libertad en el numerador y grados de libertad en
el denominador.
• La Distribución F no puede ser negativa, por lo tanto, su variación es > 0.
• Es siempre asimétrica, pero disminuye cuando aumentan los grados de libertad.
• La curva depende no sólo de los dos parámetros, sino también del orden en el que se
establecen.

4.6.3. FUNCIONES:
• Distribución F:
2 /𝑛
𝑋𝑛1
X2n1 y X2n2 ⟾ 2 /𝑛
1
̴ 𝐹𝑛1 ,𝑛2
𝑋𝑛2 2

Si 𝑠12 y 𝑠22 son varianzas en dos muestras de tamaño 𝑛1 y 𝑛2 extraídas de dos diferentes
poblaciones normales de varianzas σ12 y σ22 (independientes entre si):
𝑠2 /σ2
F = 𝑠12 /σ12 ̴ 𝐹(𝑛1−1),(𝑛2 −1)
2 2

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 17
Y en particular, si (σ12 y σ22 ) son iguales, obtenemos:
𝑠12
̴ 𝐹(𝑛1−1),(𝑛2 −1)
𝑠22

• Esperanza:
𝑛2
E (𝐹𝑛1,𝑛2 ) = Si 𝑛2 > 2
𝑛2 −2

• Varianza:
2𝑛2 ×(𝑛1 +𝑛2 −2)
2
Var (𝐹𝑛1,𝑛2 ) = 𝑛2 ×(𝑛 Si 𝑛2 > 4
1 2 −2)×(𝑛2 −4)

• Función de Densidad:
√(𝑛1 ×𝛼)𝑛1 ×𝑛2 𝑛2
(𝑛1 ×𝛼+𝑛2 )𝑛1 +𝑛2
F (𝛼, 𝑛1 , 𝑛2 ) = 𝑛 𝑛
𝛼×( 1 , 2 )
2 2

Curva de la Distribución F:

Nivel de significancia y percentiles:

NIVEL DE SIGNIFICANCIA
PERCENTILES
(α)
1% = 0.01 1 – 0.01 = 0.99
5% = 0.05 1 – 0.05 = 0.95
10% = 0.10 1 – 0.10 = 0.90
2.5% = 0.025 1 – 0.025 = 0.975

Tablas de Fisher:
Con los percentiles disponibles: (0.99), (0.95), (0.90), (0.975)
Enlace:
https://drive.google.com/file/d/1TFIMYgTFaMmXh8YdhoFkzqPZXkH_mt6/view?usp=sharing

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 18
4.6.4. USO DE LAS TABLAS:
• Valores críticos o cuantiles:
P (𝐹4,8 ≤ x) = 0.9

P (𝐹4,8 ≤ 2,806) = 0.9

Gráfico:

• Valores de probabilidad:
P (𝐹2,3 ≤ 10) =?

P (𝐹2,3 ≤ 10) = 0,95

Aquí necesitamos buscar en cada una de las tablas para hallar el valor y nos qué quedamos
con el más próximo.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 19
Gráfico:

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 20
4.7. DISTRIBUCIÓN T DE STUDENT
Descrita por William S. Gosset en 1908. Publicaba bajo el pseudónimo de “Student” mientras
trabajaba para la cervecería Guinnes en Irlanda. Está diseñada para probar hipótesis en
estudios con muestras pequeñas (menores de 30)
La fórmula general para la T de Student es la siguiente:

𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑠 = 𝑒𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
En donde el numerador representa la diferencia a probar y el denominador la desviación
estándar de la diferencia llamado también Error Estándar. En esta fórmula t representa al valor
estadístico que estamos buscando X barra es el promedio de la variable analizada de la
muestra, y µ es el promedio poblacional de la variable a estudiar. En el denominador tenemos
a s como representativo de la desviación estándar de la muestra y n el tamaño de ésta.
Fórmula de la distribución t de Student: 𝐿~𝑇𝑔
Dada una variable aleatoria continua L, decimos que la frecuencia de sus observaciones puede
aproximarse satisfactoriamente a una distribución t con g grados de libertad tal que:
La variable aleatoria L sigue una distribución t con g grados de libertad.
Grados de libertad: El número de grados de libertad es igual al tamaño de la muestra (número
de observaciones independientes) menos 1.
gl = df = (n – 1)
4.7.1. REPRESENTACIÓN DE LA DISTRIBUCIÓN T DE STUDENT:

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 21
Como podemos ver, la representación de la distribución t se parece mucho a la distribución
normal salvo que la distribución normal tiene las colas más anchas y es más apuntalada. En
otras palabras, deberíamos añadir más grados de libertad a la distribución t para que la
distribución “crezca” y se parezca más a la distribución normal.
Si pudiera expresar en un cierto número de pasos para resolver un problema de t de Student
tendría que declarar los siguientes:
Paso 1) Plantear la hipótesis nula (H0) y la hipótesis alternativa (H1). La hipótesis alternativa
plantea matemáticamente lo que queremos demostrar, en tanto que la hipótesis nula plantea
exactamente lo contrario.
Paso 2) Determinar el nivel de significancia (rango de aceptación de la hipótesis alternativa).
Se considera un nivel alfa de: 0.05 para proyectos de investigación; 0.01 para aseguramiento
de la calidad; y 0.10 para estudios o encuestas de mercadotecnia.
Paso 3) Evidencia muestral, se calcula la media y la desviación estándar a partir de la muestra.
Paso 4) Se aplica la distribución T de Student para calcular la probabilidad de error por medio
de la fórmula general presentada al principio y se contrasta con el valor T obtenido de la tabla
correspondiente.
Paso 5) En base a la
evidencia disponible se
acepta o se rechaza la
hipótesis alternativa. Si la
probabilidad de error (p) es
mayor que el nivel de
significancia se rechaza la
hipótesis alternativa. Si la
probabilidad de error (p) es
menor que el nivel de
significancia se acepta la
hipótesis alternativa.
Por supuesto que al final lo
que tenemos que
contrastar es el valor de T
que hayamos obtenido en
el problema contra el valor
T crítico que obtenemos de
la tabla de T de Student.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 22
Si el resultado del problema cae en la región de H0 se acepta ésta, de lo contrario se rechaza.
Por supuesto, si rechazas H0 aceptarás H1.
En la gráfica precedente se aprecian las regiones de aceptación y de rechazo con respecto a
H0.
Especialidad
Y… ¿Por qué es tan especial la distribución T?
Pues porqué a diferencia de la distribución
normal que depende de la media y la varianza, la
distribución t solo depende de los grados de
libertad. En otras palabras, controlando los
grados de libertad, controlamos la distribución.
4.7.2. APLICACIÓN DE LA T DE STUDENT
La distribución t se utiliza cuando:
– Queremos estimar la media de una población normalmente distribuida a partir de una
muestra pequeña.
– Tamaño de la muestra es inferior a 30 elementos, es decir, n < 30.
– A partir de 30 observaciones, la distribución t se parece mucho a la distribución normal
y, por tanto, utilizaremos la distribución normal.
– No se conoce la desviación típica o estándar de una población y tiene que ser estimada
a partir de las observaciones de la muestra.
EJEMPLO
Una empresa que fabrica los materiales necesitados para la construcción de un puente nos
afirma que el tiempo que tarda en elaborar cada bolsa de cemento es un promedio de 30 horas
laborales, para que ese promedio se mantenga se prueba el tiempo de fabricación de 16 bolsas
cada mes. Si el valor t calculado recae entre t-0.025 y t0.025 podemos quedar satisfechos con su
afirmación.
¿Qué conclusiones tenemos a partir de una muestra que tiene una media de 27?5 horas de
fabricación por bolsa y una desviación estándar de 5 horas?

Sustituyendo los valores en la formula y operando matemáticamente nos resulta que la


estadística de prueba es igual a -2 lo que nos permite graficar nuestro problema y conocer las
áreas de aceptación o rechazo.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 23
Luego comprobamos con la tabla de student para validar o rechazar la hipótesis:
Dado que tenemos 15 grados de libertad por el número de observaciones (n) con la fórmula
que nos dice gl = n-1 y una precisión de 0.025 nuestro valor para validar es 2.131.
Anteriormente el valor de t dio -2, por lo tanto, la hipótesis es correcta.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 24
4.8. DISTRIBUCIÓN TRIANGULAR
El nombre de esta distribución viene dado por la forma
de su función de densidad. Este modelo proporciona
una primera aproximación cuando hay poca
información disponible, de forma que sólo se necesita
conocer el mínimo (valor pesimista), el máximo (valor
optimista) y la moda (valor más probable). Estos tres
valores son los parámetros que caracterizan a la
distribución triangular y se denotan por a, b y c,
respectivamente.
Función de densidad de probabilidad
Un ejemplo del uso de esta distribución se encuentra
en el análisis del riesgo, donde la distribución más
apropiada es la beta pero dada su complejidad, tanto
en la su comprensión como en la estimación de sus
parámetros, se utiliza la distribución triangular como
proxy para la beta.
La función densidad de probabilidad es:

Función de distribución de probabilidad

4.8.1. CARACTERÍSTICAS DE LA DISTRIBUCIÓN


Campo de Variación:
𝑎≤𝑥≤𝑏

Parámetros:

a: mínimo, -∞<a<∞
c: moda, -∞<c<∞ con a≤c≤b
b: máximo, -∞<b<∞ con a<b
0 𝑝𝑎𝑟𝑎 𝑥≤𝑎
(𝑥−𝑎)2
[(𝑏−𝑎)(𝑐−𝑎)]
𝑝𝑎𝑟𝑎 𝑎 ≤ 𝑥 ≤ 𝑐
Función de probabilidad acumulada: (𝑏−𝑥)2
1 − [(𝑏−𝑎)(𝑏−𝑐)] 𝑝𝑎𝑟𝑎 𝑐 < 𝑥 < 𝑏
{ 1 𝑝𝑎𝑟𝑎 𝑏 ≤ 𝑥

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 25
𝑎+𝑏+𝑐
Media: 3

√(𝑏−𝑎)(𝑐−𝑎) 𝑎+𝑏
𝑎+ 𝑝𝑎𝑟𝑎 𝑐 ≥ 2
√2
Mediana: {
√(𝑏−𝑎)(𝑏−𝑐) 𝑎+𝑏
𝑏− 𝑝𝑎𝑟𝑎 𝑐 ≤ 2
√2

𝑎2 +𝑏 2 +𝑐 2 −𝑎𝑏−𝑎𝑐−𝑏𝑐
Varianza: 18

4.8.2. USO DE LA DISTRIBUCIÓN TRIANGULAR


La Distribución Triangular es habitualmente empleada como una descripción subjetiva de una
población para la que sólo se cuenta con una cantidad limitada de datos muéstrales y,
especialmente en casos en que la relación entre variables es conocida pero los datos son
escasos (posiblemente porque es alto el costo de recolectarlos). Está basada en un
conocimiento del mínimo y el máximo y un "pálpito inspirado"1 como el del valor modal. Por
estos motivos, la Distribución Triangular ha sido denominada como la de "falta de precisión" o
de información.
Ejemplo 1: Ventas de restaurantes
Suponga que un restaurante estima que sus ventas totales para la próxima semana serán un
mínimo de $ 10,000, un máximo de $ 30,000 y muy probablemente $ 25,000.

¿Cuál es la probabilidad de que el restaurante genere menos de $ 20 000 en ventas


totales?
De acuerdo con el CDF, podemos usar la siguiente fórmula para encontrar la probabilidad de
que las ventas totales sean menores a $ 20,000:
(𝑥 − 𝑎)2
𝑃(𝑋 < 𝑥) =
[(𝑏 − 𝑎)(𝑐 − 𝑎)]

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 26
A continuación, se explica cómo calcular esta probabilidad en Excel:

La probabilidad de que el restaurante genere menos de $ 20 000 en ventas totales es .33

Ejemplo 2: Número de clientes


Suponga que una tienda estima que la cantidad de clientes que ingresarán en una semana
determinada será un mínimo de 500, un máximo de 2000 y lo más probable es de 1200.

¿Cuál es la probabilidad de que más de 1500 clientes entren a la tienda en una semana
determinada?
De acuerdo con el CDF, podemos usar la siguiente fórmula para encontrar la probabilidad de
que el número total de clientes sea mayor que 1,500:
(𝑏 − 𝑥)2
𝑃(𝑋 > 𝑥) = 1 −
[(𝑏 − 𝑎)(𝑏 − 𝑐)]

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 27
A continuación, se explica cómo calcular esta probabilidad en Excel:

La probabilidad de que más de 1,500 clientes ingresen a la tienda es de 0.208.

Universidad Autónoma Gabriel René Moreno


Facultad de Ciencias Exactas y Tecnología
Ingeniería Civil 28

También podría gustarte