Aporte de Inf. Estadistica
Aporte de Inf. Estadistica
Aporte de Inf. Estadistica
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754).
Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación
de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La
distribución de una variable normal está completamente determinada por dos parámetros, su media y su
desviación estándar, denotadas generalmente por 𝜇 y 𝜎.
Fuente: https://commons.wikimedia.org/wiki/File:Normal_distribution_pdf.png
( )
−1 2
1 2 X −μ
f ( x )= e
√ 2 πσ σ
𝑒: Constante matemática con valor aproximado de 2,71828 π = ¿constante matemática con valor
aproximado de 3,14159
𝜇: Media de la población
Muchas variables continuas en el mundo de los negocios tienen distribuciones que se asemejan
estrechamente a la distribución normal.
La distribución normal sirve para acercarse a diversas distribuciones de probabilidad discreta como
la distribución binominal y la distribución de Poisson.
La distribución normal proporciona las bases para la estadística inferencial clásica por su relación
con el teorema de limite central.
La desviación estándar indica que tan agrupados o dispersos están los datos alrededor de la media, debido a
la baja o alta dispersión de los datos.
Cuando la desviación estándar es pequeña la curva de Gauss está concentrada alrededor de la media y es
señal de una baja dispersión de los datos.
Cuando la desviación estándar es muy grande la campana de Gauss se aplana y se va a los extremos esto
debido a que los datos se encuentran más alejados de la media.
𝑁 (𝜇, 𝜎)
𝜇 = 𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝜎 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖o𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
Propiedades o características
Distribución Muestral: Es el conjunto de estadísticos (valores que resultan del análisis del muestreo), que
pueden obtenerse de las diferentes muestras de igual tamaño que conforman una población determinada. Es
una distribución de probabilidades de una estadística muestral calculada a partir de todas las muestras
posibles de tamaño “𝑛” elegidas al azar de una población determinada.
Una distribución muestral es una distribución de probabilidad de una estadística muestral calculada a partir
de todas las muestras posibles de tamaña “𝑛” elegidas al azar de una población determinada. Generalmente
nos interesa conocer una o más de las siguientes características de la distribución muestral.
Propiedades o características:
Distribución de la media.
Distribución de la varianza.
Distribución de la proporción.
Distribución de la diferencia de medias.
Distribución del cociente variancias.
Distribución muestral de medias: cada muestra de tamaño 𝑛 que podemos extraer de una población
proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria
podemos estudiar su distribución que llamaremos distribución muestral de medias.
Llamado Teorema central del límite la distribución muestral de medias se aproxima también a la
normal anterior.
La frecuencia relativa es una medida estadística que se calcula como el cociente de la frecuencia absoluta de
algún valor de la población/muestra (𝑓𝑖) entre el total de valores que componen la población/muestra (𝑁).
Para calcular la frecuencia relativa antes es necesario calcular la frecuencia absoluta. Sin ella no podríamos
obtener la frecuencia relativa. La frecuencia relativa se representa con las letras hi y su fórmula de cálculo
es la siguiente:
fi
hi=
N
f ( y )= 2σ
2
; −∞< y < ∞
σ √ 2 πe e
Observe que la función de densidad normal contiene dos parámetros, 𝜇 𝑦 𝜎. Si Y es una variable aleatoria
normalmente distribuida con parámetros, 𝜇 𝑦 𝜎. Entonces:
𝐸(𝑌) = 𝜇 𝑦 𝑉(𝑌) = 𝜎2
Ejercicio 2
La tabla muestra volumen de ventas en millones de pesos de un total, de 20 vendedores de una empresa:
Rango
𝑹 = 𝑿𝒎á𝒙 − 𝑿𝒎𝒊𝒏
𝑅 = 99.4 − 25.3
𝑅 = 74.1
𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔:
𝑲 = 𝟏 + 𝟑, 𝟑𝟐𝟐 𝐥𝐨𝐠 𝒏
𝐾 = 1 + 3,322 log (20)
𝐾 = 5.32 ≈ 5
𝑨𝒎𝒑𝒍𝒊𝒕𝒖𝒅:
R
Ai=
K
74.1
Ai=
5
Ai=14.82
Calcular la media
x̅
∑ x i∗f i
n
861.68
x=
20
x=43.08
b. calcular la mediana
n+ 1 20+1 21
posicion : = = =10.5
2 2 2
n
−f
2 i−1
M e =Li+ ∗A i
fi
20
−0
2
M e =25.3 ∗14.82
11
10
M e =25,3+ ∗14.82
11
10
M e =25,3+ ∗14.82
11
M e =25,3+13.47
M e =38.77
C. Calcular la desviación estándar
√∑
2
( x i−x ) ∗f i
s=
n−1
s=
√ 4436.57
20−1
s=
√ 4436.57
19
s= √233.50
s=15.28
D. ¿Qué medias de tendencia central se elegirían y de dispersión se elegirían y por qué?
Esta elección depende de la empresa, sin embargo, entre las medidas de tendencia central que se podrían
elegirían como más sería la media aritmética o promedio ya que, esta es un valor representativo de los datos
que se tiene y, además permite que se les otorgue este mismo valor a los demás datos para ubicarlos, en un
En cuanto a las medidas de dispersión la más convenientes serian la varianza, que permite ver la
variabilidad que presentan los datos con respecto a la media, y la desviación típica