Aporte de Inf. Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

Distribución normal.

La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754).
Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación
de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La
distribución de una variable normal está completamente determinada por dos parámetros, su media y su
desviación estándar, denotadas generalmente por 𝜇 y 𝜎.

Figura 1. Campana de Gauss

Fuente: https://commons.wikimedia.org/wiki/File:Normal_distribution_pdf.png

Formula de distribución normal

( )
−1 2
1 2 X −μ
f ( x )= e
√ 2 πσ σ

𝑒: Constante matemática con valor aproximado de 2,71828 π = ¿constante matemática con valor
aproximado de 3,14159
𝜇: Media de la población

𝜎: Desviación estándar de la población.

La distribución normal es de vital importancia en estadística por tres razones fundamentales:

 Muchas variables continuas en el mundo de los negocios tienen distribuciones que se asemejan
estrechamente a la distribución normal.
 La distribución normal sirve para acercarse a diversas distribuciones de probabilidad discreta como
la distribución binominal y la distribución de Poisson.
 La distribución normal proporciona las bases para la estadística inferencial clásica por su relación
con el teorema de limite central.

La desviación estándar indica que tan agrupados o dispersos están los datos alrededor de la media, debido a
la baja o alta dispersión de los datos.

Cuando la desviación estándar es pequeña la curva de Gauss está concentrada alrededor de la media y es
señal de una baja dispersión de los datos.

Cuando la desviación estándar es muy grande la campana de Gauss se aplana y se va a los extremos esto
debido a que los datos se encuentran más alejados de la media.
𝑁 (𝜇, 𝜎)
𝜇 = 𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

𝜎 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖o𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟

Propiedades o características

 La forma de la campana de Gauss depende de los parámetros de media 𝜇 y de la deviación estándar


𝜎.
 El área bajo la curva es 1.
 La curva normal es asintótica.
 Es simétrica respecto al centro, exactamente igual a ambos lados de la media.
 Tiene una única moda que coincide con su media y su mediana.
 El 50% de los valores se encuentras a cada lado de la media, 50% al lado izquierdo y 50% lado
derecho.
 Tiene una asíntota en el eje y cerca a cero.
 Puede tomar cualquier valor entre −∞, ∞
 A mayor valor de σ mayor dispersión, ruido o distanciamiento de los datos alrededor del valor
medio. Es decir, a mayor 𝜎 la forma de campana es más abierta. En cambio,𝜎 pequeño indica que
los dados se ciñen a la media y la forma de la campana es más cerrada o puntiaguda.
Cuando o para que se utiliza: la Distribución Normal permite modelar diferentes fenómenos como lo son
los fenómenos naturales, sociales y psicológicos.
Se utiliza muy a menudo porque hay muchas variables asociadas a fenómenos naturales que siguen el
modelo de la norma. Para analizar características morfológicas de individuos como; personas, animales,
plantas, entre otros. Se realizan análisis como por ejemplo de peso, talla, diámetro, distancia, perímetro,
entre otros. Características fisiológicas como, por ejemplo: efecto de una misma dosis de un fármaco, o la
misma cantidad de un fertilizante. Ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen. En cuanto los fenómenos psicológicos, por ejemplo: cociente
intelectual, grado de adaptación a un medio, fenómenos relacionados con la violencia familiar, abuso sexual
a niños, entre otros. Valores estadísticos muéstrales como la media, varianza y moda.

Distribución Muestral: Es el conjunto de estadísticos (valores que resultan del análisis del muestreo), que
pueden obtenerse de las diferentes muestras de igual tamaño que conforman una población determinada. Es
una distribución de probabilidades de una estadística muestral calculada a partir de todas las muestras
posibles de tamaño “𝑛” elegidas al azar de una población determinada.
Una distribución muestral es una distribución de probabilidad de una estadística muestral calculada a partir
de todas las muestras posibles de tamaña “𝑛” elegidas al azar de una población determinada. Generalmente
nos interesa conocer una o más de las siguientes características de la distribución muestral.
Propiedades o características:

 Su forma funcional; como aparece en su representación gráfica.


 Su media.
 Su desviación estándar; error estándar.

Tipos de distribuciones muéstrales:

 Distribución de la media.
 Distribución de la varianza.
 Distribución de la proporción.
 Distribución de la diferencia de medias.
 Distribución del cociente variancias.

Distribución muestral de medias: cada muestra de tamaño 𝑛 que podemos extraer de una población
proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria
podemos estudiar su distribución que llamaremos distribución muestral de medias.

 Si tenemos una población normal 𝑁 (𝑚, 𝑠) y extraemos de ella muestras de tamaño 𝑛, la


distribución muestral de medias sigue también una distribución normal
 Si la población no sigue una distribución normal, pero 𝑛 > 30, aplicando el
N μ,
( σ
√n )

 Llamado Teorema central del límite la distribución muestral de medias se aproxima también a la
normal anterior.

Distribuciones de frecuencia relativas y distribución de probabilidad.

Distribución de Frecuencia Relativa

La frecuencia relativa es una medida estadística que se calcula como el cociente de la frecuencia absoluta de
algún valor de la población/muestra (𝑓𝑖) entre el total de valores que componen la población/muestra (𝑁).
Para calcular la frecuencia relativa antes es necesario calcular la frecuencia absoluta. Sin ella no podríamos
obtener la frecuencia relativa. La frecuencia relativa se representa con las letras hi y su fórmula de cálculo
es la siguiente:

fi
hi=
N

ℎ𝑖: frecuencia relativa de las observaciones i – enésima.


fi: frecuencia absoluta de las observaciones i - enésima
𝑁: número total de observaciones de la muestra. De la fórmula de cálculo de la frecuencia relativa se
desprenden dos conclusiones:
 La primera es que la frecuencia relativa va a estar acotada entre 0 y 1, debido a que la frecuencia de
los valores de la muestra siempre va a ser menor al tamaño de la muestra.
 La segunda es que la suma de todas las frecuencias relativas va a ser 1 si se mide en tanto por 1, o
100 si se mide en tanto por ciento.
Por consiguiente, la frecuencia relativa nos informa acerca de la proporción o el peso que tiene algún valor
u observación en la muestra. Esto la hace de especial utilidad, dado que, a diferencia de la frecuencia
absoluta, la frecuencia relativa nos va a permitir hacer comparaciones entre muestras de tamaños distintos.
Esta se puede expresar como un valor decimal, como fracción o como porcentaje.
Distribución de Probabilidad.
La distribución de probabilidad continua que más se utiliza es la distribución normal, con la conocida forma
de campana que estudiamos en relación con la regla empírica. Se dice que una variable Y tiene una
distribución normal de probabilidad si y solo si, para σ > 0 y−∞ < μ< ∞ la función de densidad y es:
1 − ( y−μ )
2

f ( y )= 2σ
2
; −∞< y < ∞
σ √ 2 πe e

Observe que la función de densidad normal contiene dos parámetros, 𝜇 𝑦 𝜎. Si Y es una variable aleatoria
normalmente distribuida con parámetros, 𝜇 𝑦 𝜎. Entonces:
𝐸(𝑌) = 𝜇 𝑦 𝑉(𝑌) = 𝜎2

Ejercicio 2

La tabla muestra volumen de ventas en millones de pesos de un total, de 20 vendedores de una empresa:

Realizamos la tabla de frecuencias. Organizamos los datos de menor a mayor:

25.3 25.6 29.3 29.8 32.1


31.2 32.1 32.5 33.4 33.7
35.6 40.8 40.8 40.9 43.8
45.3 54.8 57.8 60.5 99.4

Calculamos el rango, el número de intervalos y la amplitud para construir la tabla de frecuencias

Rango
𝑹 = 𝑿𝒎á𝒙 − 𝑿𝒎𝒊𝒏
𝑅 = 99.4 − 25.3
𝑅 = 74.1

𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔:
𝑲 = 𝟏 + 𝟑, 𝟑𝟐𝟐 𝐥𝐨𝐠 𝒏
𝐾 = 1 + 3,322 log (20)
𝐾 = 5.32 ≈ 5

𝑨𝒎𝒑𝒍𝒊𝒕𝒖𝒅:

R
Ai=
K
74.1
Ai=
5
Ai=14.82

Calcular la media


∑ x i∗f i
n
861.68
x=
20
x=43.08
b. calcular la mediana

n+ 1 20+1 21
posicion : = = =10.5
2 2 2

la mediana se encuentra entre 2.53−40.12

n
−f
2 i−1
M e =Li+ ∗A i
fi

20
−0
2
M e =25.3 ∗14.82
11

10
M e =25,3+ ∗14.82
11

10
M e =25,3+ ∗14.82
11

M e =25,3+13.47

M e =38.77
C. Calcular la desviación estándar

√∑
2
( x i−x ) ∗f i
s=
n−1

s=
√ 4436.57
20−1

s=
√ 4436.57
19

s= √233.50

s=15.28
D. ¿Qué medias de tendencia central se elegirían y de dispersión se elegirían y por qué?

Esta elección depende de la empresa, sin embargo, entre las medidas de tendencia central que se podrían

elegirían como más sería la media aritmética o promedio ya que, esta es un valor representativo de los datos

que se tiene y, además permite que se les otorgue este mismo valor a los demás datos para ubicarlos, en un

mismo nivel, por así decirlo.

En cuanto a las medidas de dispersión la más convenientes serian la varianza, que permite ver la

variabilidad que presentan los datos con respecto a la media, y la desviación típica

También podría gustarte