Clase 02 Estadística y Probabilidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 25

MEDIDAS DE TENDENCIA

CENTRAL Y DISPERSIÓN

Clase 02
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS

MEDIA POBLACIONAL

➔ Cualquier característica medible de una población recibe el nombre de parámetro. La media de


una población es un parámetro.
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS

EJEMPLO

Hay 42 salidas en la I-75 que atraviesa el estado de Kentucky. A continuación aparece la lista de
distancias entre salidas (en millas).

¿Por qué esta información representa una población? ¿Cuál es la media aritmética de millas entre
salidas?
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS

MEDIA DE UNA MUESTRA

La media de una muestra o cualquier otra medición basada en una muestra de datos recibe
nombre de estadístico.
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS

EJEMPLO

Hay SunCom estudia la cantidad de minutos que consumen sus clientes que cuentan con un plan
tarifario de cierto teléfono celular. Una muestra aleatoria de 12 clientes arroja la siguiente cantidad
de minutos empleados el mes pasado.

¿Cuál es el valor de la media aritmética de los minutos consumidos?

➔ Qué interpretación se puede dar del valor obtenido.


DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS

EJEMPLO

Hay SunCom estudia la cantidad de minutos que consumen sus clientes que cuentan con un plan
tarifario de cierto teléfono celular. Una muestra aleatoria de 12 clientes arroja la siguiente cantidad
de minutos empleados el mes pasado.

¿Cuál es el valor de la media aritmética de los minutos consumidos?

➔ Qué interpretación se puede dar del valor obtenido.


DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS

PROPIEDADES DE LA MEDIA ARITMÉTICA

La media aritmética es una medida de ubicación muy utilizada. Cuenta con algunas propiedades
importantes:

1. Todo conjunto de datos de intervalo —o de nivel de razón— posee una media. Recuerde que
los datos del nivel de razón incluyen datos como edades, ingresos y pesos, y que la distancia
entre los números es constante.

2. Todos los valores se encuentran incluidos en el cálculo de la media.

3. La media es única. Sólo existe una media en un conjunto de datos.

4. La suma de las desviaciones de cada valor de la media es cero. Expresado simbólicamente,


DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS

MEDIA PONDERADA

La media ponderada, que constituye un caso especial de la media aritmética, se presenta cuando
hay varias observaciones con el mismo valor. En general, la media ponderada del conjunto de
números representados como X1, X2, X3, …, Xn con las ponderaciones correspondientes w1, w2,
w3, … , wn, se calcula de la siguiente manera:

EJEMPLO

En junio, una inversionista compró 300 acciones de Oracle (una compañía de tecnología de la
información) a $20 cada una. En agosto compró 400 acciones más a $25. En noviembre compró
otras 400 acciones, pero el precio bajó a $23 cada título. ¿Cuál es el precio promedio ponderado
de cada acción?
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS

MEDIANA

Punto medio de los valores una vez que se han ordenado de menor a mayor o de mayor a menor.

Las principales propiedades de la mediana son las siguientes:

1. No influyen en ella valores extremadamente grandes o pequeños. Por consiguiente, la mediana


es una valiosa medida de ubicación cuando dichos valores se presentan.

2. Es calculable en el caso de datos de nivel ordinal o más altos. Recuerde que los datos de nivel
ordinal pueden ordenarse de menor a mayor.

EJEMPLO

Facebook es una popular red social en internet. Los usuarios pueden agregar amigos y enviarles
mensajes, así como actualizar sus perfiles personales para informar a sus amigos sobre sí
mismos y sus actividades. Una muestra de 10 adultos reveló que pasaron los siguientes números
de horas utilizando Facebook el mes pasado. Encuentre la mediana.
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS

MODA

Valor de la observación que aparece con mayor frecuencia.

➔ La moda es de especial utilidad para resumir datos de nivel nominal.

EJEMPLO

Hay 42 salidas en la I-75 que atraviesa el estado de Kentucky. A continuación aparece la lista de
distancias entre salidas (en millas).

¿Por qué esta información representa una población? ¿Cuál es la moda?


MEDIDAS DE DISPERSIÓN

Una medida de ubicación, como la media o la mediana, sólo describe el centro de los datos.
Desde este punto de vista resulta valiosa, pero no dice nada sobre la dispersión de los datos.

Una segunda razón para estudiar la dispersión en un conjunto de datos consiste en comparar la
propagación en dos o más distribuciones.
VARIANZA Y DISPERSIÓN ESTÁNDAR

VARIANZA Media aritmética de las desviaciones de la media elevadas al cuadrado.

➔La varianza no puede ser negativa y es cero sólo si todas las observaciones son las mismas.

DESVIACIÓN ESTÁNDAR Raíz cuadrada de la varianza.

VARIANZA DE LA POBLACIÓN

Las fórmulas de la varianza poblacional y la varianza de la muestra son ligeramente diferentes.


VARIANZA Y DISPERSIÓN ESTÁNDAR

Observe el proceso de cálculo de la varianza:

1. Comience por determinar la media.

2. Calcule la diferencia entre cada observación y la media, y eleve al cuadrado dicha diferencia.

3. Sume todas las diferencias elevadas al cuadrado.

4. Divida la suma de las diferencias elevadas al cuadrado entre el número de elementos de la


población.

Así, usted podría pensar que la varianza de la población es la media de las diferencias elevadas
al cuadrado entre cada valor y la media. En las poblaciones cuyos valores son cercanos a la
media, la varianza de la población puede ser pequeña. En las poblaciones cuyos valores se
apartan de la media, la varianza de la población puede ser grande.
VARIANZA Y DISPERSIÓN ESTÁNDAR

DESVIACIÓN ESTÁNDAR DE LA POBLACIÓN

Tanto el rango como la desviación media resultan fáciles de interpretar. El rango es la diferencia
entre los valores alto y bajo de un conjunto de datos, y la desviación media es la media de las
desviaciones de la media. Sin embargo, la varianza resulta difícil de interpretar en el caso de un
solo conjunto de observaciones.

La raíz cuadrada de la varianza de la población es la desviación estándar de la población.


VARIANZA Y DISPERSIÓN ESTÁNDAR

EJEMPLO

Los ingresos anuales de cinco vicepresidentes de una empresa son: $125 000, $128 000, $122
000, $133 000 y $140 000. Considere estos valores como una población.

a) ¿Cuál es el rango?

b) ¿Cuál es el ingreso medio aritmético?

c) ¿Cuál es la varianza poblacional? ¿La desviación estándar?

d) También se estudiaron los ingresos anuales del personal de otra empresa similar a TMV. La
media fue de $129 000 y la desviación estándar de $8 612. Compare las medias y dispersiones
de las dos firmas.
VARIANZA Y DISPERSIÓN ESTÁNDAR

VARIANZA MUESTRAL

La fórmula para determinar la media poblacional es , sencillamente cambie los símbolos


de la media de la muestra; es decir,

Desafortunadamente, la conversión de una varianza poblacional en una varianza muestral no es


tan directa. Requiere un cambio en el denominador. En lugar de sustituir n (el número de la
muestra) por N (el número de la población), el denominador es n-1. Así, la fórmula de la varianza
muestral es:
VARIANZA Y DISPERSIÓN ESTÁNDAR

DESVIACIÓN ESTÁNDAR DE LA MUESTRA

La desviación estándar de la muestra se utiliza para estimar la desviación estándar de la


población. Como se hizo notar, la desviación estándar de la población es la raíz cuadrada de la
varianza de la población. Asimismo, la desviación estándar de la muestra es la raíz cuadrada de
la varianza de la muestra. La desviación estándar de la muestra se calcula con mayor facilidad de
la siguiente manera:
VARIANZA Y DISPERSIÓN ESTÁNDAR

EJEMPLO

Una muestra de 25 estudiantes universitarios reportó las siguientes cifras en dólares de gastos
por concepto de entretenimiento el año pasado.

a) Encuentre la media, la mediana y la moda de esa información.

b) ¿Cuáles son el rango y la desviación estándar?


INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR

La desviación estándar normalmente se utiliza como medida para comparar la dispersión de dos o más
conjuntos de observaciones.

TEOREMA DE CHEBYSHEV

En cualquier conjunto de observaciones (muestra o población), la proporción de valores que se


encuentran a k desviaciones estándares de la media es de por lo menos 1 – (1/k2), siendo k cualquier
constante mayor que 1.

EJEMPLOS

1) Supongamos que tenemos un conjunto de datos y queremos aplicar el Teorema de Chebyshev para
evaluar la proporción de datos dentro de cierto rango. Si utilizamos k = 2, el teorema nos dice que al
menos 1 – (1/22) = 3/4 (o el 75%) de los datos estarán dentro de 2 desviaciones estándar de la
media.

2) Imaginemos que tenemos datos de las alturas de estudiantes en una universidad. Si calculamos la
media y la desviación estándar de estas alturas, podemos aplicar el Teorema de Chebyshev para
obtener una estimación de cuántos estudiantes tienen alturas dentro de ciertos rangos. Si usamos
k = 3, el teorema nos indica que al menos 1 – (1/32) = 8/9 (o el 88.89%) de las alturas estarán
dentro de 3 desviaciones estándar de la media. Esto proporciona una medida de dispersión general,
independientemente de la forma exacta de la distribución de alturas.
INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR

REGLA EMPÍRICA

En cualquier distribución de frecuencias simétrica con forma de campana, aproximadamente 68%


de las observaciones se encontrarán entre más y menos una desviación estándar de la media;
cerca de 95% de las observaciones se encontrarán entre más y menos dos desviaciones
estándares de la media y, de hecho, todas (99.7%) estarán entre más y menos tres desviaciones
estándares de la media.
INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR

EJEMPLO

Caso de una distribución con forma de campana con una media de 100 y una desviación estándar
de 10.
INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR

EJEMPLO

Una muestra de gastos estudiantiles semanales se asemeja a una distribución simétrica con
forma de campana. La media de la muestra es de $30; la desviación estándar de $2. De acuerdo
con la regla empírica conteste las siguientes preguntas:

1. ¿Entre qué dos cantidades se encuentra aproximadamente 68% de los gastos semanales de
los estudiantes?

2. ¿Entre qué dos cantidades se encuentra alrededor de 95% de los gastos semanales de los
estudiantes?

3. ¿Entre qué dos cantidades se encuentran casi todos los gastos semanales de los estudiantes?
MEDIA Y DESVIACIÓN ESTÁNDAR DATOS AGRUPADOS

Es importante aclarar que una media o una desviación estándar de datos agrupados es una
estimación de los valores reales correspondientes.

MEDIA ARITMÉTICA

Las observaciones en cada clase se representan a través del punto medio de la clase.
MEDIA Y DESVIACIÓN ESTÁNDAR DATOS AGRUPADOS

DESVIACIÓN ESTÁNDAR

Para calcular la desviación estándar de datos agrupados en una distribución de frecuencias,


necesita ajustar ligeramente la fórmula para datos no agrupados. Pondere cada una de las
diferencias cuadradas por el número de frecuencias en cada clase.
DATOS NO AGRUPADOS Y AGRUPADOS

EJEMPLO

El gerente de la tienda Wal-Mart de la localidad estudia la cantidad de artículos que compran los
consumidores en el horario de la tarde. A continuación, aparece la cantidad de artículos de una
muestra de 30 consumidores.

a) Calcule la media y la mediana de la cantidad de artículos.

b) Estime el rango y la desviación estándar de la cantidad de artículos.

c) Organice la cantidad de artículos en una distribución de frecuencias.

d) Calcule la media y la desviación estándar de los datos organizados en una distribución de


frecuencias. Compare estos valores con los que calculó en el inciso a). ¿Por qué son diferentes?

También podría gustarte