Clase 02 Estadística y Probabilidad
Clase 02 Estadística y Probabilidad
Clase 02 Estadística y Probabilidad
CENTRAL Y DISPERSIÓN
Clase 02
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS
MEDIA POBLACIONAL
EJEMPLO
Hay 42 salidas en la I-75 que atraviesa el estado de Kentucky. A continuación aparece la lista de
distancias entre salidas (en millas).
¿Por qué esta información representa una población? ¿Cuál es la media aritmética de millas entre
salidas?
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS
La media de una muestra o cualquier otra medición basada en una muestra de datos recibe
nombre de estadístico.
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS
EJEMPLO
Hay SunCom estudia la cantidad de minutos que consumen sus clientes que cuentan con un plan
tarifario de cierto teléfono celular. Una muestra aleatoria de 12 clientes arroja la siguiente cantidad
de minutos empleados el mes pasado.
EJEMPLO
Hay SunCom estudia la cantidad de minutos que consumen sus clientes que cuentan con un plan
tarifario de cierto teléfono celular. Una muestra aleatoria de 12 clientes arroja la siguiente cantidad
de minutos empleados el mes pasado.
La media aritmética es una medida de ubicación muy utilizada. Cuenta con algunas propiedades
importantes:
1. Todo conjunto de datos de intervalo —o de nivel de razón— posee una media. Recuerde que
los datos del nivel de razón incluyen datos como edades, ingresos y pesos, y que la distancia
entre los números es constante.
MEDIA PONDERADA
La media ponderada, que constituye un caso especial de la media aritmética, se presenta cuando
hay varias observaciones con el mismo valor. En general, la media ponderada del conjunto de
números representados como X1, X2, X3, …, Xn con las ponderaciones correspondientes w1, w2,
w3, … , wn, se calcula de la siguiente manera:
EJEMPLO
En junio, una inversionista compró 300 acciones de Oracle (una compañía de tecnología de la
información) a $20 cada una. En agosto compró 400 acciones más a $25. En noviembre compró
otras 400 acciones, pero el precio bajó a $23 cada título. ¿Cuál es el precio promedio ponderado
de cada acción?
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS
MEDIANA
Punto medio de los valores una vez que se han ordenado de menor a mayor o de mayor a menor.
2. Es calculable en el caso de datos de nivel ordinal o más altos. Recuerde que los datos de nivel
ordinal pueden ordenarse de menor a mayor.
EJEMPLO
Facebook es una popular red social en internet. Los usuarios pueden agregar amigos y enviarles
mensajes, así como actualizar sus perfiles personales para informar a sus amigos sobre sí
mismos y sus actividades. Una muestra de 10 adultos reveló que pasaron los siguientes números
de horas utilizando Facebook el mes pasado. Encuentre la mediana.
DESCRIPCIÓN DE DATOS: MEDIDAS NUMÉRICAS
MODA
EJEMPLO
Hay 42 salidas en la I-75 que atraviesa el estado de Kentucky. A continuación aparece la lista de
distancias entre salidas (en millas).
Una medida de ubicación, como la media o la mediana, sólo describe el centro de los datos.
Desde este punto de vista resulta valiosa, pero no dice nada sobre la dispersión de los datos.
Una segunda razón para estudiar la dispersión en un conjunto de datos consiste en comparar la
propagación en dos o más distribuciones.
VARIANZA Y DISPERSIÓN ESTÁNDAR
➔La varianza no puede ser negativa y es cero sólo si todas las observaciones son las mismas.
VARIANZA DE LA POBLACIÓN
2. Calcule la diferencia entre cada observación y la media, y eleve al cuadrado dicha diferencia.
Así, usted podría pensar que la varianza de la población es la media de las diferencias elevadas
al cuadrado entre cada valor y la media. En las poblaciones cuyos valores son cercanos a la
media, la varianza de la población puede ser pequeña. En las poblaciones cuyos valores se
apartan de la media, la varianza de la población puede ser grande.
VARIANZA Y DISPERSIÓN ESTÁNDAR
Tanto el rango como la desviación media resultan fáciles de interpretar. El rango es la diferencia
entre los valores alto y bajo de un conjunto de datos, y la desviación media es la media de las
desviaciones de la media. Sin embargo, la varianza resulta difícil de interpretar en el caso de un
solo conjunto de observaciones.
EJEMPLO
Los ingresos anuales de cinco vicepresidentes de una empresa son: $125 000, $128 000, $122
000, $133 000 y $140 000. Considere estos valores como una población.
a) ¿Cuál es el rango?
d) También se estudiaron los ingresos anuales del personal de otra empresa similar a TMV. La
media fue de $129 000 y la desviación estándar de $8 612. Compare las medias y dispersiones
de las dos firmas.
VARIANZA Y DISPERSIÓN ESTÁNDAR
VARIANZA MUESTRAL
EJEMPLO
Una muestra de 25 estudiantes universitarios reportó las siguientes cifras en dólares de gastos
por concepto de entretenimiento el año pasado.
La desviación estándar normalmente se utiliza como medida para comparar la dispersión de dos o más
conjuntos de observaciones.
TEOREMA DE CHEBYSHEV
EJEMPLOS
1) Supongamos que tenemos un conjunto de datos y queremos aplicar el Teorema de Chebyshev para
evaluar la proporción de datos dentro de cierto rango. Si utilizamos k = 2, el teorema nos dice que al
menos 1 – (1/22) = 3/4 (o el 75%) de los datos estarán dentro de 2 desviaciones estándar de la
media.
2) Imaginemos que tenemos datos de las alturas de estudiantes en una universidad. Si calculamos la
media y la desviación estándar de estas alturas, podemos aplicar el Teorema de Chebyshev para
obtener una estimación de cuántos estudiantes tienen alturas dentro de ciertos rangos. Si usamos
k = 3, el teorema nos indica que al menos 1 – (1/32) = 8/9 (o el 88.89%) de las alturas estarán
dentro de 3 desviaciones estándar de la media. Esto proporciona una medida de dispersión general,
independientemente de la forma exacta de la distribución de alturas.
INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR
REGLA EMPÍRICA
EJEMPLO
Caso de una distribución con forma de campana con una media de 100 y una desviación estándar
de 10.
INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR
EJEMPLO
Una muestra de gastos estudiantiles semanales se asemeja a una distribución simétrica con
forma de campana. La media de la muestra es de $30; la desviación estándar de $2. De acuerdo
con la regla empírica conteste las siguientes preguntas:
1. ¿Entre qué dos cantidades se encuentra aproximadamente 68% de los gastos semanales de
los estudiantes?
2. ¿Entre qué dos cantidades se encuentra alrededor de 95% de los gastos semanales de los
estudiantes?
3. ¿Entre qué dos cantidades se encuentran casi todos los gastos semanales de los estudiantes?
MEDIA Y DESVIACIÓN ESTÁNDAR DATOS AGRUPADOS
Es importante aclarar que una media o una desviación estándar de datos agrupados es una
estimación de los valores reales correspondientes.
MEDIA ARITMÉTICA
Las observaciones en cada clase se representan a través del punto medio de la clase.
MEDIA Y DESVIACIÓN ESTÁNDAR DATOS AGRUPADOS
DESVIACIÓN ESTÁNDAR
EJEMPLO
El gerente de la tienda Wal-Mart de la localidad estudia la cantidad de artículos que compran los
consumidores en el horario de la tarde. A continuación, aparece la cantidad de artículos de una
muestra de 30 consumidores.