0% encontró este documento útil (0 votos)
132 vistas14 páginas

ESTADISTICA11

Este documento presenta información sobre medidas de dispersión y centralización en estadística para un curso de 11° grado. Explica conceptos como varianza, desviación estándar, rango, coeficiente de variación, cuartiles y percentiles. Incluye ejemplos y actividades para calcular estas medidas a partir de conjuntos de datos. El objetivo es que los estudiantes aprendan a aplicar estas técnicas estadísticas descriptivas para analizar y resumir datos cuantitativos.

Cargado por

TutoGamerPc
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
132 vistas14 páginas

ESTADISTICA11

Este documento presenta información sobre medidas de dispersión y centralización en estadística para un curso de 11° grado. Explica conceptos como varianza, desviación estándar, rango, coeficiente de variación, cuartiles y percentiles. Incluye ejemplos y actividades para calcular estas medidas a partir de conjuntos de datos. El objetivo es que los estudiantes aprendan a aplicar estas técnicas estadísticas descriptivas para analizar y resumir datos cuantitativos.

Cargado por

TutoGamerPc
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 14

Colegio Campestre

Padre Arturo
SEGUNDO PERIODO - GRADO: UNDÉCIMO

ÁREA: ASIGNATURA:
MATEMÁTICAS ESTADÍSTICA

ESTANDAR:
Uso comprensivamente algunas medidas de centralización, localización, dispersión y
correlación (percentiles, cuartiles, centralidad, distancia, rango, varianza, covarianza y
normalidad).

INDICADOR DE DESEMPEÑO:
Explico de manera coherente todas las propiedades de las medidas de tendencia de dispersión y
las aplico a la cotidianidad.

EJES TEMÁTICOS:
1. Medidas de dispersión
2. Cuartiles y diagramas de cajas
3. Medidas de Forma

TEMAS DE PRUEBA SABER:


Prueba saber cuadernillo.

DERECHO BÁSICO DE APRENDIZAJE:


Plantea y resuelve situaciones problemáticas del contexto real y/o matemático que implican la
exploración de posibles asociaciones o correlaciones entre las variables estadísticas estudiadas.

Estadística
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

MARCO TÉORICO

1. MEDIDAS DE DISPERSIÓN

ESTADÍSTICA DESCRIPTIVA
La Estadística descriptiva es la rama de las matemáticas que comprende la recopilación, tabulación,
análisis e interpretación de datos cuantitativos y cualitativos, para tomar decisiones que se requieran
a fin de que el comportamiento de los datos se mantenga dentro de los parámetros de control
establecidos.

• Población (N)– Es el conjunto de todos los elementos de interés para determinado


estudio
• Parámetro – Es una característica numérica de la población, se identifica con letras
griegas (Media = µ, Desviación estándar = σ, Proporción = π, Coeficiente de correlación = ρ)
• Muestra (n) – Es una parte de la población, debe ser representativa de la misma.
• Estadístico – Es una característica numérica de una muestra, se identifica con letras
latinas (Media = X, Desviación estándar = s, Proporción = p, Coeficiente de correlación = r)

La Estadística descriptiva proporciona un criterio para lograr mejoras, debido a que sus técnicas se
pueden usar para describir y comprender la variabilidad. Por ejemplo, consideremos en una caldera
de vapor la presión del combustible alimentado y la eficiencia de la caldera, si utilizamos
instrumentos de medición con la resolución suficiente, encontraremos que existe variabilidad en esos
parámetros, y mediante el uso de técnicas estadísticas podemos realizar mejoras para reducir la
variación en rendimiento de la caldera.

Para poder obtener consecuencias y deducciones válidas de los datos de un estadístico, es muy útil
contar con información sobre los valores que se agrupan hacia el centro y sobre que tan distanciados
o dispersos estén unos respecto a otros. Comenzaremos por definir estas medidas:

La estadística inferencial se refiere a la estimación de parámetros y pruebas de hipótesis acerca de


las características de la población en base a los datos obtenidos con una muestra.

1.1. MEDIDAS DE DISPERSIÓN PARA DATOS SIMPLES

Para comprender el concepto de varianza, supóngase que tenemos los datos siguientes de los cuales
queremos saber que tan dispersos están respecto a su media:

2, 3, 4, 5, 6 con media = 20/5 = 4

Si tomamos la suma de diferencias de cada valor respecto a su media y las sumamos se tiene:

(-2) + (-1) + (0) + (1) +(2) = 0

Por lo que tomando diferencias simples no es posible determinar la dispersión de los datos.

Si ahora tomamos esas mismas diferencias al cuadrado y las sumamos se tiene:

4 + 1 + 0 + 1 + 4 = 10

Varianza De Los Datos

Es una medida que nos ayuda a comprender la variabilidad de los datos, que tan distanciados están
de la media

2
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

Poblacional (σ2 ) Se obtiene dividiendo el valor anterior entre n = 5, o sea el promedio de la


suma de las diferencias al cuadrado, tomando n datos.
2 (
xi x)2
n

• Poblacional (s2 ) Se obtiene dividiendo el valor anterior entre n - 1 = 4, o sea el promedio de la


suma de las diferencias al cuadrado, tomando n -1 datos.

s2 (xin x1)2

Desviación Estándar: Es la raíz cuadrada de la varianza:


( xi x)2
Para el caso de una población
n

( xi x ) 2
Para el caso de una muestra s
n 1

• Rango (R): es la diferencia positiva entre el valor mayor y el valor menor de un conjunto de
datos. Por ejemplo para el conjunto de datos siguiente:
2.0,2.1,2.4,2.5,2.6,2.8,2.9,2.9,3.0,3.1,3.6,3.8,4.0,4.0

Su rango es R = 4.0 – 2.0 = 2.0

• Coeficiente de Variación (CV): Se utiliza para comparar la dispersión de dos conjuntos de


datos que tienen unidades diferentes, ya que representa una medida relativa de dispersión.
s
Coeficiente.de.variación CV (100)
X
ACTIVIDAD DE LÁPIZ Y PAPEL N°1

1. Por ejemplo si la media de tiempos de respuesta es de 78.7 y su desviación estándar es


12.14, el CVt:
2. Por otra parte si la media de temperaturas es de 10 y su desviación estándar de 2, el CVs de
las temperaturas es:
3. La resistencia al rompimiento de dos muestras de botellas es la siguiente:

Muestra 1: 230 250 245 258 265 240


Muestra 2: 190 228 305 240 265 260

Calcule la desviación estándar para ambas muestras.

4. Se desea hacer un estudio estadístico de la temperatura del agua, para esto es necesario
tomar una muestra y calcular la media, mediana, media acotada al 15%, desviación estándar,
rango y coeficiente de variación. Se realizan 14 observaciones arrojando los siguientes
resultados en ºC: 2.11, 3.8, 4.0, 4.0, 3.1, 2.9, 2.5, 3.6, 2.0, 2.4, 2.8, 2.6, 2.9, 3.0.
5. Calcular la media, mediana, desviación estándar, media acotada al 5%, desviación estándar,
rango y coeficiente de variación.

3
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

OTRAS MEDIDAS DE DISPERSIÓN: PERCENTILES, DECILES Y QUARTILES

Cada conjunto de datos ordenado tiene tres cuartiles que lo dividen en cuatro partes iguales. El
primer cuartil es ese valor debajo del cual clasifica el 25% de las observaciones y sobre el cual se
encuentra el 75% restante. El segundo cuartil divide a los datos a la mitad similar a la mediana.

Los deciles separan un conjunto de datos ordenado en 10 subconjuntos iguales y los percentiles en
100 partes, la ubicación de un percentil se encuentra en:

P
Lp (n 1) 100
Donde:
Lp es el sitio del percentil deseado en una serie ordenada n es
el número de observaciones

P es el percentil deseado

Por ejemplo para el conjunto de datos siguiente:

3 10 19 27 34 38 48 56 67 74 4
12 20 29 34 39 48 59 67 74 7
14 21 31 36 43 52 62 69 76 9
15 25 31 37 45 53 63 72 79

10 17 27 34 38 47 56 64 73 80

La localización del percentil 35 se halla en:

L35 (50 1) 17.85

O sea que el percentil 35 está al 85% del trayecto comprendido entre la observación 17 que es 29 y la
observación 18 que es 31 o sea L35 = 29 + (0.85)(31-29) = 30.7. Por tanto el 35% de las
observaciones están por debajo de 30.7 y el 65% restante por encima de 30.7.

De la misma forma los percentiles 25, 50 y 75 proporcionan la localización de los cuartiles Q1, Q2 y
Q3 respectivamente.

• Q1: es el número que representa al percentil 25 (hay 25% de los datos por debajo de
este).
• Q2 o Mediana: es el número que representa al percentil 50 (hay 50% de los datos por
debajo de este).
• Q3: es el número que representa al percentil 75 (hay 75% de los datos por debajo de
este).
• Rango o Recorrido intercuartílico: es la diferencia entre Q1 y Q3.

ACTIVIDAD DE LÁPIZ Y PAPEL N° 2 °


1. Buscamos el lugar que ocupa cada cuartil mediante la expresión

Número impar de datos

2, 5, 3, 6, 7, 4, 9

Número par de datos

2, 5, 3, 4, 6, 7, 1, 9

4
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

2. Cálculo de los cuartiles para datos agrupados


3. Cálculo de los percentiles para datos agrupados 𝑑𝑑3, 𝑃𝑃5, 𝑃𝑃7𝑃𝑃9
4. Cálculo de los percentiles para datos agrupados 𝑃𝑃25, 𝑃𝑃50, 𝑃𝑃75𝑃𝑃90

1.2. MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS

Tal y como se adelantaba antes, otro aspecto a tener en cuenta al


describir datos continuos es la dispersión de los mismos. Existen
distintas formas de cuantificar esa variabilidad. De todas ellas, la
varianza (S2) de los datos es la más utilizada. Es la media de los
cuadrados de las diferencias entre cada valor de la variable y la media
aritmética de la distribución.

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto
tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable
estudiada.

En el ejemplo anterior la varianza sería:

Sx2=

La desviación típica (S) es la raíz cuadrada de la varianza. Expresa


la dispersión de la distribución y se expresa en las mismas unidades
de medida de la variable. La desviación típica es la medida de
dispersión más utilizada en estadística.

Aunque esta fórmula de la desviación típica muestral es correcta, en la práctica, la estadística nos
interesa para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de
n, el valor n-1.

Por tanto, la medida que se utiliza es la cuasidesviación típica, dada por:

Aunque en muchos contextos se utiliza el término de desviación


típica para referirse a ambas expresiones.

En los cálculos del ejercicio previo, la desviación típica muestral, que


tiene como denominador n, el valor sería 20.678. A efectos de cálculo
lo haremos como n-1 y el resultado seria 21,79.

El haber cambiado el denominador de n por n-1 está en relación al hecho de que esta segunda
fórmula es una estimación más precisa de la desviación estándar verdadera de la población y posee
las propiedades que necesitamos para realizar inferencias a la población.

Cuando se quieren señalar valores extremos en una distribución de datos, se suele utilizar la amplitud
como medida de dispersión. La amplitud es la diferencia entre el valor mayor y el menor de la
distribución.

Por ejemplo, utilizando los datos del ejemplo previo tendremos 80-15 =65.

Como medidas de variabilidad más importantes, conviene destacar algunas características de la


varianza y desviación típica:

5
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

Son índices que describen la variabilidad o dispersión y por tanto cuando los datos están muy
alejados de la media, el numerador de sus fórmulas será grande y la varianza y la desviación típica lo
serán.

Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica. Para reducir a la


mitad la desviación típica, la muestra se tiene que multiplicar por 4.

Cuando todos los datos de la distribución son iguales, la varianza y la desviación típica son iguales a
0.

Para su cálculo se utilizan todos los datos de la distribución; por tanto, cualquier cambio de valor será
detectado.

Otra medida que se suele utilizar es el coeficiente de variación (CV). Es una medida de dispersión
relativa de los datos y se calcula dividiendo la desviación típica muestral por la media y multiplicando
el cociente por 100. Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de
dos o más grupos. Así, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya
media es de 69,6 kg. y su desviación típica (s) = 10,44 y la TAS de los mismos (150, 170, 135, 180 y
195 mmHg) cuya media es de 166 mmHg y su desviación típica de 21,3. La pregunta sería: ¿qué
distribución es más dispersa, el peso o la tensión arterial? Si comparamos las desviaciones típicas
observamos que la desviación típica de la tensión arterial es mucho mayor; sin embargo, no podemos
comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los
coeficientes de variación:

CV de la variable peso =

CV de la variable TAS =

A la vista de los resultados, observamos que la variable peso tiene mayor dispersión.

Cuando los datos se distribuyen de forma simétrica (y ya hemos dicho que esto ocurre cuando los
valores de su media y mediana están próximos), se usan para describir esa variable su media y
desviación típica. En el caso de distribuciones asimétricas, la mediana y la amplitud son medidas más
adecuadas. En este caso, se suelen utilizar además los cuartiles y percentiles.

Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posición. El percentil
es el valor de la variable que indica el porcentaje de una distribución que es igual o menor a esa cifra.

Así, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de sí al 80%
del total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de sí el
25%, 50% y el 75% del total de las puntuaciones y así tenemos por tanto el primer cuartil (Q1), el
segundo (Q2) y el tercer cuartil (Q3).

ACTIVIDAD COMPLEMENTARIA N° 1 FECHA DE ENTREGA: ______________

Leer atentamente el siguiente resumen, del artículo de investigación titulado:

Competencias docentes en los profesores de medicina de la Universidad

Michoacana de San Nicolás de Hidalgo

6
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

Resumen

Para la identificación de un grupo de competencias docentes básicas en los profesores que se


desempeñan en la licenciatura en medicina en la Facultad de Medicina “Dr. Ignacio Chávez”, objetivo
fundamental del presente trabajo, se utilizaron métodos teóricos y empíricos. Se aplicó una encuesta
a una muestra seleccionada de docentes y alumnos. Se emplearon procedimientos estadísticos para
el análisis de los resultados y se elaboraron tablas. A partir de la identificación de las necesidades de
aprendizaje de los profesores estudiados, en relación con la dirección del proceso enseñanza-
aprendizaje y los referentes teóricos sobre el tema, se realizó un análisis integrador para valorar los
datos obtenidos, lo que permitió la caracterización de los docentes objeto de investigación, en
relación con las competencias docentes básicas propias de una gestión formativa pertinente. Se
tomaron en consideración los principios metodológicos más actuales acerca de la formación de
recursos humanos en la educación superior en sentido general y en particular en la educación médica
superior.

A partir de este resumen:

a. Define la población.

b. Define la muestra.

c. Define la(s) variable(s) aleatoria(s).

NOTA: ESTA ACTIVIDAD SE DEBE SUSTENTAR

ACTIVIDAD COMPLEMENTARIA N° 2 FECHA DE ENTREGA: ___________________

1. Las puntuaciones obtenidas por un grupo en una prueba han sido:

15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.

Construir la tabla de distribución de frecuencias y dibuja el gráfico más adecuado.

2. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:

3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 1,
3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4,

a) Encuentre los cuartiles


b) Encuentre los deciles: 4,5,7,9
c) Encuentre los percentiles: 23, 37, 60, 82
d) Halle el Varianza, Desviación típica y Coeficiente de variación.
3. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:

Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)
fi 8 10 16 14 10 5 2
a) Construir la tabla de frecuencias.
b) Encuentre los cuartiles
c) Encuentre los deciles: 4,5,7,9
d) Encuentre los percentiles: 23, 37, 60, 82
e) Halle el Varianza, Desviación típica y Coeficiente de variación.
f) Dibujar el histograma y el polígono de frecuencias.

7
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

4. El resultado de lanzar dos dados 120 veces viene dado por la tabla:

Sumas 2 3 4 5 6 7 8 9 10 11 12

Veces 3 8 9 11 20 19 16 13 11 6 4

a) Calcular la media y la desviación típica.


b) Hallar el porcentaje de valores comprendidos en el intervalo (x − σ, x + σ).

NOTA: ESTA ACTIVIDAD SE DEBE SUSTENTAR

2. DIAGRAMA DE CAJA
El diagrama de tallo y hoja y el histograma proporcionan una impresión visual general del conjunto de
datos, mientras que las cantidades numéricas tales como 𝑋𝑋̅ o S brindan información sobre una sola
característica de los datos. El diagrama de caja es una presentación visual que describe al mismo
tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión,
la simetría o asimetría y la identificación de observaciones atípicas.

El diagrama de caja representa los tres cuartiles, y los valores mínimo y máximo de los datos sobre
un rectángulo (caja), alineado horizontal o verticalmente.

Construcción:
1. El rectángulo delimita el rango intercuartílico con la arista izquierda (o inferior) ubicada en el
primer cuartil Q1, y la arista derecha (o superior) en el tercer cuartil Q3.
2. Se dibuja una línea a través del rectángulo en la posición que corresponde al segundo cuartil
(que es igual al percentil 50 o a la mediana), Q2 = Md.
3. De cualquiera de las aristas del rectángulo se extiende una línea, o bigote, que va hacia los
valores extremos (valor mínimo y valor máximo). Estas son observaciones que se encuentran
entre cero y 1.5 veces el rango intercuartílico a partir de las aristas del rectángulo.
4. Las observaciones que están entre 1.5 y 3 veces el rango intercuartílico a partir de las aristas
del rectángulo reciben el nombre de valores atípicos. Las observaciones que están más allá de
tres veces el rango intercuartílico a partir de las aristas del rectángulo se conocen como valores
atípicos extremos. En ocasiones se emplean diferentes símbolos (como círculos vacíos o
llenos), para identificar los dos tipos de valores atípicos.
A veces, los diagramas de caja reciben el nombre de diagramas de caja y bigotes. Nótese que el
rectángulo o caja representa el 50% de los datos que particularmente están ubicados en la zona
central de la distribución. La caja representa el cuerpo de la distribución y los bigotes sus colas.

La Figura 1 presenta esquemáticamente un diagrama de caja indicando sus partes. Del diagrama
se interpreta que la distribución de los datos es asimétrica por la derecha, ya que la longitud de los
rectángulos por debajo y por encima de la mediana así como los bigotes indican que los datos están
más agrupados en sus valores inferiores que en los superiores y además se observa que

𝑋𝑋̅ >Md. También destaca la existencia de dos valores atípicos en el extremo superior de los datos.

8
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

EJEMPLO: DISTRIBUCIÓN DE EDADES

Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de un
colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

ORDENAR LOS DATOS

Para calcular los parámetros estadístico, lo primero es ordenar la distribución

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

CALCULO DE CUARTILES

Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20
resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:

Q1 = (24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que
ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media
aritmética de dicho valor y el siguiente:

me= Q2 = (33 + 34)/ 2 =33,5

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro
caso, como 3N / 4 = 15, resulta

Q2=(39 + 39) / 2 = 39

9
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)


La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).

INFORMACIÓN DEL DIAGRAMA

Podemos obtener abundante información de una distribución a partir de estas representaciones.


Veamos alguna:

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%.

El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más
jóvenes están más concentrados que el 25% de los mayores.

El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en 14,5


años.
ACTIVIDAD DE LÁPIZ Y PAPEL N°3

1. Cuarenta estudiantes tomaron el examen de admisión de álgebra universitaria y los resultados


del mismo se resumen en el diagrama de caja y bigotes de abajo. Cuántos estudiantes serán
admitidos para inscribirse en dicha clase si la marca de
aprobación se ubicó en

(i) 65%

(ii) 60%

2. Harika tira 3 dados y suma los puntajes respectivos. Ella registra dicha suma de puntajes para
50 tiradas. Los puntajes obtenidos en cada tirada se muestran abajo (recordar que cada
número corresponde a la suma de los puntajes de los tres dados, por tirada). Representar los
datos en un diagrama de caja y bigotes. Encontrar tanto el rango de todos los datos como el
rango intercuartil.
9,10,12,13,10,14,8,10,12,6,8,11,12,12,9,11,10,15,10,8,8,12,10,14,10,
9,7,5,11,15,8,9,17,12,12,13,7,14,6,17,11,15,10,13,9,7,12,13,10,12
ACTIVIDAD COMPLEMENTARIA N°3 FECHA DE ENTREGA: _________________

1. Los diagramas de caja y bigotes mostrados abajo representan los tiempos hechos por cada
alumno de una clase durante una carrera de 150 yardas con obstáculos. Los tiempos se han
separado según género, es decir, tanto para el grupo de muchachos como para el de
muchachas. Cada uno de dichos grupos cree que posee los mejores tiempos. Determinar el
resumen de cinco números para cada grupo. Proporcionar un argumento convincente para
cada grupo.

10
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

2. Dibuja un diagrama de caja y bigotes para los siguientes datos desordenados.


49,57,53,54,49,67,51,57,56,59,57,50,49,52,53,50,58
Una simulación de un gran número de corridas para la tirada de tres dados y la suma de sus
valores resulta en el siguiente resumen de 5 números: 3, 8, 10.5, 13, 18. Construye un
diagrama de caja y bigotes para dichos datos. Haz comentarios sobre las diferencias que
existen entre dicho diagrama y el diagrama del ejemplo 2.
3. Los diagramas de caja y bigotes mostrados abajo representan el porcentaje de personas que
viven por debajo de la línea de pobreza, clasificados según los condados, tanto en Texas
como en California. Determinar el resumen de 5 números para cada estado. Haz comentarios
sobre cómo se esparcen los datos de cada distribución.

4. El resumen de 5 números para la temperatura diaria promedio en Atlantic City, NJ


(expresada en F) es 31, 39, 52, 68, 76. Dibuja el diagrama de caja y bigotes para estos datos
y utilízalo para determinar cuáles de los siguientes datos sería considerado como un outlier si
fuese incluido dentro de los datos.
• La temperatura alta récord de enero: 78
• La temperatura baja récord de enero: −8
• La temperatura alta récord de abril: 94
• La temperatura alta récord de todos los tiempos: 106
• NOTA: ESTA ACTIVIDAD SE DEBE SUSTENTAR

3. MEDIDAS DE FORMA

Proporcionan un valor numérico para saber hacia qué lado de la distribución hay mayor acumulación
de frecuencias y si la concentración central de frecuencias es mayor que en los extremos o viceversa
sin tener que graficar los datos.
Momento Respecto de la Media: El r-ésimo momento respecto a la media aritmética es:
El primer momento respecto a la media (r=1) siempre es igual a cero.
El segundo momento respecto a la media (r=2) es la varianza poblacional.
Sesgo: Es el grado de asimetría que tiene la distribución. La distribución puede ser:

- Insesgada: Si tiene forma de campana y el área acumulada del centro de la distribución a la


derecha es igual a la que se acumula a la izquierda.

Moda=Mediana=Media
Insesgada

- Con sesgo positivo o a la derecha: Si tiene la mayor acumulación de frecuencias a la izquierda y


una cola larga a la derecha.

Sesgo Positivo (a la derecha)


Moda

Mediana
Media

11
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

- Con sesgo negativo o a la izquierda: Si la mayor acumulación está a la derecha y tiene una cola
larga a la izquierda.

Sesgo Negativo (a la izquierda)


Moda
Mediana

Media

Coeficiente Momento de Sesgo (a3): se calcula dividiendo el tercer momento respecto a la media
entre la desviación estándar al cubo:
Curtosis: Mide qué tan puntiaguda es una distribución, con respecto a la Normal.
La distribución puede ser:
Mesocúrtica: solo la distribución Normal (es el término medio).
Leptocúrticas: Las distribuciones más puntiagudas que la Normal.
Platocúrticas: Las distribuciones menos puntiagudas que la Normal.

Coeficiente momento de curtosis (a4): se calcula dividiendo el cuarto momento respecto a la media
entre la varianza al cuadrado (o la desviación estándar a la cuarta).
Datos No Agrupados:

ACTIVIDAD COMPLEMENTARIA N°4. FECHA DE ENTREGA: ___________________

Calcule e interprete la asimetría y curtosis

NOTA: ESTA ACTIVIDAD SE DEBE SUSTENTAR

MEDIDAS DE CONCENTRACIÓN

En una distribución, ni la media ni la varianza son explicativas de la mayor o menor igualdad en el


reparto; para esto usamos las medidas de concentración.

12
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

Consideremos que la variable en cuestión es el salario. Una distribución muy concentrada indica que
pocos individuos reciben la mayor parte del total, mientras que poca concentración supone que todos
los individuos tienen un reparto igualitario.

Indice de Gini:

Donde: k = número de clases o categorías pi = la proporción


acumulada de individuos = fni 100= fra x 100 qi = la proporción
acumulada del total del producto de fi*xi

Si Ig=0, la variable está menos concentrada (mejor repartida).

Si Ig=1, la variable está más concentrada (peor repartida).

Curva de Lorenz:

Se grafican los valores de la proporción acumulada de individuos (p) y la proporción acumulada del
total de la variable (q).

La función identidad representa la igualdad absoluta, es decir, a la variable cuando no está


concentrada (la recta a 45 grados). La desigualdad absoluta o máxima concentración de la variable
indicaría que un solo individuo tenga el total de la variable (el triángulo inferior).

Cuanto más se acerque la Curva de Lorenz a la diagonal, más igualitario será el reparto (Ig =
0). Cuanto más se acerque la Curva de Lorenz al triángulo inferior, más concentrada esta la
variable (Ig = 1).
q

El Índice de Gini calcula el área entre la diagonal y la Curva de Lorenz, como un porcentaje del área
del triángulo inferior de la gráfica (mide la desigualdad relativa).

ACTIVIDAD DE LÁPIZ Y PAPEL N° 4

La información que se presenta a continuación representa el salario de los 300 empleados de una
empresa y nos interesa saber la concentración de los datos.

Salario Mensual No. de Marca de F*x Fra = H Q P-Q


(en miles) empleados clase P

8 - 10 190 9 1710 63.33 58.163 58.16 5.17

10 - 12 100 11 1100 96.67 37.42 95.58 1.09

12 - 14 10 13 130 100.00 4.42 100.00 0

Como podemos observar el resultado refleja que no hay mucha concentración de los datos, es decir,
los datos se encuentran bien distribuidos.

13
SEGUNDO PERIODO
COLEGIO CAMPESTRE PADRE ARTURO 11° ESTADÍSTICA

ACTIVIDAD COMPLEMENTARIA N° 5 FECHA DE ENTREGA: _______________________

1. Calcular todas las medidas de dispersión para la siguiente distribución

Xi 5 10 15 20 25

ni 3 7 5 3 2

2. Calcular todas las medidas de dispersión para los datos de la siguiente distribución

x 0–100 100–200 200–300 300-800

n 90 140 150 120

3. Una empresa de fabricación de productos cerámicos dispone de tres centros de producción.


En el centro A, el más grande y moderno, se hace un estudio de los m² de azulejo producidos
al mes durante el año pasado, obteniéndose una media de producción mensual xA 250.000
m², con una desviación típica SA = 15.000 m² . Se sabe que el centro B, por tener maquinaria
más anticuada que A, produce cada mes un tercio de la producción de A, y que el centro C,
por tener un horno menos que B, produce cada mes 25.000 m² menos que B ¿Cuál es la
media y la varianza de la producción mensual de C?
4. Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar
que ambos conjuntos de números tienen la misma desviación típica pero diferentes medias
¿cómo están relacionadas las medias?
NOTA: ESTA ACTIVIDAD SE DEBE SUSTENTAR

RECURSOS: Tablero, marcadores, borrador cuaderno sala de Sistema, fotocopias adicionales,


carpeta de fórmulas, videos, etc.

EVALUACION
• Desarrollo de las guías de trabajo
• Trabajos en clase y fuera de ella, con situaciones problemitas de contexto real
• Participación en clase
• Desarrollo del taller de aprendizaje
• Observación directa de los estudiantes en su desempeño en clase
• Simulaciones
• Quiz

BIBLIOGRAFIA:
• Norma Matemáticas Para Pensar/Grupo Editorial Norma 11°/2014
• Guía Del Docente/Glifos 11°/2013
• Hacia la Matemática/Un Enfoque Estructurado/ Yu Takeuchi”/Universidad Nacional
Estadística /Departamento De Matemáticas/Jesús Hernando Pérez/ Universidad Nacional
• Estadística Y Muestreo/Ciro Jiménez/Editorial Pearson/2015
WEBGRAFÍA
• https://www.ck12.org/section/Diagramas-de-Caja-y-Bigotes/
http://www.estadisticaparatodos.es/taller/graficas/cajas.html

14

También podría gustarte