Estadistica Descriptiva: Estadística

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 95

Estadística.

ESTADISTICA
DESCRIPTIVA

Suitberto Cabrera García.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
1

ELECTRONICOS
ELECTRONICOS2023
2018
Estadística Descriptiva.
1. Introducción.
2. Población y Muestra.
3. Distribuciones de frecuencias. Descripción de datos mediante
tablas.
4. Representaciones gráficas.
4.1. Diagrama de barras.
4.2. Diagrama de sectores.
4.4. Diagrama de Pareto.
4.4. Histograma y Polígono de frecuencias.
4.5. Series temporales.
5. Medidas que caracterizan una distribución de frecuencias.
5.1. Medidas de posición.
5.2. Medidas de dispersión.
5.3. Parámetros de simetría y curtosis.
6. Diagrama de Box and whisker
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
2

ELECTRONICOS
ELECTRONICOS2023
2018
1. Introducción

La estadística tiene un doble objetivo:

La generación y recopilación de datos


que contengan información relevante
sobre un problema determinado

El análisis de los datos con el fin de


extraer de ellos dicha información

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
3

ELECTRONICOS
ELECTRONICOS2023
2018
1. Introducción

El primer paso en el análisis de un conjunto de datos ha de ser


siempre un sencillo tratamiento descriptivo de éstos, es decir:
características y regularidades que hay en los datos y
sintetizarlos:
- parámetros
- representaciones gráficas

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
4

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra.

Población:

conjunto de todos los individuos que constituyen el objeto de


un determinado estudio, y de los cuales se quieren obtener
ciertas conclusiones

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
5

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

Ejemplos:
 en un estudio sobre la intención del voto de los ciudadanos
españoles, la POBLACIÓN es el conjunto de los españoles con
derecho a voto

 en un estudio sobre el desarrollo de la tristeza de los cítricos en


la Comunidad Valenciana, la POBLACIÓN estará formada por
la totalidad de árboles de cítricos de esta comunidad

 al realizar en una industria el control de calidad en recepción


de una partida de piezas, la POBLACIÓN estará constituida por
la totalidad de las piezas que componen la partida
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
6

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

Está formada por individuos de naturaleza muy diversa:


- personas
- árboles
- piezas ...

A veces, los individuos tienen una existencia real, previa a la


realización del estudio; pero otras veces, los individuos que
constituyen la población pueden generarse por medio de la
realización de un determinado proceso , como recibir una
pieza. Estos procesos, que en sucesivas realizaciones pueden
generar los diferentes individuos de la población, se llaman
EXPERIMENTOS ALEATORIOS.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
7

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

MUY IMPORTANTE

En toda población real hay VARIABILIDAD

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
8

ELECTRONICOS
ELECTRONICOS2022
2018
2. Población y Muestra

Cualquier característica que pueda constatarse en cada


individuo de una población se denomina CARACTERÍSTICA
ALEATORIA.

Muchas características aleatorias se expresan numéricamente,


este tipo de características aleatorias se llaman VARIABLES
ALEATORIAS
Cuando una característica aleatoria es de tipo cualitativo, nada
nos impede codificar numéricamente las diferentes alternativas
y tratarla como una variable aleatoria.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
9

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

Las caracteristicas pueden ser de tres tipos:

1.- Cualitativas.- expresan una cualidad del objeto, correcto,


incorrecto, blanco, negro, etc. Sus distintos valores se
denominan modalidades.
2.- Cuantitativas discreta.- expresan algo que se puede
contar y solo pueden tomar un conjunto de valores aislados:
números de defectos de una pieza, número de terminales,
número de accidentes en una semana, etc.
3.- Cuantitativas continuas.- expresan algo que podemos
medir y puede tomar cualquier valor en un intervalo: diámetro
de un eje, el tiempo en que tarda una transacción en ejecutarse,
etc.
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
10

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

Las variable aleatorias pueden catalogarse por su


dimensión como unideminsionales y K- dimensionales.

Es importante darse cuenta de la diferencia entre una


variable aleatoria K-dimensional, en la que las K variables
se miden sobre los individuos de una única población, y un
conjunto de K variables aleatorias unidimensionales,
definidas sobre K poblaciones distintas

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
11

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra. Autoevaluación

 Qué sentido práctico tendría el resultado de sumar y calcular la


media de los códigos de los partidos votados por un conjunto de
individuos?
Es importante darse cuenta de la diferencia entre una variable
aleatoria K-dimensional, en la que las K variables se miden sobre
los individuos de una única población, y un conjunto de K variables
aleatorias unidimensionales, definidas sobre K poblaciones distintas.
 El contenido en zumo y calibre de las naranjas de una huerta,
¿constituyen una variable aleatoria bidimensional? ¿Y el número de
líneas de código y el número de errores en los programas preparados
por una empresa de programación? ¿Y el contenido leucocitos en la
sangre de individuos alcohólicos y no alcohólicos? ¿Y las estaturas
del marido y de la mujer en los matrimonios jóvenes de un país?

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
12

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra. Autoevaluación

 En el estudio de insecticidas se define la LD50 (Dosis Letal


50) de un producto como la dosis mínima que administrada a
ratas provoca la muerte al 50% de estas. Al estudiar la LD50
de un determinado producto: ¿cuál es la población implicada,
y cuál la variable aleatoria considerada?
 En una fabrica interesa cuantificar, para controlar el consumo
de energía (utilizada en parte en la climatización de las naves),
la relación entre el consumo diario de electricidad y la
temperatura media del día correspondiente.
Cuáles son, en el contexto anterior, la población implicada y la
variable aleatoria considerada?

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
13

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra. Autoevaluación

Muchas veces se hacen afirmaciones que, a pesar de ser


ciertas, se prestan a confusión al ser interpretadas sin una
reflexión suficiente. Supongamos que en España el 80% de
los matrimonios que se divorcian están formados por católicos,
y sólo un 5% lo están por ateos. ¿Qué podría deducirse de la
afirmación anterior? Criticar esta deducción.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
14

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra. Ejemplo.

La relación entre delincuencia y tamaño familiar ha sido


discutida por muchos autores. Para dar soporte a su idea, el
señor X facilitaba los siguientes datos relativos al número de
hermanos en las famílias de jóvenes acusados de delitos (los
datos corresponden a un cierto juzgado londinense durante un
determinado período).
Hijos en la família del delincuente Número de casos
1 5
2 8
3 11
4 14
5 16
6 18

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
15

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra. Ejemplo.

El señor X argumentaba que a partir de los datos anteriores se


entendía que al aumentar el tamaño de la familia aumentaba la
probabilidad de delincuencia.
En una réplica a las afirmaciones anteriores, el señor Y
argumentó que el señor X no había tenido en cuenta que al
aumentar el número de hijos era lógico que aumentara la
probabilidad de que al menos uno fuera delincuente (es decir,
que una familia con dos hijos tiene mayor probabilidad de que
uno sea delincuente, que con hijo, sin que ello implique que al
aumentar el tamaño de la familia aumente la probabilidad
individual de que cada hijo resulte delincuente). El señor Y
argumentó que las cifras anteriores deberían de corregirse para
tener en cuenta este sesgo dividiendo el número de casos por el
de hijos, obteniendo el siguiente resultado:
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
16

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra. Autoevaluación

Hijos en la familia del delincuente Número de casos


1 5
2 4
3 3,7
4 3,5
5 3,2
6 3

El señor Y deducía de su análisis una conclusión contraria a la


del señor X: al aumentar el número de hijos disminuía la
probabilidad individual de que cada uno de ellos resultara un
delincuente

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
17

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra. Autoevaluación

El alumno tendrá que estudiar los argumentos de los señores


X e Y y pronunciarse sintetizando su opinión e indicando, si
es necesario, la información adicional que considera necesaria
para analizar el tema.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
18

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

• En general no es posible estudiar todos los individuos de una


población:
- poblaciones infinitas
- consideraciones económicas
• En consecuencia, tomaremos la muestra: un subconjunto de
individuos
• La forma de seleccionar los individuos que han de constituir la
muestra tiene mucha importancia para obtener conclusiones
que puedan extrapolarse de forma válida a la población de la
cual procede la muestra.
• El objeto final del estudio es siempre la población, la muestra
es sólo un medio para obtener información sobre esta.
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
19

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

• La muestra ha de ser representativa de la población.


• En teoría, para garantizar la representatividad de una muestra
hay que seleccionar al azar a los individuos que la han de
componer.
- aunque esta forma de proceder raramente sea aplicable en la
práctica, siempre se han de extremar las precauciones para que
la forma real de obtener la muestra sea tan parecida com sea
posible a la ideal.
- en muchos casos es necesario un conocimiento previo sobre
la población para decidir si una muestra puede considerarse o
no representativa.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
20

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

Tipos de muestreos:
• Muestreo aleatorio simple: seleccionamos los individuos
basandonos en una tabla de números aleatorios o en un
programa generador de números aleatorios.
• Muestreo sistemático de orden k: numeramos de 1 a n los
individuos de la población, a continuación seleccionamos
aleatoriamente un número, i, entre 1 y k. Para seleccionar la
muestra de tamaño n los individuos elegidos serán:
• i, i+k, i+2k, i+3k, …….i+(n-1)k.
• Fácil de realizar, pero existe el peligro de que la existencia
de cualquier factor cíclico en la población pueda sesgar los
resultados.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
21

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

 Muestreo estratificado: los individuos de la población son


clasificados en subgrupos o estratos. A continuación en cada
subgrupo realizamos un muestreo aleatorio simple.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
22

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra. Autoevaluación

Se quiere estudiar la relación que hay entre la estatura y el


peso en la juventud española. El conjunto de los alumnos
matriculados en Estadística en 2do de la ETSID de la UPV,
¿puede considerarse una muestra representativa de la
población a efectos del estudio?

¿Este conjunto puede considerarse una muestra representativa


para estudiar las tendencias políticas de la joventud española?
¿Y para estudiar el nivel cultural?
¿Y para estudiar la característica aleatória color de los ojos?

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
23

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

 Cuando la población estudiada es real, la muestra se forma,


como hemos indicado, seleccionando de la forma más aleatória
posible un conjunto de individuos de ésta.

 Cuando se hace una muestra de una población abstracta, la


forma de obtener una muestra es haciendo un cierto número de
veces el experimento aleatorio que genera los individuos de la
población.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
24

ELECTRONICOS
ELECTRONICOS2023
2018
2. Población y Muestra

 Los valores observados por la variable aleatoria en los


individuos que forman la muestra constituyen los datos
estadísticos.
 El tratamiento de estos datos con la finalidad de poner de
manifesto sus características más relevantes y sintetizarlas en
unos pocos parámetros o mediante representaciones gráficas
adecuades es el objeto de la estadística descriptiva.
 El análisis con el fín de obtener conclusiones que, con un
margen de confianza conocido, sean extrapolables a la
población de la que procede la muestra constituye el objeto de
la inferencia estadística.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
25

ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Se denomina distribución de frecuencias al conjunto de valores


que toma una variable estadística con sus respectivas
frecuencias.
Se representan mediante tablas de frecuencias.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
26

ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Variables cualitativas TABLA DE FRECUENCIAS

Variable cualitativa o cuantitativa con pocos valores


Nº de
Nº de robots % robots
procesadores Nº de robots % robots
acumulado acumulado
funcionando

0 10 6,25% 10 6,25%

1 35 21,88% 45 28,13%

2 60 37,50% 105 65,63%

3 55 34,37% 160 100%

Total 160 100%


MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA. 27
ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Variable Cualitativa o cuantitativa con pocos valores


Otro Ejemplo: Acceso a Internet más utilizado de las Viviendas
xi ni fi
Línea telefónica convencional 1.789.513 0,20
Banda Ancha (ADSL, RDSI, Red Cable) 3.491.449 0,38
Línea ADSL 2.814.462 0,31
Línea RDSI 53.808 0,01
Red de cable 691.324 0,08
Telefonía móvil 212.785 0,02
Otras formas de conexión 68.105 0,01

Σni =
9.121.446 Σfi =1
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
28

ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Variables cuantitativas

 Podríamos emplear el mismo procedimiento


• La probabilidad de encontrar valores repetidos es muy baja
• Obtendríamos una tabla tan difícil de interpretar como los
datos originales

Solución:
Agrupar los datos en tramos o intervalos

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
29

ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Variables cuantitativas
 Se divide el campo de variabilidad en un conjunto de K
intervalos (o clases) de igual longitud, teniendo en cuenta:
 Límites de cada intervalo ( [, ], ≤, ≥)
 Valor central del intervalo
 Número de observaciones por intervalo

Problema: ¿Amplitud óptima?


¿Número de intervalos?

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
30

ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Variables cuantitativas
 Número de intervalos grande

 Tabla difícil de interpretar

 Número de intervalos pequeño

 Se puede perder información importante

Recomendable:
¡¡ Entre 5 y 15 intervalos !!

(dependiendo del número de observaciones de la muestra)


MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
31

ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Variables cuantitativas
Resistencia de carcasas plásticas de procesadores (Nw/mm2)
---------------------------------------------------------------------------------------------------------------------------------------------------
- Lower Upper Relative Cumulative Cum. Rel.
Class Limit Limit Midpoint Frequency Frequency Frequency Frequency
---------------------------------------------------------------------------------------------------------------------------------------------------
- at or below 10.00 0 .00000 0 .00000
1 10.00 15.00 12.50 0 .00000 0 .00000
2 15.00 20.00 17.50 1 .00610 1 .00610
3 20.00 25.00 22.50 9 .05488 10 .06098
4 25.00 30.00 27.50 18 .10976 28 .17073
5 30.00 35.00 32.50 26 .15854 54 .32927
6 35.00 40.00 37.50 38 .23171 92 .56098
7 40.00 45.00 42.50 34 .20732 126 .76829
8 45.00 50.00 47.50 20 .12195 146 .89024
9 50.00 55.00 52.50 9 .05488 155 .94512
10 55.00 60.00 57.50 5 .03049 160 .97561
11 60.00 65.00 62.50 0 .00000 160 .97561
12 65.00 70.00 67.50 3 .01829 163 .99390
13 70.00 75.00 72.50 1 .00610 164 1.00000
----------------------------------------------------------------------------------------------------------------------------------------------------
Mean = 39.3288 Standard Deviation = 9.46009 Median = 39.1

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
32

ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Variables cuantitativa
 Resistencia de carcasas plásticas de procesadores
-----------------------------------------------------------------------------------------------------------------------------------
- Lower Upper Relative Cumulative Cum. Rel.
Class Limit Limit Midpoint Frequency Frequency Frequency Frequency
-----------------------------------------------------------------------------------------------------------------------------------
- at or below 10.00 0 Hay 18 carcasas
.00000cuya 0 .00000
1 10.00 15.00 12.50 0 resistencia
.00000 está entre 0 .00000
2 15.00 20.00 17.50 1 25 y 30.00610
Nw/mm 2
1 .00610
3 20.00 25.00 22.50 9 .05488 10 .06098
4 25.00 30.00 27.50 18 .10976 28 .17073
Representan el 10,976%
5 30.00 35.00 32.50 26 .15854 54 .32927
de las 164 carcasas
6 35.00 40.00 37.50 38 .23171 92 .56098
estudiadas
7 40.00 45.00 42.50 34 .20732 126 .76829
8 45.00 50.00 47.50 20 .12195 146 .89024
9 50.00 55.00 52.50 9 .05488 155 .94512
10 55.00 60.00 57.50 5 .03049 160 .97561
11 60.00 65.00 62.50 0 .00000 160 .97561
12 65.00 70.00 67.50 3 .01829 163 .99390
13 70.00 75.00 72.50 1 .00610 164 1.00000
------------------------------------------------------------------------------------------------------------------------------------
-
Mean = 39.3288 Standard Deviation = 9.46009 Median = 39.1
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
33

ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Otro ejemplo Estatura: 27 intervalos


- - -- - - - - - - - - - - - -
- - - - - - - - - - --

Class
Lower
Limit
Upper
Limit Midpoint
Relative Cumulative Cum. Rel.
Frequency Frequency Frequency Frequency
Muchos intervalos:
- - - - - - - - - - - - - - - - - - - - - - - - - - --
at or below 140,0 0 0,0000 0 0,0000 Difícil de interpretar
1 140,0 142,963 141,481 0 0,0000 0 0,0000
2 142,963 145,926 144,444 0 0,0000 0 0,0000
3 145,926 148,889 147,407 0 0,0000 0 0,0000
4 148,889 151,852 150,37 0 0,0000 0 0,0000
5 151,852 154,815 153,333 1 0,0076 1 0,0076
6 154,815 157,778 156,296 3 0,0229 4 0,0305
7 157,778 160,741 159,259 8 0,0611 12 0,0916
8 160,741 163,704 162,222 12 0,0916 24 0,1832
9 163,704 166,667 165,185 11 0,0840 35 0,2672
10 166,667 169,63 168,148 10 0,0763 45 0,3435
11 169,63 172,593 171,111 14 0,1069 59 0,4504
12 172,593 175,556 174,074 28 0,2137 87 0,6641
13 175,556 178,519 177,037 9 0,0687 96 0,7328
14 178,519 181,481 180,0 14 0,1069 110 0,8397
15 181,481 184,444 182,963 6 0,0458 116 0,8855
16 184,444 187,407 185,926 9 0,0687 125 0,9542
17 187,407 190,37 188,889 1 0,0076 126 0,9618
18 190,37 193,333 191,852 2 0,0153 128 0,9771
19 193,333 196,296 194,815 2 0,0153 130 0,9924
20 196,296 199,259 197,778 1 0,0076 131 1,0000
21 199,259 202,222 200,741 0 0,0000 131 1,0000
22 202,222 205,185 203,704 0 0,0000 131 1,0000
23 205,185 208,148 206,667 0 0,0000 131 1,0000
24 208,148 211,111 209,63 0 0,0000 131 1,0000
25 211,111 214,074 212,593 0 0,0000 131 1,0000
26 214,074 217,037 215,556 0 0,0000 131 1,0000
27 217,037 220,0 218,519 0 0,0000 131 1,0000
above 220,0 0 0,0000 131 1,0000
- - - - - - - - - - - - - - - - - - - - - - - - - - --
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
34

ELECTRONICOS
ELECTRONICOS2023
2018
3. Distribuciones de Frecuencias. Descripción de datos
mediante TABLAS

Otro ejemplo Estatura: 10 intervalos


- - -- - - - - - - - - - - - - - - - - - - - - - - --
Lower Upper Relative Cumulative Cum. Rel.
Class Limit Limit Midpoint Frequency Frequency Frequency Frequency
- - - - - - - - - - - - - - - - - - - - - - - - - - --
at or below 150,0 0 0,0000 0 0,0000
1 150,0 155,0 152,5 3 0,0229 3 0,0229
2 155,0 160,0 157,5 9 0,0687 12 0,0916
3 160,0 165,0 162,5 22 0,1679 34 0,2595
4 165,0 170,0 167,5 16 0,1221 50 0,3817
5 170,0 175,0 172,5 37 0,2824 87 0,6641
6 175,0 180,0 177,5 22 0,1679 109 0,8321
7 180,0 185,0 182,5 14 0,1069 123 0,9389
8 185,0 190,0 187,5 3 0,0229 126 0,9618
9 190,0 195,0 192,5 3 0,0229 129 0,9847
10 195,0 200,0 197,5 2 0,0153 131 1,0000
above 200,0 0 0,0000 131 1,0000
- - - - - - - - - - - - - - - - - - - - - - - - - - -- Mean = 172,855
Standard deviation = 9,07585

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
35

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.1.Diagrama de barras
Es la representación gráfica de una tabla de frecuencias sin agrupar en
intervalos
Frecuencia de cada valor observado
Ejemplo: número de cilindros de 155 vehículos

MECANICA 2012
ESTADÍSTICA.DEIOAC.UPV ESTADISTICA
ESTADISTICA
ESTADISTICA.
36

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.1.Diagrama de barras

Equipamiento de las viviendas productos TIC ( % hogares)

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
37

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.2. Diagrama de tarta o sectores


 Se utiliza cuando hay pocos valores diferentes de una variable cualitativa
 La superficie total de un círculo se reparte en sectores cuyas áreas son
proporcionales a las frecuencias observadas en la muestra para cada
“valor” de la característica estudiada
 Frecuencias absolutas o relativas

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
38

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.3. Diagrama de Pareto


Aplicaciones del principio de Pareto en la empresa
• Producción: el 20% de los procesos generan el 80% de los productos,
tanto en tiempo como en cantidades.
• Ventas: el 20 % de los productos generan el 80% de las ventas
• Gestión de almacenes: el 20% de los productos representan al 80% del
coste del inventario. La mayor parte del inventario lo tenemos en una
cantidad muy pequeña de productos
• Control de calidad: el 20% de los defectos afectan al 80% de los procesos.
Muy pocos defectos tienen su mayor impacto en todos los procesos de la
empresa
• Ingeniería de software: el 80% de esfuerzo en tiempo y dinero produce el
20% del código crítico.

Al analizar diversos expertos en cada una de las áreas, nos damos cuenta que
el principio de Pareto se aplica básicamente en todos de manera muy similar.
La proporción, 80-20 no tiene por qué ser exactas.
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
39

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.3. Diagrama de Pareto

¿Por qué es importante el diagrama de Pareto, teniendo en cuenta el


principio?

1. Permite asignar un orden de prioridades

2. Muestra que de una gran cantidad de actividades, recursos o resultados


que tenemos, pocos son los que realmente son importantes. Si nos
centramos en los que son vitales, las mejoras a realizar pueden ser todavía
mucho mejores.

3. Facilita el estudio de los errores en las empresas.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
40

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.3. Diagrama de Pareto

Un diagrama de Pareto es un tipo especial de diagrama de barras donde los valores


graficados están organizados de mayor a menor valor.

El 80% de los problemas están generados por 4 causas principales, por lo que hay
que enfocar todos los esfuerzos de la empresa para solucionar esas 4 causas.
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
41

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Es la representación gráfica de una tabla de frecuencias con datos agrupados
Ejemplo: precio de 155 vehículos

El histograma es una
de las herramientas
gráficas más útiles para
resumir información
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
42

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias

 Es un diagrama de barras para variables cuantitativas continuas o


discretas con muchos valores.
 Es una representación gráfica de una tabla de frecuencias donde los datos
han sido agrupados por intervalos.
 Para cada valor o intervalo de valores de la variable (eje de abscisas) se
levanta una barra de altura proporcional a la frecuencia con que aparece
dicha variable los valores del intervalo (absoluta o relativa).
 Nº de intervalos
 regla empírica: entero cercano a n
 en general, entre 5-12 intervalos

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
43

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Es la representación gráfica de una tabla de frecuencias con datos agrupados

Ejemplo: precio de 155 vehículos

El histograma sirve para


resumir la siguiente
información:
• Concentraciones
• Huecos
• Valores atípicos
• Asimetrías
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
44

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


En un histograma, hay que fijarse en las tendencias generales de los datos:
 Concentraciones: por concentraciones nos referimos a aquellos rectángulos en los que
hay mayor proporción, alrededor de los cuales se agrupan otros rectángulos de
frecuencia decreciente. Si existe más de una concentración será indicio de que los
datos son heterogéneos y que podrían proceder de más de una población diferente.
 Huecos: que sería indicio aún mayor de que los datos proceden de poblaciones
diferentes.
 Valores atípicos, por ser demasiado altos o bajos. Un dato será atípico si se separa
mucho del patrón general que siguen los datos.
 Asimetrías: que indican hacia dónde tienden a desplazarse los datos cuando nos
alejamos de las zonas de concentración. Cuando la asimetría es tal que la cola de la
distribución de los datos apunta hacia la derecha, hacia +∞ , diremos que hay
asimetría positiva. Cuando la cola de la distribución apunta hacia la izquierda, hacia
-∞, la asimetría se denomina negativa.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
45

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Histogramas: “Normal”

v.a. : desviaciones (mm) sobre el nominal del Φ de una pieza


24

20

16
frequency

12

0
-2,8 -1,8 -0,8 0,2 1,2 2,2 3,2
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
46

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Histograma: mezcla de poblaciones

Tiempo de ejecución (ms) de 200 programas


24

20

16
frequency

12

0
0 2 4 6 8 10
T ejec
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
47

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Histograma: mezcla de poblaciones

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
48

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Histograma: mezcla de poblaciones
30

25

20
frequency

15

10

0 25
0 2 4 6 8
T ejec 20

frequency
15

10
El histograma anterior es la
superposición de estos dos 5

0
4,2 6,2 8,2 10,2 12,2
T ejec

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
49

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Histogramas: datos atípicos

40 Hay un valor, el 10, que se


separa de la mayoría de
los datos.
30
Es un dato atípico y puede
frequency

deberse a un error (o no).


20

10

0
0 2 4 6 8 10 12
T ejec
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
50

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Histograma: “acantilado” Los datos menores que 3,5
(aprox.) se han eliminado
Datos modificados artificialmente
deliberadamente 
Corte del histograma por la
24
izquierda: acantilado.
20

16
frequenc

12
y

0
2,8 3,8 4,8 5,8 6,8 7,8
T ejec
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
51

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Histograma: asimetría

Distribución de frecuencias simétrica

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
52

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Histograma: asimetría

Asimetría a la derecha o positiva Asimetría a la izquierda o negativa

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
53

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias

 Un polígono de frecuencias es un gráfico lineal que se obtiene uniendo los


puntos medios de la base superior de cada rectángulo de un diagrama de barras
o bien el punto medio de las bases superiores de un histograma.

 Dependiendo de cada conjunto de datos, el polígono de frecuencias nos puede


ayudar mejor que el histograma a hacernos una idea de cómo son los datos, sobre
todo si tenemos un tamaño muestral grande.

 Al igual que con los histogramas, tendremos cuatro tipos de polígonos de


frecuencias, según que los datos que representemos correspondan a:
− la frecuencia absoluta,
− frecuencia relativa,
− frecuencia absoluta acumulada y
− frecuencia relativa acumulada.
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
54

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias


Es la representación gráfica de una tabla de frecuencias con datos agrupados

Ejemplo: precio de 155 vehículos

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
55

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.4. Histograma y polígono de frecuencias

MECANICA 2012
ESTADÍSTICA.DEIOAC.UPV ESTADISTICA
ESTADISTICA
ESTADISTICA.
56

ELECTRONICOS
ELECTRONICOS2023
2018
4. Representaciones gráficas

4.5. Series temporales


El eje X es el tiempo. Representa la evolución temporal de la variable

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
57

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS características de una variable

• Ahora buscamos medidas que mediante un solo número


resuman alguna característica importante de los datos, a
las que llamaremos medidas características

• Resumir toda la información de nuestra muestra en un


solo número puede ser muy arriesgado

• El uso de estas medidas características ha de hacerse


siempre acompañando a herramientas gráficas

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
58

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

 Objetivo: buscamos resumir las características más


importantes de los datos en un conjunto reducido de
números.
 Cada característica un número

 La pauta de variabilidad de una variable aleatoria unidimensional se


caracteriza por tres tipos de parámetros:

 La Posición de las observaciones


 La Dispersión de las observaciones
 La Forma de las observaciones

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
59

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Posición y Dispersión

-∞ -200 0 300 +∞

Puntos alrededor de Puntos alrededor Puntos alrededor


-200: posición 1 del 0: posición 2 de 300: posición 3

-∞ 0 +∞

Puntos alrededor del 0: posición 2, pero los


puntos (valores) están más alejados unos de
otros: distinta dispersión

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
60

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Parámetros de posición
− ¿Cuál es el centro de los datos?
− Permiten cuantificar, mediante un número, la posición de las observaciones.
− Dan una idea de la magnitud de la variable.
− Con un número nos indican “alrededor” de qué valor están las observaciones
(que obviamente se supone que son cuantitativas).
− Medidas de posición centrales más relevantes:
MEDIA ARITMÉTICA
 MEDIANA
 MODA
− Medidas de posición NO centrales más relevantes:
 PERCENTILES
 CUARTILES
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
61

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición centrales: MEDIA ARITMÉTICA* * Promedio


(Statgraphics)
Sea un conjunto de observaciones x1, x2, …, xn

Si hay J valores diferentes que se repiten (variable discreta):

x1, se repite n1 veces


x2, se repite n2 veces

xJ, se repite nJ veces

Donde fr(xj) es la frecuencia relativa del valor xj:

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
62

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición centrales: MEDIA ARITMÉTICA

Puede interpretarse como el centro de gravedad de los datos

Por ejemplo, en un histograma, es el punto de apoyo para que esté en


equilibrio

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
63

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición centrales: MEDIA ARITMÉTICA

Si la distribución es asimétrica, el centro de gravedad se verá


desplazado respecto a la clase más frecuente:

← →

Cuanto más asimétrica sea la distribución, más se desplazará la media


hacia la cola
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
64

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición centrales: MEDIA ARITMÉTICA


Es muy sensible a valores atípicos

Media

Media
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
65

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición centrales: MEDIANA


− Es una medida basada en el orden de las observaciones (no en sumas)
− Es el valor que deja a cada lado el 50% de los datos
− Es poco sensible a asimetrías
− Es insensible a valores atípicos (medida robusta)

3, 5, 6, 9, 12, 24, 27, 31, 33 9 datos


Mediana

Con un número impar de datos: el dato en posición central

3, 5, 6, 9, 12, 24, 27, 31, 33, 34 10 datos


Mediana = (12+24)/2 = 18
Con un número par de datos: la media de los dos datos centrales
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
66

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición centrales: MEDIANA


Sea X la variable de la que se observan 10 valores, ordenados de menor a mayor,
{3, 5, 6, 9, 12, 24, 27, 31, 33, 34}

Al ser un número par de valores la mediana será:

mientras que la media es

La mediana, al contrario que la media, no es sensible a que alguna observación


tenga un valor atípico. Por ejemplo, si el valor más alto fuese 340 en lugar de 34 se
tendría que la mediana seguiría manteniendo su valor, sin embargo la media
aumentaría a

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
67

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición centrales: MEDIANA

• Los valores atípicos no alteran


la posición de la mediana

• Con valores atípicos y


asimetrías fuertes, la mediana
es una medida de centralidad
Media=Mediana más útil que la media

Media

Mediana
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
68

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición centrales: MODA


Es el valor más frecuente

1 2 2 2 2 5 5 5 8 8 11 13
Moda

• Con datos agrupados, es la clase más frecuente.


• Puede haber varias, sugiriendo la posible existencia de varios grupos
• También es frecuente usar el término moda a cualquiera de los
máximos relativos de un histograma

Distribución unimodal Distribución bimodal Distribución trimodal

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
69

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición centrales: MODA

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
70

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición NO centrales: PERCENTILES


Los percentiles son valores de los datos correspondientes al 1%, al 2%... y al
99% de los datos

Dado un conjunto de datos, el valor m es el percentil p, si el p x100% de los


datos son menores o iguales a m.

Ejemplo: Si un estudiante que mide 1,69 m tiene una altura que es el


percentil 30 de su clase, quiere decir que el 30% de sus compañeros mide
menos de 1,69 m

Ejemplo: Obtener los


percentiles 20 y 80 del
siguiente gráfico:

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
71

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición NO centrales: CUARTILES


Q1, Q2, Q3: Son los valores que dividen la muestra en 4 grupos, cada uno
con el 25% de los datos (aproximadamente)
• Entre el mínimo y Q1 25% de los datos
• Entre Q1 y Q2 25% de los datos 50%
• Entre Q2 y Q3 25% de los datos
50%
• Entre Q3 y el máximo 25% de los datos

Q1 = percentil 25; Q2 = mediana; Q3 = percentil 75 • Q1: cuartil inferior


• Q3: cuartil superior
Q3-Q1 = Rango Intercuartílico (RI) (Statgraphics)
25% 25% 25% 25%
Hay varios métodos para
calcular Q1 y Q3. Con
pocos datos pueden dar
valores diferentes

MECANICA 2012
ESTADÍSTICA.DEIOAC.UPV ESTADISTICA
ESTADISTICA
ESTADISTICA. 67
72
min Q1 Q2 Q3 max ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Medidas de posición NO centrales: CUARTILES


Método sencillo para calcular cuartiles: X:{1, 1, 3, 3, 5, 9, 11, 14, 15} ; n=9

1. Obtener la mediana Q2 5

2. Excluimos ese valor y nos


quedamos con dos grupos de izda.: {1, 1, 3, 3}
datos, uno a cada lado de la dcha.: {9, 11, 14, 15}
mediana

3. Q1 es la mediana del grupo


Q1 = (1+3)/2 = 2
que queda a la izquierda

4. Q3 es la mediana del grupo


Q3 = (11+14)/2 = 12.5
que queda a la derecha

MECANICA 2012
ESTADÍSTICA.DEIOAC.UPV ESTADISTICA
ESTADISTICA
ESTADISTICA. 68
73

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Los parámetros de posición no permiten describir totalmente como es


un conjunto de datos

Parámetros de DISPERSIÓN:

 VARIANZA (DESVIACIÓN TÍPICA)


 CUASIVARIANZA (CUASIDESVIACIÓN TÍPICA)
 RANGO
 RANGO INTERCUARTÍLICO
 COEFICIENTE DE VARIACIÓN

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
74

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Parámetros de dispersión:
• Varianza • Desviación Típica

s2n sn

• Son sensibles a los valores extremos y asimetrías

• Cuasivarianza* • Cuasidesviación típica**

s2 = s2n-1 s = sn-1

* Varianza ** Desviación estándar


(Statgraphics) (Statgraphics)
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
75

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Parámetros de dispersión:

• Rango o recorrido
También llamado recorrido. El rango es la amplitud de los datos, es
decir

• Es sensible a los valores extremos y asimetrías


• Se suele usar con muestras pequeñas

• Rango Intercuartílico
• Diferencia entre el tercer y el primer cuartil.
𝑅𝑅𝐼𝐼 = 𝑄𝑄3 – 𝑄𝑄1
• Es robusto a los valores extremos y asimetrías

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
76

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Parámetros de dispersión:

La varianza y la desviación típica dependen de las unidades de la


variable X.

El Coeficiente de Variación se utiliza para comparar dispersiones


de variables que tengan unidades distintas

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
77

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Parámetro de posición y parámetro de dispersión UTILES según el tipo de


distribución de frecuencias:

Distribución de frecuencias simétrica Distribución de frecuencias asimétrica


Parámetro de posición: Media aritmética Parámetro de posición: Mediana
Parámetro de dispersión: Parámetro de dispersión:
Cuasi-varianza/Cuasi-desviación típioca Recorrido intercuartílico
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
78

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Parámetros de forma: Permiten comprobar si nuestros datos se parecen


lo suficiente a un campana de Gauss (distribución Normal)

Coeficiente de ASIMETRÍA (Skewness - mide asimetría)

CA = 0; distribución simétrica

CA > 0; si hay asimetría positiva

(adimensional) CA < 0; si hay asimetría negativa


* * Sesgo Estandarizado
(Statgraphics)
𝐶𝐶𝐴𝐴
𝐂𝐂𝐀𝐀𝐄𝐄 =
6◌ൗ
𝑛𝑛
MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
79

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Parámetros de forma:

Coeficiente de ASIMETRÍA Estandarizado (CAE):

CAE ∈ [-2, 2] CAE > 2


mediana mediana media
media

CAE < -2

media mediana

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
80

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Parámetros de forma:

Coeficiente de CURTOSIS (Kurtosis - mide apuntamiento)

CC = 3; distribución simétrica

CC CC > 3; si hay asimetría positiva

(adimensional)
CC < 3; si hay asimetría negativa

*
* Curtosis Esta ndarizada
(Statgraph ics)

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
81

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS que caracterizan una distribución de
frecuencias.

Ejemplo:

Histogram
40
CA = 0,878671
30 CA-estandarizado = 3,38412
frequency

20
CC = 0,979509
CC-estandarizado = 1,88624
10
CA-estandarizado > 2 Asimetría positiva
0
160 170 180 190 200
CC-estandarizado∈ [-2, 2] Datos normales
ESTATURA

No Distribución Normal

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
82

ELECTRONICOS
ELECTRONICOS2023
2018
6. Diagrama de Caja-Bigotes

• Al conjunto de los tres cuartiles junto con el mínimo y el máximo de los


datos se le suele denominar el resumen de las 5 cifras (mínimo, Q1, Q2,
Q3, máximo).
• El diagrama de la caja, o box-plot, es precisamente la representación
gráfica del resumen de las 5 cifras.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
83

ELECTRONICOS
ELECTRONICOS2023
2018
6. Diagrama de Caja-Bigotes

Para construir un diagrama Box&Whisker:


Recorrido intercuartílico
Primer paso

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
84

ELECTRONICOS
ELECTRONICOS2023
2018
5. MEDIDAS características de una variable

Recorrido intercuartílico
Segundo paso

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
85

ELECTRONICOS
ELECTRONICOS2023
2018
6. Diagrama de Caja-Bigotes

Tercer paso

Las líneas (bigotes) se extienden solo hasta el último punto dentro de los límites

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
86

ELECTRONICOS
ELECTRONICOS2023
2018
6. Diagrama de Caja-Bigotes

Tercer paso

Los puntos que caigan fuera de los límites se marcan como datos atípicos

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
87

ELECTRONICOS
ELECTRONICOS2023
2018
6. Diagrama de Caja-Bigotes

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
88

ELECTRONICOS
ELECTRONICOS2023
2018
6. Diagrama de Caja-Bigotes

Los gráficos Box&Whisker son muy útiles para:


• Comparar grupos
• Ver asimetrías
• Detectar datos atípicos

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
89

ELECTRONICOS
ELECTRONICOS2023
2018
6. Diagrama de Caja-Bigotes

Ojo!! Cuando hay asimetría, un Dato atípico: dato que se sale del
dato extremo no debe patrón general de los datos
necesariamente catalogarse
como atípico

La asimetría indica que al final de


la cola habrá cada vez menos
datos

No es atípico.
Es compatible con el patrón de los datos

MECANICA 2012 90
ESTADISTICA
ESTADISTICA.
ELECTRONICOS 2018
6. Diagrama de Caja-Bigotes

Sí es atípico

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
91

ELECTRONICOS
ELECTRONICOS2023
2018
6. Diagrama de Caja-Bigotes

Relación entre histograma y diagrama caja- bigote

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
92

ELECTRONICOS
ELECTRONICOS2023
2018
Fuentes:
1.-Métodos estadísticos en Ingeniería. Rafael Romero Villafranca y Luisa Rosa
Zuñica Ramajo. Editorial UPV. Ref.: 2005.637.
2.-Material docente S. Cabrera.
3.-Material docente asignaturas de estadística de la Universidad Carlos III.
4.-Material docente de P. Tormos, A. Lova, S. Vidal, E. Vázquez (DEIOAC - UPV).
5.-Material docente profesores estadística ETSID UPV.

Esta obra está bajo una licencia Reconocimiento-No comercial-Compartir bajo la


misma licencia 2.5 España de Creative Commons. Para ver una copia de esta
licencia, visite http://creativecommons.org/licenses/by-nc-sa/2.5/es/

MECANICA 2012
91 ESTADISTICA
ESTADISTICA
ESTADISTICA.
93

ELECTRONICOS
ELECTRONICOS2023
2018
Estadística.

ESTADISTICA DESCRIPTIVA

GRACIAS

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
94

ELECTRONICOS
ELECTRONICOS2023
2018
Estadística.

ESTADISTICA
DESCRIPTIVA

Suitberto Cabrera García.

MECANICA 2012
ESTADISTICA
ESTADISTICA
ESTADISTICA.
95

ELECTRONICOS
ELECTRONICOS2023
2018

También podría gustarte