Estadistica Descriptiva

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 20

INSTITUTO TECNOLOGICO SUPERIOR

DE PEROTE

JESSICA ALEXANDRA MORALES GONZÁLEZ

ING. INDUSTRIAL

No. DE CONTROL. 19020051

L.C.A. RAFAEL GREGORIO HERNANDEZ

PROBABILIDAD Y ESTADISTICA

FECHA: 29 DE ENERO DEL 2020


INDICE

INTRODUCCIÓN, NOTACIÓN SUMATORIA……………………………………… 2

1.2 DATOS NO AGRUPADOS………………………………………………………. 3

1.2.1 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN. ……………….. 4


Media aritmética. ……………………………………………………………………… 4
Media ponderada. ………………………………………………………………….…. 5
Media armónica. …………………………………………………………………….… 6
Media geométrica. ………………………………………………………………….… 6

1.2.2 MEDIDAS DE DISPERSIÓN. ………………………………………………… 7


Varianza. …………………………………………………………………………….… 7
Desviación Estándar. …………………………………………………………….….. 8

1.3 DATOS AGRUPADOS. ……………………………………………………….… 8


Media Aritmética. ………………………………………………………………….…. 9
Moda. ……….…………………………………………………………………………. 9
Mediana. ……….……………………………………………………………………… 9
Percentil………………………………………………………………………………..
11
Cuartiles………………………………………………………………………………..
12

1.3.1 TABLA DE FRECUENCIA…………………………………………………….


13

1
Tallo de Hojas………………………………………………………………………….
13
Histograma……………………………………………………………………………..
15
Conclusión…………………………………………………………………………….. 18

ESTADÍSTICA DESCRIPTIVA

1.1 INTRODUCCIÓN, NOTACIÓN SUMATORIA.

Introducción.

En los siguientes temas se dara a conocer lo mas importante de cada uno


de los temas, contando cada uno con ejemplos para asi ser mas entendible cada
tema.
La estadística descriptiva se ocupa de la organización y resumen de datos
estadísticos.
Esto incluye el cálculo y la interpretación de medidas numéricas como la
media, la mediana y la desviación estándar, al igual que la elaboración y empleo
de representaciones gráficas, como las distribuciones de frecuencia.

“ESTADÍSTICA: Es el arte de reunir, analizar, presentar e interpretar datos.

La estadística se divide en tres ramas:

Estadística descriptiva

2
ESTADÍSTICA Teoría de probabilidad

Estadística inferencial

1.2 DATOS NO AGRUPADOS.

Cuando los datos estadísticos se recolectan, estos se encuentran


desordenados y por tanto deberán ser asociados de tal forma que puedan
interpretarse.
Los datos estadísticos se van a identificar en dos formas, como población y como
muestra.

POBLACIÓN: El conjunto de todos los elementos de interés en


determinado estudio.1
MUESTRA: Un subconjunto de la población.

Con lo anterior se va a clasificar la forma de medir los datos:

Medidas de Media de la Población.


tendencia
central
Varianza.
Población
Medidas de Desviación Estándar.
dispersión
Error estándar.
1

3
Datos
Estadísticos
Medidas de Media de la muestra.
tendencia
central

Muestra Varianza de la muestra.

Medidas de Desviación estándar de la


dispersión muestra.

Error estándar de la muestra.

1.2.1 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN.

Media aritmética.

La media aritmética también llamada media de la muestra, esperanza


matemática o tan conocida por todos como promedio: esta es la suma de los
datos y dividida entre la cantidad de datos que se estén sumando. 2 La fórmula de
esta es:

Para la Población:

4
Para la Muestra:

EJEMPLO:
Se tienen las siguientes calificaciones de alumnos, obtenga la media aritmética:

Matemáticas Física Dibujo Ética Taller de H. Fundamentos de investigación.


70 71 85 95 90 83

La media aritmética es: 82.33


NOTA: Ya sea media de la población y media de la muestra, el procedimiento
sigue siendo el mismo para obtener el resultado.

Media ponderada.

La media ponderada es muy similar a la anterior con la diferencia de que se


maneja un grado de importancia o ponderación para cada dato. 3 La fórmula es la
siguiente:

En este caso w es la ponderación i-èsima. Que se le aplica a cada dato.


EJEMPLO:

5
Con las siguientes calificaciones obtenga un promedio ponderado:

Media armónica.

Esta se define como n divida entre la suma de los recíprocos de los n s; o


n.4

Bien: La media armónica tiene una utilidad limitada, pero es adecuada.

Ejemplo:
Si un avión vuela 100 millas a 300 millas/hora y las siguientes 100 millas a 600
Millas/hora.

Ha recorrido 400 millas/hora en promedio

Media geométrica.

Se aplica a un conjunto de n s positivos y es la raíz n-ésima de su producto.


Si todos los s son iguales, la media geométrica es igual a la media aritmética;
pero, en caso contrario, la media geométrica es siempre menor que la aritmética.5
4
5

6
La fórmula es:

Ejemplo:

Obtenga la media geométrica de las siguientes calificaciones:


Examen (n) Calificación (x,)
No. 1 80
No. 2 90
Final 96

1.2.2 MEDIDAS DE DISPERSIÓN.

Varianza.

La varianza o también conocida como variancia, es la desviación promedio


de valores obtenidos a partir de la media, elevada al cuadrado y calculada
mediante n-1 en lugar de n.6 Las fórmulas que se emplean son las siguientes:

7
Para la Población: ó

Para la Muestra: ó
Desviación Estándar.

La desviación estándar de un conjunto de s se define como la raíz


cuadrada positiva de la variancia.7
Es simplemente la raíz cuadrada positiva de la variancia. De este modo si la
variancia es 81, la desviación estándar es 9; si la variancia es √10, la desviación
estándar es √10= 3.16. Para obtener la desviación estándar, se debe calcular la
variancia y hallar su raíz cuadrada.

Las fórmulas para la desviación estándar son:

S=
√ ∑ ( x i −x )2
n−1

Como se hizo anteriormente, sustituir (n-1) por n las convierte en fórmulas para
calcular la desviación estándar de la población.

1.3 DATOS AGRUPADOS.

8
Las medidas fundamentales en lo que a datos agrupados se refieren, son
las mismas que para los pequeños conjuntos de datos, principalmente la media,
mediana y moda como medidas de tendencia central y la desviación estándar,
variancia y amplitud de variación como medidas de dispersión.

Media Aritmética.

La media aritmética es lo que viene a la mente de las personas cuando se


menciona la palabra “promedio”. Como este término tiene ciertas características
matemáticas deseables, es la más importante de las tres medidas.
La media aritmética se calcula al sumar los valores de un conjunto y al
8
dividir el producto de esta suma entre el de valores del mismo.

70+80+ 120 270


= =90
Ejemplo: 3 3

Mo
da.

Es el valor que con más frecuencia se presenta en un conjunto. 9

Ejemplo:
En el conjunto 10, 10, 8, 6 y 10, el 10 se presenta tres veces en tanto que uno de
los otros valores, solo una vez. El valor más frecuente, la moda, es 10.

Mediana.

Es el valor intermedio, cuando los valores de los datos se ordenan en forma


ascendente. Si hay una cantidad impar de elementos, la mediana es el valor del
8
9

9
elemento intermedio, cuando todos los elementos están ordenados de manera
ascendente.
Si hay una cantidad par de elementos, la mediana es el valor promedio de
los dos elementos intermedios, cuando todos se ordenan en forma ascendente.10

Ejemplo:

Sueldos mensuales iniciales para una muestra de 12 egresados de una escuela


de administración.

Egresado Sueldo Egresado Sueldo


mensual ($) mensual ($)

1 2350 7 2390
2 2450 8 2630
3 2550 9 2440
4 2380 10 2825
5 2255 11 2420
6 2210 12 2380

Al disponer los cinco valores de datos en orden ascendente, se obtiene la


siguiente lista ordenada.
32 42 46 46 54

Como n = 5 es impar, la mediana es el elemento intermedio de la lista ordenada.


Así, la mediana del tamaño de clase es 46 alumnos. Aun cuando hay dos valores
46, cada uno se maneja como artículo.

10

10
Calculemos la mediana del salario inicial de los egresados de la escuela de
administración. Ordenamos los 12 elementos de la tabla

2210 2255 2350 2280 2380 2390 2420 2440 2450 2550 2630
2825

Dos valores intermedios

Como n = 12 es par, identificamos los dos elementos intermedios. La mediana es


la media de esos dos valores.

2390+2420
Mediana= =2405
2

Percentil.

El p-ésimo percentil es un valor tal que por lo menos un p por ciento de los
elementos tienen dicho valor o menos y. al menos, un (100—p) por ciento de los
elementos tienen este valor o más.11

Para calcular el p-ésimo percentil se aplica el siguiente método.

Paso 1. Ordenar los datos de manera ascendente.

Paso 2. Calcular un índice i

11

11
i =
(100P ) n

En donde:
p es el percentil de interés
n es la cantidad de elementos.

Paso 3.
(a) Si i no es entero, se redondea. El valor entero inmediato mayor que i
indica la posición del p-ésimo percentil.
(b) Si i seis entero, el p-ésimo percentil es el promedio de los valores de
los datos ubicados en los lugares i e i + 1.

Como ejemplo de este procedimiento, determinemos el 85o percentil de los


datos de salario inicial en la tabla

Paso 1. Disponer los 12 valores de los datos en orden ascendente.

2210 2255 2350 2380 2380 2390 2420 2440 2450 2550 2630
2825

Paso 2.

i= (100P ) n=(85100 )12=10 .2


Paso 3. Como i no es entera, redondeamos. El lugar del 85o percentil es el
siguiente entero mayor que 10.2, o sea el lugar 11.

Regresando a los datos, vemos que el 85o percentil corresponde al 1 lo


lugar en los datos, que es 2630.

12
Cuartiles.

La mediana (ya sea de una población o de una muestra) divide los datos en
dos partes iguales. También es posible dividir los datos en más de dos partes.
Cuando se divide un conjunto ordenado de datasen cuatro partes iguales, los
puntos de división se conocen como cuartiles12.

El primer cuartil o cuartil inferior, q1, es un valor que tiene aproximadamente


la cuarta parte (25%) de las observaciones por debajo de él, y el 75% restante,
por encima de él. El segundo cuartil, q2, tiene aproximadamente la mitad (50%)
de las observaciones por debajo de él. Es segundo cuartil es exactamente igual a
la mediana. El tercer cuartil, o cuartil superior, q3, tiene aproximadamente las tres
cuartas partes (75%) de las observaciones por debajo de él. Al igual que en el
caso de la mediana, es posible que los cuartiles no sean únicos. Por simplicidad,
si más de una observación satisface la definición de un cuartil, entonces se utiliza
el promedio de ellas como cuartil.

1.3.1 TABLA DE FRECUENCIA.

Tallo de Hojas.

Las técnicas del análisis exploratorio de datos consisten en operaciones


aritméticas sencillas y representaciones fáciles de trazar, que pueden emplearse
para resumir con rapidez los datos. 13
Sin embargo, hay una que se llama diagrama de tallo y hojas, que todavía
se usa mucho para mostrar tanto el orden de rangos como La forma de un
conjunto de datos, en forma simultánea.

Ejemplo:

12
13

13
La información es resultado de un examen de aptitudes de 150 preguntas,
aplicado a 50 personas durante un proceso de selección de personal en Haskens
Manufacturíng. Los datos indican el de respuestas correctas.

A) Ordenamos, de acuerdo con los dígitos iniciales de cada uno, en el lado


izquierdo de una línea vertical.
B) A la derecha de esa recta se anota el último dígito de cada dato,
conforme se recorren las calificaciones en el orden en que fueron anotadas.
C) El último dígito de cada dato se coloca en el renglón de los primeros
dígitos del correspondiente.

6 9 8
7 2 3 6 3 6 5
8 6 2 3 1 1 0 4 5
9 7 2 2 6 2 1 5 8 854
10 7 4 8 0 2 6 6 0 6
11 2 8 5 9 3 5 9
12 6 8 7 4
13 2 4
14 1

D) Con esta organización de los datos, es fácil clasificar los dígitos de cada
renglón en su rango (magnitud) correspondiente. Al hacerlo se llega al diagrama
de tallo y hojas que vemos a continuación:

6 8 9
7 2 3 3 5 6 6
8 0 1 1 2 3 4 5 6
9 1 2 2 2 4 5 5 6 7
10 0 0 2 4 6 6 6 7 8

14
11 2 3 5 5 8 9 9
12 4 6 7 8
13 2 4
14 1

E) Cada línea de este diagrama se denomina como tallo, y cada dígito en


el tallo es una hoja.

Histograma.

Es la representación gráfica común de datos cuantitativos este resume


grafico se puede preparar con datos que sean resumido anteriormente en una
distribución de frecuencia porcentual. 14
Se traza colocando la variable de interés sobre el eje horizontal y la
frecuencia porcentual de cada clase trazando un rectángulo, cuya base es el
intervalo de la clase sobre el eje horizontal y cuya altura es la frecuencia
correspondiente.

Pasos para la elaboración de un histograma.

1.- La raíz de todos los s cualitativos.

K = √n
Nota: Los rangos deben de ser de 5 ≤ k ≥ 15.

2.- De ¿cuántos valores va a constar cada clase?

Amplitud de clase = (valor máximo – valor mínimo )


o rango
k
3.- Crear las clases o rangos.

14

15
4.- Contabilizar las frecuencias de cada clase.
5.- Con los datos obtenidos al contabilizar las frecuencias elaboraremos
el histograma.

Ejemplo:
Los siguientes datos son resultado de una encuesta realizada a alumnos
de segundo año de secundaria. Obtendremos su histograma.

Calificaciones

7
0 88 94 88 88 96 84 92 90 90
8
0 90 95 90 92 85 82 94 86 80
9
0 90 85 72 80 72 80 96 70 85
7
5 95 90 83 70 78 78 80 86 85
8
4 76 70 96 77 80 76 72 70 80
9
6 72 80 75 70 82 74 94 70 80
8
5 92 85 82 70 84 90 92 75 90
7
5 83 77 90 72 86 75 90 80 90
9
6 73 72 70 90 88 86 88 70 75
7
2 77 85 96 75 90 90 86 75 80
Clases Frecuencia Frecuencia Frecuencia Frecuencia
(Calificaciones (Absoluta) (Relativa) Absoluta Absoluta

16
) Acumulada Acumulada
(ascendente) (descendente)
z 100
50 - 54 14 14% 14 86
55 - 59 6 6% 20 80
60 - 64 11 11% 31 69
65 - 69 11 11% 42 58
70 - 74 6 6% 48 52
75 - 79 11 11% 59 41
80 - 84 7 7% 66 34
85 - 89 14 14% 80 20
90 - 94 9 9% 89 11
95 - 99 11 11% 100 0

ACUMULADA DE LAS CALIFICACIONES DE 2º


AÑO DE PRIMARIA 2002
120
frecuencia absoluta

100 100
86 89
acumulada

80 80 80
69 66
60 58 59
52
48
40 42 41
31 34
20 20 20
14 11
0 0
= = = = = = = = = =
50 - 55 - 60 - 65 - 70 - 75 - 80 - 85 - 90 - 95 -
54 59 64 69 74 79 84 89 94 99
CLASE [calificacion % ]
FRECUENCIA ABSOLUTA ACUMULADA FRECUENCIA ABSOLUTA ACOMULADA DESENDENTE

HISTOGRAMA DE CALIFICACIONES (2º AÑO DE


SECUNDARIA, 2002)

1,4 1,4 50 - 54 =
1,4
1,2 1,1 1,1 1,1 1,1 55 - 59 =

1 0,9 60 - 64 =
FRECUENCIA 0,8 0,7 65 - 69 =
0,6 0,6
RELATIVA 0,6 70 - 74 =
0,4 75 - 79 =
0,2 17 80 - 84 =
0 85 - 89 =
1
90 - 94 =
CLASE [calificacion %]
95 - 99 =
CONCLUSION

Con los temas hablados podemos obtener que la estadística es una rama de las
matemáticas, que no le damos cierta importancia, pero en realidad es de mucha
utilidad ya que de ella podemos obtener gráficas, números secuenciales, etc. por
eso es de gran importancia conocer cada uno de los temas.

18
19

También podría gustarte