Conceptos Basicos Repaso

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 29

Estadística Descriptiva.

Mtro. Gustavo Adolfo Torres Blanco.

CONCEPTOS GENERALES.
OBJETIVOS DE APRENDIZAJE.
• Cómo se usa la estadística en los negocios.
• Cuáles son las bases de datos que se utilizan en los negocios.
• Los tipos de datos usados en negocios.
Enfoque del curso.
El objetivo principal de este curso es que el alumno aprenda, entienda y comprenda cómo
los métodos estadísticos son útiles en el proceso de toma de decisiones.
Por lo tanto, los estudiantes deben ser capaces de:
• Presentar y describir de forma apropiada los datos e información en los negocios.
• Llegar a conclusiones sobre grandes poblaciones únicamente a partir de información
recolectada de las muestras.
• Hacer predicciones confiables acerca de las tendencias en los negocios.
• Mejorar los procesos de los negocios.

Como lo hemos señalado anteriormente, la estadística se divide en dos ramas, ambas aplicables
a la administración de negocios. La Estadística Descriptiva se enfoca en la recolección,
resumen y presentación de un conjunto de datos. La Estadística Inductiva o Inferencial
utiliza datos de las muestras para obtener conclusiones acerca de cierta población.
CAMPO DE ACCIÓN DE LA ESTADÍSTICA EN LOS NEGOCIOS.
Entre otras muchas aplicaciones, la contabilidad utiliza métodos estadísticos para seleccionar
muestras con el propósito de auditar y para entender los costos de los insumos y productos
en la contabilidad de costos. Las finanzas usan métodos estadísticos para seleccionar entre
alternativas de cuentas de inversión y para analizar las mediciones de rentabilidad financiera
a través del tiempo. La administración utiliza métodos estadísticos para controlar y mejorar
la calidad de los productos manufacturados o los servicios que ofrece una organización. El
marketing emplea métodos estadísticos para estimar el número de consumidores que
prefieren un producto sobre otro y para entender por qué lo prefieren, así como para obtener
conclusiones que permitan determinar la mejor estrategia de publicidad que incremente las
ventas de un producto.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

toma de decisiones
racionales.

Obtención de Realización de
Presentación y Mejoramiento de
conclusiones. La pronósticos confiables
descripción correcta de procesos.
población analizada a de las variables de
la información.
partir de una muestra. interés. .

Procesos de
Muestreo y recolección Principios de la
producción y mejora de Regresión lineal.
de datos. probabilidad.
la calidad.

Presentación gráfica de Distribuciones de


Regresión múltiple.
los datos. Probabilidad discreta.

Medidas numéricas
Distribución normal.
descritivas.

Distribución de
muestras.

Estimación del Fundamentos de la


intervalo de confianza. Prueba de Hipótesis.

Identificación de las fuentes de datos.


Las fuentes de datos se clasifican en fuentes primarias y fuentes secundarias.
Cuando el recolector de datos es quien los usa para el análisis, la fuente es primaria.
Cuando una organización o individuo han acudido a datos que recabados otra entidad o
individuo, la fuente es secundaria.
Existen cuatro importantes fuentes de datos:
1. Los que proporciona una organización o individuo.
2. Un experimento implementado para tal fin.
3. La encuesta.
4. Un estudio de observación.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

VARIABLES
Las variables son las características de los objetos o de los individuos. Todas las variables
deben tener una definición operacional, es decir, un significado universalmente aceptado que
sea claro para todos aquellos que estén relacionados con el análisis. La falta de definiciones
operacionales genera confusión.
TIPOS DE VARIABLES.
Existen dos tipos de variables: Cualitativas y Cuantitativas.

VARIABLE ORDINAL.
Es una variable cualitativa cuyos valores solamente pueden ser ordenados con algún criterio.
Por ejemplo, tipo de medalla que se obtiene en una competencia olímpica.
VARIABLE NOMINAL.
Es una variable cualitativa la cual sólo permite asignar nombres a los datos y no implica
ningún orden.
VARIABLE UNIDIMENSIONAL.
Es aquella que proporciona información sobre una sola característica (por ejemplo: edad de
los alumnos de una clase).
VARIABLE BIDIMENSIONAL.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Es aquella que proporciona información sobre dos características, por ejemplo; tamaño y
precio de un producto.
VARIABLE PLURIDIMENSIONAL.
Es aquella que proporciona información sobre tres o más características, por ejemplo: edad,
altura y peso de los alumnos de una clase.
VARIABLE DICOTÓMICA.
Es aquella que solo acepta dos opciones de respuesta, por ejemplo: resultado de un examen
de Covid 19, positivo o negativo. Pueden ser nominales o binarias.
VARIABLE POLITÓMICA.
Es aquella que acepta más de dos opciones de respuesta, por ejemplo: resultado de
calificaciones un examen de conocimientos. Pueden ser nominales u ordinales.

POBLACIÓN
La población consiste en todos los miembros de un grupo acerca de los cuales se desea
obtener una conclusión.
MUESTRA
Una muestra es una parte de la población seleccionada para análisis. Es un subconjunto
representativo de la población a partir del cual se pretende realizar inferencias respecto a la
población de donde procede. Los elementos seleccionados reúnen ciertas características que
la hacen ser representativa, significativa y confiable y que con base a ella se pueden hacer
inferencias respecto a la población.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

•Todos los miembros •Parte de la población


de un grupo acerca de seleccionada para
los cuales se desea análisis.
obtener una
conclusión.

Población. Muestra.

Parámetro. Estadístico.

•Medida numérica que •medida numérica que


describe una describe alguna
característica de la característica de la
población muestra

La muestra puede ser probabilística y no probabilística.

MUESTRA PROBABILÍSTICA.
Es aquella muestra obtenida por un mecanismo de probabilidades, en el cual cada elemento
de la población total o universo tiene una probabilidad conocida de selección. (Muestreo
aleatorio).
MUESTRA NO PROBABILÍSTICA.
Es aquella que se obtiene mediante juicio de la persona que selecciona los elementos de la
muestra que usualmente es un experto en la materia. Este método está basado en los puntos
de vista subjetivos de una persona y la teoría de la probabilidad no puede ser empleada para
medir el error de muestreo. Las principales ventajas de una muestra de juicio son la facilidad
de obtenerla y que el costo usualmente es bajo.
MUESTREO.- Es un conjunto de métodos y procedimientos estadísticos destinados a la
selección de una o más muestras es la técnica seguida para elegir muestras. El objetivo
principal de un diseño de muestreo es proporcionar procedimientos para la selección de
muestras que sean representativas de la población en estudio.
RECOLECCIÓN DE DATOS
Conviene recordar que para administrar un negocio de forma efectiva se requiere recolectar,
procesar y analizar correctamente los datos apropiados. En muchas ocasiones, los datos se
obtienen de los elementos de una muestra, y las muestras se toman de la población, de tal
forma que se debe procurar que estas sean lo más significativas y representativas posible.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

La técnica más común para asegurar una representación adecuada es usar una muestra
aleatoria.
MUESTREO ALEATORIO SIMPLE.
También llamado aleatorio. Es un método de muestreo donde una muestra aleatoria simple
es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual
probabilidad de ser seleccionada de la población.
Una muestra aleatoria, también llamada una muestra probabilística es aquella cuyos
elementos se seleccionan individualmente de la población en forma aleatoria, y es preferida
por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede
ser medido en términos de probabilidad bajo la curva normal.
Una variante del muestreo aleatorio simple es el muestreo aleatorio sistemático. Otros tipos
más comunes de muestreo aleatorio son: muestreo aleatorio estratificado y muestreo por
conglomerados.
MUESTREO SISTEMÁTICO.
Es una variante del método aleatorio simple de selección de cada elemento de la muestra. Se
aplica cuando la población está listada en algún orden. Consiste en seleccionar un dato y fijar
un número o criterio determinado para realizar las selecciones siguientes de manera
uniforme; El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra
sistemática puede dar la misma precisión de estimación acerca de la población que una
muestra aleatoria simple cuando los elementos en la población están ordenados al azar.
MUESTREO ESTRATIFICADO ALEATORIO.
Es un método de muestreo que se aplica cuando se divide la población en grupos, llamados
estratos, donde los datos son más homogéneos pero un estrato frente al otro muy distintos.
Para extraer la muestra aleatoria se aplica el muestreo aleatorio simple a cada estrato y el
tamaño es la suma de los tamaños de todos los estratos. Para determinar los tamaños de los
estratos se puede utilizar la asignación proporcional, óptima y óptima económica. Si no se
conoce la variabilidad de los datos se aplica la asignación proporcional o ponderada.
MUESTREO POR CONGLOMERADOS.
Es un método de muestreo en el cual la población está en grupos debido a la organización
administrativa u otro (conglomerados). Ejemplo: Colegios, Universidades, manzanas de
casas, entre otros. Al interior de los conglomerados no se puede garantizar homogeneidad.
Cada conglomerado es una unidad donde la muestra se selecciona como en el muestreo
aleatorio simple y se aplica la encuesta a todos los elementos del conglomerado.
Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto,
se obtiene menor precisión de las estimaciones acerca de la población) que una muestra
aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada
"conglomerado" tienden frecuentemente a ser iguales.
PARÁMETRO
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Un parámetro es una medida numérica que describe una característica de la población. Es


decir, cualquier valor característico de la población. Sin embargo estos valores son
desconocidos porque no siempre podemos tener todos los datos de la población para
calcularlos, por lo cual debemos calcularlos de acuerdo con los datos que arroje la toma
muestral de nuestro estudio, que como lo hemos señalado antes, debe ser significativa y
representativa, puede entenderse que no es un dato cualquiera, sino un elemento de medición
de un sistema que permite clasificarlo para evaluar algunas de sus características y sirve para
conocer atributos de una distribución de datos. Por ejemplo, la media aritmética o la
desviación típica de estos.
Sin parámetros no podríamos estudiar la información ni analizarla, por ello se dice que a
partir de un parámetro, una cierta circunstancia puede comprenderse o ubicarse en
perspectiva. El objetivo de los paramétros es resumir en un número un aspecto relevante de
la distribución que pueda dar una idea de la misma o compararla en ese aspecto, con otras.
Evidentemente, todo proceso de síntesis conlleva una pérdida de información; pero se gana
en el hecho de que es más fácil trabajar con unos pocos parámetros con significado muy
preciso que con la totalidad de los datos.
Se trata, por lo tanto, de una cifra representativa cuya utilidad se encuentra ante la dificultad
para manejar datos individuales en un elevado número, permitiendo obtener una imagen
más clara la población en su conjunto y llevar a cabo mediciones, comparaciones
y predicciones probabilísticas.
DATO ESTADÍSTICO:
Es una cantidad numérica calculada sobre la muestra que resume el hallazgo de información
sobre algún aspecto de la variable, podría señalarse como una forma de diferenciarlos, que
mientras el parámetro se extrae de las medidas de unidades en la población, el dato
estadístico corresponde a la medición de los elementos de una muestra.
Resumiendo, es importante tener en cuenta que parámetro es un valor de medida obtenido y
aplicable a la población, mientras que el dato estadístico se obtiene de la muestra, y solo es
aplicable a ella.
Los parámetros y los estadisticos suelen clasificarse, según el papel que juegan, en varios
tipos:
Medidas de centralización (de tendencia central).
Pretenden reflejar "en torno a qué valores se agrupan los datos reflejados", "qué valores son
los más frecuentes".
a) Moda. es el valor que se presenta con mayor frecuencia en una colección de datos.
b) Media Aritmética. es la suma de todos los valores de una variable estadística dividido
por el número de valores.
c) Mediana. es el valor del individuo que ocuparía el lugar central si se colocaran
ordenados de menor a mayor.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

a) Desviación media.
b) varianza.
c) desviación típica.
Medidas de posición.
Señalan la situación de algunos valores importantes en la distribución.
Las mas comunes son los cuartiles, deciles y percentiles: Por ejemplo, los cuartiles son los
valores que dejan a cada lado el 25% y el 75% de los demás.
Medidas de asimetría.
Con los coeficientes de asimetría se trata de medir si las observaciones están dispuestas
simétrica o asimétricamente respecto a un valor central (en general, la media aritmética) y el
grado de esta asimetría.
Medidas de apuntamiento O curtosis.
Indican si la distribución es más o menos puntiaguda.

Medidas de posición de tendencia central.


Son medidas de resumen que, de acuerdo a algún criterio, indican un valor alrededor del
cual se distribuyen las observaciones. Se tiene a: la media, mediana y moda, media
geométrica y media armónica.
Media aritmética.
Es una medida de tendencia central que denota el promedio de un conjunto de datos. Se
calcula dividiendo la suma del conjunto de datos entre el total de ellos.
Simbólicamente se representa por:

Es la medida de tendencia central más adecuada cuando la característica observada es


cuantitativa.
Se define como el cociente entre la suma de los valores de la variable observados en los
elementos de la muestra y el tamaño de esta. Si la distribución de frecuencias se presenta con
los valores de la variable agrupados en intervalos, al calcular la media utilizando las
correspondientes marcas de clase se obtiene un resultado aproximado.
La media se expresa en las unidades de medida de la variable.
Propiedades:
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

· La media siempre toma un valor comprendido entre los valores de X mínimo y máximo
observados.
· La media aritmética es el punto de equilibrio o centro de gravedad de la distribución, es
decir, la suma de las desviaciones de todos los valores de la variable con respecto a la media
es igual a cero.
· En el cálculo de la media se utiliza toda la información contenida en la distribución de
frecuencias.
· La media de una constante es la misma constante.
Inconvenientes
· Solo se puede obtener si la característica observada es cuantitativa.

Fórmula para datos agrupados.

Media aritmética para datos agrupados.


Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Es una medida de tendencia central. Se calcula multiplicando cada valor de los elementos
por el número de veces que se repite. La suma de todos estos elementos se divide entre el
total de datos:
La media aritmética de una variable se define como la suma ponderada de los valores de la
variable por sus frecuencias relativas.
Mediana. (Me, Md)
Es una medida de tendencia central. Es el valor que divide al conjunto de datos ordenados,
en aproximadamente dos partes: 50% de valores son inferiores y otro 50% son superiores.
Por ejemplo, si decimos que la mediana de los sueldos de los obreros de una empresa es de
$3,600 mensuales, estamos indicando que el 50% gana menos que $3,600 y el otro 50% gana
más.
Simbólicamente se representa por

La mediana es el valor de la variable correspondiente al elemento que ocupa la posición


central. La mediana, por tanto, divide la distribución de frecuencias en dos partes con igual
número de elementos.
Tiene la ventaja de que no depende de los valores que toma la variable, sino del orden de las
mismas.
Para el cálculo de la mediana interesa que los valores estén ordenados de menor a mayor.
Su aplicación no considera alguna característica de los datos, solo su orden jerárquico, por
lo que se ve limitada en su uso.
Características
· La mediana se expresa en las mismas unidades de medida de la variable.
· Los cambios de origen y de escala modifican la mediana.
· La mediana puede ser una medida de tendencia central más representativa que la media
cuando la variable presenta valores extremos.
Inconvenientes
· Solo se puede obtener si la característica observada es ordinal.
· En el cálculo de la mediana no se tiene en cuenta toda la información contenida en la
distribución de frecuencias.
El procedimiento a seguir para localizarla depende de la forma en que se presente la
ordenación de los datos: Stem and leaf (Tallo y hoja), tabla de frecuencias simples, tabla de
frecuencias con los valores agrupados en intervalos.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Para datos no agrupados de número de datos impar.


La mediana es el dato que se encuentra a la mitad de la lista. Para calcular su posición se
aplica la siguiente ecuación:

Ejemplo ilustrativo:
Calcular la mediana de las siguientes calificaciones del curso de Estadística evaluadas sobre
diez: 10, 8, 6, 4, 9, 7, 10, 9 y 6
Solución:
1) Se ordena los datos de menor a mayor:

2) Se aplica la ecuación:

La mediana es el valor de x5 (quinto dato), es decir, Md=8

Para un número de datos par.


La mediana es la media aritmética de los dos datos que se encuentran a la mitad de la lista.
Para calcular su posición se aplica la siguiente ecuación:

Ejemplo ilustrativo: Calcular la mediana de las siguientes calificaciones del curso


de Matemáticas evaluadas sobre diez: 10, 8, 9, 6, 4, 8, 9, 7, 10 y 9
Solución:
1) Se ordena los datos de menor a mayor:
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

2) Se aplica la ecuación

Cálculo de la mediana para datos agrupados.


La mediana, llamada algunas veces media posicional, es el valor del término medio que
divide una distribución de datos ordenados en dos partes iguales, es decir, el 50% de los datos
se ubican sobre la mediana o hacia los puntajes altos y el 50% restante hacia los puntajes
bajos.

Para datos agrupados en tablas de frecuencia.


Para calcular la posición de la mediana se aplica la siguiente ecuación:

Ejemplo ilustrativo: Dados los siguientes 20 números:


1, 3, 3, 5, 5, 5, 5, 2, 2, 2, 6, 6, 4, 4, 4 ,4, 5, 5, 5 y 5

1) Agrupar los datos en tabla de frecuencia acumulada.


Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

x f fa

1 1 1
Solución:
2 3 4
Calculando la posición de la mediana se obtiene:
3 2 6

4 4 10
Como la posición de la mediana es 10.5, su valor es el
promedio de los datos décimo y undécimo. Para observar con
5 8 18 claridad cuáles son los datos décimo y undécimo se aconseja
calcular la frecuencia Se observa que el décimo dato es 4 y
6 2 20 el undécimo es 5, por lo tanto:

Tot
20
al

Para datos agrupados en intervalos.


a) Por interpolación.
Ejemplo ilustrativo: Calcular la mediana de los pesos de un grupo de 50 personas que se
distribuyen de la siguiente manera:

Intervalos f Solución:

[45,55) 6 Primero se calcula n/2 y después se averigua el intervalo


en el que está la mediana, este intervalo recibe el
[55, 65) 10 nombre de intervalo o clase de la mediana. Para
averiguar el intervalo en el que está la mediana se
[65, 75) 19 aconseja calcular la frecuencia acumulada.

[75, 85) 11

[85, 95) 4
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

En este ejemplo el intervalo de la media es [65,75).Se observa que


Intervalos f fa 16 valores están por debajo del valor 65. Los 9 que faltan para
llegar a 25 se interpolan en el ancho del intervalo de la mediana
[45,55) 6 6 que en este ejemplo es 10.

[55, 65) 10 16 Aplicando regla de tres:

19/10 ₌ 9/ x
[65, 75) 19 35

[75, 85) 11 46
Por lo tanto la Mediana es igual a 65 + 4.737 = 69.737≈ 69.74
[85, 95) 4 50

Moda.
La moda es el valor de la variable que más veces se repite en la muestra. Es una medida de
tendencia central es el valor de la variable que tiene mayor frecuencia absoluta, la que más
se repite es la única medida de centralización que tiene sentido estudiar en una variable
cualitativa, pues no precisa la realización de ningún cálculo. Por su propia definición, la moda
no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia
siendo esta máxima. Entonces tendremos una distribución bimodal o polimodal según el
caso.
Se representa por:

Características:
· La moda se expresa en las unidades de medida de la variable.
· La moda es la única medida de posición que sintetiza la distribución de frecuencias de una
característica categórica nominal.
Inconvenientes
· Una distribución de frecuencias puede tener más de una moda.
· Para determinar la moda no se tiene en cuenta toda la información contenida en la
distribución de frecuencias.
Para localizar la moda se busca la frecuencia (absoluta o relativa) máxima, el valor de la
variable correspondiente a dicha frecuencia es la moda.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Si los valores de la variable se agrupan en intervalos, el intervalo modal es aquel al que le


corresponde la frecuencia máxima. En tal caso puede tomarse la marca de clase del intervalo
modal como valor aproximado de la moda.

Medidas de tendencia central. Media aritmética.

Mediana.

Moda.

Las medidas de tendencia central sintetizan mediante un solo valor el orden de magnitud de
los valores de la variable.
MEDIDAS DE LOCALIZACIÓN: CUANTILES.
Las medidas de localización, CUANTILES, dividen la distribución en un cierto número de
tramos con igual número de observaciones:
Los CUARTILES dividen la distribución de frecuencias en cuatro partes iguales.
Los DECILES dividen la distribución de frecuencias en diez partes iguales.
Los CENTILES O PERCENTILES dividen la distribución de frecuencias en cien partes
iguales.
Si se ordenan los elementos de la muestra desde el que tiene el menor valor de la variable
hasta el que tiene el mayor valor, los cuantiles son los valores de la variable que dividen a la
distribución en un cierto número de partes con igual número de elementos.
Los cuantiles se expresan en las mismas unidades de medida de la variable y le afectan los
cambios de origen y cambios de escala.
Los cuantiles más utilizados son los cuartiles, los deciles y los centiles o percentiles.
Cuartiles.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Los cuartiles son los tres elementos de un conjunto de datos ordenados que dividen el
conjunto en cuatro partes iguales.
Distinguimos los casos en que los datos están agrupados en frecuencias y los que no lo están.
Los datos también pueden estar agrupados en intervalos de valores. Se representan como,
Q1, Q2, Q3 , siendo los valores que dividen la distribución en cuatro partes con igual número
de observaciones.
El primer cuartil, Q1, es el valor de la variable que deja por debajo el 25% del total de
observaciones. El segundo cuartil, Q2, es el valor de la variable que deja por debajo el 50%
de las observaciones y, por tanto, coincide con la mediana. El tercer cuartil, Q3, es el valor
de la variable que deja por debajo el 75% del total de observaciones.
Entre dos cuartiles consecutivos se encuentra el 25% del total de observaciones.
El cuartil es el valor de la variable al que le corresponde la primera frecuencia absoluta
acumulada mayor o igual que kn donde k para Q1 = 0.25; k para Q2 =0.5 y k para Q3 = 0.75
Si los valores de la variable se agrupan en intervalos, el intervalo que contiene al cuartil es
aquel cuya frecuencia absoluta acumulada es la primera mayor o igual que kn.
Deciles, Centiles o Percentiles
Los deciles son los nueve valores de la variable, D1, D2, …., D8, D9 que dividen la
distribución en diez partes con igual número de observaciones.
El primer decil, D1, es el valor de la variable que deja por debajo el 10% del total de
observaciones; el segundo decil, D2, es el valor de la variable que deja por debajo el 20% de
las observaciones y así sucesivamente. El quinto decil, D5, coincide con la mediana.
Entre dos deciles consecutivos se encuentra el 10% del total de observaciones.
Los Centiles o Percentiles son los noventa y nueve valores de la variable,
C1, C2, …., C98, C99 que dividen la distribucion en cien partes con igual número de
observaciones.
El primer centil, C1, es el valor de la variable que deja por debajo el 1% del total de
observaciones; el segundo centil, C2, es el valor de la variable que deja por debajo el 2% de
las observaciones y así sucesivamente. El quincuagesimo centil, C50, coincide con la
mediana.
Entre dos centiles consecutivos se encuentra el 1% del total de observaciones.
Ejercicios de auto evaluación de la primera unidad.
1 En un negocio de comida se venden diferentes bebidas: aguas frescas, refrescos, té y café.
Señala a que el tipo de variable corresponden las bebidas y ¿por qué?
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

2 En una tienda departamental se vende un artículo de limpieza en tres presentaciones: chico,


mediano y grande. ¿A qué tipo de variable corresponden?
3 Se quiere el registrar tiempo que tardan en reconectarse a la clase virtual de Internet después
de una interrupción. ¿A qué tipo de variable corresponde? ¿Es discreta o continua?
4 Explica en tus palabras la diferencia entre una muestra y una población.
5 ¿Cuál es la diferencia entre un estadístico y un parámetro?
6 ¿Cuál es la diferencia entre la estadística inferencial y la descriptiva? ¿Cuál es su campo
de acción?
7 ¿Cuáles son los tipos que hay de variables cualitativas y cuantitativas?
8 ¿Cuál es la diferencia entre una variable discreta y una continua?
9 Para cada una de las siguientes variables, determina si es cuantitativa o cualitativa. . Si la
variable es cuantitativa, indica si es discreta o continua; si es cualitativa, indica si es ordinal
o nominal. En todos los casos, identifica en que otras clasificaciones se encuentran:
a. Número de aparatos telefónicos por casa.
b. Duración (en minutos) de la sesión virtual de enseñanza de estadística.
c. Si existe en la casa una línea telefónica conectada a un módem de computadora.
d. Si hay un servicio de internet en tu casa.
10 se solicita la siguiente información a estudiantes de la FCA con relación a actividades de
reforzamiento al conocimiento recibido en las clases virtuales:
a. Cantidad de tiempo que pasan de repasando el material de apoyo.
b. Número de libros de texto comprados.
c. Número de videos tutoriales que consultan.
d. Número de artículos especializados que consultan.
Clasifica cada una de esas variables.
11 Para cada una de las siguientes variables, determina el tipo de variable y su clasificación.
a. Nombre del proveedor de Internet.
b. Cantidad de tiempo que navegas en Internet por semana.
c. Número de correos mensajes recibidos en whats App una semana.
d. Cantidad de compras hechas en línea durante un mes.
e. Cantidad de redes sociales que utilizas.
f. Red social de tu preferencia.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

12 La siguiente información surge del contrato de un préstamo hipotecario:


a. Pagos mensuales: $1,427.
b. Número de empleos que el solicitante ha tenido en los últimos 10 años: 3
c. Ingreso salarial familiar anual: $186,000.
d. Estado civil: casado.
Clasifica cada una de las respuestas por el tipo de datos.
13 Una de las variables que más a menudo se incluyen en las encuestas es el nivel de
ingresos.
Si en una encuesta la pregunta es: “¿cuál es su ingreso (en miles de pesos)?”Y en otra, se
le pide que “Marque con una X en el círculo que corresponda a su nivel de ingreso” y se
ofrecen varios rangos para elegir.
a. Considerando el primer caso, explica en tus palabras, por qué el ingreso podría
considerarse tanto discreto como continuo.
b. ¿Cuál de los dos formatos preferirías usar al aplicar tu encuesta una encuesta y por qué?
c. ¿Cuál consideras que tiene mayor precisión y cuál es la más practica? ¿Por qué?
14 Te solicitan que realices de investigación de mercado de una cadena de tiendas de
conveniencia (OXXO), en la que se te pide conocer la preferencia del consumidor respecto
diferentes tipos de bloqueador solar y botana de su preferencia. Para lo cual seleccionas 10
ubicadas en la zona turística.
a. Describa cuál es la población y cuál es la muestra, e indique el tipo de datos que debes
recolectar.
b. Desarrolla un primer borrador del cuestionario requerido, anotando series de tres preguntas
que contengan variables cualitativas y tres preguntas que contengan variables cuantitativas,
que a tu criterio sean apropiadas para la encuesta.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Presentación de datos en tablas y gráficas.


Tablas y gráficas.
Son formas de representar de una colección de datos, de tal forma que estos sean manejables
y fácilmente interpretables. Es importante destacar que existe una gran cantidad de formas
de representar las tablas y los gráficos estadísticos, ya que tienen que ver con la creatividad
y habilidades de quien las maneja, sin embargo, haremos un repaso por las de uso más común.

Distribución Unidimensional. Es una tabla resumen en la que se considera una sola variable.
Los datos se disponen según agrupamientos o categorías convenientemente establecidas.
Puede construirse con variable cualitativa o cuantitativa.

Variable. Frecuencia Frecuencia Frecuencia Frecuencia


Absoluta. Absoluta Relativa. Relativa
acumulada. acumulada.
0 6
1 2
2 8
3 11
4 16
5 31
6 12
7 8
8 8
9 1
10 11
Σ 114

Distribución Bidimensional. Es la disposición de la frecuencia de dos variables de cada


elemento de la población. Por ejemplo: peso y altura de un grupo de estudiantes, superficie
y precio de las viviendas de una ciudad, etc.
En su elaboración debemos considerar la Frecuencia Marginal, siendo esta en una
distribución conjunta, las frecuencias de cada una de las variables sin tener en cuenta el valor
de la otra.
A continuación se presenta una tabla con variables bidimensionales, donde de toma el dato
de número de hijos en 100 familias, donde X son del sexo masculino y Y del sexo femenino.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Una tabla debe contener algunos elementos básicos que permitan su fácil comprensión.
Estos son; Titulo (a qué se refiere), Encabezado (categorias de los datos), Cuerpo (distribución) y
Fuente de información (de donde se obtuvieron los datos).
Tabla de registro de estudiantes de la FCA que trabajan en despachos contables. Titulo.
 Porcentajes por sexo y grado de estudios.
Semestre. Hombres. Mujeres.
Porcentaje. Porcentaje. Encabezado
Primero. 12 10 ......
Tercero. 17 14
Quinto. 35 33 Cuerpo.
Septimo. 55 55
Noveno. 87 91
Egresado sin titular. 75 70
Egresado con titulo. 92 92 Fuente.
Fuente: investigación propia.

Tablas de doble entrada.


En muchas ocasiones requerimos tener una información más detallada de algunos aspectos
para la mejor comprensión de los fenómenos de estudio, en estos casos se recurre a la
utilización de tablas de doble entrada, que clasifican la información por dos criterios, en vez
de uno. Por ejemplo; si deseamos conocer la cantidad de unidades de un producto que se ha
vendido durante el mes de julio del 2021 en una cadena de tiendas de artículos deportivos,
podríamos tener una tabla como la siguiente:
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Deportes Anáhuac S.A. de C.V.


Reporte de ventas de camisetas de X equipo de futbol.
Periodo: julio 2021.
Tienda. Unidades vendidas. Porcentaje.
Progreso. 55 29.1
Costera. 45 23.8
Magallanes. 42 22.2
Zapata. 47 24.9
Totales. 189 100
Fuente: departamento de contabilidad.

Sin embargo requeriríamos mayor detalle para saber de que categoría se vendió mas, a efecto de
programar los nuevos pedidos. Esto nos llevaría a una tabla como la siguiente:

Deportes Anáhuac S.A. de C.V.


Reporte de ventas de camisetas de X equipo de futbol.
Periodo: julio 2021.
Tienda. Infantil. Adulto Adulto Adulto Total.
chica. mediana. grande.
Progreso. 13 14 21 7 55
Costera. 10 14 11 10 45
Magallanes. 12 11 17 2 42
Zapata. 9 8 13 17 47
Totales. 44 47 62 36 189
Fuente: departamento de contabilidad.

El nivel de detalle de la información de esta tabla nos permite tener mejores elementos para entender el
comportamiento del producto y tomar las decisiones convenientes al respecto.

Tablas de contingencia.
Es muy común que se pretendan analizar distintas variables de manera independiente, pero
que tengan aspectos relacionados que condicionen el logro de objetivos, es decir, que sean
contingentes. La Real Academia de la Lengua, define “contingencia” (del lat. contingentia)
Como la posibilidad de que algo suceda o no suceda, es decir, algo que puede suceder o no
suceder. Dicho de otra manera, un riesgo.
Pensemos que en un taller se han detectado fallas en la producción de cubre bocas y queremos
identificar en que turno se concentra el mayor número de ellas, para iniciar medidas de
corrección, mismas que pueden ser atribuibles a la capacitación y competencia de los
operadores y/o a las condiciones en que se desarrolla la actividad. Debemos iniciar por
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

recabar la información y clasificarla por turno laboral (matutino, vespertino, nocturno), así
como el tipo de falla detectada (empaque, costura, sellado, etiquetado).
Si se han encontrado 312 artículos con alguna anormalidad, debemos agrupar los datos
destacando el defecto encontrado, lo que nos llevaría a una tabla como la siguiente:
Cubre bocas de México S.A.
Tabla de contingencias en la producción del mes de abril 2021.
Turno. Costura. Empaque. Sellado. Etiquetado. Total.
Matutino. 16 5.13 22 7.05 46 14.74 13 4.17 97 31.09
Vespertino. 26 8.33 17 5.45 34 10.90 5 1.60 82 26.28
Nocturno. 33 10.58 31 9.94 49 15.71 20 6.41 133 42.63
Σ 75 24.04 70 22.44 129 41.35 38 12.18 312 100
Fuente: departamento de control de calidad.

Tabla de resumen.
La tabla de resumen indica la frecuencia, cantidad o porcentaje de objetos en un conjunto de
categorías para observar las diferencias que hay entre ellas, es de mucha utilidad para tener
visiones muy rápidas del comportamiento de las variables en la colección de datos,
fundamentalmente en el caso de variables cualitativas, pero no se limitan a ellas.

Por ejemplo, indicar las razones por las que se realiza una compra.

Motivo de decisión de compra. Porcentaje. (%)


Precio de venta. 20
Gusto personal. 25
Confianza y conocimiento de 16
marca.
Soporte postventa. 5
Atención y servicio al cliente. 34
Σ 100

Tabla de resumen de frecuencia relativa al nivel de riesgo para fondos de inversión.


Nivel de riesgo. Frecuencia Frecuencia relativa Frecuencia
absoluta. absoluta. relativa
acumulada.
Bajo. 58 47.93 47.93
Medio. 46 38.02 85.95
Alto. 17 14.05 100
Σ 121 100
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Histogramas y Polígonos de frecuencia.


La tabla de frecuencias puede presentar mediante representaciones gráficas, mismas
permiten una visualización rápida de la información recogida. Entre las más usadas podemos
señalar las siguientes: Histogramas, Polígonos de frecuencia, graficas de sectores o de pastel,
diagrama de bastones, diagrama de cajas, diagrama de dispersión, diagrama de tallos y hojas
y el diagrama en escalera.
Gráfica de barras.
Como lo hemos señalado en las clases previas, cada barra muestra una categoría, su longitud
representa la cantidad, frecuencia o porcentaje de los valores que caen en cada categoría. Las
gráficas de barras permiten comparar los valores absolutos y/o los porcentajes de frecuencia
en las diferentes variables o categorías.

MOTIVOS DE DECISIÓN DE
COMPRA.
Precio de venta. Gusto personal.
Confianza y conocimiento de marca. Soporte postventa.
Atención y servicio al cliente.
40 34
30 25
20
20 16

10 5

0
Porcentaje. (%)

Gráfica de pastel.
La gráfica de pastel es un círculo que se divide en partes para representar las categorías. El
tamaño de cada rebanada varía de acuerdo con el porcentaje correspondiente a cada
categoría. En la primera tabla, por ejemplo, el 20% de los encuestados aseveraron que la el
precio del producto fue la principal razón su compra, el 25% obedece a su gusto personal,
el 16% a la confianza y conocimiento de la marca, el 5% al soporte postventa y el 34%
determinaron su compra por la calidad en la atención y servicio al cliente. La suma de todas
ellas equivale al 100% de las motivaciones de compra y representan los 360° de la
circunferencia.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

MOTIVOS DE DECISIÓN DE COMPRA. (%)

Precio de venta.
20%
Gusto personal.
34%

Confianza y conocimiento de
marca.

25% Soporte postventa.

5%
Atención y servicio al cliente.
16%

Un polígono de frecuencia es un gráfico que se obtiene uniendo con segmentos de recta las
marcas de clase y se cierra considerando las marcas de clase de intervalos adyacentes, con
frecuencia cero.
La ojiva es un polígono de frecuencias acumuladas, es muy útil en las frecuencias acumuladas
en variables cualitativas.
Diagrama de Pareto.
Es un gráfico en el que la información de los datos analizados se muestra mediante un
diagrama de barras de forma descendente y en función de su prioridad.
Es decir, un diagrama de frecuencias que se traza en orden descendente de acuerdo con sus
frecuencias y se combinan con la línea de porcentaje acumulado en la misma gráfica de
izquierda a derecha, por medio de barras sencillas después de haber reunido los datos para
calificar las causas, de modo que se pueda asignar un orden de prioridades; separa los
problemas muy importantes de los menos importantes, estableciendo un orden de
prioridades. Este diagrama permite identificar situaciones en las que se da el principio de
Pareto, según el cual, si se tiene un problema con muchas causas, podemos decir que el 20%
de las causas resuelven el 80% del problema y el 80% de las causas sólo resuelven el 20%
del problema. El diagrama de Pareto se convierte en una herramienta valiosa para dar
prioridad a los esfuerzos de mejoramiento.
¿Cómo hacer un diagrama de Pareto?
El proceso es sencillo, sobre todo si tenemos nociones básicas de estadística descriptiva. Eso
sí, dependiendo de las variables a analizar se puede complicar algo más, sobre todo en el
trabajo de campo. Los pasos a seguir pueden ayudarnos a ordenar las ideas y serían los
siguientes; En primer lugar, hay que hacer una lista de dichas variables. Imaginemos que
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

queremos conocer las causas de compra de los clientes de un determinado producto, la idea
es conocer de forma aproximada cuáles son.
Una vez las tenemos, realizamos el estudio descriptivo. Podemos usar fuentes secundarias
como otros análisis o fuentes primarias, a través de cuestionarios. La más recomendable es
la última, en la que preguntaremos por qué compran el producto.
Luego hay que ordenar estas variables en función de sus frecuencias absolutas de manera que
permita un orden descendente. Es conveniente superponer la frecuencia acumulada que
permita ver en qué punto estamos.
Ejemplo de diagrama de Pareto
Imaginemos un ejemplo del diagrama de Pareto en una empresa. Queremos saber qué mueve
a los clientes para comprar un determinado producto, por ejemplo, un teléfono móvil o
celular. Estamos utilizando un ejemplo sencillo con diez motivaciones (el 20% serían dos) y
con 100 casos (el 80% serían 80). Podría ser algo parecido a la siguiente figura:

Podemos observar que el diseño y la calidad (el 20% de variables) fueron elegidas por 80
personas de 100 (el 80% de los casos). Por supuesto, en la realidad estos valores no son
exactos, pero suelen aproximarse. Eso sí, hay excepciones, por supuesto, pero el principio en
cuestión se suele cumplir la mayoría de las veces y el diagrama de Pareto nos ayuda a
visualizarlo.

50% Errores de formato


30% Catálogo de cuentas
10% Falta de soporte
5% Falta de justificación
5% Registro extemporáneo.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
Comercializadora del Pacifico S.A. de C.V.
Tabla de resumen de las causas de los defectos en los teclados de computadora en 2020.

Causa. Frecuencia absoluta. Frecuencia relativa.


Mancha negra 413 6.53
Daño 1,039 16.43
Embarque 258 4.08
Marcas de clavijas 834 13.19
Rasguños 442 6.99
Impacto en el molde 275 4.35
Raya plateada 413 6.53
Marca de hundimiento 371 5.87
Marca de spray 292 4.62
Deformación 1,987 31.42
Total 6,324 100.01≈ 100
Fuente: departamento de mantenimiento.

Debe ordenarse la tabla de resumen de acuerdo al tipo de defectos que presentan, considerando
sus frecuencias y no alfabéticamente.

Comercializadora del Pacifico S.A. de C.V.


Tabla de resumen de las causas de los defectos en los teclados de computadora en 2020.

Causa. Frecuencia absoluta. Frecuencia relativa.


Deformación 1,987 31.42
Daño 1,039 16.43
Marcas de clavijas 834 13.19
Rasguños 442 6.99
Mancha negra 413 6.53
Raya plateada 413 6.53
Marca de hundimiento 371 5.87
Marca de spray 292 4.62
Impacto en el molde 275 4.35
Embarque 258 4.08
Total 6,324 100.01≈ 100
Fuente: departamento de mantenimiento.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Causas de defecto en teclados 2020


2,500 120.00

1,987 100.00
100.01
2,000 95.93
91.58
86.96
81.09 80.00
1,500 74.56
68.03
1,039 61.04 60.00
1,000 47.85834
40.00
31.42 442
500 413 413 371
292 275 258 20.00

0 0.00

Frecuencia absoluta. Frecuencia relativa. frecuencia acumulada

Causas de los defectos en los teclados de computadora en 2020.


Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
En la tabla anterior, la primera categoría en la lista es la deformación (con el 31.42% de los defectos),
seguida por daño (16.43%) y marca de clavijas (13.19%). Las dos categorías más frecuentes
(deformación y daño), abarcan el 47.85% de los defectos; las tres categorías más frecuentes
(deformación, daño y marcas de clavijas), abarcan el 61.04% de los defectos, y así sucesivamente.
La figura resultante del polígono de frecuencia acumulada es un diagrama de Pareto basado en los
resultados mostrados en forma tabular en la tabla.
La gráfica presenta las barras de forma vertical a lo largo de la línea de porcentaje acumulado. La
línea acumulativa deberá trazarse en el punto medio de cada barra a una altura semejante al
porcentaje acumulado. Al continuar la línea, se verá que estas tres primeras categorías abarcan
más del 60% de las correcciones. Como las categorías del diagrama de Pareto están ordenadas por
la frecuencia de ocurrencia, quienes toman decisiones podrán ver dónde concentrar sus esfuerzos
para mejorar el proceso. Los intentos de reducir los defectos por deformación, daño y marcas de
clavijas deberán generar el mayor gasto. Después podrán hacerse esfuerzos para reducir los
rasguños y las manchas negras.

Ejercicios de reafirmación.

Tabla de resumen de las causas de los defectos en la fabricación de cubrebocas en el mes


de abril 2021.
1.- Elaborar el histograma, la gráfica de pastel y el diagrama de Pareto de la siguiente tabla.
Defecto. Frecuencia. Porcentaje.
Costura. 75 24.04
Empaque. 70 22.44
Sellado. 129 41.35
Etiquetado. 38 12.18
Σ 312 100
. Fuente: departamento de control de calidad.
2.- En el reporte de incidencias laborales se presentan tres categorías de ellos que afectan
la prestación de los servicios en una jornada con las siguientes frecuencias:

Categoría Frecuencia

Inasistencias 13
Retardos 28
Abandono del área de trabajo 9

a. Calcule el porcentaje de valores en cada categoría.


b. Construya una gráfica de barras.
c. Construya una gráfica de pastel.
d. Construya un diagrama de Pareto.
3.- En una encuesta se preguntó a los responsables de las áreas de reclutamiento cuál
creían que era el error más común de los aspirantes a una vacante durante las entrevistas
de trabajo. Obteniéndose los resultados siguientes:
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.

Razón. Frecuencia relativa.


Poco o nulo conocimiento de sus 44
funciones.
Falta de preparación para el cargo. 23
Apatía. 16
Falta de contacto visual. 5
Falta de habilidades. 3
Falta de experiencia 4
Presentación inadecuada. 5

a. Construya una gráfica de barras, una gráfica de pastel y un diagrama de Pareto.


b. ¿Cuál es el método gráfico que mejor refleja los datos?
c. Si fuera un candidato en una entrevista de trabajo, ¿qué errores trataría de evitar
especialmente?

También podría gustarte