Conceptos Basicos Repaso
Conceptos Basicos Repaso
Conceptos Basicos Repaso
CONCEPTOS GENERALES.
OBJETIVOS DE APRENDIZAJE.
• Cómo se usa la estadística en los negocios.
• Cuáles son las bases de datos que se utilizan en los negocios.
• Los tipos de datos usados en negocios.
Enfoque del curso.
El objetivo principal de este curso es que el alumno aprenda, entienda y comprenda cómo
los métodos estadísticos son útiles en el proceso de toma de decisiones.
Por lo tanto, los estudiantes deben ser capaces de:
• Presentar y describir de forma apropiada los datos e información en los negocios.
• Llegar a conclusiones sobre grandes poblaciones únicamente a partir de información
recolectada de las muestras.
• Hacer predicciones confiables acerca de las tendencias en los negocios.
• Mejorar los procesos de los negocios.
Como lo hemos señalado anteriormente, la estadística se divide en dos ramas, ambas aplicables
a la administración de negocios. La Estadística Descriptiva se enfoca en la recolección,
resumen y presentación de un conjunto de datos. La Estadística Inductiva o Inferencial
utiliza datos de las muestras para obtener conclusiones acerca de cierta población.
CAMPO DE ACCIÓN DE LA ESTADÍSTICA EN LOS NEGOCIOS.
Entre otras muchas aplicaciones, la contabilidad utiliza métodos estadísticos para seleccionar
muestras con el propósito de auditar y para entender los costos de los insumos y productos
en la contabilidad de costos. Las finanzas usan métodos estadísticos para seleccionar entre
alternativas de cuentas de inversión y para analizar las mediciones de rentabilidad financiera
a través del tiempo. La administración utiliza métodos estadísticos para controlar y mejorar
la calidad de los productos manufacturados o los servicios que ofrece una organización. El
marketing emplea métodos estadísticos para estimar el número de consumidores que
prefieren un producto sobre otro y para entender por qué lo prefieren, así como para obtener
conclusiones que permitan determinar la mejor estrategia de publicidad que incremente las
ventas de un producto.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
toma de decisiones
racionales.
Obtención de Realización de
Presentación y Mejoramiento de
conclusiones. La pronósticos confiables
descripción correcta de procesos.
población analizada a de las variables de
la información.
partir de una muestra. interés. .
Procesos de
Muestreo y recolección Principios de la
producción y mejora de Regresión lineal.
de datos. probabilidad.
la calidad.
Medidas numéricas
Distribución normal.
descritivas.
Distribución de
muestras.
VARIABLES
Las variables son las características de los objetos o de los individuos. Todas las variables
deben tener una definición operacional, es decir, un significado universalmente aceptado que
sea claro para todos aquellos que estén relacionados con el análisis. La falta de definiciones
operacionales genera confusión.
TIPOS DE VARIABLES.
Existen dos tipos de variables: Cualitativas y Cuantitativas.
VARIABLE ORDINAL.
Es una variable cualitativa cuyos valores solamente pueden ser ordenados con algún criterio.
Por ejemplo, tipo de medalla que se obtiene en una competencia olímpica.
VARIABLE NOMINAL.
Es una variable cualitativa la cual sólo permite asignar nombres a los datos y no implica
ningún orden.
VARIABLE UNIDIMENSIONAL.
Es aquella que proporciona información sobre una sola característica (por ejemplo: edad de
los alumnos de una clase).
VARIABLE BIDIMENSIONAL.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
Es aquella que proporciona información sobre dos características, por ejemplo; tamaño y
precio de un producto.
VARIABLE PLURIDIMENSIONAL.
Es aquella que proporciona información sobre tres o más características, por ejemplo: edad,
altura y peso de los alumnos de una clase.
VARIABLE DICOTÓMICA.
Es aquella que solo acepta dos opciones de respuesta, por ejemplo: resultado de un examen
de Covid 19, positivo o negativo. Pueden ser nominales o binarias.
VARIABLE POLITÓMICA.
Es aquella que acepta más de dos opciones de respuesta, por ejemplo: resultado de
calificaciones un examen de conocimientos. Pueden ser nominales u ordinales.
POBLACIÓN
La población consiste en todos los miembros de un grupo acerca de los cuales se desea
obtener una conclusión.
MUESTRA
Una muestra es una parte de la población seleccionada para análisis. Es un subconjunto
representativo de la población a partir del cual se pretende realizar inferencias respecto a la
población de donde procede. Los elementos seleccionados reúnen ciertas características que
la hacen ser representativa, significativa y confiable y que con base a ella se pueden hacer
inferencias respecto a la población.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
Población. Muestra.
Parámetro. Estadístico.
MUESTRA PROBABILÍSTICA.
Es aquella muestra obtenida por un mecanismo de probabilidades, en el cual cada elemento
de la población total o universo tiene una probabilidad conocida de selección. (Muestreo
aleatorio).
MUESTRA NO PROBABILÍSTICA.
Es aquella que se obtiene mediante juicio de la persona que selecciona los elementos de la
muestra que usualmente es un experto en la materia. Este método está basado en los puntos
de vista subjetivos de una persona y la teoría de la probabilidad no puede ser empleada para
medir el error de muestreo. Las principales ventajas de una muestra de juicio son la facilidad
de obtenerla y que el costo usualmente es bajo.
MUESTREO.- Es un conjunto de métodos y procedimientos estadísticos destinados a la
selección de una o más muestras es la técnica seguida para elegir muestras. El objetivo
principal de un diseño de muestreo es proporcionar procedimientos para la selección de
muestras que sean representativas de la población en estudio.
RECOLECCIÓN DE DATOS
Conviene recordar que para administrar un negocio de forma efectiva se requiere recolectar,
procesar y analizar correctamente los datos apropiados. En muchas ocasiones, los datos se
obtienen de los elementos de una muestra, y las muestras se toman de la población, de tal
forma que se debe procurar que estas sean lo más significativas y representativas posible.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
La técnica más común para asegurar una representación adecuada es usar una muestra
aleatoria.
MUESTREO ALEATORIO SIMPLE.
También llamado aleatorio. Es un método de muestreo donde una muestra aleatoria simple
es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual
probabilidad de ser seleccionada de la población.
Una muestra aleatoria, también llamada una muestra probabilística es aquella cuyos
elementos se seleccionan individualmente de la población en forma aleatoria, y es preferida
por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede
ser medido en términos de probabilidad bajo la curva normal.
Una variante del muestreo aleatorio simple es el muestreo aleatorio sistemático. Otros tipos
más comunes de muestreo aleatorio son: muestreo aleatorio estratificado y muestreo por
conglomerados.
MUESTREO SISTEMÁTICO.
Es una variante del método aleatorio simple de selección de cada elemento de la muestra. Se
aplica cuando la población está listada en algún orden. Consiste en seleccionar un dato y fijar
un número o criterio determinado para realizar las selecciones siguientes de manera
uniforme; El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra
sistemática puede dar la misma precisión de estimación acerca de la población que una
muestra aleatoria simple cuando los elementos en la población están ordenados al azar.
MUESTREO ESTRATIFICADO ALEATORIO.
Es un método de muestreo que se aplica cuando se divide la población en grupos, llamados
estratos, donde los datos son más homogéneos pero un estrato frente al otro muy distintos.
Para extraer la muestra aleatoria se aplica el muestreo aleatorio simple a cada estrato y el
tamaño es la suma de los tamaños de todos los estratos. Para determinar los tamaños de los
estratos se puede utilizar la asignación proporcional, óptima y óptima económica. Si no se
conoce la variabilidad de los datos se aplica la asignación proporcional o ponderada.
MUESTREO POR CONGLOMERADOS.
Es un método de muestreo en el cual la población está en grupos debido a la organización
administrativa u otro (conglomerados). Ejemplo: Colegios, Universidades, manzanas de
casas, entre otros. Al interior de los conglomerados no se puede garantizar homogeneidad.
Cada conglomerado es una unidad donde la muestra se selecciona como en el muestreo
aleatorio simple y se aplica la encuesta a todos los elementos del conglomerado.
Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto,
se obtiene menor precisión de las estimaciones acerca de la población) que una muestra
aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada
"conglomerado" tienden frecuentemente a ser iguales.
PARÁMETRO
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
a) Desviación media.
b) varianza.
c) desviación típica.
Medidas de posición.
Señalan la situación de algunos valores importantes en la distribución.
Las mas comunes son los cuartiles, deciles y percentiles: Por ejemplo, los cuartiles son los
valores que dejan a cada lado el 25% y el 75% de los demás.
Medidas de asimetría.
Con los coeficientes de asimetría se trata de medir si las observaciones están dispuestas
simétrica o asimétricamente respecto a un valor central (en general, la media aritmética) y el
grado de esta asimetría.
Medidas de apuntamiento O curtosis.
Indican si la distribución es más o menos puntiaguda.
· La media siempre toma un valor comprendido entre los valores de X mínimo y máximo
observados.
· La media aritmética es el punto de equilibrio o centro de gravedad de la distribución, es
decir, la suma de las desviaciones de todos los valores de la variable con respecto a la media
es igual a cero.
· En el cálculo de la media se utiliza toda la información contenida en la distribución de
frecuencias.
· La media de una constante es la misma constante.
Inconvenientes
· Solo se puede obtener si la característica observada es cuantitativa.
Es una medida de tendencia central. Se calcula multiplicando cada valor de los elementos
por el número de veces que se repite. La suma de todos estos elementos se divide entre el
total de datos:
La media aritmética de una variable se define como la suma ponderada de los valores de la
variable por sus frecuencias relativas.
Mediana. (Me, Md)
Es una medida de tendencia central. Es el valor que divide al conjunto de datos ordenados,
en aproximadamente dos partes: 50% de valores son inferiores y otro 50% son superiores.
Por ejemplo, si decimos que la mediana de los sueldos de los obreros de una empresa es de
$3,600 mensuales, estamos indicando que el 50% gana menos que $3,600 y el otro 50% gana
más.
Simbólicamente se representa por
Ejemplo ilustrativo:
Calcular la mediana de las siguientes calificaciones del curso de Estadística evaluadas sobre
diez: 10, 8, 6, 4, 9, 7, 10, 9 y 6
Solución:
1) Se ordena los datos de menor a mayor:
2) Se aplica la ecuación:
2) Se aplica la ecuación
x f fa
1 1 1
Solución:
2 3 4
Calculando la posición de la mediana se obtiene:
3 2 6
4 4 10
Como la posición de la mediana es 10.5, su valor es el
promedio de los datos décimo y undécimo. Para observar con
5 8 18 claridad cuáles son los datos décimo y undécimo se aconseja
calcular la frecuencia Se observa que el décimo dato es 4 y
6 2 20 el undécimo es 5, por lo tanto:
Tot
20
al
Intervalos f Solución:
[75, 85) 11
[85, 95) 4
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
19/10 ₌ 9/ x
[65, 75) 19 35
[75, 85) 11 46
Por lo tanto la Mediana es igual a 65 + 4.737 = 69.737≈ 69.74
[85, 95) 4 50
Moda.
La moda es el valor de la variable que más veces se repite en la muestra. Es una medida de
tendencia central es el valor de la variable que tiene mayor frecuencia absoluta, la que más
se repite es la única medida de centralización que tiene sentido estudiar en una variable
cualitativa, pues no precisa la realización de ningún cálculo. Por su propia definición, la moda
no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia
siendo esta máxima. Entonces tendremos una distribución bimodal o polimodal según el
caso.
Se representa por:
Características:
· La moda se expresa en las unidades de medida de la variable.
· La moda es la única medida de posición que sintetiza la distribución de frecuencias de una
característica categórica nominal.
Inconvenientes
· Una distribución de frecuencias puede tener más de una moda.
· Para determinar la moda no se tiene en cuenta toda la información contenida en la
distribución de frecuencias.
Para localizar la moda se busca la frecuencia (absoluta o relativa) máxima, el valor de la
variable correspondiente a dicha frecuencia es la moda.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
Mediana.
Moda.
Las medidas de tendencia central sintetizan mediante un solo valor el orden de magnitud de
los valores de la variable.
MEDIDAS DE LOCALIZACIÓN: CUANTILES.
Las medidas de localización, CUANTILES, dividen la distribución en un cierto número de
tramos con igual número de observaciones:
Los CUARTILES dividen la distribución de frecuencias en cuatro partes iguales.
Los DECILES dividen la distribución de frecuencias en diez partes iguales.
Los CENTILES O PERCENTILES dividen la distribución de frecuencias en cien partes
iguales.
Si se ordenan los elementos de la muestra desde el que tiene el menor valor de la variable
hasta el que tiene el mayor valor, los cuantiles son los valores de la variable que dividen a la
distribución en un cierto número de partes con igual número de elementos.
Los cuantiles se expresan en las mismas unidades de medida de la variable y le afectan los
cambios de origen y cambios de escala.
Los cuantiles más utilizados son los cuartiles, los deciles y los centiles o percentiles.
Cuartiles.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
Los cuartiles son los tres elementos de un conjunto de datos ordenados que dividen el
conjunto en cuatro partes iguales.
Distinguimos los casos en que los datos están agrupados en frecuencias y los que no lo están.
Los datos también pueden estar agrupados en intervalos de valores. Se representan como,
Q1, Q2, Q3 , siendo los valores que dividen la distribución en cuatro partes con igual número
de observaciones.
El primer cuartil, Q1, es el valor de la variable que deja por debajo el 25% del total de
observaciones. El segundo cuartil, Q2, es el valor de la variable que deja por debajo el 50%
de las observaciones y, por tanto, coincide con la mediana. El tercer cuartil, Q3, es el valor
de la variable que deja por debajo el 75% del total de observaciones.
Entre dos cuartiles consecutivos se encuentra el 25% del total de observaciones.
El cuartil es el valor de la variable al que le corresponde la primera frecuencia absoluta
acumulada mayor o igual que kn donde k para Q1 = 0.25; k para Q2 =0.5 y k para Q3 = 0.75
Si los valores de la variable se agrupan en intervalos, el intervalo que contiene al cuartil es
aquel cuya frecuencia absoluta acumulada es la primera mayor o igual que kn.
Deciles, Centiles o Percentiles
Los deciles son los nueve valores de la variable, D1, D2, …., D8, D9 que dividen la
distribución en diez partes con igual número de observaciones.
El primer decil, D1, es el valor de la variable que deja por debajo el 10% del total de
observaciones; el segundo decil, D2, es el valor de la variable que deja por debajo el 20% de
las observaciones y así sucesivamente. El quinto decil, D5, coincide con la mediana.
Entre dos deciles consecutivos se encuentra el 10% del total de observaciones.
Los Centiles o Percentiles son los noventa y nueve valores de la variable,
C1, C2, …., C98, C99 que dividen la distribucion en cien partes con igual número de
observaciones.
El primer centil, C1, es el valor de la variable que deja por debajo el 1% del total de
observaciones; el segundo centil, C2, es el valor de la variable que deja por debajo el 2% de
las observaciones y así sucesivamente. El quincuagesimo centil, C50, coincide con la
mediana.
Entre dos centiles consecutivos se encuentra el 1% del total de observaciones.
Ejercicios de auto evaluación de la primera unidad.
1 En un negocio de comida se venden diferentes bebidas: aguas frescas, refrescos, té y café.
Señala a que el tipo de variable corresponden las bebidas y ¿por qué?
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
Distribución Unidimensional. Es una tabla resumen en la que se considera una sola variable.
Los datos se disponen según agrupamientos o categorías convenientemente establecidas.
Puede construirse con variable cualitativa o cuantitativa.
Una tabla debe contener algunos elementos básicos que permitan su fácil comprensión.
Estos son; Titulo (a qué se refiere), Encabezado (categorias de los datos), Cuerpo (distribución) y
Fuente de información (de donde se obtuvieron los datos).
Tabla de registro de estudiantes de la FCA que trabajan en despachos contables. Titulo.
Porcentajes por sexo y grado de estudios.
Semestre. Hombres. Mujeres.
Porcentaje. Porcentaje. Encabezado
Primero. 12 10 ......
Tercero. 17 14
Quinto. 35 33 Cuerpo.
Septimo. 55 55
Noveno. 87 91
Egresado sin titular. 75 70
Egresado con titulo. 92 92 Fuente.
Fuente: investigación propia.
Sin embargo requeriríamos mayor detalle para saber de que categoría se vendió mas, a efecto de
programar los nuevos pedidos. Esto nos llevaría a una tabla como la siguiente:
El nivel de detalle de la información de esta tabla nos permite tener mejores elementos para entender el
comportamiento del producto y tomar las decisiones convenientes al respecto.
Tablas de contingencia.
Es muy común que se pretendan analizar distintas variables de manera independiente, pero
que tengan aspectos relacionados que condicionen el logro de objetivos, es decir, que sean
contingentes. La Real Academia de la Lengua, define “contingencia” (del lat. contingentia)
Como la posibilidad de que algo suceda o no suceda, es decir, algo que puede suceder o no
suceder. Dicho de otra manera, un riesgo.
Pensemos que en un taller se han detectado fallas en la producción de cubre bocas y queremos
identificar en que turno se concentra el mayor número de ellas, para iniciar medidas de
corrección, mismas que pueden ser atribuibles a la capacitación y competencia de los
operadores y/o a las condiciones en que se desarrolla la actividad. Debemos iniciar por
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
recabar la información y clasificarla por turno laboral (matutino, vespertino, nocturno), así
como el tipo de falla detectada (empaque, costura, sellado, etiquetado).
Si se han encontrado 312 artículos con alguna anormalidad, debemos agrupar los datos
destacando el defecto encontrado, lo que nos llevaría a una tabla como la siguiente:
Cubre bocas de México S.A.
Tabla de contingencias en la producción del mes de abril 2021.
Turno. Costura. Empaque. Sellado. Etiquetado. Total.
Matutino. 16 5.13 22 7.05 46 14.74 13 4.17 97 31.09
Vespertino. 26 8.33 17 5.45 34 10.90 5 1.60 82 26.28
Nocturno. 33 10.58 31 9.94 49 15.71 20 6.41 133 42.63
Σ 75 24.04 70 22.44 129 41.35 38 12.18 312 100
Fuente: departamento de control de calidad.
Tabla de resumen.
La tabla de resumen indica la frecuencia, cantidad o porcentaje de objetos en un conjunto de
categorías para observar las diferencias que hay entre ellas, es de mucha utilidad para tener
visiones muy rápidas del comportamiento de las variables en la colección de datos,
fundamentalmente en el caso de variables cualitativas, pero no se limitan a ellas.
Por ejemplo, indicar las razones por las que se realiza una compra.
MOTIVOS DE DECISIÓN DE
COMPRA.
Precio de venta. Gusto personal.
Confianza y conocimiento de marca. Soporte postventa.
Atención y servicio al cliente.
40 34
30 25
20
20 16
10 5
0
Porcentaje. (%)
Gráfica de pastel.
La gráfica de pastel es un círculo que se divide en partes para representar las categorías. El
tamaño de cada rebanada varía de acuerdo con el porcentaje correspondiente a cada
categoría. En la primera tabla, por ejemplo, el 20% de los encuestados aseveraron que la el
precio del producto fue la principal razón su compra, el 25% obedece a su gusto personal,
el 16% a la confianza y conocimiento de la marca, el 5% al soporte postventa y el 34%
determinaron su compra por la calidad en la atención y servicio al cliente. La suma de todas
ellas equivale al 100% de las motivaciones de compra y representan los 360° de la
circunferencia.
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
Precio de venta.
20%
Gusto personal.
34%
Confianza y conocimiento de
marca.
5%
Atención y servicio al cliente.
16%
Un polígono de frecuencia es un gráfico que se obtiene uniendo con segmentos de recta las
marcas de clase y se cierra considerando las marcas de clase de intervalos adyacentes, con
frecuencia cero.
La ojiva es un polígono de frecuencias acumuladas, es muy útil en las frecuencias acumuladas
en variables cualitativas.
Diagrama de Pareto.
Es un gráfico en el que la información de los datos analizados se muestra mediante un
diagrama de barras de forma descendente y en función de su prioridad.
Es decir, un diagrama de frecuencias que se traza en orden descendente de acuerdo con sus
frecuencias y se combinan con la línea de porcentaje acumulado en la misma gráfica de
izquierda a derecha, por medio de barras sencillas después de haber reunido los datos para
calificar las causas, de modo que se pueda asignar un orden de prioridades; separa los
problemas muy importantes de los menos importantes, estableciendo un orden de
prioridades. Este diagrama permite identificar situaciones en las que se da el principio de
Pareto, según el cual, si se tiene un problema con muchas causas, podemos decir que el 20%
de las causas resuelven el 80% del problema y el 80% de las causas sólo resuelven el 20%
del problema. El diagrama de Pareto se convierte en una herramienta valiosa para dar
prioridad a los esfuerzos de mejoramiento.
¿Cómo hacer un diagrama de Pareto?
El proceso es sencillo, sobre todo si tenemos nociones básicas de estadística descriptiva. Eso
sí, dependiendo de las variables a analizar se puede complicar algo más, sobre todo en el
trabajo de campo. Los pasos a seguir pueden ayudarnos a ordenar las ideas y serían los
siguientes; En primer lugar, hay que hacer una lista de dichas variables. Imaginemos que
Estadística Descriptiva.
Mtro. Gustavo Adolfo Torres Blanco.
queremos conocer las causas de compra de los clientes de un determinado producto, la idea
es conocer de forma aproximada cuáles son.
Una vez las tenemos, realizamos el estudio descriptivo. Podemos usar fuentes secundarias
como otros análisis o fuentes primarias, a través de cuestionarios. La más recomendable es
la última, en la que preguntaremos por qué compran el producto.
Luego hay que ordenar estas variables en función de sus frecuencias absolutas de manera que
permita un orden descendente. Es conveniente superponer la frecuencia acumulada que
permita ver en qué punto estamos.
Ejemplo de diagrama de Pareto
Imaginemos un ejemplo del diagrama de Pareto en una empresa. Queremos saber qué mueve
a los clientes para comprar un determinado producto, por ejemplo, un teléfono móvil o
celular. Estamos utilizando un ejemplo sencillo con diez motivaciones (el 20% serían dos) y
con 100 casos (el 80% serían 80). Podría ser algo parecido a la siguiente figura:
Podemos observar que el diseño y la calidad (el 20% de variables) fueron elegidas por 80
personas de 100 (el 80% de los casos). Por supuesto, en la realidad estos valores no son
exactos, pero suelen aproximarse. Eso sí, hay excepciones, por supuesto, pero el principio en
cuestión se suele cumplir la mayoría de las veces y el diagrama de Pareto nos ayuda a
visualizarlo.
Debe ordenarse la tabla de resumen de acuerdo al tipo de defectos que presentan, considerando
sus frecuencias y no alfabéticamente.
1,987 100.00
100.01
2,000 95.93
91.58
86.96
81.09 80.00
1,500 74.56
68.03
1,039 61.04 60.00
1,000 47.85834
40.00
31.42 442
500 413 413 371
292 275 258 20.00
0 0.00
Ejercicios de reafirmación.
Categoría Frecuencia
Inasistencias 13
Retardos 28
Abandono del área de trabajo 9