EAI Libro Resumen

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 157

EA I - estadística aplicada I

EDUBP | MKT | quinto cuatrimestre

EDUBP | MARKETING | estadística aplicada I - pag. 1


í ndice

 presentación 3

 programa 4
contenido módulos

 mapa conceptual 5

 macroobjetivos 6

 agenda 6

 material 7
material básico
material complementario

 glosario 8

 módulos *
m1 | 13
m2 | 26
m3 | 49
m4 | 87
m5 | 108
m6 | 129
m7 | 145

* cada módulo contiene:


microobjetivos
contenidos
mapa conceptual
material
actividades
glosario

 evaluación 157

impresión total del documento 157 páginas !

EDUBP | MARKETING | estadística aplicada I - pag.2


p r e s e n t ación

¡Bienvenido a la asignatura!

Es conocido por usted y por nosotros que estamos viviendo tiempos de grandes
cambios, en donde el común denominador es la globalización de los mercados
con una competencia muy agresiva. A su vez, los cambios a los que debemos
enfrentarnos son continuos, generales y vertiginosos.

Frente a este panorama, nuestra


capacidad en la toma de
decisiones inteligentes, a través
de un manejo eficaz de los
datos que a diario nos rodean,
y la posibilidad de realizar
predicciones basadas en dicha
información, juegan un papel
fundamental. Estamos hablando
aquí del manejo de destrezas
tales como recolectar, organizar,
presentar e interpretar datos.

Es ahí donde aparece en escena la disciplina Estadística que, frente a un


conocimiento imperfecto de las situaciones planteadas y a un grado considerable
de incertidumbre, nos ayuda a tomar decisiones eficientes y oportunas, a través
de los métodos y técnicas que elabora. Si se conocen los métodos y las técnicas
adecuados, prácticamente cualquier conjunto de datos puede dar información
útil.

Nuestro principal objetivo es que usted se convierta en consumidor inteligente


de la información y que sea también capaz de generarla y producirla de
manera eficiente. Creemos que si no le brindamos la oportunidad de aprender
esta matemática aplicada, nos estaremos arriesgando a crear una sociedad
polarizada, en la que sólo unos pocos tendrán el conocimiento matemático
necesario para controlar el desarrollo económico y científico. En tal caso, no
estaríamos contribuyendo a la conformación de una sociedad coherente con
los valores éticos de un sistema democrático justo y con sus necesidades
económicas.

Las actividades que le iremos proponiendo en el transcurso de la asignatura, han


surgido de las distintas áreas que conforman la currícula del plan de estudio. En
este sentido, encontrará actividades vinculadas con el área contable, con el área
del management, finanzas, marketing, producción y economía entre otras.

Es necesario tener presente que si bien en la currícula que conforma el plan


de estudio de la carrera, esta materia se presenta por separado de Estadística
Aplicada II, sus contenidos se encuentran estrechamente relacionados ya que
son ejes conceptuales vinculados entre sí que, por las característica propias del
plan, se organizan en dos cuatrimestres.

Para concluir creemos relevante darle a conocer el tercer axioma de la didáctica


que postula el investigador italiano Bruno D´Amore y que esperamos oriente su
paso por la asignatura:

EDUBP | MARKETING | estadística aplicada I - pag. 3


Axioma de la profesionalidad:

Es necesario estar dispuesto a aprender lo que no se conoce, y que se


necesita saber.

p r o g rama

Módulo 1: Introducción a la estadística descriptiva


Concepto de estadística. Aplicación de la estadística en los distintos campos
de la investigación. Población y muestra. Tipos de estadística: descriptiva e
inferencial. Tipos de variable. Niveles o escalas de medición.

Módulo 2: Descripción de datos: tablas de frecuencias, distribuciones de


frecuencias y gráficos.
Tablas estadísticas: construcción. Distribuciones unidimensionales. Series
simples y distribuciones de frecuencias para datos cualitativos y cuantitativos.
Distribuciones bidimensionales. Gráficos estadísticos: interpretación y análisis.
Aplicaciones y utilización de software de aplicación (SPSS, InfoStat, Excel).

Módulo 3: Descripción de datos: medidas numéricas, presentación y análisis


de datos
Parámetros y estadísticos. Medidas de posición: media aritmética, propiedades.
Mediana. Modo. Cuartiles. Medidas de dispersión: recorrido, varianza, desviación
estándar, coeficiente de variación, desviación cuartílica. Interpretación. Regla
empírica. Propiedades. Diagrama de caja. Medidas de forma: asimetría y
puntiagudez. Diagrama de Tallo y Hojas. Descripción de la relación entre dos
variables: diagrama de dispersión. Covarianza. Aplicaciones y estudio de casos.
Utilización del software adecuado (SPSS, InfoStat, Excel). Números índices.
Definición. Tipos de índices: precio, cantidad y valor. Cómo usar un índice de
precios. Concepto y estructura de los índices de precios. Lugar e instancias
en que se difunden los índices de precio. INDEC. Nuevo índice de precios al
consumidor.

Módulo 4: Estudio de los conceptos de probabilidad


Espacios muestrales. Eventos. Definición de probabilidad. Teorías: clásica,
frecuencial y subjetiva. Propiedades aditiva y multiplicativa. Probabilidad
condicional. Independencia probabilística.

Módulo 5: Distribuciones discretas de probabilidad


Concepto de variable aleatoria. Variables aleatorias discretas. Distribución de
probabilidad. Esperanza matemática o valor esperado. Varianza. Propiedades.
Modelos de probabilidad para variables aleatorias discretas: binomial,
hipergeométrica, Poisson. Manejo de tablas. Aplicaciones.

EDUBP | MARKETING | estadística aplicada I - pag.4


Módulo 6: Distribuciones de probabilidad continua
Variables aleatorias continuas. Distribución de probabilidad. Esperanza
matemática. Varianza. Propiedades. Modelos de probabilidad de variables
aleatorias continuas: Normal. Aproximaciones. Manejo de tablas. Aplicaciones.

Módulo 7: Distribuciones muestrales


Distribución de medias muestrales: teorema central del límite. Distribución de
proporciones muestrales. Uso de las distribuciones muestrales.

m a p a c o n c eptual

EDUBP | MARKETING | estadística aplicada I - pag. 5


m a c r o o b j etivos

• Reconocer la terminología básica de la asignatura con el objeto de


unificar el vocabulario técnico necesario que permita abordar la disciplina
bajo análisis.

• Comprender los fundamentos teóricos y prácticos del análisis estadístico


descriptivo con la finalidad de poder resumir y analizar información útil
para la toma de decisiones.

• Desarrollar habilidades en el manejo de los distintos modelos de


probabilidad, con el objeto de poder manejar la incidencia de la
incertidumbre en la toma de decisiones.

• Utilizar la computadora en la aplicación de técnicas estadísticas con el


objeto de adquirir rapidez en el análisis de datos, avanzar hacia técnicas
que requieren un análisis más avanzado, y posibilitar el análisis de
grandes volúmenes de datos.

• Transferir los conocimientos teóricos y prácticos a situaciones reales a


los fines de elaborar juicios propios e independientes.

a genda

Porcentaje estimativo por módulo según la cantidad y complejidad de


contenidos y actividades

MÓDULOS PORCENTAJES ESTIMADOS


1 5%
2 10%
3 25%
4 10%
5 10%
6 20%
7 20%
TOTAL 100%

EDUBP | MARKETING | estadística aplicada I - pag.6


Representación de porcentajes en semanas:

SEMANAS MÓDULOS
1 2 3 4 5 6 7
1
2
3
4
5
6
7 Parcial 1
8
9
10
11
12
13
14
15 Parcial 2

m a terial

Material Básico:

• LIND, D., MARCHAL, W. y WATHEN, S. Estadística Aplicada a los Negocios


y a la Economía. Ed. McGraw Hill (2008). 13era edición.
El texto seleccionado posee un excelente diseño lo cual contribuirá a que el
aprendizaje sea ameno. Bajo ningún punto de vista se deberá fotocopiar el
material, no sólo por ser un delito sino porque estará perdiendo los aportes
que un texto en colores le brinda. El libro además posee un CD que le permitirá
ampliar las funciones del Excel, lo cual será fundamental para trabajar con los
datos.

Material Complementario:

• ANDERSON, DAVID R.; SWEENEY, DENNIS J.; WILLIAMS, THOMAS


A. (2008) Estadística para administración y economía. Ed. THOMSON
INTERNATIONAL
• LEVINE, DAVID M.; BERENSON, MARK L.; KREHBIEL, TIMOTHY C.
(2006) Estadística para administración. Ed. Pearson
• MENDENHALL, WILLIAM; BEAUER, BARBARA M.; BEAUER, ROBERT
J. (2007) Introducción a la probabilidad y estadística Ed. THOMSON
INTERNACIONAL
• VISAUTA VINACUA, BIENVENIDO. (2007) Análisis estadístico con SPSS
14. Estadística Básica. Ed. McGraw Hill

EDUBP | MARKETING | estadística aplicada I - pag. 7


g l osario

Coeficiente de variación: Medida de la dispersión relativa de un conjunto de


datos. Se calcula dividiendo la desviación estándar entre la media y multiplicando
el cociente por 100.
Complemento del evento A: El evento que contiene todos los puntos muestrales
que no están en A.
Conjunto de datos: Todos los datos reunidos en determinado estudio.
Covarianza: Medida numérica de la asociación lineal entre dos variables.
Sus valores positivos indican una relación positiva; los negativos una relación
negativa.
Cuartiles: Los percentiles 25%, 50% y 75% se llaman primer cuartil, segundo
cuartil (mediana) y tercer cuartil, respectivamente. Se pueden usar los cuartiles
para dividir al conjunto de datos en cuatro partes, cada una de las cuales contiene
aproximadamente el 25% de los datos.
Datos: Los hechos y números que se reúnen, analizan e interpretan.
Datos agrupados: Datos disponibles en intervalos de clase, como los resumidos
por una distribución de frecuencias. Los valores individuales de los datos
originales no están registrados.
Datos cualitativos: Datos que aparecen en etiquetas o nombres de determinada
característica de un elemento.
Datos cuantitativos: Datos que indican cuánto o cuántos de algo. Los datos
cuantitativos siempre son numéricos.
Datos de una serie de tiempo: Datos reunidos en diversos periodos sucesivos.
Datos transversales: Datos reunidos en el mismo, o aproximadamente el mismo,
punto en el tiempo.
Desviación estándar: La raíz cuadrada positiva de la varianza.
Desviación estándar: Medida de la dispersión de un conjunto de datos; se
calcula sacando la raíz cuadrada positiva de la varianza.
Diagrama de árbol: Dispositivo gráfico útil para definir puntos muestrales de un
experimento donde se presentan varias etapas.
Diagrama de caja: Resumen gráfico de los datos. Se traza un rectángulo desde
el primer cuartil hasta el tercero, que indica la ubicación del 50% intermedio
de los datos. Luego unas líneas punteadas, llamadas bigotes, que van en los
extremos de la caja muestran la ubicación de datos mayores que el tercer cuartil
y menores que el primero. También se muestran las ubicaciones de los valores
atípicos.
Diagrama de dispersión: Método gráfico para mostrar la relación entre dos
variables cuantitativas. Una variable se representa sobre el eje horizontal y la
otra sobre el eje vertical.
Diagrama de pastel: Forma gráfica de presentar resúmenes de datos cualitativos,
basado en la subdivisión de un círculo en sectores que corresponden a la
frecuencia relativa de cada clase.

EDUBP | MARKETING | estadística aplicada I - pag.8


Diagrama de tallo y hojas: Técnica de análisis exploratorio de datos que clasifica
y ordena simultáneamente los datos cuantitativos y proporciona una perspectiva
de la forma de la distribución.
Diagrama de Venn: Dispositivo gráfico para representar, simbólicamente, el
espacio muestral y las operaciones que implican eventos.
Distribución acumulada de frecuencias: Resumen tabular de un conjunto
de datos cuantitativos que muestra la cantidad de artículos que tienen valores
menores que, o iguales al límite superior de cada clase.
Distribución acumulada de frecuencias porcentuales: Resumen tabular de un
conjunto de datos cuantitativos donde se muestra el porcentaje de los artículos
que tienen valores menores que, o iguales al límite superior de cada clase.
Distribución acumulada de frecuencias relativas: Resumen tabular de un
conjunto de datos cuantitativos donde se muestra la fracción o proporción de
los elementos cuyos valores son menores que, o iguales al límite superior de
cada clase.
Distribución binomial de probabilidad: Una distribución de probabilidad que
muestra la probabilidad de x éxitos en n intentos, en un experimento binomial.
Distribución de frecuencias: Resumen tabular de un conjunto de datos donde
se muestra la frecuencia (o cantidad) de artículos en cada una de varias clases
que no se traslapan.
Distribución de frecuencias porcentuales: Resumen tabular de un conjunto de
datos donde se muestra el porcentaje de la cantidad total de elementos en cada
una de varias clases que no se traslapan.
Distribución de frecuencias relativas: Resumen tabular de un conjunto de
datos donde se ve la frecuencia relativa, esto es, la fracción o la proporción, de
la cantidad total de elementos en cada una de varias clases que no se traslapan.
Distribución de probabilidad: Descripción de cómo se distribuyen las
probabilidades entre los valores que puede asumir la variable aleatoria.
Distribución de probabilidad de Poisson: Una distribución de probabilidad
que muestra la probabilidad de x ocurrencias de un evento en un intervalo
especificado de tiempo o de espacio.
Distribución muestral: Una distribución de probabilidades que consta de todos
los valores posibles de un estadístico de muestra.
Distribución normal de probabilidad: Una distribución continua de probabilidad.
Su función de densidad tiene forma de campana y está determinada por la media
y la desviación estándar.
Distribución normal estándar de probabilidad: Una distribución normal con
media 0 y desviación estándar 1.
Elementos: Las entidades a cerca de las que se reúnen datos.
Error estándar: La desviación estándar de un estimador puntual.
Espacio muestral: El conjunto de todos los puntos muestrales posibles
(resultados experimentales).
Estadística: El arte y ciencia de reunir, analizar, presentar e interpretar datos.
Estadística descriptiva: Métodos tabulares, gráficos y numéricos para resumir
datos.
Estadístico de muestra: Es una característica de la muestra, como la media

EDUBP | MARKETING | estadística aplicada I - pag. 9


de la muestra, la desviación estándar de muestra s, la proporción muestral, etc.
El valor del estadístico de muestra se usa para estimar el valor del parámetro
poblacional.
Estimado puntual: Un valor numérico único que se usa como estimado de un
parámetro poblacional. _ _­
Estimador puntual: El estadístico de muestra, como x, s, y p, que produce el
estimado puntual del parámetro poblacional.
Evento: Un conjunto de puntos muestrales.
Eventos independientes: Dos eventos, A y B, para los que P(A / B) = P(A) o que
P (B/ A) = P (B); esto es, los eventos no tienen influencia entre sí.
Eventos mutuamente excluyentes: Eventos que no tienen puntos muestrales
en común; esto es, A ∩ B está vacío y P(A ∩ B) = 0.
Experimento: Cualquier proceso que genere resultados bien definidos, que se
representan por E¡.
Experimento binomial: Experimento probabilístico que tiene las cuatro
propiedades descritas: a) el experimento consiste en una sucesión de n intentos
o ensayos idénticos; b) en cada intento son posibles dos resultados. A uno
lo llamamos éxito y al otro fracaso; c) la probabilidad del éxito, representada
por p, no cambia de un intento a otro. En consecuencia, la probabilidad de
fracaso, representada por 1- p, no cambia de un intento a otro; d) los intentos
son independientes.
Factor de corrección por continuidad: Valor de 0.5 que se suma o resta de un
valor de x cuando se usa la distribución normal para aproximar distribuciones
discretas.
Factor de corrección por población finita: El término V(N -n)I(N- 1) que se usa
en las fórmulas del error estándar de la media muestral y del de la proporción
muestral, cuando se selecciona una muestra de una población finita (no de una
población infinita). La regla fácil que generalmente se acepta es no tomar en
cuenta el factor de corrección por población finita siempre que nIN < 0.5.
Función de densidad: La función que define la distribución de probabilidades
de una variable aleatoria continua.
Función de probabilidad: Una función, representada por f(x), que determina
la probabilidad de que x asuma un valor determinado de una variable aleatoria
discreta.
Función de probabilidad binomial: La función que se usa para calcular las
probabilidades en un experimento binomial.
Función de probabilidad de Poisson: La función que se usa para calcular las
probabilidades de Poisson
Función hipergeométrica de probabilidad: La función que se usa para calcular
la probabilidad de x éxitos en n intentos, cuando éstos son dependientes.
Gráfico de barras: Forma gráfica de representar la información de una distribución
de frecuencias, de frecuencias relativas o de frecuencias porcentuales de datos
cualitativos.
Histograma: Presentación gráfica de una distribución de frecuencias, de
frecuencias relativas o de frecuencias porcentuales de datos cuantitativos. Se
traza colocando los intervalos de clase sobre el eje horizontal y las frecuencias
sobre el eje vertical.

EDUBP | MARKETING | estadística aplicada I - pag.10


Inferencia estadística: El proceso de reunir datos obtenidos de una muestra
para hacer estimaciones o probar hipótesis acerca de las características de una
población.
lnsesgo: Propiedad de un estimador puntual cuando su valor esperado es igual
al parámetro poblacional que estima.
Intersección de A y B: El evento que contiene a todos los puntos muestrales
que están simultáneamente en A y en B. La intersección se representa como A
∩ B.
Ley aditiva: Una ley de probabilidades que se emplea para calcular la
probabilidad de una unión, P(A U B). Esto es P(A U B) = P(A) + P (B) - P(A n B).
Para eventos mutuamente excluyentes, ya que P(A B) = 0, se reduce a P(A U B)
= P(A) + P(B).
Ley multiplicativa: Ley para calcular la probabilidad de una intersección, P(A B).
Es P(A B )= P(A) P(B/A) o bien P(A B)= P(B) P(A/B). Para eventos independientes
se reduce P(A B) = P(A) P(B).
Media: Medida de la localización central de un conjunto de datos. Se calcula
sumando todos los valores de los datos y dividiendo el resultado entre el número
de elementos.
Media ponderada: Media para un conjunto de datos, que se obtiene asignando
un factor de ponderación a cada valor de dato; este factor refleja la importancia
dentro del conjunto.
Mediana: Medida de la localización central. Es el valor que divide a los datos en
dos grupos iguales, uno con valores mayores que o iguales a la mediana, y el
otro con valores menores que o iguales a ella.
Medida estadística o estadístico de la muestra: Valor numérico que se usa
como medida resumida de una muestra (por ejemplo, la media de la muestra, la
varianza de la muestra, y la desviación estándar de la muestra s).
Método clásico: Método de asignar probabilidades que supone que los
resultados experimentales son igualmente posibles.
Método de la frecuencia relativa: Método de asignar probabilidades, basado
en la experimentación o en datos históricos.
Método subjetivo: Método de asignar probabilidades basadas en el juicio
personal.
Moda o modo: Medida de la localización, definida como el valor de dato que
ocurre con más frecuencia.
Muestra: Un subconjunto de la población.
Observación: El conjunto de mediciones obtenidas de un solo elemento.
Parámetro poblacional: Valor numérico que se usa como medida resumida de
una población de datos (por ejemplo, la media de la población, la varianza de la
población, y la desviación estándar de la población).
Percentil: Un valor tal que, cuando menos, p por ciento de los elementos son
menores que o iguales a ese valor, y al menos (100 - p) por ciento de los elementos
tienen valor mayor que o igual a ese valor. El 50° percentil es la mediana.
Población: El conjunto de todos los elementos de interés en determinado
estudio.
Probabilidad: Medida numérica de la posibilidad de que ocurra un evento.

EDUBP | MARKETING | estadística aplicada I - pag. 11


Probabilidad condicional: La probabilidad de un evento, dado que ha ocurrido
otro evento. La probabilidad condicional de A dado B es P(A / B) = P(A B)IP(B).
Probabilidades posteriores: Probabilidades actualizadas de eventos, basadas
en información adicional.
Probabilidades previas: Estimados iniciales de las probabilidades de los
eventos.
Punto medio de clase: Punto en cada clase que está a la mitad entre los límites
inferior y superior de clase.
Punto muestral: Resultado individual de un experimento.
Rango: Medida de dispersión, definida como el valor máximo menos el valor
mínimo.
Rango intercuartil (RIC): Medida de dispersión, definida como la diferencia
entre el tercer y el primer cuartil.
Regla empírica: Regla que establece los porcentajes de elementos que están
dentro de una, dos y tres desviaciones estándar de distancia del promedio, para
distribuciones con forma de colina o campana.
Requisitos básicos de probabilidad: Dos requisitos que restringen la forma de
hacer asignaciones de probabilidad:
a. Para cada resultado experimental, E¡ debe tener 0 ≤ P(Ei) ≤ 1.
b. Si hay k resultados experimentales, entonces ∑P(Ei) = 1.
Tabulación cruzada: Resumen tabular de datos para dos variables. Las clases
de una variable se representan en los renglones; las clases de la otra variable,
en las columnas.
Teorema de Chebyshev: Teorema que se aplica a cualquier conjunto de datos, y
que se puede emplear para hacer inferencias acerca del porcentaje de artículos
que deben quedar dentro de una cantidad especificada de desviaciones estándar
alrededor de la media.
Teorema central del límite: Teorema que permite usar la distribución normal
de probabilidades para aproximar la distribución de la media muestral y de la
proporción de la muestra cuando el tamaño de la muestra es grande.
Unión de eventos A y B: El evento que contiene todos los puntos muestrales
que están en A, en B, o en ambos. La unión se representa como A U B.
Valor atípico: Valor de un dato demasiado pequeño o demasiado grande.
Valor esperado: Medida de la media o localización central de una variable
aleatoria.
Valor z: Valor calculado dividiendo la desviación respecto al promedio, (xi - x),
entre la desviación estándar s. Se llama también valor estandarizado, y representa
la cantidad de desviaciones estándar que hay entre el valor xi y el promedio.
Variable aleatoria: Descripción numérica del resultado de un experimento.
Variable aleatoria continua: Una variable aleatoria que puede asumir cualquier
valor en un intervalo o conjunto de intervalos.
Variable aleatoria discreta: Una variable aleatoria que sólo puede asumir una
sucesión finita o infinita de valores.
Variable: Una característica de interés de los elementos.
Variable cualitativa: Una variable con valores cualitativos.

EDUBP | MARKETING | estadística aplicada I - pag.12


Variable cuantitativa: Una variable con valores cuantitativos.
Varianza: Medida de dispersión para un conjunto de datos, basada en las
desviaciones de los valores de los datos respecto a la media, elevadas al
cuadrado.

m ó dulos

m1

m1 microobjetivos

• Reconocer las diferencias entre los conceptos de población y muestra a


los fines de poder discernir sobre las metodologías de análisis y sobre
las implicancias de las mismas.

• Reconocer las distintas variables o características que se desean


investigar a los fines de poder aplicar las técnicas estadísticas adecuadas.

• Clasificar los distintos tipos de datos que recoge un analista a los fines
de poder seleccionar la mejor manera para su representación como
así también la elección de las técnicas estadísticas adecuadas para su
análisis.

• Distinguir entre las escalas de medición nominal, ordinal, de intervalo y


de razón a los fines de poder detectar las medidas resúmenes acordes
a cada una de ellas y decidir las técnicas de análisis más apropiadas.

m1 contenidos

Introducción a la Estadística Descriptiva


Los temas que desarrollaremos en el presente módulo son los siguientes:

1. Población y muestra
2. Variable y dato estadístico
3. Tipo de datos
4. Niveles de medición

Asimismo, antes de comenzar con el desarrollo de los temas planteados, le


solicito remitirse al Capítulo 1 (Lind, Marchal, y Wathen, 2008) del material básico,
donde se explica claramente el concepto de estadística, su aplicación y tipos.

EDUBP | MARKETING | estadística aplicada I - pag. 13


1. Población y Muestra

Se denomina población o universo al conjunto de artículos, individuos o cosas


sobre los cuales se desea realizar una investigación. Todo el proceso de reunir,
organizar e interpretar datos es motivado por el deseo de conocer algo acerca
de la población. En ocasiones la población bajo estudio está compuesta por una
cantidad infinita de unidades elementales que hacen imposible trabajar con la
totalidad de ellas o que lo hace muy costoso.
Entonces, la solución será trabajar con una parte de ella, ya que así reduciremos
costos y tiempo. Este subconjunto de la población es el que se denomina muestra
y deberá intentarse que ella sea una parte representativa de la población.

2. Variable y dato estadístico

Una variable es una característica de interés a investigar sobre las unidades


elementales de las cuales se reúnen datos. Veamos juntos un ejemplo: si
realizamos un estudio sobre los alumnos que cursan esta asignatura, las variables
que se podrían analizar serían, entre otras: edad, estatura, sexo; cantidad de
materias aprobadas, ciudad de origen; si en cambio el estudio se encamina hacia
empresas mayoristas dedicadas a la comercialización de productos alimenticios
no perecederos las variables que se podrían abordar son: costos, rentabilidad,
ventas, deudas fiscales, cantidad de empleados, entre otras.
Los datos estadísticos se obtienen contando o midiendo las unidades
elementales. Es un conjunto de resultados que se presentan para cada variable
en estudio y cuya principal característica es que pueden tomar diferentes valores
de una unidad elemental a otra. Los datos estadísticos pueden ser analizados,
relacionados e interpretados.
Es necesario aclarar que la unidad elemental es cada uno de los elementos
de la población o universo sobre los cuales queremos hacer un determinado
análisis.

3. Tipo de datos

Datos cualitativos: son aquellos datos que, ante una determinada pregunta,
arrojan respuestas categóricas. Las unidades elementales pueden ser clasificadas
sólo como poseedoras o no poseedoras de cierta cualidad o propiedad.
Las observaciones cualitativas de las unidades elementales se llaman atributos.

Dato cuantitativo: las unidades elementales asumen cualquier valor numérico,


existen dos tipos:

Dato cuantitativo discreto: son datos que, ante una pregunta


determinada, arrojan respuestas numéricas que surgen de
un proceso de conteo. Ejemplos: cantidad de hijos, cantidad
de materias aprobadas, cantidad de aportantes en el hogar,
cantidad de habitaciones en una vivienda.

Dato cuantitativo continuo: son datos que, ante una


pregunta, dan una respuesta numérica que surge de un
proceso de medición. Ejemplos: peso, altura, edad, ventas,
gastos, rentabilidad, vida útil de un electrodoméstico, etc.

EDUBP | MARKETING | estadística aplicada I - pag.14


A los fines de poder evaluar si se han comprendido los conceptos anteriores le
propongo realizar juntos la siguiente actividad:
Supongamos que tenemos un conjunto de variables y le pido a Ud. que
clasifique los datos que a continuación se le proporcionan en datos cualitativos
y cuantitativos (discretos o continuos).

En la primera columna usted deberá identificar la variable en estudio y marcar


con una cruz la clasificación de la misma.

EDUBP | MARKETING | estadística aplicada I - pag. 15


4. Niveles de medición

Este tipo de clasificación trata de mostrar las distintas maneras de medir o


cuantificar las respuestas a diversas preguntas. La cuantificación permitirá
sintetizar la información, y a su vez permitirá la aplicación de diversas técnicas
estadísticas permitiendo un mayor aprovechamiento de la información. Existen
cuatro escalas básicas: la nominal, la ordinal, la de intervalo y la de ratios o
razón.

Escala nominal: es la que identifica distintas categorías de respuestas, no


existiendo un orden particular para las diferentes categorías y en donde éstas
son mutuamente excluyentes. Ejemplos: la variable sexo es una variable a
escala nominal, admite dos categorías como respuesta masculino o femenino,
donde las mismas son mutuamente excluyentes y donde el orden en que se las
mencione carece de importancia. La preferencia por una marca de una gaseosa
cola podría mencionarse como otro posible ejemplo para este tipo de escala. Se
cree oportuno destacar que aunque las etiquetas de respuesta estén codificadas
por números, estos números no indican ningún orden lógico.

Escala ordinal: en ellas, las diferentes categorías tienen un orden, donde unas
son mayores que otras y en donde los números que se asignan a las distintas
alternativas de respuesta implican un rango de orden. Las categorías son
mutuamente excluyentes y exhaustivas. Este tipo de escala permite determinar
si un objeto tiene más o menos una característica, comparado con algún otro
objeto, pero no cuanto más o cuanto menos. Ejemplos posibles de este tipo
de escala, e intentando mencionar algunos, son los diferentes niveles socio-
económicos, la categoría ocupacional de los empleados de una empresa, la
preferencia por un determinado programa de televisión (1º lugar, 2º lugar, 3º
lugar, etc.)

Escala de intervalo: tiene las mismas características de la escala ordinal, y la


distancia entre valores es constante. La diferencia entre dos valores cualesquiera
de la escala es la misma diferencia que entre cualquier otro par de valores
adyacentes de una escala de intervalos. Un ejemplo común de la vida diaria es
la escala de la temperatura, en ella se puede observar que el cero es un valor
arbitrario, la diferencia entre 1 y 2 grados es la misma diferencia que entre 2 y
3 grados, que es la misma diferencia que entre 7 y 8 grados. Debido a que el
punto cero es arbitrario, no es significativo tomar proporciones de las escalas
de valores. Deseando conocer la preferencia de un encuestado por diferentes
hipermercados en una escala de 7 puntos, por ejemplo si Wal- Mart recibió una
calificación de 6 y Libertad una de 2, esto no significa que Wal-Mart sea preferido
el triple que Libertad.

Escala de ratios o razón: en este tipo de escala el punto de partida no es


arbitrario ni tampoco ambiguo, por ejemplo, cuando decimos tener “cero peso”,
decimos en definitiva que la ausencia de dinero es absoluta. En este tipo de
escalas se puede identificar o clasificar objetos, jerarquizarlos y comparar los
intervalos o diferencias. También es significativo considerar las proporciones de
los valores de la escala. No solamente la diferencia entre $2 y $4 es la misma
que la diferencia entre $10 y $12, sino que $10 es 5 veces más grande que $2
en sentido absoluto. El cociente de dos números es relevante. Los ejemplos
comunes de escala de razón incluyen edad, peso, ventas, participación en el
mercado, número de clientes, la tasa de retorno de las empresas entre otros.

Recuerde continuar profundizando los temas presentados a partir del material


de estudio propuesto.

EDUBP | MARKETING | estadística aplicada I - pag.16


Diríjase a la página 7 para leer el contenido de este material.

m1 material

Material Básico:

• LIND, D., MARCHAL, W. y WATHEN, S. (2008) Estadística Aplicada a los


Negocios y a la Economía. Ed. McGraw Hill. Capítulo Nº 1.

Material Complementario:

• ANDERSON, DAVID R.; SWEENEY, DENNIS J., WILLIAMS, THOMAS


A. (2008) Estadística para administración y economía. Ed. THOMSON
INTERNATIONAL
• LEVINE, DAVID M.; BERENSON, MARK L.; KREHBIEL, TIMOTHY C.
(2006) Estadística para administración. Ed. Pearson
• MENDENHALL, WILLIAM; BEAUER, BARBARA M.; BEAUER, ROBERT J.
(2007)
• Introducción a la probabilidad y estadística. Ed. THOMSON
INTERNATIONAL.
• VISAUTA VINACUA, BIENVENIDO. (2007) Análisis estadístico con SPSS
14. Estadística Básica Ed. McGraw Hill

m1 actividades

m1 | actividad 1

“La más larga caminata comienza con un paso” (Proverbio hindú)

Un día domingo, como tantos otros domingos


de estos últimos dos meses, se encuentra en su
casa leyendo la página de la sección clasificados
de uno de los periódicos de mayor difusión en la
región donde vive. Sabe que dar con el empleo
buscado no será una tarea sencilla. Los avisos
solicitando estudiantes avanzados de carreras
vinculadas con el área de los negocios son
variados: se solicitan operadores del sistema
Tango, asistentes para el área de recursos
humanos, colaboradores para gerentes de
marketing, asistentes con conocimientos de
finanzas, etc., etc. Está decidido a enviar su
currículum, dando respuesta a algunos de los
avisos. Está realmente ansioso por vincularse
con alguna de las empresas y comenzar a poner
en práctica los conocimientos que día a día le
van ayudando a construir los docentes en la
universidad.

EDUBP | MARKETING | estadística aplicada I - pag. 17


Tiene los temores lógicos de cualquier estudiante que decide comenzar a
indagar en el mundo profesional donde le tocará desenvolverse en pocos años.

Los días se hacen interminables y el llamado


tan esperado no ocurre…

…Pero un día, mientras estaba reunido con


un grupo de compañeros de estudio, suena
el teléfono... las palabras del otro lado de la
línea suenan inesperadas: le comunican desde
la consultora Lépore y Asociados que han
recibido su currículum y que están interesados
en concertar una entrevista con usted.

La entrevista se desarrolla con normalidad y, luego de varias citas le informan


que usted ha sido la persona seleccionada para cubrir un nuevo cargo dentro
de la empresa, una consultora conformada por profesionales de distintas áreas:
sociólogos, administradores, estadísticos, abogados, contadores entre otros.

La consultora asesora empresas en sus distintas áreas. Su puesto de trabajo


ha sido creado de manera estratégica, a efectos de mejorar el actual vínculo
existente entre los profesionales de estadística y el resto de los sectores que
solicitan los servicios de este departamento.
Ya hace unos días que se encuentra en plena actividad. Pero por primera vez,
uno de los profesionales de su área lo convoca para decirle lo siguiente:

“La firma Artin SA está estudiando la viabilidad de incorporarse al sector de


las tarjetas de crédito. En el estudio en el que se sustentará la decisión final
se verán implicadas las áreas Finanzas, la Impositiva y la Legal. A nuestro
departamento se le ha solicitado que se busque información vinculada con
el sector de las tarjetas de crédito y que realicemos los aportes que creamos
relevantes. ¡Manos a la obra! Está frente a su primera tarea.

¡Buena Suerte!”

Luego de sobreponerse a la primera sensación de no saber por dónde comenzar,


recuerda que con motivo de tener que preparar un trabajo para el área de
management en la universidad, había leído un material sobre el tema que ahora
se le pedía investigar. Pero no recordaba en cuál ejemplar de la revista “Mercado”
estaba la información.

Luego de buscar en algunos números de la revista, finalmente encuentra el


artículo titulado: “Aún con señales mixtas, las tarjetas de crédito crecen”.

EDUBP | MARKETING | estadística aplicada I - pag.18


Síntesis sectorial

2005 2006 2007


Caracterización del negocio

Dimensionamiento
Consumo (en millones de $) 31.465 46.135 67.200
Tasa de crecimiento 2005/2007 p.a +46%
Plásticos (en miles) 15.514 20.163 25.516
Bancarios 10.602 13.389 17.000
No Bancarios 4.912 6.774 8.516
Titulares 10.314 13.361 15.882
Adicionales 5.200 6.802 9.634
Variables sectoriales
Personal ocupado 7.200 7.300
Cantidad de empresas 60 60
Perspectivas Alto crecimiento

Fuente: Mercado, Septiembre 2008.

Con este artículo se pone a trabajar para brindar una respuesta. La consigna
es:

Realizar un análisis breve donde incluya las variables presentadas y su


clasificación. (Considere que los datos ya están organizados).
De dicho análisis la firma Artin SA podrá deducir la conveniencia de
implementar o no la utilización de tarjetas de crédito, lo cual usted deberá
informarles por escrito.

m1 | actividad 2

Cara a Cara con la encuesta

En conversación con los profesionales del área estadística surge la necesidad


de implementar una encuesta a efectos de sondear el sector de supermercados
y conocer aspectos sobre las preferencias de los consumidores.

Uno de los especialistas del área le dice: “Hemos decidido trabajar con una
muestra de 385 personas, seleccionadas aleatoriamente en la segunda
quincena de marzo del presente año, en la ciudad de Córdoba (Argentina)
– lugar donde se piensa establecer el supermercado–. Pensamos que algunas
de las preguntas que debería contener el instrumento a utilizar serían, entre
otras, las siguientes:

EDUBP | MARKETING | estadística aplicada I - pag. 19


1.- Sexo: 1 Masculino 2 Femenino

2.- Edad:.....................

3.- ¿Realiza compras en supermercados? 1 Sí 2 No

Si la respuesta fue No pase a la pregunta Nº 7

4.- ¿Con qué frecuencia promedio en el mes realiza compras en los


supermercados?:
1 1a2
2 3a4
3 más de 5

5.- ¿Cuál es el sector de supermercado al cuál recurre a realizar compras?


(permite elegir más de una alternativa):
1 almacén en general 5 carnicería
2 verdulería 6 bazar
3 indumentaria 7 panadería
4 perfumería 8 otros.....................

6.- ¿Cuánto gasta en promedio (al mes) en el supermercado? $...................


(Fin de la encuesta para las personas que respondieron Sí en la pregunta
número 3)

7.- ¿Podría indicar la causa por la cual no realiza compras en el


supermercado?................
...........................................................................................................................
......................

“Usted tiene la responsabilidad de capacitar al grupo de encuestadores que


realizarán el trabajo de campo”.

.....

Durante la capacitación, usted comienza a darse cuenta de que hay algunos


puntos que los encuestadores no tienen muy en claro y cree que si llegan a
internalizar de mejor manera algunos temas, se logrará que la información que
se obtenga sea más consistente. Entre otras cosas, ha observado que manejan
indistintamente los conceptos de Población y Muestra, y usted lo percibe
porque manejan indistintamente los términos. Algunos de ellos no llegan a
establecer qué características se pretenden analizar ni tampoco diferencian de
qué tipo serán estas últimas y cuál podría ser la escala de medición para cada
características a investigar. El éxito de todo el equipo depende básicamente de
la ayuda que usted les pueda brindar. Por favor intente aclararles con precisión
aquellos conceptos que aún no están del todo claros y utilice la encuesta con el
fin de identificar las variables que intervienen y la clasificación de las mismas…
no deje de acudir al AA1 en caso que lo necesite.

A 1

C 1

EDUBP | MARKETING | estadística aplicada I - pag.20


m1 |actividad 2 | AA

asistente académico 1

Creemos conveniente que recuerde que cada pregunta genera una característica
a analizar, y que a su vez cada una de ellas conducirá a que se realice el análisis
de datos correspondiente.

m1 |actividad 2 | CC

clave de corrección 1

Población: todas las personas que viven en la ciudad de Córdoba, Argentina, en


la segunda quincena de marzo del corriente año.

Muestra: 385 personas (recuerde que surgirán de la población que se ha definido


anteriormente).

Variables objeto de estudio y clasificación:

Cada pregunta de la encuesta genera una variable.

1.- Sexo: cualitativa, escala de medición: nominal.

2.- Edad: cuantitativa continua, escala de medición: razón.

3.- Realiza compra en supermercados: cualitativa, escala de medición: nominal.

4.- Frecuencia con que realiza compras en un supermercado: cuantitativa


discreta, escala de medición: ordinal

5.- Sector del supermercado en el que realiza compras: cualitativa, escala de


medición: nominal.

6.- Gasto promedio en el mes en el supermercado: cuantitativa continua, escala


de medición: razón.

EDUBP | MARKETING | estadística aplicada I - pag. 21


m1 | actividad 3

Toma de decisiones… en problemas

A esta altura de los acontecimientos, usted se encuentra en plena actividad. El


trabajo con los encuestadores está dando resultados; es lógico pensar que valió
la pena.

En uno de aquellos momentos que se encuentran dentro de las horas de trabajo


para compartir un café con los compañeros, la asistente del área contable, Andrea,
le comenta que, a raíz de que la consultora se encuentra analizando la viabilidad
de que la firma “Artin S.A.” se incorpore al negocio de los supermercados, se
están realizando contactos para que otro de los clientes, dedicado a la venta de
“controladores fiscales” (máquinas registradoras), pueda ubicar sus productos
en la empresa Artin SA. -en caso de que el negocio se lleve adelante.

La empresa “Technology punto com SRL” es la interesada en ubicar sus


máquinas registradoras. La firma está promocionando una nueva línea más
económica que las anteriores; pero en el mercado se rumorea que a las pocas
horas de estar funcionando comienzan a generar errores, y que no es siempre
fácil encontrar una solución para las mismas.

Obviamente, el problema llega a su departamento. Luego de reiteradas


conversaciones entre el gerente del departamento de control de calidad de
Technology punto com SRL y el Licenciado Sánchez Navarro (asesor de su área),
éste les comunica lo siguiente: “A raíz de los comentarios desfavorables respecto
de esta nueva línea de máquinas, hemos acordado con Technology que se tomará
una muestra representativa de la población; una vez seleccionada se encenderán
los aparatos y se observará el tiempo que éstos funcionan sin generar errores.
Dependerá de los resultados obtenidos de que aconsejemos o no a Artin S.A. la
conveniencia de adquirir este producto”.

Andrea, que ocasionalmente se encontraba en su oficina, ha escuchado las


palabras de Sánchez Navarro y comenta: “Creo que lo que dice el Licenciado
no es correcto, ya que según mi entender deberían probarse todas las
máquinas. ¿Cómo puede confiarse con los resultados que surjan, si sólo se
piensa analizar una parte del total producido?”

Me imagino su expresión... quedó estupefacto con el comentario de su


compañera. No es para menos. Sin embargo usted le explica a Andrea los
fundamentos que seguramente argumentaría Sánchez Navarro si hubiese
escuchado su comentario.

Exprese por escrito esos fundamentos. Considere lo siguiente:


Piense si la sugerencia de Andrea es lógica. ¿Qué sucedería si se probara toda
la producción? ¿Trabajar con toda la población le asegura mejores resultados?
¿Qué sucede con los tiempos, con los costos?

C 1

EDUBP | MARKETING | estadística aplicada I - pag.22


m1 |actividad 3 | CC

clave de corrección 1

La opinión del gerente es la correcta, no así la de Andrea, ya que el hecho


de trabajar con toda la población no nos asegura mejores resultados. En
procesos productivos probar toda la producción llevaría a agotarla. Si la muestra
se selecciona de manera representativa de la población, los resultados que
provengan de ella seguramente serán confiables.

m1 | actividad 4

Estadística Descriptiva y Estadística Inferencial

1. Explique de manera simple, concisa y precisa qué entiende Ud. cuando


hablamos de Estadística Descriptiva y qué comprende cuando hablamos de
Estadística Inferencial.

2. Para cada caso de este apartado, identifique:

 Población objeto de estudio/ muestra.


 Unidad elemental.
 La/s característica/s analizada/s, y clasifique los datos generados por las
mismas.

2.1. En el primer semestre del año próximo pasado, la empresa ARSOR S.A.
realizó exportaciones de golosinas a los Estados Unidos. Para llevar a cabo dicho
envío al país del norte, el departamento de control de calidad de la mencionada
firma debió verificar especialmente el peso de las golosinas enviadas y su sabor,
con el fin de evitar que las mismas fueran rechazadas al llegar a destino.

2.2. En el año pasado, la empresa ZAPATIN SRL. exportó toda su producción de


zapatos de cuero a Brasil. Las condiciones acordadas para que los brasileños
recibieran el embarque fue respetar las especificaciones en el margen de costura
del calzado y el color de los mismos.

2.3. Los alumnos que cursaron la actual materia el año próximo pasado realizaron
un trabajo monográfico que consistió en recolectar datos a través de una encuesta
y procesar la información. Decidieron hacer las encuestas a los alumnos de la
Universidad Blas Pascal. Se trabajó con una muestra aleatoria de 106 alumnos.
Entre las preguntas que se les realizaron encontramos las siguientes:

1.-Estatura:..............(en cm.)

2.-Edad: ....................

EDUBP | MARKETING | estadística aplicada I - pag. 23


3.-Carrera que cursa: 1 Lic. en Administración 2 Lic. en Comunicación
3 Lic. en Informática 4 Ingeniería en
Telecomunicaciones
5 Lic. en Diseño Gráfico 6 Abogacía
7 Contador Público 8 Gestión Ambiental
9 Lic. en Turismo 10 Lic. en Psicopedagogía

4. ¿Cuál es su estado actual de empleo?


1 Tiempo completo 2 Tiempo parcial 3 Sin empleo

2.4. El productor de un programa infantil de televisión, "Colorín Colorado",


quiere conocer la aceptación que tiene su programa en comparación con otros
programas infantiles que se dan a la misma hora. Para esto decide hacer una
encuesta telefónica a 200 posibles televidentes en el horario de su programa.

2.5. Un comerciante desea instalar una hostería en Mina Clavero. Con el fin de
determinar la conveniencia o no de la inversión en dicha ciudad, se estudiará
la cantidad de automóviles que pasen por las rutas de acceso en los períodos
Enero a Marzo, en el período vacacional del mes de Julio y en Semana Santa.
La investigación se realizará mediante un relevamiento de cuatro horas todos los
días de los períodos a los cuales se hace referencia.

2.6. Un fabricante de aparatos de televisión ha afirmado que en el pasado sólo


el 10% de sus aparatos necesitaron reparación durante los dos primeros años.
Para comprobar esta afirmación se seleccionaron 100 aparatos de TV.

2.7. Un gerente de comercialización de una empresa indumentaria de alta


costura, está estudiando la posibilidad de abrir un nuevo centro de ventas en
una zona determinada. Para ello desearía saber cuál es el nivel de ingresos de
las familias en esa zona y cuál es el monto que destinan a la compra de ropa por
mes. Por tal motivo se hizo un relevamiento para obtener tal información a 200
familias de la zona.

2.8. Suponga usted que el director de una empresa que fabrica pilas desea saber
cuál es la duración promedio de las pilas que produce. Indique cuáles serían los
pasos que seguiría usted para obtener la respuesta pedida. Si usted realizara
la investigación, indique si trabajaría con muestra o población y justifique su
método.

A fin de ampliar el espectro de práctica le propongo resolver las actividades


sugeridas por el autor del material básico, en los ejercicios del capítulo
correspondiente.

EDUBP | MARKETING | estadística aplicada I - pag.24


Diríjase a la página 8 para leer el contenido de este glosario.

m1 glosario

Conjunto de datos: Todos los datos reunidos en determinado estudio.

Datos: Los hechos y números que se reúnen, analizan e interpretan.

Datos cualitativos: Datos que aparecen en etiquetas o nombres de determinada


característica de un elemento. Los datos cualitativos pueden ser numéricos o no
numéricos.

Datos cuantitativos: Datos que indican cuánto o cuántos de algo. Los datos
cuantitativos siempre son numéricos.

Datos de una serie de tiempo: Datos reunidos en diversos periodos sucesivos.

Datos transversales: Datos reunidos en el mismo, o aproximadamente el mismo,


punto en el tiempo.

Elementos: Las entidades a cerca de las que se reúnen datos.

Estadística: El arte y ciencia de reunir, analizar, presentar e interpretar datos.

Estadística descriptiva: Métodos tabulares, gráficos y numéricos para resumir


datos.

Inferencia estadística: El proceso de reunir datos obtenidos de una muestra


para hacer estimaciones o probar hipótesis acerca de las características de una
población.

Muestra: Un subconjunto de la población.

Observación: El conjunto de mediciones obtenidas de un solo elemento.

Población: El conjunto de todos los elementos de interés en determinado


estudio.

Variable: Una característica de interés de los elementos.

Variable cualitativa: Una variable con valores cualitativos.

Variable cuantitativa: Una variable con valores cuantitativos.

Recomendamos la ampliación del presente texto con el glosario


del material básico sugerido. Página 132 (decimotercera edición)

EDUBP | MARKETING | estadística aplicada I - pag. 25


m ó dulos

m2

m2 microobjetivos

• Organizar un conjunto de datos en una distribución de frecuencias a los


fines de resumir la información para realizar un análisis más eficaz.

• Determinar el método más eficiente para presentar un conjunto de datos


a los fines de facilitar una toma de decisiones más certera.

• Construir los distintos diagramas y gráficas, como el de torta, barras,


histogramas, polígonos de frecuencia y ojivas a los fines de resumir
de una manera amena y de fácil lectura para quienes deban abordar la
información.

m2 contenidos

Descripción de datos: Tablas de frecuencias, distribuciones de frecuencias


y gráficos

Los temas que desarrollaremos en el presente módulo son los siguientes:

1. Tipos de frecuencias
2. Pasos sugeridos para la construcción de la tabla de frecuencias
con intervalos
3. Uso correcto e incorrecto de los gráficos estadísticos

Antes de comenzar a estudiar el módulo es conveniente realizar la siguiente


aclaración:

Una de las cuestiones que hacen complejo el estudio de la Estadística es la


diversidad de simbología que existe para tratar un mismo tema. Por ejemplo,
en el material básico se utiliza la letra H para hacer referencia al valor máximo
que puede asumir una variable, al cual nosotros no le asignamos ninguna letra
en particular simplemente lo llamamos valor máximo y en cambio utilizamos la
letra H cuando hacemos referencia a la frecuencia relativa acumulada.
¡Adelante con el módulo 2!

EDUBP | MARKETING | estadística aplicada I - pag.26


1. Tipos de Frecuencias:

Frecuencia absoluta simple: es la cantidad de veces que se repite cada valor


de la variable y que simbolizamos como fi. La sumatoria de todas las frecuencias
absolutas simples, es igual al tamaño de la muestra: ∑ fi = n

Frecuencia relativa simple: es la proporción que en el total de las observaciones


tiene cada frecuencia absoluta simple, y la simbolizamos como hi. Ésta se
calcula: hi: fi / n.

La sumatoria de todas las frecuencias relativas simples es igual a uno (1): ∑hi
=1

Frecuencia absoluta acumulada: surge de ir sumando las frecuencias absolutas


simples. Simbólicamente: Fj = f1 + f2 +... + fj

Frecuencia relativa acumulada: se obtiene al ir sumando las frecuencias


relativas simples. Simbólicamente: Hj = h1 + h2 +...+ hj

Trataremos de dar un ejemplo que facilite la comprensión de estos temas:

Supongamos que estamos estudiando la cantidad de accidentes de motos que


ocurren en una populosa ciudad de nuestro país, las estadísticas se toman
durante quince días y los resultados que surgen son:
2 1 3 2 4 0 1 1 0 0 2 3 2 2 1

En primer lugar Ud. deberá tener en claro que la variable que está analizando es
la cantidad de accidentes de moto, la cual es una variable cuantitativa discreta de
escala de razón. La misma en esta oportunidad la simbolizaremos con la letra X

En segundo lugar deberá observar los valores que puede asumir esta variable: 0
1 2 3y4

En tercer lugar ya podrá comenzar a construir la tabla de frecuencia

X
f
i
F
i hi H
i
0 3 3 3/15 3/15
1 4 7 4/15 7/15
2 5 12 5/15 12/15
3 2 14 2/15 14/15
4 1 15 1/15 1

∑ fi =n=15

Vayamos más allá de los números y analicemos algunos resultados:

f 3
= 5 significa que hay 5 días donde se produjeron 2 accidentes de moto

EDUBP | MARKETING | estadística aplicada I - pag. 27


F 3
= 1212 significa que hay 12 días en que se produjeron 2 o menos accidentes

h3
= 55/15
/ 15 ==00,33
,3 y si a este valor lo multiplico por cien, diremos que en el

33% de los días hubo 2 accidentes de moto.

H 3
/ 15 ==0,80,80
= 1212/15 0 convirtiéndolo en porcentaje diremos que en el 80% de los

días ocurrieron 2 o menos accidentes de moto.

De trabajar con una variable cualitativa en términos generales hay similitudes,


no perdiendo de vista si se trata de una variable de escala nominal o de una de
escala ordinal. Plantearemos un ejemplo:

Se trabajará utilizando un estudio que realizaron alumnos que cursaron la materia


Investigación de mercado y trabajaremos con la variable “Frecuencia en el uso
de Internet”. La población objeto de análisis fueron los habitantes de la ciudad
de Córdoba de 18 años o más de edad. Los datos fueron procesados en Mega
Stat con su versión para Excel obteniéndose los siguientes resultados:

Frequency Distribution - Qualitative

Data
frequency percent
cotidianamente 149 62,6
habitualmente 23 9,7
esporádicamente 18 7,6
no lo uso 46 19,3
238 100,0

Frecuencia en el uso de internet

no lo uso
19%

esporádicamente
8%

habitualmente
10%
cotidianamente
63%

Respecto a dicha salida podemos hacer algunas apreciaciones:

• Dependiendo del software que se utilice y de la versión del mismo la


terminología técnica podrá estar en castellano o en inglés.

• Las frecuencias relativas simples en la mayoría de los casos aparecen


expresadas en porcentajes “percent”.

• Algunos software realizan el cálculo de sólo algunas de las frecuencias

EDUBP | MARKETING | estadística aplicada I - pag.28


mencionadas; en el ejemplo aparecen “frequency” frecuencia absoluta
simple y “percent” término análogo al de las frecuencias relativas
simples.


En este caso la variable bajo análisis es cualitativa de escala ordinal
dado que
cotidianamente hace referencia a todos los días, habitualmente se
refiere a una
vez por semana como mínimo, esporádicamente se definió como cada
quince días o más; si así fuera considerada se justificaría el cálculo de
las frecuencias
acumuladas. En cambio en el caso de trabajar con variables a escala
nominal el
cálculo de las frecuencias acumuladas carecerán de sentido.

f 3
= 1818 significa que hay 18 personas que respondieron que usan Internet sólo

esporádicamente.

2. Pasos sugeridos para la construcción de la tabla de frecuencias con intervalos:

• Seleccionar el número apropiado de clases para cada tabla.1*


• Obtener la amplitud apropiada para cada clase o intervalo, para lo cual
debemos:
- Definir el rango o recorrido de la variable que lo simbolizamos
como R.
El recorrido o rango surge de la diferencia entre el valor máximo
que asume
la variable y el valor mínimo de ésta.

- A la amplitud del intervalo la simbolizamos con la letra C y será


igual a:

R
C = 
Nº de intervalos

1 * El número de intervalos de una tabla de frecuencias es arbitrario. En


términos generales, diremos que una tabla debe tener entre 5 y 20 clases (o
intervalos). Si el número de intervalos es escaso no se revelará ningún detalle
sobre los datos, pero si son muy numerosos perderá sentido haberlos agrupado.
Una regla sencilla que se puede seguir para aproximar el número de intervalos
es la siguiente:
Siendo c el número de intervalos, diremos que el número de éstos es la menor
potencia a la que ha de elevarse 2 para que el resultado sea igual o mayor que
el número de observaciones.
C 5
2 =n En el caso que Ud. debe resolver 2 = 30. Por lo que el número de
intervalos sugerido es 5.

EDUBP | MARKETING | estadística aplicada I - pag. 29


Si C es un decimal se redondea en el entero superior más
próximo. Este nuevo

valor que surgirá lo simbolizaremos con la letra C’.

Al obtener un nuevo valor para la amplitud, se producirá un cambio


en el R;
definiendo como R’ = C’. nº de intervalos.

La diferencia que existe entre R’ y R será distribuida


arbitrariamente entre el
valor máximo y el valor mínimo de la variable, ampliando de esta
manera el recorrido(nunca disminuyéndolo).

• Establecer los límites de fronteras de cada clase, logrando de esta manera


evitar superposiciones en la asignación de los valores a cada intervalo.

A manera de ejemplo desarrollaremos la Actividad 3 que propone el módulo.

a) Clasificar los datos en una tabla de frecuencias construida por 5


intervalos y obtener la distribución de frecuencia
b) Indicar el significado de algunos valores. Por ejemplo f4 =6 y F2 =12

a) Clasificar los datos en una tabla de frecuencias construida por 5 intervalos y


obtener la distribución de frecuencia
Número de intervalos: 5
Rango: Valor máximo – Valor Mínimo = 1341 – 1324 = 17
C (amplitud) = R / nº intervalos= 17 / 5 = 3,4 ⇒ C´ = 4
R´ = C´ x nº intervalos = 20
R´ - R = 20 - 17 = 3

Frequency Distribution - Quantitative

Data cumulative
lower upper midpoint width frequency percent frequency percen
1.324 < 1.328 1.326 4 6 20,0 6 20,
1.328 < 1.332 1.330 4 7 23,3 13 43,
1.332 < 1.336 1.334 4 9 30,0 22 73,
1.336 < 1.340 1.338 4 6 20,0 28 93,
1.340 < 1.344 1.342 4 2 6,7 30 100,

30 100,0

¿Cómo lo hicimos utilizando los comandos del software MegaStat. De la siguiente


manera:

EDUBP | MARKETING | estadística aplicada I - pag.30


nt
,0
,3
,3
,3
,0

EDUBP | MARKETING | estadística aplicada I - pag. 31


Algunas consideraciones a tener en cuenta:

• Hemos considerado los intervalos cerrados por la izquierda y abiertos


por la derecha, significa que en el caso del primer intervalo en caso
de aparecer un valor 1.328 éste debe ser contado dentro del segundo
intervalo y no dentro del primero, ya que en el primero en realidad va
hasta menos 1328, iría hasta 1327,999.
• Lo que en la salida aparece como midpoint (punto medio) nosotros lo
llamaremos marca de clase. La simbolizaremos como yi y es el valor
central de cada intervalo
• Frequency = frecuencia absoluta simple.
• Percent = frecuencia relativa simple expresada en porcentaje

b) Analizar los valores f4 =6 y F2 =12

f4 = 6 significa que de los 30 obreros hay 6 que ganan entre $ 1.336 y $ 1.340
F2 = 12 significa que de los 30 obreros hay 13 que ganan menos de $ 1.332.
Las frecuencias relativas simples y las acumuladas podrán ser expresadas como
porcentajes.

A. Representación gráfica de una distribución de frecuencias

Continuando con la Actividad 3 se construirán los gráficos pertinentes a la


variable bajo estudio:

El Histograma será el gráfico apropiado para trabajar con las frecuencias


absolutas simples o relativas simples. Se podrá construir de manera manual o
utilizando el software.

EDUBP | MARKETING | estadística aplicada I - pag.32


Histogram

35

30

25

Percent
20

15

10

4
32

32

33

33

34

34
1.

1.

1.

1.

1.

1.
Data

La ojiva será el gráfico apropiado para trabajar con las frecuencias absolutas
acumuladas o relativas acumuladas. Se podrá construir de manera manual o
utilizando el software.

Ogive

100,0

75,0
Cumulative Percent

50,0

25,0

0,0
1.320 1.324 1.328 1.332 1.336 1.340
Data

Es importante resaltar que la Ojiva deberá construirse sobre el extremo superior


de cada intervalo, como el ejemplo, o bien sobre el punto medio de cada
intervalo

EDUBP | MARKETING | estadística aplicada I - pag. 33


B. Representación gráfica de datos cualitativos2**
Un ejemplo ya visto anteriormente es cuando se trabajó con la variable
“Frecuencia en el uso de Internet”.

Aquí le sugerimos visitar la siguiente dirección:


http://www.youtube.com/watch?v=j120LUI4k7g

3. Uso correcto e incorrecto de los gráficos estadísticos

Si bien los gráficos estadísticos son de gran utilidad, éstos deben emplearse
con cuidado, tratando de evitar que el lector que desconoce el tema llegue a
conclusiones equivocadas. Algunos de los métodos más comunes para confundir
a los lectores inexpertos son:

• Modificar la escala de los ejes de la gráfica.


No es fácil dar una regla objetiva respecto del tamaño adecuado del diagrama
de una curva. Podemos lograr impresiones raras al prolongar o al contraer
demasiado cualquier escala de una gráfica. Aumentar o disminuir la pendiente
se logrará encogiendo o alargando el eje horizontal. Otra manera de lograr
este mismo efecto es ampliando o reduciendo el eje vertical; por lo expuesto
anteriormente es conveniente que el lector no sea tomado desprevenido y que
realice un análisis cuidadoso de las escalas utilizadas en ambos ejes.

• Suprimir el origen
Cuando los valores representados por un gráfico son elevados y varían poco
entre sí, se suele perder un espacio por debajo de la curva; para ello, quienes
los construyen deciden omitir el cero, proporcionando una impresión visual que
es totalmente contraria a los hechos. La manera de indicar el cero y evitar que la
curva se desplace demasiado hacia arriba es realizar una división en la gráfica
trazando una línea entera o bien trazando una muesca (esta aclaración es válida
para cualquiera de los dos ejes).

Usted podrá consultar un ejemplo de lo que venimos desarrollando hasta aquí


en la siguiente dirección:

http://estadisticaestasahi.blogspot.com/2008/04/las-cifras-no-mienten-pero-el-
hombre.html

Asimismo, diríjase al libro para profundizar sobre los contenidos presentados.


Recuerde utilizar el espacio de la tutoría para canalizar sus preguntas.

2 ** Se sugiere profundizar el tema con la lectura del texto básico.

EDUBP | MARKETING | estadística aplicada I - pag.34


EDUBP | MARKETING | estadística aplicada I - pag. 35
EDUBP | MARKETING | estadística aplicada I - pag.36
m2 material

Material Básico:

• LIND, D., MARCHAL, W. y WATHEN, S. (2008) Estadística Aplicada a los


Negocios y a la Economía. Ed. McGraw Hill. Capítulo Nº 2.

Material Complementario:

• ANDERSON, DAVID R.; SWEENEY, DENNIS J.; WILLIAMS THOMAS


A. (2008) Estadística para administración y economía. Ed. THOMSON
INTERNATIONAL
• LEVINE, DAVID M.; BERENSON, MARK L.; KREHBIEL, TIMOTHY C.
(2006) Estadística para administración. Ed. Pearson
• MENDENHALL, WILLIAM; BEAUER, BARBARA M.; BEAUER ROBERT
J. (2007) Introducción a la probabilidad y estadística. Ed. THOMSON
INTERNATIONAL.
• VISAUTA VINACUA, BIENVENIDO (2007) Análisis estadístico con SPSS
14. Estadística Básica Ed. McGraw Hill

m2 actividades

m2 | actividad 1

“Technology punto com” S.R.L.

“Por la ignorancia nos equivocamos, y por las equivocaciones aprendemos”


Proverbio romano

El encargado de los técnicos en reparaciones de la empresa Technology


punto com SRL, aprovechando los encuentros que tenía su empresa con la
consultora para estudiar el tiempo de aparición de errores en las máquinas
registradoras, comenta: “Últimamente estoy preocupado; creo que en el
corto plazo comenzaremos a tener problemas, ya que a raíz de las reiteradas
inasistencias de mis empleados se producirán retrasos en los tiempos de arreglo
de las máquinas. Temo que los clientes se sientan insatisfechos con el trabajo
y por ende la gerencia general no estará muy contenta con el rendimiento de
mi sección. Quisiera que me ayuden a presentarle el problema a mis técnicos y
mentalizarlos de la importancia de su labor dentro de la firma... ¡Pero recuerden!:
la información que les presente debe ser fácil de visualizar y comprender”.

EDUBP | MARKETING | estadística aplicada I - pag. 37


Le piden a usted que se encargue del problema, ya que el resto del departamento
se encuentra abocado a otras actividades.

Piensa que recoger la información no será tarea compleja, pero su mayor


preocupación se centra en las palabras finales del encargado: “¡Pero recuerden:
la información que les presente debe ser fácil de visualizar y comprender!

Usted debe armar el gráfico a partir de los datos que se presentan seguidamente.
Indique la variable objeto de estudio.
¿Utilizará una tabla de frecuencia para datos puntuales o una para datos por
intervalos?
¿Qué tipo de de gráficos a utilizará? Realice la consigna y fundamente su
decisión.

A 1

C 1

EDUBP | MARKETING | estadística aplicada I - pag.38


m2 |actividad 1 | AA

asistente académico 1

m2 |actividad 1 | CC

clave de corrección 1

La variable objeto de estudio es: días de inasistencia, cuantitativa discreta,


escala de medición: razón.

Distribución de frecuencia:

Días de inasistencia Número de empleados

0 3
1 2
2 1
4 4
5 1
6 1
7 3
9 1
10 3
19

El gráfico apropiado es el de bastones.

EDUBP | MARKETING | estadística aplicada I - pag. 39


m2 | actividad 2

Elaboración del Informe

Ya tienen en su área de trabajo una parte de las encuestas utilizadas para sondear
y conocer las preferencias de los consumidores, cargadas en el software que se
empleará a efectos de procesar los datos.

Desde el área de marketing se ha pedido, con carácter urgente, que les envíen
un informe provisorio con los datos que tengan hasta el momento. Necesitan
que se les presenten algunos gráficos, de manera que le permitan visualizar
rápidamente las preferencias de los consumidores.

Una vez más, usted está ansioso por colaborar. Se sienta frente a su PC y genera
como primer paso la siguiente información:

A continuación, genere los gráficos apropiados para estos datos y elabore el


informe.

A 1

C 1

EDUBP | MARKETING | estadística aplicada I - pag.40


m2 |actividad 2 | AA

asistente académico 1

m2 |actividad 2 | CC

clave de corrección 1

¿Realiza compras en
supermercados?

no
38% si
62%

EDUBP | MARKETING | estadística aplicada I - pag. 41


¿Cuál es el sector del supermercado al cuál
recurre a realizar compras

Otros 195
Panadería 79
Bazar 90
Carnicería 45
Perfumería 110
Indumentaria 95
Verdulería 83
Almacen en Gral 195

0 50 100 150 200 250

En base a los gráficos anteriores, realice el informe que le han solicitado.

m2 | actividad 3

Empresa Artin SA

Ya han pasado dos meses desde que trabaja en su nuevo empleo, pero como
está siempre tan ocupado, ha perdido la noción del tiempo transcurrido. A esta
altura, en la consultora están abocados de lleno al análisis de factibilidad de este
nuevo emprendimiento de la empresa.

Desde el área contable les hacen llegar información sobre los salarios de 30
empleados de un supermercado ya instalado. El contador Soteras les dice:
“Se ha pensado que el supermercado que desea instalar Artin SA. tendrá en
términos generales características similares a este otro caso, del cual contamos
con suficiente información; por lo que analizando los datos suministrados,
seguramente éstos serán de valor para emplearlos en el análisis de costos del
caso que es de nuestro interés. Nosotros necesitamos que ustedes nos organicen
los datos y nos los presenten gráficamente. Dejamos en sus manos la manera en
que se agruparán”.

EDUBP | MARKETING | estadística aplicada I - pag.42


Organice los datos proporcionados y grafíquelos.

A 1

C 1

m2 |actividad 3 | AA

asistente académico 1

Recuerde:

Es casi seguro que se está preguntando: ¿Cuántos intervalos debe tener la tabla
de frecuencias que pretendo armar?

El número de intervalos de una tabla de frecuencias es arbitrario. En términos


generales, diremos que una tabla debe tener entre 5 y 20 clases (o intervalos). Si
el número de intervalos es escaso no se revelará ningún detalle sobre los datos,
pero si son muy numerosos perderá sentido haberlos agrupado.

Una regla sencilla que se puede seguir para aproximar el número de intervalos
es la siguiente:

EDUBP | MARKETING | estadística aplicada I - pag. 43


Siendo c el número de intervalos, diremos que el número de éstos es la menor
potencia a la que ha de elevarse 2 para que el resultado sea igual o mayor que
el número de observaciones.
2 c= n
5
En el caso que Ud. debe resolver 2 = 30. Por lo que el número de intervalos
sugerido es 5.

Complemente esta información con la lectura de los contenidos correspondientes


al presente módulo.

m2 | actividad 4

Asesoramiento sobre gráficos

Han quedado plenamente conformes las áreas que les solicitaron, unas semanas
atrás, las Actividades 1 y 2 del Módulo 1. Ahora desean ser asesorados sobre
qué gráficos sería más conveniente utilizar para representar las variables que
figuran en el artículo de la revista Mercado y, por otro lado, qué gráficos se
deberían implementar para visualizar de la mejor manera posible los resultados
que surgieron de la encuesta implementada.

Obviamente, el asesoramiento que le han pedido resulta para usted muy simple
de resolver.

C 1

m2 |actividad 4 | CC

clave de corrección 1

1.- Para las variables provenientes del artículo de la revista Mercado podrá
realizar gráficos de líneas (analizando la evolución en los tres años) y gráficos de
tortas o barras para cada uno de los años.

2.- Para las variables que surgen de la encuesta, los gráficos podrán ser de
pastel o de barras según los casos.

EDUBP | MARKETING | estadística aplicada I - pag.44


m2 | actividad 5

Empresa mayorista “M & J” S.A.

1. Los siguientes datos corresponden a las unidades vendidas de jeans durante


el mes de enero pasado, por la empresa mayorista “M & J” S.A.

200 300 300 500 450 350 450 400 400 400
250 500 500 500 650 350 200 350 500 350
650 500 350 400 700 400 300 500 500 700

a) Construya una tabla de distribución de frecuencias.


b) Calcule las frecuencias relativas simples y acumuladas y las frecuencias
absolutas simples y acumuladas.
c) Represente gráficamente y clasifique la variable.

2. En la siguiente tabla figuran los puntajes alcanzados en una evaluación de


matemática tomada en el ingreso de un determinado instituto de nivel terciario.

PUNTAJE FRECUENCIA
0 10 15
10 20 35
20 30 52
30 40 60
40 50 90
50 60 115
60 70 85
70 80 50
80 90 34
90 100 21

Se le pide que obtenga:

a) Las frecuencias absolutas simples y las relativas acumuladas.


b) Interprete la información.
c) Identifique la variable analizada y clasifique los datos.
d) Represente gráficamente.

3.-La cantidad de personas que asistieron a cierto espectáculo público durante


las dos semanas pasadas fueron las siguientes:

200 200 250 350 350 300 265


265 250 265 350 300 300 300

EDUBP | MARKETING | estadística aplicada I - pag. 45


a) Construya una tabla y calcule las distribuciones de frecuencia relativa,
absoluta y relativa acumulada y absoluta acumulada.
b) Represente gráficamente y clasifique variable.

4.-La siguiente distribución de frecuencia resultó de un estudio de la cantidad de


dinero gastado por los clientes de una heladería en cada compra:

CANTIDAD GASTADA ($) fi hi Fi Hi


0 5 6
5 10 0,15
10 15 0,62
15 20 13
20 25 53

a) Complete la tabla.
b) Grafique las frecuencias absolutas simples y las acumuladas.
c) ¿Cuál es el significado de N 4 = 46 y el de F 3 = 0,62?

5.- Los siguientes datos son montos mensuales de gastos generales (en miles
de pesos) de la Cía. Factory:

Cifras expresadas en pesos


300 550 850 1100 1500
300 560 850 1200 1600
350 600 850 1200 1650
350 600 900 1250 1800
450 685 950 1250 1900
450 700 1000 1300 2000
500 750 1000 1400 2500
500 750 1000 1500 3000

a) Construya una tabla de frecuencias con 7 intervalos.


b) Calcule las frecuencias absolutas y relativas.
c) Calcule las frecuencias acumuladas absolutas y relativas.
d) Obtenga la marca de clase.
e) Utilice el histograma de frecuencias y el polígono de frecuencias para
representar gráficamente.

6.-Un inversionista ha registrado rendimientos mensuales de los dos últimos


años de las acciones de la compañía “A” y la compañía “B”, para determinar en
cuál compañía invertir sus ahorros. El rendimiento por acción expresado en $ es
el siguiente:

CIA. “A”
10 10 12 15 17 18
18 19 20 21 22 24
24 24 24 26 27 27
28 29 32 35 35 35

EDUBP | MARKETING | estadística aplicada I - pag.46


CIA. “B”
15 15 17 17 20 20
21 23 24 25 26 27
28 29 29 30 31 31
32 32 34 34 35 40

a) Construya en un mismo gráfico las ojivas para cada compañía. Trabaje con
cuatro intervalos.
b) Compare las gráficas de ambas distribuciones e indique en cada compañía
cuál es el rendimiento (en $) aproximado para el 50% de las observaciones.
c) Observe las ojivas e indique para qué cantidad de meses la compañía A
registró rendimientos superiores a $ 25, y en qué porcentaje de meses
registró rendimientos inferiores a $ 20 la compañía B.

7.- Dados los siguientes datos:

5 10 12 12 14 15 16 17 22 25
25 25 26 30 32 34 40 45 50 51

a) Construya un diagrama de tallo-hoja.


b) Indique la cantidad de observaciones efectuadas. (n)
c) ¿Cuál es el mayor valor?
d) ¿Cuál es el menor valor?
e) ¿Cuál es el valor que más se repite?

8.-Dado el siguiente diagrama de tallo y hoja:

TALLO HOJA
1 2 4 5

2 2 2 4 7

3 5 5 5 7 8

4 0 0 1 2

5 0 1 2

a) Construya una tabla con distribución de frecuencias por intervalos.


b) Determine la frecuencia relativa y acumulada.
c) Construya un histograma y en un mismo gráfico marque el polígono de
frecuencias.
d) ¿Qué forma tiene esta distribución de valores?

9.-Una encuesta realizada a los estudiantes de esta Universidad respecto al


estado de situación laboral, arrojó los siguientes resultados:

EDUBP | MARKETING | estadística aplicada I - pag. 47


TURNO Mañana Tarde Total
SITUACIÓN
no trabaja 75 35 110

trabaja menos de 20 30 50
4 horas
trabaja más de 4 5 35 40
horas
Total 100 100 200

a) Construya un gráfico de barras porcentuales, en el cual usted pueda hacer


las correspondientes comparaciones por turno.
b) Confeccione un gráfico de pastel para cada turno.
c) ¿Cuál de las dos gráficas anteriores le parece más adecuada?

Le propongo, a fin de ampliar el espectro de práctica, resolver las actividades


propuestas por el autor del material básico y que se presentan con los títulos:
“Auto evaluaciones” ”Ejercicios del capítulo” y “Ejercicios de la base de datos”.

m2 glosario

Datos cualitativos: Datos que indican etiquetas o nombres de categorías, para


artículos semejantes.

Datos cuantitativos: Datos que indican cuánto o cuántos de algo. Los datos
cuantitativos siempre son numéricos.

Diagrama de dispersión: Método gráfico para mostrar la relación entre dos


variables cuantitativas. Una variable se representa sobre el eje horizontal y la
otra sobre el eje vertical.

Diagrama de pastel: Forma gráfica de presentar resúmenes de datos cualitativos,


basada en la subdivisión de un círculo en sectores que corresponden a la
frecuencia relativa de cada clase.

Diagrama de tallo y hojas: Técnica de análisis exploratorio de datos que clasifica


y ordena simultáneamente los datos cuantitativos y proporciona una perspectiva
de la forma de la distribución.

Distribución acumulada de frecuencias: Resumen tabular de un conjunto


de datos cuantitativos que muestra la cantidad de artículos que tienen valores
menores que, o iguales al límite superior de cada clase.

Distribución acumulada de frecuencias porcentuales: Resumen tabular de un


conjunto de datos cuantitativos donde se muestra el porcentaje de los artículos
que tienen valores menores que, o iguales al límite superior de cada clase.

EDUBP | MARKETING | estadística aplicada I - pag.48


Distribución acumulada de frecuencias relativas: Resumen tabular de un
conjunto de datos cuantitativos donde se muestra la fracción o proporción de
los elementos cuyos valores son menores que, o iguales al límite superior de
cada clase.

Distribución de frecuencias: Resumen tabular de un conjunto de datos donde


se muestra la frecuencia (o cantidad) de artículos en cada una de varias clases
que no se traslapan.

Distribución de frecuencias porcentuales: Resumen tabular de un conjunto de


datos donde se muestra el porcentaje de la cantidad total de elementos en cada
una de varias clases que no se traslapan.

Distribución de frecuencias relativas: Resumen tabular de un conjunto de


datos donde se ve la frecuencia relativa, esto es, la fracción o la proporción, de
la cantidad total de elementos en cada una de varias clases que no se traslapan.

Gráfico de barras: Forma gráfica de representar la información de una distribución


de frecuencias, de frecuencias relativas o de frecuencias porcentuales de datos
cualitativos.

Histograma: Presentación gráfica de una distribución de frecuencias, de


frecuencias relativas o de frecuencias porcentuales de datos cuantitativos. Se
traza colocando los intervalos de clase sobre el eje horizontal y las frecuencias
sobre el eje vertical.

Punto medio de clase: Punto en cada clase que está a la mitad entre los límites
inferior y superior de clase.

Tabulación cruzada: Resumen tabular de datos para dos variables. Las clases
de una variable se representan en los renglones; las clases de la otra variable,
en las columnas.

Recomendamos la ampliación del presente glosario con el del material básico.

m ó dulos

m3

m3 microobjetivos

• Reconocer cómo se deben calcular las medidas de posición central y


no central: media, mediana, moda, cuartiles con la finalidad de poder
resumir en unos pocos indicadores al conjunto de datos.

• Explicar las ventajas y desventajas de cada medida de posición, con


la finalidad de aplicar las más adecuadas para cada problema que se
aborde.

EDUBP | MARKETING | estadística aplicada I - pag. 49


• Reconocer cómo se deben calcular las siguientes medidas de dispersión:
recorrido, varianza, desviación estándar, coeficiente de variación con la
finalidad de identificar la variabilidad de los datos.

• Analizar las medidas de forma de las distribuciones; asimetría y


puntiagudez, con la finalidad de continuar abordando las propiedades
de los datos, ampliando a las de posición y dispersión.

• Reconocer cómo se deben calcular tablas, gráficos e indicadores para


dos variables con la finalidad de comprender y entender la relación
posible entre dos variables.

m3 contenidos

Descripción de datos: medidas numéricas y presentación y análisis de


datos.*

Los temas que desarrollaremos en el presente módulo son los siguientes:

1. Medidas de posición
2. Medidas de dispersión
3. Medidas de forma
4. Análisis exploratorio de los datos
5. Medidas de asociación entre dos variables
6. Números Índices.

Las características que describen un conjunto de datos reciben el nombre de


propiedades de los datos; si los datos se obtuvieron de una población, estas
medidas reciben el nombre de parámetros poblacionales; si surgen de una
muestra, las medidas se denominan estadísticos o estadígrafos. Entre las
propiedades de los datos, podemos mencionar la POSICIÓN, DISPERSIÓN y
la FORMA.

1. Medidas de posición

Las medidas de posición o localización son valores que se calculan para un


grupo de datos y que se utilizan para describir los mismos.
Generalmente, lo que se pretende es que esas medidas sean representativas de
todos los valores del grupo, permitiéndonos localizar el punto medio o típico de
un conjunto de datos. Algunas de las medidas de posición en la que centraremos
nuestro estudio serán: la media aritmética, el modo o moda, la mediana y los
cuartiles.

• Media aritmética
La media aritmética o promedio es la suma de los valores del conjunto de datos,
dividida por el total de observaciones. Las fórmulas de cálculo para la media de
la población y para la media de una muestra son las siguientes:

EDUBP | MARKETING | estadística aplicada I - pag.50


Propiedades de la media aritmética

a) La media aritmética de una constante es la constante misma.

M (k) = k; siendo k una constante.


b) La media aritmética de una constante por una variable es igual a la constante
por la media aritmética de la variable.

M (k X) = k M(X)

c) La media aritmética de una suma o diferencia entre una variable y una constante
es igual a la media aritmética de la variable, más o menos la constante.

M( X + k ) = M ( X) + k
M( X - k ) = M ( X ) - k

d) La suma de la diferencia de los valores de la variable y su media aritmética


debidamente ponderada es igual a cero.

Σ [ X i - M(X) ] f i = 0 Z i = X i - M(X)= Variable desvío

e) La suma de los cuadrados de los desvíos, entre los valores que puede asumir
la variable y la media aritmética debidamente ponderada es igual a un MÍNIMO.

Σ [ X i - M(X) ]² f i = MÍNIMO

EDUBP | MARKETING | estadística aplicada I - pag. 51


g) La media aritmética de una suma de variables expresadas en la misma unidad
de medida es igual a la suma de las medias de dichas variables.

M( X + Y + W ) = M ( X) + M(Y) + M(W)

La media aritmética tiene la ventaja de ser un concepto familiar para la mayoría


de las personas; cada conjunto de datos tiene una y sólo una media. Esta
medida de posición tiene en cuenta para su cálculo todas las observaciones de
la variable, debiéndose prestar atención a la presencia de valores extremos que
puede llegar a asumir la variable, ya que éstos pueden distorsionar el valor de
la media.
Si vinculamos la media con las escalas de medición a que hacíamos referencia
en el módulo 2, diremos que esta medida se utiliza cuando estamos en presencia
de escalas de intervalo y de razón.

• Mediana

La mediana es una medida de posición que aparece en el centro de una sucesión


ordenada de valores de la variable.
A continuación veremos el cálculo de la mediana según trabajemos con una
serie simple o con una distribución de frecuencia.

EDUBP | MARKETING | estadística aplicada I - pag.52


F j: es la menor de las frecuencias absolutas acumuladas que supera a la mitad
de las observaciones.

Y j - 1: es el extremo inferior del intervalo que tiene como frecuencia absoluta


acumulada a Fj.

c j: es la amplitud del intervalo j- ésimo.

La mediana es una medida de posición que no se ve afectada por valores extremos


de la variable, como sucede con la media aritmética, y su principal inconveniente
es que no puede calcularse cuando trabajamos con datos cualitativos en escala
nominal. En cambio, todo conjunto de datos a escala ordinal, escala de intervalo
o escala de razón tiene mediana.

• Modo o moda

El modo o moda es el valor de la variable que se presenta más frecuentemente.


Se utiliza en datos a escala nominal, ordinal, de intervalo y de razón.

Mo (X) = X j ; f j: es la máxima frecuencia absoluta simple.

EDUBP | MARKETING | estadística aplicada I - pag. 53


La determinación del modo para datos puntuales no presenta ninguna dificultad;
en cambio, cuando los datos se agrupan en intervalos se presentan algunos
inconvenientes:

* Si seguimos el criterio de tomar el valor modal al punto medio del intervalo


modal, veremos que este valor no será del todo representativo, ya que las
observaciones dentro de cada intervalo no se encuentran distribuidas de manera
regular.

* Si utilizamos el método de la interpolación algebraica a través de la fórmula:

Mo (X) = X j - 1 + c j [ d1 ] ; d1 = fj-fj-1
d1+d2 d2 = fj+fj+1

el problema no se elimina totalmente, ya que el punto de concentración en la


distribución depende del sistema de clasificación.

* La localización del modo cambia si se cambia el tamaño del intervalo de clase.

* Puede suceder además que no hallemos ningún valor de la variable que se


repita más de una vez, o bien que varios valores se repitan un número igual de
veces.

• Cuartiles y percentiles

Son medidas útiles para obtener una posición ¨no central¨, utilizadas a menudo
para resumir o describir un conjunto de datos.

Cuartiles:

Son valores de la variable que dividen la serie de datos en cuatro partes iguales,
conteniendo cada parte la misma cantidad de observaciones.

Serie simple:

Primer cuartil Q 1 es el valor correspondiente a la (n + 1) / 4


observación ordenada.

Segundo cuartil Q 2 = Me

Tercer cuartil Q 3 es el valor correspondiente a la 3 (n + 1) /


4 observaciones ordenadas.

EDUBP | MARKETING | estadística aplicada I - pag.54


Percentil:

Son valores de la variable que dividen la serie de datos en cien partes iguales.
Sus fórmulas de cálculo se obtienen de manera similar a las de los cuartiles, con
la salvedad de que en vez de dividir por cuatro, se dividirá por cien.

En ambos casos los datos provienen de escalas ordinales, nominales o de razón.

2. Medidas de dispersión

Si bien el cálculo de las medidas de posición para un conjunto de datos es


de vital importancia para resumir la información, no debemos dejar de lado la
relevancia que tiene saber el grado de dispersión o variabilidad que tiene ese
conjunto de datos. Esa variabilidad generalmente se toma respecto de alguna de
las medidas de tendencia central.

Las medidas de dispersión en las que nos detendremos serán las siguientes:
el rango o recorrido, la varianza, la desviación estándar y el coeficiente de
variación.

• Rango o recorrido
El rango o recorrido de una variable puede ser definido como la diferencia entre
el valor máximo que puede asumir la variable y el valor mínimo de la misma. Lo
representaremos con la letra R.

• Varianza
La varianza se define como la media aritmética de los cuadrados de las
desviaciones de la variable con respecto a la media aritmética.

Varianza para la Población: σ²


A la varianza poblacional podremos calcularla de la siguiente manera:

Propiedades de la varianza:

a) La varianza de una constante es igual a cero.

V (k) = 0; siendo k una constante.

EDUBP | MARKETING | estadística aplicada I - pag. 55


b) La varianza de una constante por una variable es igual al cuadrado de la
constante por la varianza de la variable.

V (k X) = k² V (X)

c) La varianza de una variable más o menos una constante es igual a la varianza


de la variable.

V (X ± k) = V (X)

d) La varianza de una suma o diferencia de variables independientes entre sí,


es igual a la suma de las varianzas de dichas variables.

V (X ± Y) = V (X) + V (Y)

Varianza para la muestra: S²

Para la serie simple:

_ _
S² = ∑ ( Xi - X ) ² = ∑ Xi² - n X²
n- 1 n- 1

Podemos observar que en el cálculo anterior se ha utilizado la media muestral y


no la media poblacional en el cálculo del desvío. En el denominador empleamos
n-1, que representan los grados de libertad. Los grados de libertad se refieren al
número de elementos dentro del grupo de datos que pueden variar libremente.
Si en lugar de dividir por n - 1, hubiésemos dividido por n, el valor de s², que es
una estimación de la varianza poblacional V (X), tendería después de muchas
pruebas a un valor un poco más pequeño del que debería ser. Si en el cálculo del
desvío se hubiese utilizado el valor de la media poblacional en lugar de la media
muestral, el numerador habría sido más grande.

• Desviación estándar

La desviación estándar será definida como la raíz cuadrada positiva de la


varianza.

Al calcular la varianza, la unidad de medida ha quedado expresada al cuadrado,


lo cual hace difícil su interpretación. La desviación estándar es una clase
de media de los desvíos algebraicos que da valores positivos, estos valores
positivos aumentan cuando aumenta la variabilidad y están expresadas en la
misma unidad de medida que las observaciones originales.
La desviación estándar es de utilidad si necesitamos evaluar la representatividad
de la media de un conjunto de datos; una desviación estándar pequeña nos
estará indicando un alto grado de homogeneidad de la serie. Si tenemos dos

EDUBP | MARKETING | estadística aplicada I - pag.56


o más series comparables con medias aritméticas idénticas o casi idénticas
expresadas en igual unidad de medida, la distribución con menos desviación
estándar será la que tenga la media más representativa. Cuando entremos de
lleno a la inferencia estadística veremos el rol fundamental que tiene la desviación
estándar.

• Coeficiente de variación
Cuando deseamos comparar la dispersión de dos o más series que tienen
medias diferentes entre sí o bien que se expresan en distinta unidad de medida,
las desviaciones estándar resultarán imposibles de comparar, debiendo recurrir
a una medida de variación relativa llamada coeficiente de variación.

CV (Y) = DS ( Y ) . 100
M (Y)

Mientras menor sea el coeficiente de variación, habrá mayor homogeneidad en


los datos, encontrándose éstos más concentrados en torno a la media aritmética.

3. Medidas de forma

La forma es la manera en la cual están distribuidos los datos según la asimetría


y la puntiagudez de una distribución.

• Puntiagudez o curtosis:
La puntiagudez permite mostrar el grado de concentración en el área alrededor
de la moda (curva apuntada) o descentralizada con respecto a la moda (curva
achatada).

a) leptocúrtica
b) platicúrtica

EDUBP | MARKETING | estadística aplicada I - pag. 57


c) mesocúrtica

Asimetría

La asimetría nos permite mostrar la deformación horizontal de la distribución.


Para describir la propiedad de la asimetría compararemos la media y la mediana.

Si

Positiva o Asimétrica Derecha

Simétrica

Negativa o Asimétrica Izquierda

a)

a) asimetría derecha
b) asimetría izquierda
c) simetría

Siguiendo la modalidad de trabajar un caso con el MegaStat se partirá del


ejercicio 66 del capítulo 3 del texto básico sugerido, se cargarán los datos y se
procederá a su procesamiento. El ejercicio estudia la cantidad de veces que se
utiliza un cajero automático en un banco en un período de 30 días.

Se solicitó la obtención de las medidas resumen, antes estudiadas: posición,


dispersión y forma.

EDUBP | MARKETING | estadística aplicada I - pag.58


El promedio diario en que se utiliza un cajero automático es de 70,53 veces, la
distribución de los datos presenta una asimetría izquierda o negativa, esto se
puede observar en el coeficiente de asimetría (-0,27), en la comparación entre la
media y la mediana y el gráfico de caja; en éste último no se observan valores

EDUBP | MARKETING | estadística aplicada I - pag. 59


extremos. Sólo un 25% de los días superan los 83,75 contactos, el 75% restante
se encuentra por debajo de dicho valor. La variable bajo análisis presenta un
valor mínimo de 36 y un valor máximo de 95 contactos.

4. Análisis exploratorio de los datos

A veces los datos se recolectan sobre determinada variable con un objetivo


específico, por ejemplo verificar nuevas medidas de seguridad en determinada
zona o conocer la incidencia en el incremento de las ventas de un producto
en función de la campaña publicitaria sobre el mismo. Pero en otras ocasiones
simplemente se desea explorar los datos para ver qué nos dicen.
Al organizar y luego presentar los datos a través de distribuciones de frecuencias
y de histogramas, se pierde parte de la información, se pierde el dato puntual
ya que por ejemplo decimos: “En el intervalo 5.000 a 10.000 pesos de ventas
mensuales se encuentra el 5% de las empresas que se dedican a la venta de
bebidas alcohólicas en el último año”, pero perdemos la individualización del
dato. El espíritu del análisis exploratorio de datos (AED) es no limitarse a mirar
un histograma; se debe explorar. Muchas veces errores en la introducción de los
datos en una base, puede conducir a la construcción de gráficas incorrectas y
si no se exploran más a fondo los datos se podrían arribar a conclusiones muy
equivocadas con sólo observar un histograma.
Con el AED se pone énfasis en las exploraciones originales con el objetivo de
simplificar la forma en que se describen los datos y entender mejor la naturaleza
de los mismos.
Algunos métodos en la exploración de los datos son el Diagrama de tallo y hoja,
el resumen de 5 números, el Diagrama de caja y la Regla empírica.

• Diagrama de tallo y hoja

Esta gráfica es una de las técnicas más sencillas del análisis exploratorio;
proporciona el orden de clasificación de los elementos del conjunto de datos y
la forma de la distribución.

El siguiente conjunto de datos corresponde a la relación precio-utilidad de


25 empresas que realizan acciones de Responsabilidad Social en el territorio
nacional.

10.6 8.1 10.2 10.0 9.4


9.6 7.8 9.3 8.2 11.0
10.8 9.6 7.5 8.2 9.9
7.7 9.6 10.6 10.1 8.4
8.3 9.6 10.1 10.4 10.6

Para producir la gráfica se hace una lista vertical de los tallos (los primeros dígitos
o bien en este caso la parte entera de los elementos de los datos) como sigue:

7
8
9
10
11

EDUBP | MARKETING | estadística aplicada I - pag.60


Después se dibuja una línea vertical a la derecha de los tallos y se listan las hojas
(el siguiente dígito o en este caso la parte decimal de cada valor, para cada tallo)
a la derecha de la línea en el orden en que aparecen en el conjunto de datos
original.

7 8 5 7
8 1 2 2 4 3
9 4 6 3 6 9 6 6
10 6 2 0 8 6 1 1 4 6
11 0

Luego se ordenan todas las hojas en cada renglón en orden de clasificación.

7 5 7 8
8 1 2 2 3 4
9 3 4 6 6 6 6 9
10 0 1 1 2 4 6 6 6 8
11 0

Cada renglón en la gráfica corresponde a un tallo con sus correspondientes


hojas; de esta manera a partir de este diagrama es posible reconstruir todos
y cada uno de los valores originales de la variable estudiada, entonces se
mantienen los datos de origen, no se pierde información como podría ocurrir
con una tabla de frecuencias en la que un determinado intervalo condensa varios
valores de la variable.
Si se gira la página en 90º en sentido contrario a las agujas del reloj, se obtiene
una figura que se asemeja al histograma, haciendo la salvedad que aquí con este
diagrama de tallo y hoja se mantienen todos los valores originales, tal como se
expresó. Y esto se convierte en una de las ventajas que presenta este diagrama
en la exploración de los datos.

Con este diagrama además es posible tener una idea de la forma que adoptan
los datos, detectar el valor de la variable mínimo, máximo y más frecuente. En
nuestro ejemplo la relación precio-utilidad que más se presenta es 9,6 ya que 4
empresas tienen dicha relación.

• Resumen de cinco números

En esta técnica descriptiva se utilizan cinco valores para describir a un conjunto


de datos, ellos son:
• Valor mínimo
• Primer cuartil
• Mediana
• Tercer cuartil
• Valor máximo

La manera más fácil de elaborar este resumen de datos es poner los mismos
en orden ascendente. Veamos un ejemplo. Supongamos que contamos con la
información relativa a la cantidad de lluvia anual caída en una región geográfica

EDUBP | MARKETING | estadística aplicada I - pag. 61


determinada de nuestro país, los valores corresponden a 17 mediciones, esto
servirá de utilidad al gobierno para tomar medidas al respecto.

525 570 610 550 612 630 633 510

570 600 614 600 320 615 632 640 510

Como expresamos, lo primero que debemos hacer es ordenar los datos:

320; 510; 510; 525; 550; 570; 570; 600; 600; 610; 612; 614; 615; 630;
632; 633; 640

1er. Cuartil = 537,50


2do. Cuartil= 600
3er. Cuartil= 622,50

(Mediana)

Para el ejemplo, el resumen de cinco números es:


• Valor mínimo: 320 mm.
• Primer cuartil: 537,50 mm.
• Mediana: 600 mm.
• Tercer cuartil: 622,50 mm.
• Valor máximo: 640 mm.

Recordando la interpretación de los cuartiles, se puede ahora aplicar en este


caso en particular agregando en el análisis e interpretación los valores mínimos
y máximo de la variable.

• Diagrama de caja

Este diagrama es útil para revelar la tendencia central, la dispersión, la forma de


la distribución de los datos y la presencia de valores distantes.
La base de la construcción de este diagrama es el cálculo de los tres cuartiles
(primero, segundo, coincidente con la mediana y tercero). También se utiliza el
rango intercuartílico (diferencia entre el tercer y el primer cuartil).

Se construirá este diagrama con los datos del milimetraje de lluvia medido en 17
oportunidades en una región geográfica.
Los pasos para trazar este diagrama son los siguientes:

1) Se traza un rectángulo (caja) con los extremos en el primer y el tercer cuartil.


Este rectángulo contiene al 50% central de las observaciones. En nuestro
caso esos extremos de la caja serán, 537,50 mm. (1er.Cuartil) y 622,50 mm.
(3er.Cuartil). Esta caja contendrá el 50% central de los datos.
2) En el interior de la caja se traza una línea vertical en el lugar de la mediana.
En el ejemplo que venimos presentando es 600 mm. (2do. Cuartil).
3) Se indican en el gráfico los límites. Los límites se encuentra a 1,5 veces
el rango intercuartílico por debajo del primer cuartil y 1,5 veces el rango
intercuartílico por encima del tercer cuartil. En nuestro ejemplo los límites
son: 410 mm. (límite inferior) y 750 mm. (límite superior).

EDUBP | MARKETING | estadística aplicada I - pag.62


4) Se trazan los brazos (o bigotes) mediante líneas punteadas (o bien línea
entera) que van desde los bordes de la caja (cuartil primero y tercero) hasta
el valor mínimo y máximo del conjunto de datos, respectivamente, dentro de
los límites calculados. En nuestro caso los brazos terminan en los valores de
410 mm. y 640 mm.
5) Finalmente se marca con un asterisco (*) la ubicación de los valores atípicos.
En el caso planteado se presenta un valor atípico, correspondiente a los 320
mm.

En el ejemplo presentado se observa un valor inusitado o atípico, la medición


de 320 mm. que se aleja demasiado del milimetraje anual de la región en las
restantes mediciones; además se puede concluir que el 75% de las mediciones
de mm. caídos se presentan concentrados a la derecha de los 537,50 mm. (1er.
cuartil).

La siguiente figura muestra el diagrama de caja y brazos para los datos de los
mm. de lluvia.

200 250 300 350 400 450 500 550 600 650 700

milímetros de lluvia

En la construcción del diagrama de caja y brazos, es posible la detección de


valores inusitados, es decir aquellos datos distantes, en el sentido de que
están muy alejados de la mayor parte de los datos. Al explorar un conjunto de
datos es necesario considerar aquellos valores distantes ya que podrían revelar
información importante o bien podría tratarse de errores en la medición o en la
carga de los datos, lo que implicaría que se está trabajando con valores erróneos
que por supuesto deberían corregirse o eliminarse. En general, deberían
eliminarse aquellos valores distantes que son errores obvios, aunque a menudo
puede ocurrir que esos valores atípicos sean anomalías interesantes que deben
investigarse más a fondo.

Tanto el resumen de cinco números como el diagrama de caja y brazos son útiles
para hacer un análisis de la forma en que se distribuye el conjunto de datos. A
saber:

• Cuando un conjunto de datos es simétrico, la media y la mediana son iguales


y, además la longitud del brazo o bigote izquierdo será igual la del derecho,
y la línea de la mediana dividirá a la caja en partes iguales.
• Cuando un conjunto de datos presenta una asimetría hacia la izquierda, la

EDUBP | MARKETING | estadística aplicada I - pag. 63


media será más pequeña que la mediana, justamente las pocas observaciones
pequeñas desplazan a la media hacia la izquierda, la concentración de
los valores se observa a la derecha de la gráfica ya que el 75% de las
observaciones se encuentra entre el primer cuartil y el extremo derecho del
brazo (valor máximo).
• Un análisis similar, pero inverso se presenta a un conjunto de datos con
sesgo o asimetría derecha.

Regla empírica

En los conjuntos simétricos de datos una parte considerable de los datos tiende
a concentrarse en torno del valor de la media. Ya se vio que se puede determinar
la asimetría de la distribución comparando tanto media y mediana, como del
AED mediante el diagrama de caja y brazos. Cuando no existe un sesgo extremo
y se observa una alta concentración de los datos en torno de las medidas de
tendencia central (media y mediana) es posible utilizar la llamada regla empírica
para examinar la propiedad de variabilidad de los datos y adquirir una idea más
clara de lo que mide la desviación estándar.

La regla empírica establece que para un conjunto de datos simétrico o


prácticamente simétrico, aproximadamente dos de cada tres observaciones (es
decir el 68%) se encuentra adentro de una distancia de una desviación estándar
con respecto de la media, y entre el 90 y el 95% de las observaciones se
encuentran a una distancia de dos desviaciones estándar alrededor de la media.

Por lo tanto, la desviación estándar, como medida del promedio de variación


alrededor de la media aritmética, nos ayuda a comprender la distribución de las
observaciones arriba o debajo de la media y detectar observaciones inusitadas
o poco usuales (valores atípicos), cuando analizamos un conjunto de datos
cuantitativos.

Supongamos que se tienen los montos de ventas de 50 empresas que tienen


en su misión trabajar en Responsabilidad Social Empresaria. Los 50 montos
(expresados en miles de pesos) se presentan a continuación.

10,3 13,0 13,0 8,0 11,1 11,6 10,0 12,5 9,3 10,5
11,1 6,7 11,2 11,8 10,2 15,1 12,9 9,3 11,5 7,6
9,6 11,0 7,3 8,7 11,1 12,5 9,2 10,4 10,7 10,1
9,0 8,4 5,3 10,6 9,9 6,5 10,0 12,7 11,6 8,9
14,5 10,3 12,5 9,5 9,8 7,5 12,8 10,5 7,8 8,6

En este ejemplo las 50 empresas constituyen la población de empresas que se


enrolan en la RSE en el último año. Por lo tanto los datos son poblacionales.

Si a este conjunto de montos de operaciones se les calculan las medidas


descriptivas se llega a los siguientes valores:

Media (µ) = 10,28 miles de $


Mediana = 10,30 miles de $
Desviación estándar (σ) = 2,045 miles de $

Además es posible concluir, del análisis estadístico descriptivo, que la distribución


de los montos de las operaciones es prácticamente simétrica, entonces es

EDUBP | MARKETING | estadística aplicada I - pag.64


factible aplicar la regla empírica.

Observando los datos presentados es posible advertir que 32 de los montos


(aproximadamente el 64%) se encuentran entre µ ± σ (es decir, entre los
8,24 y los 12,33 miles de $), en tanto que 47 montos (alrededor del 94%) se
hallan a µ ± 2σ (es decir, entre 6,19 y 14,37 miles de $)

5. Medidas de asociación entre dos variables

Con frecuencia, a quien toma decisiones, le interesa la relación entre dos


variables. A continuación se verán dos herramientas estadísticas que permiten
analizar e interpretar la relación entre dos variables: la Covarianza y el Coeficiente
de Correlación

Supongamos que el gerente de RR.HH de una empresa (que tiene en su misión


trabajar en RSE) desea investigar la relación entre la cantidad de anuncios dando
a conocer a la comunidad el accionar de la firma en el tema y que aparecen en
la revista mensual de divulgación de la empresa; y las ventas de los productos
y servicios de la misma (en miles de pesos) en los meses posteriores a la
promoción de las acciones. Con tal fin, selecciona aleatoriamente 10 meses en
los que se publicó poniendo en conocimiento de las acciones de RSE llevadas
a cabo en la sociedad. La tabla siguiente presenta los datos de las dos variables
de interés (x = cantidad de anuncios; y = monto de ventas en miles de $)
Cantidad Ventas
de anuncios (en miles de $)
x y

1 41
2 50
4 54
5 57
2 46
4 59
5 63
1 38
3 54
3 48

El primer paso para investigar si existe o no relación entre estas variables


consiste en construir un diagrama de dispersión, tal como se muestra en la figura
siguiente.

Diagrama de dispersión para la empresa


de agroquímicos
70

65

60
Ventas (en miles de $)

55

50

45

40

35
30
0 1 2 3 4 5 6

cant.de anuncios

EDUBP | MARKETING | estadística aplicada I - pag. 65


Al observar la nube de puntos o diagrama de dispersión se aprecia una relación
en sentido positivo entre las dos variables. Vamos a calcular a continuación una
medida descriptiva que me refleje lo que se observa en el gráfico.

• Covarianza

En el caso que se desee lograr una medida de variabilidad conjunta de dos


variables cuantitativas, la covarianza es una medida que permite analizar si existe
relación entre las variables que se desean estudiar, es una medida (absoluta) de
asociación entre dos variables.

La covarianza de una muestra de pares de datos se calcula de la siguiente


manera:

∑ (x − x )(y − y )
Cov ( x; y ) = n −1

En la tabla de los datos a cada cantidad de anuncios comerciales le corresponde


un monto de ventas, se aplicará la fórmula para calcular la covarianza a este
conjunto de datos.

Con los datos de las dos variables se calcula la media aritmética tanto para la
cantidad de anuncios comerciales en los micros de agro como de las ventas del
producto, dichas medias resultan ser:

Media aritmética de la cantidad de anuncios: x =3

Media aritmética del monto de ventas =


y = 51 (miles de $)

La tabla que sigue muestra los cálculos necesarios para determinar la


covarianza.

x y xi - M(x) yi - M(y) (xi - M(x)) (yi - M(y))

1 41 -2 -10 20
2 50 -1 -1 1
4 54 1 3 3
5 57 2 6 12
2 46 -1 -5 5
4 59 1 8 8
5 63 2 12 24
1 38 -2 -13 26
3 54 0 3 0
3 48 0 -3 0
99

Aplicando la fórmula de la covarianza, ésta resulta ser:

Cov (x; y) = 11

EDUBP | MARKETING | estadística aplicada I - pag.66


Nota: cabe acotar que si en lugar de trabajar con una muestra de pares de datos
se trabaja con la población, es decir con el total de parejas de datos para las
variables de interés; en la fórmula de la covarianza, la suma de los productos se
debe dividir por N (tamaño de la población), en lugar de n-1.

• Analizando el valor obtenido para la covarianza

El valor distinto de cero indica que hay asociación lineal entre las variables. En
este caso un valor positivo de la covarianza está indicando una relación directa
o positiva, es decir a medida que una variable crece también lo hace la otra, en
este caso a medida que aumenta la cantidad de anuncios en las publicaciones
de la empresa, aumentan las ventas de los productos y servicios en los meses
posteriores.

Para el caso que la covarianza asuma un valor negativo, ello estaría indicando una
relación inversa o negativa entre las variables, es decir a medida que aumentan
los valores de una, disminuyen los valores de la otra y viceversa.

Cuando la covarianza es igual a cero, el mismo está indicando que las variables
no se encuentran asociadas linealmente.

En los gráficos que siguen se presentan tres diagramas de dispersión hipotéticos


que muestran la asociación entre dos variables y la covarianza resultante en
cada caso. El primero corresponde a una covarianza positiva, el segundo a una
covarianza negativa y el último a una covarianza igual a cero.

50000 30
y

40000

20

30000

10

20000

10000 0
10 20 30 40 50 60 70 80 0 10 20 30

x x

160
y

140

120

100

80

60
10 20 30 40 50 60 70 80

EDUBP | MARKETING | estadística aplicada I - pag. 67


Coeficiente de correlación

Según lo expresado acerca de la covarianza parecería que un valor grande


y positivo de la covarianza indica una fuerte relación lineal positiva y, por el
otro lado un valor negativo grande de la covarianza indica una fuerte relación
lineal negativa entre las variables. Sin embargo en la covarianza se presenta el
problema de la magnitud en que están expresadas las variables ya que esta es
una medida absoluta de variabilidad conjunta y se ve afectada por la unidad en
que estén medidas las variables a relacionar. Este inconveniente se subsana
calculando una medida relativa de variación conjunta que se llama coeficiente
de correlación:

Cov( x; y )
r= sx × s y

El coeficiente de correlación (r) permite medir la intensidad en la asociación


lineal de las variables, su valor varía de –1 a 1. Valores de r próximos a –1 ó a 1
indican un alto grado de relación lineal entre las variables, en tanto que valores
cercanos a 0 están indicando ausencia de relación lineal entre las variables, lo
cual no significa que no existe algún otro tipo de relación no lineal.

Entonces, con el coeficiente de correlación se puede analizar no sólo el sentido


en que se relacionan las variables, lo que viene dado por el signo positivo o
negativo del coeficiente, sino que también podemos medir el grado en que se
vinculan las variables ya que cuanto más cercano a 1 sea el coeficiente, mejor
y más fuerte es la asociación y cuanto más cercano a 0, más débil resulta la
relación entre las variables.

Continuando con el ejemplo con el que se venía trabajando se calculará el


coeficiente de correlación para las variables que le interesaba al gerente de
RRHH de la empresa que emprende acciones de RSE.
Ya se había visualizado a través del diagrama de dispersión, que existía una
relación positiva o directa entre la cantidad de anuncios del accionar social de
la firma que aparecían en las revistas mensuales y las ventas posteriores de
los productos y servicios. Además al calcular la covarianza entre las variables
se había llegado a un valor positivo, lo que confirmaba la existencia de una
relación lineal positiva entre dichas variables; se calculará ahora el coeficiente
de correlación.

Para poder aplicar la fórmula del coeficiente de correlación es necesario calcular


previamente las desviaciones estándar de cada una de las variables, recordando
que anteriormente cuando se estudió las medidas de dispersión, se aprendió a
calcular las desviaciones estándar de una muestra.

Las desviaciones estándar para cada variable son:


sx
Desviación Estándar (x): = 1,4907 anuncios
sy
Desviación Estándar (y): = 7,9303 miles de $

Como ya se vio que la covarianza de las variables era igual a 11, ahora se
podrá llegar al valor del coeficiente de correlación, por lo tanto:
1
11
r **
=
1,4907 × 7,9303 = 0,93

EDUBP | MARKETING | estadística aplicada I - pag.68


Ante este resultado del coeficiente de correlación, se puede concluir que
existe una alta asociación positiva entre las variables, en otras palabras,
la mayor cantidad de anuncios que publica la firma dando a conocer el
accionar en RSE se asocia con mayores montos de ventas de los productos
y servicios en los meses posteriores y el grado en que se asocia las dos
variables, es fuerte.

Con respecto al coeficiente de correlación es muy importante lo siguiente:

• Se debe tener cuidado de evitar concluir que la correlación implica


causalidad. Cuando se concluye que existe una correlación entre
dos variables, esto significa que las dos variables están vinculadas
linealmente de manera positiva o negativa, pero esto no significa que
una sea la causa de la otra.
• La conclusión de que no existe correlación lineal no implica que entre
la dos variables no existe otro tipo de relación que no se la lineal. Este
coeficiente mide la fuerza de una asociación lineal entre dos variables.

6. Números Índices (Capítulo 15 del texto sugerido como básico)

Un número índice es un indicador diseñado para describir los cambios de una


variable en el tiempo.
Pueden intentar reflejar:

• la evolución en la cantidad de un determinado bien o servicio o de un


conjunto de ellos (por ejemplo cantidades producidas o consumidas).

• la evolución en el precio de un bien o servicio o conjunto de éstos.

• la evolución en el valor de un bien o servicio o de una canasta de bienes


y servicios

• Índice de Precios

Los indicadores más relevantes son:

• Índice de precios al consumidor


• Índice de precios internos al por mayor
• Índice de precios básicos al productor
• Índice de precios internos básicos al por mayor
• Índice de costo de la construcción

Estamos llegando al final de los contenidos y consideramos oportuno


complementar lo desarrollado hasta aquí con algunos materiales sumamente
interesantes y direcciones de páginas Web pertinentes para profundizar lo que
usted ya ha estudiado.

Le recomendamos consultar la siguiente dirección: http://www.indec.mecon.ar/

A su vez, le proponemos realizar la lectura y estudio del material Cómo usar un


índice de precios IC 1. Una vez realizada la lectura, resuelva los ejercicios que
propone el material básico bajo el título: Uso Práctico de los números índices.

EDUBP | MARKETING | estadística aplicada I - pag. 69


Lea y reflexione a partir del material La Argentina ¿sin mapa de ruta? IC 2

Por último, le recomendamos consultar la siguiente dirección:

http://www.saimo.org.ar/index.php?option=com_content&task=view&id=338&
Itemid=1

m3 |contenidos | IC

informaciones complementarias 1- 2

Para visualizar estas informaciones complementarias dirijasé al sector respectivo


en la Plataforma.

m3 material

Material Básico:

• LIND, D., MARCHAL, W. y WATHEN, S. Estadística Aplicada a los Negocios


y a la Economía. Ed. McGraw Hill (2008): Capítulos 3 y 4. Capítulo 15.

Material Complementario:

• ANDERSON, DAVID R. SWEENEY, DENNIS J., WILLIAMS, THOMAS


A. (2008) Estadística para administración y economía. Ed. THOMSON
INTERNATIONAL
• LEVINE, DAVID M., BERENSON, MARK L., KREHBIEL, TIMOTHY C.
(2006) Estadística para administración. Ed. Pearson
• MENDENHALL, WILLIAM; BEAUER, BARBARA M.; BEAUER, ROBERT
J. (2007) Introducción a la probabilidad y estadística Ed. THOMSON
INTERNATIONAL.
• VISAUTA VINACUA, BIENVENIDO. (2007) Análisis estadístico con SPSS
14. Estadística Básica. Ed. McGraw Hill

EDUBP | MARKETING | estadística aplicada I - pag.70


m3 actividades

m3 | actividad 1

Ampliando el informe

“Los números no mienten, algunas personas sí”.


Gen C. H. Grosvenor

El teléfono de su oficina suena, usted atiende y del otro lado de la línea escucha la
voz del encargado del servicio de reparaciones de Technology punto com SRL:
“La reunión con el personal técnico que está a mi cargo fue realmente positiva.
Comprendieron la importancia que tiene no sólo la calidad de los trabajos que
realizan, sino también la entrega en el tiempo pactado de las máquinas entregadas
para su reparación. Las tablas y gráficas que usted preparó fueron de gran
utilidad y, para serle totalmente honesto, debo decirle que de no haber contado
con ellas las explicaciones se hubiesen hecho difíciles. Ahora estoy pensando
en presentar un informe a la gerencia relatando la problemática y la manera en
que se solucionó, pero quisiera, si es posible, que me amplíe el informe ¿Podría
incorporar algunos números que resumieran la información?
Usted no lo duda, sabe perfectamente qué indicadores puede generar con
los datos que posee y que satisfarán plenamente al encargado del servicio de
reparaciones de Technology punto com SRL, permitiéndole allanar su camino
en la toma de decisiones.

Consigna

- Especifique la variable objeto de estudio.


- Calcule los siguientes indicadores: la media aritmética, la mediana, la moda o
modo, la varianza, la desviación estándar, los cuartiles.

A 1

C 1

m3 |actividad 1 | AA

asistente académico 1

En el módulo 2, usted ha realizado la tabla de frecuencia para el caso que se está


planteando y el diagrama de bastones. Aconsejamos:

1.- Retomar la tabla de frecuencia planteada en el módulo 2 en el caso en


cuestión.
2.- Como lo expresa la consigna, usted preparará: la media aritmética, la mediana,
la moda o modo, la varianza, la desviación estándar, los cuartiles.
3.- Como se sugiere presentar un informe, el mismo puede tener la siguiente
estructura:

EDUBP | MARKETING | estadística aplicada I - pag. 71


A.- Resumen ejecutivo:

En él se realiza una presentación de los hechos y hallazgos relevantes derivados


de la investigación, que permitan a la gerencia de la empresa un fácil acceso a la
información. No deben utilizarse términos técnicos. Por lo general, a la dirección
de la empresa les interesan poco los aspectos técnicos. Sólo desean cerciorarse
de que se han tenido en cuenta los aspectos relevantes de la empresa y que se
han seguido los procedimientos científicos adecuados.
Si bien el resumen ejecutivo precede al informe, se escribirá una vez realizado
el estudio.

B.- Introducción:

En esta etapa se realiza una descripción de la naturaleza y del alcance del


estudio planteado y de la importancia del mismo.

C.- Metodología:

En esta instancia se detallan las técnicas y herramientas estadísticas utilizadas.


Se individualiza la población objeto de estudio, se caracteriza y se define
la muestra con la que se trabajará (en caso de emplear sólo una parte de la
población).

D.- Hallazgos:

Aquí se realizan los cálculos estadísticos, y se realizan comentarios vinculados


con los cálculos y los resultados.

E.- Discusión e interpretación:

En esta etapa se proporciona una interpretación de los hallazgos. No debe


emplearse lenguaje técnico.

F.- Conclusiones y recomendaciones:

Es la misma información que la del resumen ejecutivo, pero explicada con mayor
detalle. Las conclusiones y recomendaciones que aquí aparezcan siempre
deben estar respaldadas por lo desarrollado en la etapa que hemos llamado
Hallazgos.

m3 |actividad 1 | CC

clave de corrección 1

La variable objeto de estudio es: Días de inasistencia, cuantitativa discreta,


escala de medición, por los que las medidas apropiadas serán todas las de
posición, dispersión y de forma.

EDUBP | MARKETING | estadística aplicada I - pag.72


Días de inasistencia Número de 2

empleados x i fi x i fi Fi
xi fi
0 3 0 0 3
1 2 2 2 5
2 1 2 4 6
4 4 16 64 10
5 1 5 25 11
6 1 6 36 12
7 3 21 147 15
9 1 9 81 16
10 3 30 300 19
19 91 659

Media = 91/19 = 4,79 días Modo = 4 días Varianza = 659/19 - 22,94 =


11,74 días al cuadrado

Desviación estándar = 3,43 días

Mediana:
1.- n/2 = 9,5
2.- Fj = 10
3.- Fj-1 = 6
4.- Al comparar la mitad de las observaciones con la frecuencia acumulada Fj-1
esta última es menor que la primera, por lo que la mediana se corresponderá con
la frecuencia absoluta j- ésima.

Mediana = 4 días

Primer Cuartil (Q1) = 1días Segundo Cuartil (Q2) = Mediana = 4 días Tercer
Cuartil (Q3) = 7 días

Asimetría de la distribución:

Como la media es idéntica a la mediana la distribución es simétrica.

Una vez encontradas todas las medidas está en condiciones de realizar el informe
solicitado por Technology punto com SRL.

m3 | actividad 2

Se solicita mayor información

Ha comenzado una nueva jornada de trabajo; como ocurre cada día, lo primero
que hace al llegar a su oficina es leer el correo electrónico. Usted tiene dos
e-mails:

EDUBP | MARKETING | estadística aplicada I - pag. 73


Asunto: Más información
Fecha: Mon, 04 Jul 2009 14:33
Para: [email protected]

Estimado:
La información que nos presentó días atrás sobre salarios de un supermercado
nos ha sido de suma utilidad, pero nos hemos dado de cuenta que para nuestro
trabajo no sólo necesitaremos de tablas y gráficos sino que deberíamos
contar con algunos números que nos resumieran la información (usted sabe:
promedios, desvíos y todo otro indicador que crea conveniente incorporar al
informe). Desde ya muchas gracias.
Atte.

Cr. Soteras.

Asunto: Área Finanzas


Fecha: Fri, 29 Jul 2009 19:01
Para: [email protected]

¿Cómo estás? Necesitaría con carácter de URGENTE que resumas de alguna


manera la información que nos enviaste de la revista Mercado. Te pido que
apenas tengas algo me lo envíes, ya que dependemos de esa información
para continuar con nuestras acciones.
Gracias.

Flor.

Desarrolle las respuestas pertinentes a cada mensaje recibido.

A 1

C 1

m3 |actividad 2 | AA

asistente académico 1

Cada email genera información, una independiente de otra.

Para el primero de ellos, usted ya confeccionó en el módulo 2 la tabla de


frecuencia para datos agrupados por intervalos, confeccionó un histograma
o un polígono de frecuencias. Regrese a esa tabla y a partir de ella podrá
calcular la media, la mediana, establecer el intervalo modal, calcular la
desviación estándar, definir la asimetría de la distribución. La marca de
clase entra a tener un rol relevante en este caso.

Para el segundo caso planteado tenemos varias variables. Aconsejamos


seleccionar tres de ellas y generar los indicadores de cada una de las
características en estudio. Los datos corresponden a series simples, no existen
valores de las variables que se repitan. Para calcular la varianza y la desviación
estándar recomendamos el uso de calculadora donde aparezcan estas medidas.
Este caso es el más sencillo de todos, ya que se presentan pocos datos y donde
cada valor se presenta sólo una vez.

EDUBP | MARKETING | estadística aplicada I - pag.74


m3 |actividad 2 | CC

clave de corrección 1

( y* i - y*í + 1 ) yi fi yi . fi Fi

1324 - 1328 1326 6 6


7956
1328 - 1332 1330 7 13
9310
1332 - 1336 1334 9 22
12006
1336 - 1340 1338 6 28
8028
1340 - 1344 1342 2 30
2684
TOTAL 30
39984

Recuerde: una vez que encontró la marca de clase, ese es el valor que se
tomará para realizar los cálculos.

Media = $ 1.332,80
Mediana = $ 1.332,88
Modo = $ 1.334
Intervalo modal = $1332 a $ 1.336
Varianza = 23,29
Desviación estándar = $ 4,83
Q1 = $1.328,25
Q2 = $1.332,88
Q3 = $1.335,75
Como la media es menor que la mediana la distribución de datos es asimétrica
negativa o asimétrica izquierda.

Q1 y Q3 se calcularon con el MegaStat

m3 | actividad 3

Horas extras

El área contable solicita nuevamente su cooperación. Dos de las


empresas autopartistas que asesora le han proporcionado unas gráficas a
efectos de analizar las horas extras en el mes que realizan los empleados:

EMPRESA A

POLÍGONO DE FRECUENCIAS RELATIVAS

0,4
0,3
0,2
0,1
0
0 10 20 30 40 50

EDUBP | MARKETING | estadística aplicada I - pag. 75


EMPRESA B

OJIVA

1,2
1
0,8
0,6
0,4
0,2
0
0 20 40 60

El contador le dice: “Si bien es correcta la información presentada por


nuestros clientes, ya que a efectos de la rápida visualización los gráficos son el
instrumento adecuado, tenemos algunos inconvenientes. Por un lado han utilizado
gráficos diferentes y por otro lado nosotros necesitaríamos que usted generara a
partir de ellos algunos indicadores como: el valor promedio de las horas extras,
el desvío de las mismas y alguna otra medida alternativa al promedio”.
De las dos empresas desearíamos, de ahora en más, continuar trabajando
con la información de aquella que tenga los datos más homogéneos... ¡Ah! Me
olvidaba de decirle que la cantidad de empleados es la misma en los dos casos
y es igual a 100”.

Usted se pone a trabajar con la consigna que le dio el contador:


“Necesitaríamos que usted generara a partir de ellos algunos indicadores
como: el valor promedio de las horas extras, el desvío de las mismas y alguna
otra medida alternativa al promedio”. Recuerde que la cantidad de empleados
es igual a 100.

A 1

C 1

m3 |actividad 3 | AA

asistente académico 1

Para resolver el caso deberá recordar algunos conceptos que se introdujeron en


el módulo 2.

 En el caso planteado para la Empresa A deberá realizar algunas asociaciones:

M(X) = ∑ Xi fi Por lo que otra manera de calcular la media será M(X)= ∑ Xi hi


N

EDUBP | MARKETING | estadística aplicada I - pag.76


Recuerde además que: hi: fi / N

 Para la Empresa B, en cambio, se proporcionan a través de la ojiva las


frecuencias relativas acumuladas. Deberá:

1.- Obtener las frecuencias relativas simples, partiendo de las acumuladas.


2.- Obtener a partir de las relativas simples las frecuencias absolutas simples.

m3 |actividad 3 | CC

clave de corrección 1

Empresa A

xi fi x i fi Fi
xi hi fi
0 0 0 0 0 0
5 0.05 5 25 125 5
10 0.1 10 100 1000 15
15 0.2 20 300 4500 35
20 0.3 30 600 12000 65
25 0.2 20 500 12500 85
30 0.1 10 300 9000 95
35 0.05 5 175 6125 100
40 0 0 0 0 100
100 2000 45250

Media = 20 hs Mediana = Modo = 20 hs Varianza = 52,5 hs al cuadrado


Desviación estándar = 7,25 hs Coeficiente de variación = 36,35%

EDUBP | MARKETING | estadística aplicada I - pag. 77


Empresa B

x i fi
xi Hi hi fi x i fi Fi
0 0 0 0 0 0 0
10 0.30 0.30 30 300 3000 30
20 0.60 0.30 30 600 12000 60
30 0.80 0.20 20 600 18000 80
40 0.90 0.10 10 400 16000 90
50 1 0.10 10 500 25000 100
100 2400 74000

Media = 24hs Mediana= 20hs Modo = Bimodal (2 modos 10 y 20) Varianza


=164 hs al cuadrado Desviación estándar = 12,81 hs Coeficiente de
variación = 53,56%

Conclusión: Como la empresa A tiene menor coeficiente de variación que


la empresa B, los datos de la empresa A son más homogéneos (hay menor
dispersión).

m3 | actividad 4

La empresa nacional y la empresa extranjera

Desde el sector de Marketing se está estudiando la viabilidad de lanzar


al mercado nacional e internacional una nueva alternativa de producto generado
en un microemprendimiento. Se ha logrado desde esa área obtener información
de otro producto similar que está inserto en ambos mercados.

La empresa nacional posee tres locales de venta para su único


producto. Las ventas corresponden a una semana del mes de mayo.
- En el local A trabajan 10 empleados que vendieron en promedio $ 400.
- En el local B las ventas totales sumaron $ 7.500, siendo el promedio de ventas
de $ 500.
- En el local C los 15 empleados vendieron $ 8.400.
La suma del cuadrado de las ventas de los tres locales en la semana, asciende a
11.230.000.
En la empresa extranjera, el promedio de ventas por empleado es de
1.500 dólares y la desviación estándar es de 120 dólares (en la misma semana
que la empresa nacional).

Consigna:
Contribuya con ellos, asesorándolos sobre cuál de ambos mercados –
nacional o internacional– genera el promedio más representativo. Esa información

EDUBP | MARKETING | estadística aplicada I - pag.78


será un importante aporte para el estudio del nuevo producto que se desea
lanzar a ambos mercados.

A 1

C 1

m3 |actividad 4 | AA

asistente académico 1

El problema central es el de decidir a través del coeficiente de variación cuál de


las dos series de datos tienen el promedio más representativo. Pero antes de
llegar a esta comparación tenemos el inconveniente de no conocer la media y la
desviación estándar de la empresa nacional. Con los datos que se proporcionan,
la media surgirá aplicando una de las propiedades de la media aritmética.

Otro comentario válido es que cuando se refiere a la suma del cuadrado de las
ventas de los tres locales, se refiere a lo que simbólicamente es:
2
∑ Xi = 11.230.000

m3 |actividad 4 | CC

clave de corrección 1

Empresa nacional:
Media = (400x10 + 500x15 + 560x15) / 40 = $ 497,50

Varianza = 11.230.000 - 247506,25 = 33.243,75


40

Desviación estándar = 182,33

Coeficiente de variación = 36,60%

Empresa extranjera:
Coeficiente de variación = 8%

Conclusión: el promedio más representativo es el de la empresa extranjera, ya


que tiene menor coeficiente de variación.

EDUBP | MARKETING | estadística aplicada I - pag. 79


m3 | actividad 5

Una serie de ejercicios…

1.- Los siguientes datos representan el número de revistas leídas en el último año
por 25 alumnos de una determinada universidad:

7; 5; 4; 5; 6; 3; 2; 1; 7; 7; 3; 5; 4; 3; 3; 2; 4; 1; 5; 7; 3; 2; 6; 3; 1

a) Calcule la media aritmética del número de revistas leídas por los alumnos de
la universidad donde se realiza el estudio.
b) Calcule la mediana y el valor modal.
c) Calcule cuál es la dispersión en torno de la media.
d) Calcule e interprete el primer y el tercer cuartil.
e) Expídase sobre la forma de la distribución (asimetría).

2.- Las calificaciones de 28 estudiantes en una evaluación de estadística están


dadas en la siguiente tabla:

Calificaciones Cantidad de estudiantes


30 - 40 2
40 - 50 3
50 - 60 5
60 - 70 8
70 - 80 5
80 - 90 3
90 - 100 2

Se le pide:
a) Calcule la media aritmética, la mediana y el modo.
b) Construya un histograma. ¿Dónde ubicaría las medidas obtenidas
anteriormente?
c) Obtenga la varianza.
d) De acuerdo a los valores obtenidos en el punto a) y al gráfico del punto b)
¿qué podría decir acerca de la forma de la distribución?

3.- Un vendedor entregó la siguiente rendición de gastos correspondientes a sus


seis viajes al interior de la provincia realizados en el mes anterior, indicando la
cantidad de días que le llevó cada uno de sus viajes.

Se le pide:
a) Calcule el gasto promedio diario del vendedor.

EDUBP | MARKETING | estadística aplicada I - pag.80


b) Calcule la mediana del gasto.
c) Suponiendo una disminución del 5% de los gastos del vendedor para el
próximo mes, ¿cuál sería el nuevo gasto promedio, si el vendedor piensa hacer
los mismos viajes y en la misma cantidad de días?
d) ¿Qué podría decir acerca de la forma de la distribución? ¿Qué herramientas
estadísticas utilizó para llegar a esta conclusión?

4.- En la tabla que sigue se presentan los gastos (en $) por consumo semanal
de medicamentos por familia; para ello se seleccionaron 50 familias de un
determinado barrio de nuestra ciudad.

a) Complete la tabla.
b) Calcule la media aritmética y la mediana e interprete el resultado.
c) Calcule la varianza y la desviación estándar.
d) Ante un aumento de los precios de los medicamentos anunciado para el mes
próximo, las familias incrementarán sus gastos en este rubro en un 10%; ¿cuál
será la nueva media aritmética y el nuevo desvío de los gastos en remedios?

5.- El número de automóviles que vendió cada uno de los once vendedores de
una concesionaria en un mes determinado, en orden ascendente, fue:

2; 4; 7; 10; 10; 10; 10; 12; 12; 14; 15

¿Podría calcular usted cuáles son los límites del intervalo central que contienen
el 50% de las observaciones?

6.- Con los siguientes datos correspondientes a las variables: cantidad de


cigarrillos consumidos por día y edad, distribuidos como indica el siguiente
cuadro. Se le pide:
a) Calcular la media y la varianza de la variable cigarrillos consumidos
b) Calcular la mediana y el modo de la variable edad.
c) Obtenga una medida de variabilidad conjunta e interprete.

EDUBP | MARKETING | estadística aplicada I - pag. 81


7.- En la siguiente representación de tallo-hoja se indica el número de días que
estuvo cada paciente bajo el tratamiento con una nueva droga. La información se
obtuvo a partir de una muestra aleatoria seleccionada del registro de pacientes
de una clínica privada de nuestra ciudad.

a) ¿Cuántos pacientes están representados?


b) ¿Cuál fue el período de tratamiento más corto?
c) ¿Cuál fue el período de tratamiento más largo?
d) ¿Cuál fue el período de tratamiento más frecuente?
e) Determine la cantidad de días que en promedio permaneció un paciente bajo
tratamiento.

8.- La siguiente información corresponde a los saldos en cuenta corriente de


los nuevos clientes que ha captado un banco de nuestro medio, en base a una
nueva política en la que la entidad ofrece más y mejores servicios. Los saldos
están expresados en miles de pesos.

a) Calcule el saldo promedio de los clientes.


b) Calcule la mediana y el modo de los saldos.
c) Obtenga la desviación estándar de la variable.
d) ¿Qué podría decir en cuanto a la forma de la distribución? Indique qué
herramientas utilizaría para definirlo.

9.- La información que a continuación se detalla corresponde al stock de fichas


de parquímetros que poseían 30 kioscos del casco céntrico:

EDUBP | MARKETING | estadística aplicada I - pag.82


Se le pide:
a) Calcule el stock promedio de fichas que poseen los kioscos.
b) Calcule el valor modal.
c) Calcule la varianza del stock de fichas.
d) Si se produce un incremento de 100 fichas por kiosco, ¿qué ocurrirá con el
promedio y con la varianza del stock de fichas?

10.- La siguiente tabla de doble entrada presenta la información referida al


número de patologías detectadas por el gabinete de psicopedagogos, en un
grupo de escolares considerando el ingreso (expresado en pesos) del grupo
familiar.

a) Calcule la media aritmética para los ingresos de las familias de los escolares.
b) Calcule la covarianza.

11.- Con los datos proporcionados a continuación a través de una salida del
SPSS se le solicita a usted:
a) Identifique la variable en estudio y clasifíquela.
b) Identifique las medidas de posición.
c) Identifique las medidas de dispersión y analice.
d) ¿Qué opina usted sobre la forma de la distribución? Realice un gráfico a
mano alzada y ubique en él las medidas de posición.
e) Identifique el primer cuartil e interprete.
f) Con respecto al ejercicio 10, y comparando con la actual serie, ¿podría usted
opinar sobre la homogeneidad de los datos? Justifique.

EDUBP | MARKETING | estadística aplicada I - pag. 83


12.-Para saber cuál es la cantidad de agua que cada familia consume por año en
la zona sur de una ciudad cordobesa, el intendente pidió al administrador de la
empresa que provee el servicio que hiciera una investigación al respecto. Para
ello se tomó una muestra de 30 familias de la zona en cuestión y se registraron
los siguientes datos en el año anterior: (expresado en miles de litros)

Cantidad de agua fi
consumida por familia (m. de lts.)

11.2 6
14.2 7
16.9 8
22.7 5
26.5 4

a) ¿Cuál es la cantidad promedio anual utilizada por familia?


b) Suponga usted que el intendente estima que dentro de 10 años habrá en la
zona sur unas 45.000 familias. ¿Cuántos litros de agua se requerirán al año
si la tasa de consumo por familia permanece igual?
c) Calcule la varianza y desviación estándar.
d) Analice la forma de la distribución de estos datos.
e) ¿Cuál será la cantidad de litros que requerirán, si la tasa de consumo se
incrementa en un 15%?

13.-Con los siguientes datos construya un diagrama de bloque y analice:

n = 15, media=61 Me = 75 Modo=27.98 V min= 10 V max= 90 Q1= 30 Q3 = 80

14.- Los siguientes datos corresponden al precio por acción de 10 empresas


seleccionadas aleatoriamente, las cuales cotizan en la bolsa de valores:

10 12 12 15 16 16 16 17 30

Calcule:
a) Media, mediana y el modo.
b) Varianza, desviación estándar y coeficiente de variación.
c) Elabore un diagrama de tallo y hoja.
d) Construya un diagrama de caja y analice.
e) ¿Están sesgados los números? ¿De qué manera?
f) En base a la regla de Bienaymé-Chebyshev, ¿entre qué par de valores se
estimaría que están contenidos por lo menos el 75% de los datos?

15.- Se ha contraído una deuda en Mayo de 2005 por $10.000. Se pide actualizar
la misma a Marzo de 2008 utilizando el IPCCba.

EDUBP | MARKETING | estadística aplicada I - pag.84


ÍNDICE DE PRECIOS AL CONSUMIDOR CÓRDOBA (IPC) - NIVEL GENERAL

Base 2003=100
AÑOS 2005 2006 2007 2008
Promedio
   125,15 126,15
Anual
ENE 119,39   132,74   147,70
FEB 120,37   133,67   149,03

MAR 122,12   135,55   151,52

ABR 123,47   137,17 153,85


MAY 123,98   138,40   155,29
JUN 124,69   140,00   157,25
JUL 125,18   141,62   158,48

AGO 126,03   142,98 159,94


SET 126,96   144,11 161,43

OCT 114,58   128,29   145,46 162,63

NOV 115,94   129,73   145,42 163,95

DIC 117,40   131,57   146,57   164,76

a) ¿Cuál será el nuevo valor actualizado?


b) ¿Qué es un Índice de precios?
c) ¿Cuáles son los capítulos de la canasta que constituyen el IPC?

Le proponemos, a fin de ampliar el espectro de práctica, resolver las actividades


propuestas por el autor del libro recomendado como bibliografía básica y que
se presentan con los títulos: “Auto evaluaciones” ” Ejercicios del capítulo” y
“Ejercicios de la base de datos” (Capítulos 3 y 4)

m3 glosario

Coeficiente de variación: Medida de la dispersión relativa de un conjunto de


datos. Se calcula dividiendo la desviación estándar entre la media y multiplicando
el cociente por 100.

Covarianza: Medida numérica de la asociación lineal entre dos variables.


Sus valores positivos indican una relación positiva; los negativos una relación
negativa.

Cuartiles: Los percentiles 25%, 50% y 75% se llaman primer cuartil, segundo
cuartil (mediana) y tercer cuartil, respectivamente. Se pueden usar los cuartiles
para dividir al conjunto de datos en cuatro partes, cada una de las cuales contiene
aproximadamente el 25% de los datos.

Datos agrupados: Datos disponibles en intervalos de clase, como los resumidos


por una distribución de frecuencias. Los valores individuales de los datos

EDUBP | MARKETING | estadística aplicada I - pag. 85


originales no están registrados.

Desviación estándar: Medida de la dispersión de un conjunto de datos; se


calcula sacando la raíz cuadrada positiva de la varianza.

Diagrama de caja: Resumen gráfico de los datos. Se traza un rectángulo desde


el primer cuartil hasta el tercero, que indica la ubicación del 50% intermedio
de los datos. Luego unas líneas punteadas, llamadas bigotes, que van en los
extremos de la caja y muestran la ubicación de datos mayores que el tercer
cuartil y menores que el primero. También se muestran las ubicaciones de los
valores atípicos.

Media: Medida de la localización central de un conjunto de datos. Se calcula


sumando todos los valores de los datos y dividiendo el resultado entre el número
de elementos.

Media ponderada: Media para un conjunto de datos, que se obtiene asignando


un factor de ponderación a cada valor de dato; este factor refleja la importancia
dentro del conjunto.

Mediana: Medida de la localización central. Es el valor que divide a los datos en


dos grupos iguales, uno con valores mayores que o iguales a la mediana, y el
otro con valores menores que o iguales a ella.

Medida estadística o estadístico de la muestra: Valor numérico que se usa


como medida resumida de una muestra (por ejemplo, la media de la muestra, la
varianza de la muestra y la desviación estándar de la muestra s).

Moda o modo: Medida de la localización, definida como el valor de dato que


ocurre con más frecuencia.

Parámetro poblacional: Valor numérico que se usa como medida resumida de


una población de datos (por ejemplo, la media de la población, la varianza de la
población, y la desviación estándar de la población).

Percentil: Un valor tal que, cuando menos, p por ciento de los elementos son
menores que o iguales a ese valor, y al menos (100 - p) por ciento de los elementos
tienen valor mayor que o igual a ese valor. El 50° percentil es la mediana.

Rango: Medida de dispersión, definida como el valor máximo menos el valor


mínimo.

Rango intercuartil (RIC): Medida de dispersión, definida como la diferencia


entre el tercer y el primer cuartil.

Regla empírica: Regla que establece los porcentajes de elementos que están
dentro de una, dos y tres desviaciones estándar de distancia del promedio, para
distribuciones con forma de colina o campana.

Teorema de Chebyshev: Teorema que se aplica a cualquier conjunto de datos, y


que se puede emplear para hacer inferencias acerca del porcentaje de artículos
que deben quedar dentro de una cantidad especificada de desviaciones estándar
alrededor de la media.

Valor atípico: Valor de un dato demasiado pequeño o demasiado grande.

EDUBP | MARKETING | estadística aplicada I - pag.86


Valor z: Valor calculado dividiendo la desviación respecto al promedio, (xi - x),
entre la desviación estándar s. Se llama también valor estandarizado, y representa
la cantidad de desviaciones estándar que hay entre el valor xi y el promedio.

Varianza: Medida de dispersión para un conjunto de datos, basada en las


desviaciones de los valores de los datos respecto a la media, elevadas al
cuadrado.

Recomendamos la ampliación del presente texto con el glosario del material


básico sugerido.

m ó dulos

m4

m4 microobjetivos

• Comprender la definición del término probabilidad y los diferentes


enfoques del mismo con la finalidad de conocer la posibilidad de que un
evento ocurra bajo un marco de incertidumbre.

• Reconocer las reglas básicas de probabilidad con la finalidad de tomar


decisiones reduciendo al mínimo los riesgos que puedan existir en las
mismas en un contexto de incertidumbre.

m4 contenidos

Estudio de los conceptos de probabilidad

Los temas que desarrollaremos en el presente módulo son los siguientes:

1. Diferencia entre la escuela clásica, la subjetivista y la frecuencial de


probabilidad.
2. Reglas básicas de probabilidad.

Introducción

Cuando trabajamos con datos de una población a las distintas medidas que

EDUBP | MARKETING | estadística aplicada I - pag. 87


obtenemos las llamamos parámetros. Estos últimos describen y caracterizan
a la población y es a través de ello que podremos tomar decisiones de manera
directa.
En cambio, cuando trabajamos con muestras, antes de tomar decisiones con
respecto a toda la población, debemos realizar la generalización de los resultados
obtenidos a partir de la muestra con respecto a los parámetros. Este proceso de
vinculación es lo que llamaremos estadística inferencial.

Fenómenos Determinísticos y Fenómenos Aleatorios:

Los Fenómenos Determinísticos son aquellos de un comportamiento exacto


y previsible. En cambio, los Fenómenos Aleatorios son de resultado incierto,
no tenemos seguridad de cuál será el resultado final, conduciéndonos estos
resultados inciertos al concepto de Espacio Probabilístico.

1. Espacio Probabilístico y Eventos:

Al espacio probabilístico lo simbolizaremos con la letra griega omega (Ω) y es


el conjunto que contiene todos los resultados posibles de un experimento o
fenómeno aleatorio. Cada uno de los resultados posibles recibe el nombre de
evento. Cada uno de estos últimos, a su vez, tendrá asociado un número que
llamaremos probabilidad.

Los eventos elementales, constituyen todas las alternativas, igualmente posibles,


exhaustivas y mutuamente excluyentes.

Un espacio probabilístico elemental es el conjunto de eventos elementales,


finito o infinito, que puede verificar una hipótesis dada, cada uno de los cuales
lleva asociado un valor numérico que definiremos como probabilidad del evento
elemental.

Aclararemos los conceptos anteriores a través de un ejemplo:

Supongamos que se lanza una moneda perfecta, al arrojarse pueden presentarse


dos resultados posibles: cara o seca. La salida de cualquiera de esos resultados
posibles es un evento elemental y, esos dos eventos, constituyen un conjunto de
elementos igualmente posibles ya que cualquiera puede salir sin preferencia de
uno sobre otro.
Exhaustivo, porque fuera de esos resultados no pueden presentarse otros.
Mutuamente excluyentes, porque si al arrojar la moneda sale cara excluye la
salida de seca y viceversa.

Simbólicamente:

Ω = { C, S } C = cara S = seca N = 2 (número de eventos elementales)

P (C) = P (S) = 1 / N = 1 / 2

Es importante resaltar que los eventos y solamente los eventos tienen


probabilidad. No tiene sentido hablar de probabilidad como un concepto en sí
mismo.

EDUBP | MARKETING | estadística aplicada I - pag.88


2. Teorías Probabilísticas:

Anteriormente hemos mencionado que cada uno de los resultados posibles de


un determinado experimento lleva asociado un número llamado probabilidad,
ahora bien: ¿cómo cuantificaremos esa probabilidad? En el afán de lograr esa
cuantificación es que surgieron distintas escuelas de probabilidad.

Teoría Clásica

Esta teoría sostiene que el valor de la probabilidad de un evento surge del


cociente entre el número de casos favorables a su presentación y el número
de casos igualmente posibles del espacio. Se hace la suposición de que los
sucesos de un experimento son igualmente posibles.

Ejemplo:

A = {salida de cara en el experimento de arrojar una moneda perfecta}

P (A) = 1 / 2 = 0,50

Teoría Frecuencial

Esta teoría define a la probabilidad como el valor límite de la frecuencia relativa,


de un determinado suceso para cuando el número de observaciones tiende a
infinito.

P (A) = lim hi
n→ ∞

En otros términos podríamos decir que la frecuencia relativa se torna estable a


medida que aumenta el número de observaciones.
Determinamos con qué frecuencia algo ha ocurrido en el pasado, empleando este
dato para predecir de que vuelva a ocurrir en el futuro. El principal inconveniente
que presenta esta teoría es la probabilidad de experimentar que muchas veces
se torna imposible.

Teoría Subjetivista

Esta teoría sostiene que la probabilidad es producto de la apreciación que cada


individuo pudiese hacer en relación a la posibilidad de que un evento suceda
o no suceda. Esta teoría tiene escaso rigor matemático y refleja sentimientos y
opiniones respecto a las posibilidades de que ocurra un resultado en particular.

Debemos destacar que las diferencias entre las distintas teorías se reducen a
los fundamentos y exposición matemática, ya que desde el punto de vista de las
aplicaciones, son en gran medida coincidentes.

3. Eventos Particulares:

Ya hemos visto que Ω representa al espacio probabilístico. A este también se lo


suele representar por S (del inglés ¨space¨).

Haremos mención a dos eventos particulares:

EDUBP | MARKETING | estadística aplicada I - pag. 89


Evento Cierto: es aquel para el cual todos los eventos elementales le son
favorables. Para el ejemplo que hemos venido planteando de arrojar una
moneda, supongamos que se pidiera la presentación de cualquiera de las dos
caras, tendremos la seguridad que aparecerá alguna de las caras.

Evento Imposible: es aquel para el cual ninguno de los eventos elementales le es


favorable. En el caso de arrojar una moneda sería el evento de que salgan tres
caras. A la probabilidad de este evento lo simbolizaremos como:

P () = 0 / N = 0

4. Presentación Axiomática:

Axiomas para la familia de eventos:

Llamaremos F al conjunto que llamaremos familia de eventos, que corresponde


a todos los eventos del espacio probabilístico y a todos los eventos compuestos
posibles que se pueden formar con ellos.

1- El evento seguro y el evento imposible pertenecen a la familia de eventos.

Ω ∅ ∈ F

Dado un conjunto de eventos Ai , finito o infinito numerable, que pertenecen a la


familia de eventos, la intersección de dichos eventos también es un evento que
pertenece a dicha familia.

Dado un conjunto de eventos Ai , finito o infinito numerable, que pertenecen


a la familia de eventos, la unión de dichos eventos también es un evento que
pertenecerá a dicha familia.

2- Si A es un evento que pertenece a la familia de eventos, el complemento de


A será un evento que también pertenecerá a la familia de eventos.

Si A ∈ F ⇒ A ∈ F

EDUBP | MARKETING | estadística aplicada I - pag.90


3- Teorema:
Dados dos eventos A y B que pertenecen a la familia de eventos, la diferencia
de A – B, o B – A, también permanecerán a dicha familia.

Si A ∧ B ∈ F ⇒ A – B ∧ B- A ∈ F

5. Axiomas de Probabilidad

1. Si A es un evento que pertenece a la familia de eventos, A llevará asociado


un número llamado probabilidad de A.

2. Axioma de no negatividad:
La probabilidad de un evento es siempre no negativa

P (A) ≥ 0

3. Axioma de certidumbre:
La probabilidad de todo el espacio probabilístico es igual a uno.

P (Ω) = 1

4. Axioma o ley de probabilidad total:


Dado un conjunto de eventos Ai, finito o infinito, que pertenece a la familia de
eventos, mutuamente excluyentes, la probabilidad de la unión de dichos eventos,
es igual a la suma de las probabilidades de cada uno de ellos.


P (∪1∞ Ai ) = P( Ai ) Ai ∩ A j = ∅ ∀ ij
I=1

6. Teoremas relacionados a la Probabilidad

1. Si A es un evento, la probabilidad del evento complementario, es igual a uno


menos la probabilidad del evento A.
_ _
P (A) = 1 - P (A) P (A) + P (A) = 1

2. La probabilidad del evento imposible es igual a cero.

P(∅) =0

3. Para todo evento A, su probabilidad estará comprendida entre cero y uno.

0 ≤ P (A) ≤ 1

EDUBP | MARKETING | estadística aplicada I - pag. 91


4. Dados dos eventos A y B, en donde A es un subconjunto de B, la probabilidad
de la diferencia B – A, es igual a la probabilidad de B menos la probabilidad
de A.

P (B - A) = P (B) – P(A) A ⊆ B
B = A ∪ (B - A)
P (B) = P (A) + P (B - A)
P (B - A) = P (B) - P (A)

5. Dados dos eventos A y B, tales que A sea subconjunto de B, la probabilidad


de A es menor o a lo sumo igual a la probabilidad de B.

Si A ⊆ B, P (A) ≤ P (B)

6. Desigualdad de Boole

• Dado dos eventos A y B, que no son mutuamente excluyentes, la probabilidad


de A unión B será menor o a lo sumo igual que la suma de las probabilidades
de dichos eventos.

Si A ∩ B ≠ ∅
P (A ∪ B) ≤ P (A) + P (B) P (A ∪ B) = P (A) + P (B) – P (AB)

• Dado dos eventos A y B, que son mutuamente excluyentes, la probabilidad


de A unión B será igual a la suma de las probabilidades de dichos eventos.

P (A B) = P (A) + P (B)

7. Probabilidad Condicional:

Supongamos que tenemos un espacio probabilístico con n eventos elementales.


Un evento A con a eventos elementales, B con b elementos elementales y en
donde c son eventos elementales favorables a la presentación conjunta de A
y B.
Supongamos que se ha presentado B ¿Cuál es la probabilidad de que también
se haya presentado A?

Simbólicamente: P (A / B)
Nuestro espacio probabilístico será B con b eventos elementales de los cuales c
le son favorables a A. Por lo tanto:

P (A / B) = c / b; en B En donde P (A) y P (B) deberán ser


distintas de cero.

Para referirnos al espacio primitivoΩ, divido numerador y denominador por n


(eventos elementales del espacio muestral Ω)

P (A / B) = c / b = c/n : b/n = P (A B) ; P(B)≠ 0


P (B)

de manera similar podemos deducir que P (B / A) = P (A B) ; P (A) ≠ 0


P (A)

EDUBP | MARKETING | estadística aplicada I - pag.92


8. Probabilidad Compuesta:

De las probabilidades condicionales podemos deducir:

P (A / B) = P (A B) ∴ P (A B) = P (A / B) P (B)
P (B)

P (B / A) = P (A B) ∴ P (A B) = P (B / A) P (A)
P(A)

9. Eventos Independientes:

Dos eventos son estadísticamente independientes entre sí, si la probabilidad de


presentación de uno de ellos a condición de que se haya dado el otro, es igual a
la probabilidad simple del evento condicionado.

P (A / B) = P (A) P (B / A) = P (B)

A: evento condicionado B: evento condicionado


B: evento condicionante A: evento condicionante

Si dos eventos son independientes, la probabilidad de presentación conjunta es


igual al producto de las probabilidades de dichos eventos.

Lo invitamos a complementar el estudio de los temas presentados con la lectura


de la bibliografía básica.

m4 material

Material Básico:

• LIND, D., MARCHAL, W. y WATHEN, S. Estadística Aplicada a los Negocios


y a la Economía. Ed. McGraw Hill (2008). Capítulo Nº 5.

Material Complementario:

• ANDERSON, DAVID R.; SWEENEY, DENNIS J.; WILLIAMS, THOMAS


A. (2008) Estadística para administración y economía. Ed. THOMSON
INTERNATIONAL
• LEVINE, DAVID M.; BERENSON, MARK L.; KREHBIEL, TIMOTHY C.
(2006) Estadística para administración. Ed. Pearson
• MENDENHALL, WILLIAM; BEAUER, BARBARA M.; BEAUER, ROBERT
J. (2007) Introducción a la probabilidad y estadística Ed. THOMSON
INTERNATIONAL
• VISAUTA VINACUA, BIENVENIDO. (2007) Análisis estadístico con SPSS
14. Estadística Básica. Ed. McGraw Hill

EDUBP | MARKETING | estadística aplicada I - pag. 93


m4 actividades

m4 | actividad 1

Una cuestión de probabilidades

“El que nada duda, nada sabe”


Proverbio griego

Una de las mayores empresas dedicadas a la producción de golosinas


del MERCOSUR se ha incorporado como cliente de la consultora. La primera
inquietud que les han planteado desde el departamento de calidad es el siguiente:
“Tenemos una máquina automática que empaqueta galletas con un peso de 55gr.
La mayoría de los paquetes se llenan de manera adecuada; sin embargo, algunos
de los paquetes se detectan con un peso mayor y otros con un peso menor.
Hemos tomado una muestra y analizado lo que sucedía:

¿Podrían ayudarnos a establecer cuál será la probabilidad de que un paquete


esté por encima o por debajo del peso que se ha especificado? De la respuesta
que ustedes nos proporcionen, dependerán en gran medida las acciones que
decidamos tomar.

Usted se pone a trabajar para establecer la probabilidad solicitada.

A 1

C 1

EDUBP | MARKETING | estadística aplicada I - pag.94


m4 |actividad 1 | AA

asistente académico 1

Para poder resolver el caso no deberá perder de vista lo siguiente:

1. ¿Cuántos eventos tiene el caso?

Los eventos son tres:

2. Los eventos son mutuamente excluyentes y colectivamente exhaustivos

3.- Dados tres eventos A, B y C, que son mutuamente excluyentes, la


probabilidad de A unión B unión C será igual a la suma de las probabilidades
de dichos eventos.

P(A ó B ó C) =P (A ∪ B ∪ C) = P (A) + P (B) + P (C)

m4 |actividad 1 | CC

clave de corrección 1

A: Peso por debajo de las especificaciones

B: Peso específico

C: Peso por encima de las especificaciones

P (A o C)= P(A U C) = P(A) + P(C) = 0,01 + 0,03 = 0,04

EDUBP | MARKETING | estadística aplicada I - pag. 95


m4 | actividad 2

Asesorando a un banco

A 1
Uno de los bancos que la consultora asesora está realizando un
relevamiento sobre clientes que han adoptado por los distintos tipos de servicios
que éste ofrece. Analizando una de las sucursales se sabe que, de un total de
1.000 clientes, 700 tienen caja de ahorro, 400 tienen cuenta corriente, y 300
tienen ambos tipos de cuentas. La gerencia le realiza una consulta y le dicen: “A
raíz de la información anterior que le estamos proporcionando, hemos pensado
que a partir de ella podríamos contar con alguna información adicional. ¿Usted
considera posible establecer la probabilidad de que un cliente que se seleccione
al azar tenga cualquiera de las dos cuentas? El dato que surja nos permitirá
lanzarnos al mercado de manera diferente”.

Lo invito a responder la pregunta en cuestión.

C 1

m4 |actividad 2 | AA

asistente académico 1

Para poder resolver el caso no deberá perder de vista lo siguiente:

1. ¿Cuántos eventos tiene el caso?

Los eventos son dos:

2.- Los eventos son no mutuamente excluyentes

3. Dados dos eventos A y B, que son no mutuamente excluyentes, la probabilidad


de A unión B, será igual a la suma de las probabilidades de dichos eventos
menos la probabilidad de la intersección.

P( A o B o C) = P (A ∪ B ∪ C ) = P (A) + P (B) - P (A B)

EDUBP | MARKETING | estadística aplicada I - pag.96


m4 |actividad 2 | CC

clave de corrección 1

A: Clientes con caja de ahorro

B: Clientes con cuenta corriente

AB: Clientes con ambos tipos de cuenta

P(A o B) = P(A U B) = P (A) + P (B ) - P(AB) =(700/1000) + (400/1000) -


(300/1000) = 0,80

m4 | actividad 3

Lanzamiento de nuevos productos al mercado

A 1

¿Recuerda la empresa Technology punto com SRL? La misma, a través de uno


de sus gerentes, les informa que está pensando lanzar al mercado dos nuevos
productos. El Licenciado Sánchez Navarro le dice: “Usted habrá escuchado
que nuestro cliente, Technology punto com SRL, está estudiando la viabilidad
de lanzar al mercado dos nuevos productos. Según mi opinión y mi experiencia
personal, me atrevería a decir que la posibilidad de aceptación de uno de ellos
es del 95%, frente a un 70% del otro. Le repito: estos números a los que hago
referencia son meramente subjetivos, ya que me he basado en mi experiencia y no
en hechos documentados. Si hiciéramos el supuesto que las dos opiniones son
independientes una de la otra: ¿me podría ayudar a definir cuál es la probabilidad
de que ambos productos tengan éxito?”

Responda con fundamento al Sr. Sánchez Navarro.

C 1

m4 |actividad 3 | AA

asistente académico 1

Para poder resolver el caso no deberá perder de vista lo siguiente:

1. ¿Cuántos eventos tiene el caso?

Los eventos son dos:

 El éxito del producto A lo podemos llamar A

EDUBP | MARKETING | estadística aplicada I - pag. 97


 El éxito del producto B llamado B

2.- Los eventos son independientes

P(A y B) = P(A B) = P(A) x P(B)

P(A ∩ B)

m4 |actividad 3 | CC

clave de corrección 1

A: aceptación del producto A

B: aceptación del producto B

P(A B) = P(A) P (B)....... si los eventos son independientes

P(A B) = 0,95 x 0,70 =0,665

m4 | actividad 4

¿Ayudará para aprobar?

A 1

Es sábado y usted se encuentra reunido con un grupo de amigos conversando


e intercambiando opiniones sobre las vivencias universitarias. Entre los temas
que se hablan surge la polémica de la importancia de asistir o no a los talleres
de apoyo en el área matemática, propuestos por su carrera, y su vinculación con
aprobar o reprobar en el área.

Al respecto, María Laura, una de sus compañeras de estudio, comenta lo


siguiente:

“La profesora de estadística contó en clase que la universidad ya


contaba con información sobre el tema: por estudios previos se
sabe que 40 de las personas que cursan materias pertenecientes
al área matemática asisten al gabinete de apoyo. De todos
los estudiantes que asistieron al gabinete, 30 aprobaron sin
inconveniente los exámenes”.

EDUBP | MARKETING | estadística aplicada I - pag.98


Jorge es otro de sus amigos; él estudia abogacía y no comprende bien lo que
María Laura relata y les dice:

“Con esos datos que tienen, ¿pueden llegar a saber qué tan
probable es que un estudiante haya asistido por consultas al
gabinete de apoyo siendo que éste haya aprobado los exámenes?
o bien… ¿qué tan probable es que un alumno seleccionado al
azar haya aprobado los exámenes dado que haya asistido por
consultas al gabinete de apoyo?”

Lo invitamos a responder la inquietud planteada por Jorge.

C 1

m4 |actividad 4 | AA

asistente académico 1

Para poder resolver el caso no deberá perder de vista lo siguiente:

1. ¿Qué aspectos son relevantes en este caso?

 Un evento simple: haber asistido al gabinete de apoyo llamado A

 Otro evento simple: haber aprobado el examen llamado B

 Una probabilidad condicionada: haber aprobado el examen dado que asistió


al gabinete de apoyo P (B / A)

P (B / A)

Siendo:

A: Evento condicionante
B: Evento condicionado

2.- Los eventos son dependientes

P (A y B) = P( A B ) = P (A) x P( B/A )

EDUBP | MARKETING | estadística aplicada I - pag. 99


m4 |actividad 4 | CC

clave de corrección 1

A: Alumnos que asistieron al gabinete de apoyo.

B: Alumnos que asistieron al gabinete de apoyo y aprobaron.

P (B / A ) = P( A B) / P( A ) = 30 / 40 =0,75

m4 | actividad 5

Esclareciendo dudas

A 1

Su departamento ha sido notificado que después de realizar diversos análisis


se ha resuelto la conveniencia para Artin SA de incorporarse al sector de los
supermercados.
Frente a este resultado, el área de Recursos Humanos realiza una primera
convocatoria a efectos de seleccionar personal para cubrir los cargos de
supervisores y los puestos de administrativos jerárquicos.
El responsable de RR.HH. le dice:

“Hemos entrevistado hasta ahora 30 personas; en el grupo había


16 varones de los cuales 6 tenían títulos terciarios y el resto no
los tenía. Del grupo de mujeres sólo 4 no tenían títulos terciarios.
¿Usted podría colaborar confeccionando una tabla? Estamos
seguros de que esta manera de presentar la información permitirá
avanzar en nuestro estudio de manera más efectiva. A los datos que
surgen de la tabla: ¿los podría presentar como probabilidades?
Además, nos interesaría conocer cuán probable es que la persona
seleccionada sea varón y tenga estudios terciarios, por un lado,
y también conocer cuál es la posibilidad de que la persona
seleccionada sea mujer o no tenga estudios terciarios.
Otra duda que nos ha surgido es sobre la dependencia o
independencia de los eventos; ¿podría ayudarnos a esclarecer
nuestras dudas?”

¿Qué respondería al responsable de RRHH? Fundamente.

C 1

EDUBP | MARKETING | estadística aplicada I - pag.100


m4 |actividad 5 | AA

asistente académico 1

Recuerde que:

1. Debe identificar los eventos; por un lado tiene dos eventos mutuamente
excluyentes entre sí: “Varón”, “Mujer”; y por otro lado otros dos eventos
mutuamente excluyentes “Tener estudios terciarios”, “No tener estudios
terciarios”.
De lo anterior se desprende que la tabla tendrá dos filas y dos columnas.

2. Deberá completar la tabla utilizando la información que se le proporciona. El


total de personas entrevistadas es de 30. No olvide colocar los totales marginales,
que no son otra cosa que los totales de cada fila y los totales de cada columna.

3. No debe olvidar que los nexos “o” e “y” son sinónimos de unión y de
intersección, respectivamente.

m4 |actividad 5 | CC

clave de corrección 1

Varón Mujer Total


Título terciario 6 10 16
Sin título terciario 10 4 14
Total 16 14 30

a) P( V T) = 6/30
_ _ _
b) P( M U T ) = P( M) + P( T ) - P(MT)= (14/30) + (14/30) - P(4/30) = 24/30

c) P( VT) = P( V) P( T)

6/30 = 16/30 x 16/30

0,20 ≠ 0,28 Los eventos son dependientes

EDUBP | MARKETING | estadística aplicada I - pag. 101


m4 | actividad 6

Una serie de ejercicios

1. Una caja contiene dos lápices de color rojo y tres de color negro. Se extraen
con reemplazo tres lápices; calcule la probabilidad de encontrar en dicha
extracción:

a) ningún lápiz negro.


b) dos lápices negros.
c) uno o más lápices rojos.

2. Resuelva el ejercicio anterior sin reemplazo en la extracción de los lápices.

3. Una compañera encontró en uno de los cajones de su guardarropa, dos


guantes para la mano izquierda y siete guantes para la mano derecha. Si ella
selecciona al azar dos guantes del cajón, sin reemplazo, cuál es la probabilidad
de que:

a) Ambos guantes seleccionados sean para la mano derecha.


b) Seleccione un guante para la mano derecha y otro para la mano izquierda.
c) Si ahora selecciona tres guantes: ¿cuál es la probabilidad de que los tres
guantes sean para la mano izquierda?
d) Si nuestra compañera tomara a la muestra con reemplazo: ¿cuáles serían las
probabilidades en los puntos a) y b)?

4. Alejo arroja simultáneamente una moneda y un dado y quiere conocer:

a) Todos los resultados posibles de su experimento.


b) ¿Cuál es la probabilidad de que salga cara y el número cinco?
c) ¿Cuál es la probabilidad de que salga seca y un número menor a tres?

5. Un empleado de una fábrica encontró en el depósito una caja que contenía


repuestos de una de las máquinas. En ella había 10 repuestos en buen estado y
5 defectuosos. Si el empleado elige tres repuestos al azar, con reemplazo, cuál
es la probabilidad de que:

a) Todos sean defectuosos.


b) Todos estén en buen estado.
c) Al menos dos estén en condiciones de uso.

6. Se arroja un dado en tres oportunidades y se desea calcular las siguientes


probabilidades:

a) Que la cara número uno salga por lo menos una vez.


b) Que la cara número cinco salga dos o tres veces.
c) Que la cara número tres salga tres veces.

EDUBP | MARKETING | estadística aplicada I - pag.102


7. Si se arrojan dos dados al mismo tiempo, uno negro y uno blanco, encuentre
la probabilidad de que la suma de los puntos de las caras de los dados, sea
siete y que el número correspondiente a la cara del dado blanco sea mayor que
el número de la cara del dado negro.

8. Calcule las siguientes probabilidades: P (A B) ; P (A U B ) y P ( A/ B)


Conociendo que los eventos son mutuamente excluyentes y
P(A) = 0,60 en tanto que P (B) = 0,20

9. Siendo A y B dos eventos independientes y sabiendo que P(A) = 0,20 y P (B)


= 0,50 se pide que calcule:
_
a) P(A/B) ; b) P(A U B) ; c) P (AB)

10. La siguiente información se refiere a 200 clientes que concurrieron, el pasado


fin de semana, al nuevo snack bar inaugurado recientemente:

Edad Sexo Hombre Mujer

Menor de 20 50 60

De 20 o más 70 20

Cuál es la probabilidad de que una persona elegida al azar:

a) Sea mujer.
b) Sea menor de 20 años o sea hombre.
c) Tenga 20 o más años y sea varón.
d) Sabiendo que se trata de un varón, ¿cuál es la probabilidad de que sea mayor
de 20 años?

11.-Lea los siguientes enunciados y seleccione la alternativa correcta en cada


caso:

♦ Si “A” y “B” son conjuntos mutuamente excluyentes:


a) La probabilidad de la intersección es igual a 1.
b) La probabilidad de la intersección es un número cualquiera.
c) La probabilidad de la intersección es igual a cero.

♦ Los valores entre los cuales están comprendidas las probabilidades de


diferentes eventos son:
a) Entre cero y uno, inclusive.
b) Entre cero y uno sin incluir.

EDUBP | MARKETING | estadística aplicada I - pag. 103


c) Entre - ∞ y + ∞.

♦ Si “A” y “B” son conjuntos no mutuamente excluyentes:


a) La probabilidad de la intersección es igual a cero.
b) La probabilidad de la intersección es distinta de cero y mayor que uno.
c) La probabilidad de la intersección es distinta de cero, pero no mayor que
uno.

12.-Sea la probabilidad de A = 0.40 y B = 0.50; y siendo A y B eventos


mutuamente excluyentes, pertenecientes al espacio muestral S; calcule:
• P(A∪B)=
• P(A∩B)=

13.-Sea la probabilidad de A = 0.30 y B = 0.50; y siendo A y B eventos no


mutuamente excluyentes pertenecientes al espacio muestral S, por lo cual A ∩
B = 0.15; calcule:
• P(A∪B)=
• P(A / B)=

14.-Elija la opción correcta:

♦ Si dos eventos son mutuamente excluyentes:


a) Son estadísticamente independientes.
b) Son estadísticamente dependientes, para una sola extracción.
c) Son estadísticamente independientes si extrae una selección de muestreo
con reposición.

♦ Si dos eventos son no mutuamente excluyentes, son:


a) Únicamente independientes.
b) Únicamente dependientes.
c) Pueden ser dependientes o independientes.

15.-Una caja contiene 10 productos de la marca “A” y 5 de la marca “B”:

a) Si seleccionamos un producto al azar; ¿cuál sería la probabilidad de extraer


un producto de la marca “A”, y cuál la probabilidad de extraer un producto de
la marca “B”, según la teoría clásica?

b) Asigne la probabilidad del espacio muestral según la teoría relativa:


Si se extraen al azar dos productos, sin reponer el primero antes de extraer el
segundo producto:

c) ¿Cuál es la probabilidad de que ambos sean A?

d) ¿Cuál es la probabilidad de que sea uno de la marca “A” y otro de la marca


“B”?

e) ¿Cuál es la probabilidad de que ambos sean de la marca “B”?

f) Si seleccionamos al azar una muestra de tres productos con reposición:


• Defina el espacio muestral.
• Asigne probabilidades según la teoría clásica.
• Calcule la probabilidad de que tres productos sean de marca B, según la

EDUBP | MARKETING | estadística aplicada I - pag.104


teoría relativa.

16.-Si se lanza un dado perfecto una sola vez, ¿cuál es la probabilidad de que:
a) la cara del dado sea impar?
b) la cara del dado sea par?
c) la cara del dado sea par y uno?
d) la cara del dado sea impar y uno?
e) sabiendo que la cara es impar, sea un uno?

17.-Una empresa tiene 250 empleados de los que 130 fuman. Además se conoce
que hay 150 hombres de los cuales 85 fuman:

a) Elabore una tabla de contingencia.


b) Calcule las siguientes probabilidades:
b1- que fume
b2- que sea mujer
b3- que no fume
b4- que sea hombre
b5- que sea mujer y no fume
b6- que sea hombre y fume
b7- que sea hombre o que fume
b8- que sea mujer o que no fume
c) Dado que es mujer, ¿cuál es la probabilidad de que fume?
d) Dado que fuma, ¿cuál es la probabilidad de que sea mujer?
e) ¿Son estadísticamente independientes el hecho de que fume con el hecho
de que sea mujer?

18.-Si se lanza un dado dos veces, se pide:

a) Determine el espacio muestral.


b) ¿Cuál es la probabilidad de que la suma de caras sea igual a un número par?
c) Si un dado es impar, ¿cuál es la probabilidad de que la suma de puntos sea
5?

19.-Dada la siguiente tabla de contingencia:

Economía Derecho Matemática Total


Aprobados 150 180 120 450
No aprobados 90 70 40 200
Total 240 250 160

Si seleccionamos un alumno al azar; cuál es la probabilidad de que:


a) sea un estudiante de economía
b) sea un estudiante de derecho
c) sea un estudiante aprobado
d) sea un estudiante de economía o derecho o aprobado
e) sea un estudiante de economía y esté aprobado
f) sea un estudiante de economía o de derecho
g) sea un estudiante de matemática y derecho
h) sea un estudiante de matemática o economía y no esté aprobado

EDUBP | MARKETING | estadística aplicada I - pag. 105


i) sea un estudiante de economía y no esté aprobado
j) Si sabemos que es un estudiante de derecho, ¿cuál es la probabilidad de
que esté aprobado?
k) Si sabemos que es un estudiante aprobado, ¿cuál es la probabilidad de que
sea de matemática?
l) Indique si hay independencia entre los hechos de ser un estudiante aprobado
y de derecho.

20. La siguiente información es de una importante empresa fabril que cuenta


con 250 empleados, de los cuales 150 trabajan en turno mañana y el resto por
la tarde. Del turno mañana, 120 tienen una antigüedad superior a 5 años y en el
turno de la tarde sólo 30 de ellos tienen antigüedad superior a 5 años. Con esta
información se solicita que:
♦ Confeccione la tabla de doble entrada correspondiente.
♦ Si se selecciona un empleado al azar, calcule las siguientes probabilidades:
a) Que sea un empleado del turno mañana.
b) Que sea un empleado del turno mañana o tarde.
c) Que sea un empleado del turno mañana o tenga una antigüedad superior
a 5 años.
d) Que sea un empleado del turno mañana y no tenga antigüedad superior a
5 años.
e) Dado que es un empleado del turno tarde, que no tenga antigüedad superior
a 5 años.
f) Dado que es un empleado del turno mañana, que tenga antigüedad superior
a 5 años.
g) Verificar si son estadísticamente independientes los eventos: turno mañana
y antigüedad superior a 5 años.

A fin de complementar la ejercitación propuesta, le sugerimos resolver las


actividades propuestas por el autor del libro recomendado como material básico
y que se presentan con los títulos: “Auto evaluaciones” y ”Ejercicios del capítulo”
(Capítulo 5).

m4 glosario

Complemento del evento A: El evento que contiene todos los puntos muestrales
que no están en A.

Diagrama de árbol: Dispositivo gráfico útil para definir puntos muestrales de un


experimento donde se presentan varias etapas.

Diagrama de Venn: Dispositivo gráfico para representar, simbólicamente, el


espacio muestral y las operaciones que implican eventos.

Espacio muestral: El conjunto de todos los puntos muestrales posibles


(resultados experimentales).

Evento: Un conjunto de puntos muestrales.

EDUBP | MARKETING | estadística aplicada I - pag.106


Eventos independientes: Dos eventos, A y B, para los que P(A / B) = P(A) o que
P(B/ A) = P(B); esto es, los eventos no tienen influencia entre sí.

Eventos mutuamente excluyentes: Eventos que no tienen puntos muestrales


en común; esto es, A ∩ B está vacío y P(A ∩ B) = 0.

Experimento: Cualquier proceso que genere resultados bien definidos, que se


representan por E¡.

Intersección de A y B: El evento que contiene a todos los puntos muestrales


que están simultáneamente en A y en B. La intersección se representa como A
∩ B.

Ley aditiva: Una ley de probabilidades que se emplea para calcular la


probabilidad de una unión, P(A U B). Esto es P(A U B) = P(A) + P (B) - P(A n B).
Para eventos mutuamente excluyentes, ya que P(A B) = 0, se reduce a P(A U B)
= P(A) + P (B).

Ley multiplicativa: Ley para calcular la probabilidad de una intersección, P(A B).
Es P(A B)= P(A) P (B/A) o bien P(A B)= P (B) P(A/B). Para eventos independientes
se reduce P(A B) = P(A) P (B).

Método clásico: Método de asignar probabilidades que supone que los


resultados experimentales son igualmente posibles.

Método de la frecuencia relativa: Método de asignar probabilidades, basado


en la experimentación o en datos históricos.

Método subjetivo: Método de asignar probabilidades basadas en el juicio


personal.

Probabilidad: Medida numérica de la posibilidad de que ocurra un evento.

Probabilidad condicional: La probabilidad de un evento, dado que ha ocurrido


otro evento. La probabilidad condicional de A dado B es P(A / B) = P(A B) IP (B).

Probabilidades posteriores: Probabilidades actualizadas de eventos, basadas


en información adicional.

Probabilidades previas: Estimados iniciales de las probabilidades de los


eventos.

Punto muestral: Resultado individual de un experimento.

Requisitos básicos de probabilidad: Dos requisitos que restringen la forma de


hacer asignaciones de probabilidad:
a. Para cada resultado experimental, E¡ debe tener 0 ≤ P(Ei) ≤ 1.
b. Si hay k resultados experimentales, entonces ∑P (Ei) = 1.

Unión de eventos A y B: El evento que contiene todos los puntos muestrales


que están en A, en B, o en ambos. La unión se representa como A U B.

Recomendamos la ampliación del presente glosario con el del material básico


sugerido.

EDUBP | MARKETING | estadística aplicada I - pag. 107


m ó dulos

m5

m5 microobjetivos

• Comprender el concepto de los términos: distribución de probabilidad y


variable aleatoria con la finalidad de introducir las bases necesarias que
permitan comprender la posible ocurrencia de hechos futuros.

• Describir las características de las distribuciones de probabilidad


discretas; en particular la distribución binomial, la distribución
hipergeométrica y la distribución de Poisson y sus aplicaciones en el
cálculo de probabilidades, con la finalidad de conocer los principales
modelos teóricos que guardan una estrecha relación con muchas
situaciones reales en el mundo de los negocios.

• Conocer cómo debe calcularse la esperanza y la desviación estándar


para distribuciones de probabilidad discretas, con la finalidad de poder
resumir al conjunto de datos, en unos pocos indicadores.

m5 contenidos

Distribuciones discretas de probabilidad

Los temas que abordaremos en el presente módulo son los siguientes:

1. Variable aleatoria
2. Distribución de probabilidad
3. Esperanza matemática y Medidas de dispersión
4. Distribuciones de probabilidad: binomial, hipergeométrica y
Poisson

Creemos oportuno recordarle algunos aspectos sobre los cuáles hemos estado
trabajando anteriormente:

EDUBP | MARKETING | estadística aplicada I - pag.108


1. ¿Qué es una VARIABLE ALEATORIA?

Es una variable cuyos valores se deben al azar. Por ejemplo: “salidas de caras en
un experimento de lanzar 1 vez dos monedas”, “número de unidades vendidas”,
“niveles de producción diaria”, etc.

2. Distribución de probabilidad

Lista de todos los valores posibles que


pueda asumir la variable aleatoria (VA)

+ = Distribución
de la probalidad
Probabilidad asociada a cada resultado
o valor asumido por la VA

¿Recuerda otro concepto análogo visto? ¿Cuál?

Clasificación de la variable aleatoria

Discreta: surge del conteo de


algún elemento de interés.
Variable aleatoria

Continua: surge de un proceso


de medición.

Función de probabilidad discreta:

Denominación: Función de cuantía

EDUBP | MARKETING | estadística aplicada I - pag. 109


Se escribe: f (x)

Condiciones a cumplir: f (x) ≥0

∑ f(x)=1

Esperanza y varianza para una variable aleatoria discreta:

3. Esperanza:

E (x) = µ = ∑ x f(x) ¿Recuerda haber visto en la unidad 3 otro


concepto análogo a
este?, ¿cuál?

Varianza:

V(x) = E( x2 ) - [ E( x ) ] 2
; La E( x2 ) = ∑ x2 f( x)

4. Distribuciones de variables discretas

Distribución binomial:

Es una de las distribuciones discretas de probabilidad más utilizadas. Se


encontrará su aplicación en problemas planteados con ventas, mercadotecnia,
investigación de opiniones, control de calidad etc. La emplearemos cuando de un
experimento se puedan obtener dos resultados: la ocurrencia (que llamaremos
éxito) o la no ocurrencia de un evento (llamada fracaso). A la probabilidad del
evento “éxito” la llamaremos p y a la probabilidad del fracaso la llamaremos 1- p
=q

 Caracterización del experimento:

1.- Existen “n “ pruebas idénticas.

2.-Cada prueba tiene dos resultados posibles mutuamente excluyentes.

3.- La probabilidad de cada resultado permanece constante de una prueba a


otra.

4.- Las pruebas son independientes.

5.- Se aplica a poblaciones finitas con reemplazo o infinitas sin reemplazo.

 Función de probabilidad o cuantía.

x x n-x
f (x)= Cn p q x= 0,1, 2,...,n

0 para todo otro valor

EDUBP | MARKETING | estadística aplicada I - pag.110


f (x) = probabilidad de x éxitos en n pruebas

x
C n = número de obtener exactamente x éxitos en n pruebas

p = probabilidad de éxito en cualquier prueba

q = probabilidad de fracaso en cualquier prueba

n = número de pruebas

x = número de éxitos en la muestra

 Parámetros:

E(x) = µ = np V(x) = npq

Veremos un ejemplo donde utilizaremos las tablas binomiales IC 1:

Un vendedor tiene el 20% de posibilidades de cerrar una venta con un cliente


cualquiera. Si llama a 5 clientes:

a) ¿Cuál es la probabilidad de que haga menos de 3 ventas?


b) ¿Cuál es la probabilidad de que no se haga ninguna venta?
c) ¿Cuál es el número promedio de ventas?
d) ¿Cuál es la probabilidad de que se hagan 2 o más ventas?
e) ¿Cuál es la probabilidad de que se hagan entre 2 y 4 ventas (ambos
extremos inclusive)?

Los casos se resolverán utilizando las tablas adjuntas (Ud. podrá, si así lo prefiere,
utilizar las tablas del Apéndice del texto básico sugerido).
La tabla que se propone con este módulo presenta la ventaja de tener que realizar
menor cantidad de operaciones que si decidiese trabajar con las tablas del libro.
La tabla que se utilizará para resolver el problema presenta la característica
que acumula desde 0 hasta un valor particular de la variable, lo que implica que
sólo se podrá entrar directamente en los casos que X≤ xi , los demás casos
necesitarán de una transformación.

Veamos a continuación la solución paso a paso:

a) P(X<3; n=5; p=0,20)= P(X≤2, n=5; p=0,20)= 0,9421

EDUBP | MARKETING | estadística aplicada I - pag. 111


b) P(X=0, n=5, p=0,20)=0,3277

c) µ=np= 5.0,20= 1 promedio de ventas

d) P (X≥2; n=5, p=0,20)= 1- P(X ≤ 1; n=5; p=0,20)=1- 0,7373=0,2627

e) P (2≤ X ≤ 4, n=5; p=0,20)= P(X ≤ 4) - P(X ≤ 1)=0,9997-0,7373=0,2626

Los valores remarcados deben ser tenidos en cuenta para no cometer errores
en la solución de los ejercicios.

Distribución hipergeométrica:

 Caracterización del experimento:

1.- Se trabaja con una muestra proveniente de una población finita sin reemplazo.

2.- La probabilidad de éxito cambia de una prueba a otra.

3.- El tamaño de la muestra “n” es mayor que el 5% de la población N.

 Función de probabilidad o cuantía.

n-x x
C C
N-r r x =0, 1, ..., n; x ≤ r ; n -x ≤ N- r; N, n, r, enteros positivos
f(x) = n
C
N

0 Para cualquier otro valor

EDUBP | MARKETING | estadística aplicada I - pag.112


f(x) = probabilidad de x éxitos en n pruebas

n = la cantidad de pruebas

N = tamaño de la población

r = número de éxitos en la población

x = número de éxitos en la muestra

C = combinación

Distribución de POISSON (o de los casos raros)

En esta distribución discreta la variable aleatoria representa el número de


eventos independientes que ocurren a una velocidad constante en el tiempo
o en el espacio. Ejemplo: número de clientes que llegan a lugar específico
en un tiempo determinado, número de solicitudes de seguro procesadas por
una compañía en un tiempo determinado, etc. Esta distribución es el principal
modelo de probabilidad empleado para analizar problemas de líneas de espera.
Ver tablas de Poisson IC 2

 Caracterización del experimento:

1.- Los eventos aleatorios ocurren de manera independiente con una velocidad
constante en el tiempo o en el espacio.

2.- Una distribución binomial con “n” grande y “p” muy pequeña se acerca a una
distribución de Poisson.

 Parámetros:

E(x) = m V(x) = m

Lo invitamos a complementar el estudio de los temas del módulo, remitiéndose


a la bibliografía básica.

EDUBP | MARKETING | estadística aplicada I - pag. 113


m5 |contenidos | IC

informaciones complementarias 1- 2

Para visualizar las informaciones complementarias dirijasé al sector respectivo


en la Plataforma.

m5 material

Material Básico:

• LIND, D., MARCHAL, W. y WATHEN, S. Estadística Aplicada a los Negocios


y a la Economía. Ed. McGraw Hill (2008). Capítulo Nº 6.

Material Complementario:

• ANDERSON, DAVID R.; SWEENEY, DENNIS J.; WILLIAMS, THOMAS


A. (2008) Estadística para administración y economía. Ed. THOMSON
INTERNATIONAL
• LEVINE, DAVID M.; BERENSON, MARK L.; KREHBIEL, TIMOTHY C.
(2006) Estadística para administración. Ed. Pearson
• MENDENHALL, WILLIAM; BEAUER, BARBARA M. ; BEAUER, ROBERT
J. (2007) Introducción a la probabilidad y estadística Ed. THOMSON
INTERNATIONAL
• VISAUTA VINACUA, BIENVENIDO. (2007) Análisis estadístico con SPSS
14. Estadística Básica. Ed. McGraw Hill

m5 actividades

m5 | actividad 1

¿Sería conveniente terciarizar el servicio?

A 1

El socio gerente de la empresa Technology punto com SRL se pone en contacto


nuevamente con la consultora y le comenta a usted lo siguiente: “Desde hace
unos meses estamos preocupados ya que nuestra empresa está teniendo
algunos problemas. Uno de los puntos a analizar es la baja utilidad que tiene el
área de reparaciones; se ha llegado a pensar en la alternativa de terciarizar el

EDUBP | MARKETING | estadística aplicada I - pag.114


servicio. Hemos postergado la decisión hasta que usted nos asesore sobre el
tema, de esta manera se podrá llegar a la decisión correcta. Se han evaluado
los resultados de los últimos meses y la frecuencia de ocurrencia de los mismos.
Si el resultado esperado no supera o a lo sumo es igual a los $5.500 mensuales
promedio que nos asegura la empresa interesada en terciarizar el servicio, se
deberá dar de baja al área. Obviamente, nuestra mayor preocupación son los
empleados del sector, por lo que de llegar a esta decisión extrema, trataremos de
capacitar al personal y de reubicarlo, en caso de ser posible, en otras áreas de
nuestra empresa”.

Usted responde: “Creo oportuno el análisis, pero yo sugeriría incorporar al análisis


el estudio de las variabilidades de ambas series; ¿podría usted informarnos sobre
cuál será la variabilidad de los ingresos que asegura la empresa que les propuso
terciarizar el servicio?”

El socio gerente de Technology punto com SRL le proporciona el dato que


usted solicita: la variabilidad es de $ 800. Con este dato proporcionado usted
realiza el análisis para brindar una respuesta a la inquietud del gerente de
Technology punto com.

C 1

m5 |actividad 1 | AA

asistente académico 1

1.- La información se proporciona a través de una tabla de frecuencias en donde


la variable en estudio es el “Resultado” (cuantitativa) y la frecuencia absoluta
simple es el “Número de meses”.

2.- En uno de los párrafos se dice: “Si el resultado esperado no supera o a


lo sumo es igual...”, el comentario nos está guiando a calcular la esperanza
matemática.

3.- Antes de calcular la esperanza matemática deberá transformar la distribución


de frecuencia en una distribución de probabilidad.

4.- El total de meses es 12; deberá obtener las frecuencias relativas simples. La

EDUBP | MARKETING | estadística aplicada I - pag. 115


columna de la variable y la de las frecuencias relativas conforman la distribución
de probabilidad para los resultados de este sector de la empresa. Inherente
a estas frecuencias relativas está la suposición de que el futuro reflejará las
condiciones que prevalecían en el pasado.

5.- Una vez obtenida la distribución de probabilidad, podrá calcular la esperanza


matemática, la desviación estándar y el coeficiente de variación.

6.- Por último, comparará los coeficientes de variación de ambas series y


obtendrá las conclusiones para el caso planteado.

m5 |actividad 1 | CC

clave de corrección 1

m5 | actividad 2

Asesorando a Technology punto com SRL

A 1

Technology punto com SRL le informa que está evaluando su volumen


de ventas diarias. Están interesados en definir un día rentable para la firma. El
área contable de la consultora en la cual usted trabaja ha llegado a la conclusión
de que cualquier día en que se vendan 10 o más equipos es un día rentable.

EDUBP | MARKETING | estadística aplicada I - pag.116


Usted ha pedido mayor información al área contable sobre las ventas
unitarias por día de Technology punto com SRL. Respondiendo a su solicitud le
envían la siguiente información:

Usted ha pensado que utilizando la distribución de frecuencia, que le proporcionó


el sector contable, podrá generar a partir de ella la distribución de probabilidad
y ésta, a su vez, podrá ser utilizada como un resumen de los niveles de ventas
anticipadas para el futuro. No se equivoca al pensar que, con algunos pocos
cálculos más, estaría en condiciones de proporcionarle a Technology punto com
SRL no sólo la definición de lo que se entiende por un día rentable sino también
aportar la probabilidad de que esto suceda. Realice los cálculos para poder
definir un día rentable para la firma.

C 1

m5 |actividad 2 | AA

asistente académico 1

1.- Deberá transformar la distribución de frecuencia que le proporcionan en una


distribución de probabilidad. Son válidas las sugerencias propuestas para la
actividad 1.

2.- Un día rentable ha sido definido como aquel en que se venden 10 o


más equipos, por lo que deberá realizar la siguiente suma para conocer la
probabilidad que se sugiere obtener: P (x = 10) + P (x = 12) + P(x = 13) + P(x
= 15). (Obviamente, los eventos son mutuamente excluyentes).

EDUBP | MARKETING | estadística aplicada I - pag. 117


m5 |actividad 2 | CC

clave de corrección 1

m5 | actividad 3

Días rentables

Usted ha aportado al departamento contable información adicional a la que ellos


le proporcionaron sobre lo que se entiende como día rentable (aquel en que
se vendan 10 o más equipos), ya que a través de los cálculos que realizó pudo
ampliar la información al definir la probabilidad de que un día cualquiera sea
rentable es del 60%.

A raíz de su trabajo, el contador Soteras le dice: “Hemos pensado que Usted


nos podría aportar algún otro tipo de información que sería de gran utilidad para
nuestros futuros análisis. Por ejemplo: ¿qué tan probable es que seis días de una
semana sean rentables? ¿Podría definirnos cuál es la probabilidad de que no
haya días rentables en una semana?; ¿qué tan probable es que en 15 días se den
entre 7 días –como mínimo– y 13 días como máximo que sean rentables?”
Obviamente, si usted logra proporcionarnos, además de lo solicitado
anteriormente, el promedio de días rentables que se puede esperar por semana
(bajo el supuesto de que los días hábiles de la semana son seis) y la variabilidad
de la misma, estaremos por de más satisfechos con su aporte.

No sienta temor ante el pedido del contador Soteras. Usted está en condiciones
de ayudarlos. Adelante con la elaboración de su respuesta al contador.

A 1

C 1

EDUBP | MARKETING | estadística aplicada I - pag.118


m5 |actividad 3 | AA

asistente académico 1

1.- Para poder dar respuesta al pedido del Contador Soteras deberá previamente:

a) Definir qué distribución se va a utilizar.


b) Para encontrar la distribución adecuada usted deberá observar que:
 Tenemos dos sucesos posibles: “un día rentable “ o “un día no rentable”.
 Se piensa que el número de equipos vendidos es un suceso aleatorio y
la probabilidad de un buen día sigue siendo la misma. Las ventas de un
día no afectan a las del día siguiente. Usted puede decidir que se cumple
lo de “probabilidad constante”.
 Los niveles de ventas son independientes entre sí.

c) Todo lo anterior conduce a pensar que la distribución binomial es la apropiada


para el caso planteado.

2.- Ahora se encuentra en condiciones de obtener las probabilidades que le ha


pedido el Contador Soteras.

3.- Para resolver los ejercicios emplee las tablas que se adjuntan al final del libro
de texto.

m5 |actividad 3 | CC

clave de corrección 1

La distribución a utilizar es la binomial.

a) P( x = 6, n=6 , p =0,60) = 0,0467

b) P(x =0, n=6, p = 0,60) = 0,1382

c) P( 7 ≤ x ≤ 13 , n= 15, p=0,60 ) = 0,8998

EDUBP | MARKETING | estadística aplicada I - pag. 119


m5 | actividad 4

Preocupados

A 1

Acaba de sentarse frente a su PC a leer los e-mails del día y entre ellos se detiene
especialmente en el que envió la empresa Technology punto com SRL.

Asunto: Preocupados
Fecha: Mon, 18 Jul 2001 17:33
Para: [email protected]

Estimado:
Nuestro encargado del servicio de reparaciones nos ha presentado su
preocupación, ya que se enteró de que, de alguna manera, los empleados del
área bajo su cargo se han enterado de que se está pensando en terciarizar el
servicio, dada la baja rentabilidad de la misma. Esto ha generado malestar, y en el
sector se está pensando en tomar medidas de fuerza para los próximos días. Por
un lado, nos hemos contactado con el área de recursos humanos de la consultora
para que intenten anticiparse a los problemas que podemos llegar a tener en el
corto plazo. Por el otro, deseamos realizarle algunas consultas. Recordará que
los empleados del sector en conflicto son 19; nos hemos enterado que 12 están
a favor de las medidas de fuerza y 7 no lo están. Como estamos pensando en
reubicar a algunos dentro de nuestra empresa desearíamos conocer, si tomamos
una muestra de 6 de ellos (los posibles candidatos a permanecer en la empresa),
¿cuál es la posibilidad de que no encontremos entre ellos empleados que estén
a favor de las medidas de fuerza?

Desde ya muchas gracias. Quedamos a la espera de su respuesta.


Atte.

Jorge Rodríguez
Socio Gte.

Conteste al Sr. Rodríguez de modo fundado.

C 1

m5 |actividad 4 | AA

asistente académico 1

1.- Antes de comenzar con los cálculos, sepa que son válidas las sugerencias
dadas en la actividad 3.

2.- Debería hacerse algunas preguntas:

a) ¿Cuál sería la clasificación de la población? ¿Finita o infinita?


b) La probabilidad de éxito de una prueba a otra, ¿permanece constante o
cambia?

EDUBP | MARKETING | estadística aplicada I - pag.120


3.- Si respondió correctamente estas preguntas, ya tiene identificada la
distribución a utilizar en este caso.

m5 |actividad 4 | CC

clave de corrección 1

m5 | actividad 5

La empresa Artin

A 1

La empresa Artin SA ha solicitado a la consultora un estudio sobre la


cantidad de cajas que deberían instalarse en el supermercado, pensando que no
deberán colocarse cajas de más que tornen poco rentable el sector, ni tampoco
de menos que impliquen largas esperas de los futuros clientes, lo que provocaría
un descontento por parte de éstos.

Para llegar a tomar la decisión correcta usted ha realizado averiguaciones


en otros supermercados con características similares al que desea instalar Artin
SA, y ha llegado a tener información de que el promedio de clientes que llega en
el período de un minuto a una caja a realizar el pago de las compras es de tres.
Por lo que usted cree oportuno conocer: ¿qué tan probable es que lleguen tres
personas en un minuto? Como así también desearía saber ¿qué tan probable

EDUBP | MARKETING | estadística aplicada I - pag. 121


es que lleguen más de tres personas a una caja en un minuto?

Una vez más, está listo para poner en práctica todo su conocimiento,
que le permitirá resolver este nuevo desafío. Lo invitamos a responder.

C 1

m5 |actividad 5 | AA

asistente académico 1

1.- Es válido, como en las dos actividades anteriores, comenzar por identificar
la distribución.

2.- De la lectura, es conveniente detenerse en ”... el promedio de clientes que


llega en el período de un minuto a una caja a realizar el pago de las compras
es de tres”. La variable es discreta.

3.- ¿Qué distribución necesita sólo de una medida: promedio por unidad de
tiempo, para poder calcular la probabilidad de un valor de x?

m5 |actividad 5 | CC

clave de corrección 1

La distribución a utilizar es la Poisson y las tablas a utilizar se encuentran en el


Apéndice B del libro.

µ=3

a) P( x = 3, µ =3) = 0,2240

b) P(x> 3, µ =3 ) = P ( x ≥ 3 ; µ = 3)= 0,3527 (debe sumar las probabilidades


que van de 4 a 12 para una media de 3).

EDUBP | MARKETING | estadística aplicada I - pag.122


m5 | actividad 6

Una serie de ejercicios

1.- En la siguiente tabla se indican los posibles resultados asociados con el


lanzamiento de dos dados y la probabilidad asociada con la suma de puntos de
las dos caras:

a) ¿Cuál es la suma esperada de las dos caras?


b) ¿Cuál es la probabilidad de que la suma de las caras sea mayor a 9?
c) ¿Cuál es la probabilidad de que la suma de las caras sea inferior a 6?

2.- El número de llamadas que se reciben en un servicio de emergencia médica


y sus probabilidades estimadas (en un intervalo de cinco minutos) se detallan a
continuación:

Cantidad de llamadas 0 1 2 3 4 5
Frecuencia relativa 0,04 0,25 0,50 0,10 0,05 0,06

Determine:

a) El número de llamadas esperadas en un intervalo de cinco minutos.


b) La varianza del número de llamadas.
c) La probabilidad de que en los próximos cinco minutos ocurran:
- menos de dos llamadas.
- entre una y cuatro llamadas inclusive.

3.- Si entre las familias que tienen tres hijos, las probabilidades de que tengan 0;
1; 2 ó 3 mujeres son de 1/8; 3/8; 3/8 y 1/8 respectivamente; ¿cuál es el número
esperado de hijas mujeres en dichas familias? ¿Cuál es la probabilidad de
encontrar menos de tres hijas mujeres en esas familias?

4.- Dada la siguiente función de probabilidad:

x 0 1 2 3 4
f(x) ¼ ¼ ¼ 1/8 1/8

Calcular la siguiente probabilidad: P (1 < x < 3)

Si los valores de x representan las ventas por semana en miles de pesos de un


comercio de artículos de decoración y f(x) sus probabilidades; ¿es correcto decir
que el negocio tiene una venta semanal en promedio de $ 1.625?

EDUBP | MARKETING | estadística aplicada I - pag. 123


5.-La demanda de teclados de computadora de una empresa varía mucho de
un mes a otro. La siguiente distribución de probabilidad muestra la demanda
mensual de teclados durante los últimos dos años:

DEMANDA MENSUAL f(x)


40 0.15
45
50 0.45
55 0.15

a) Represente gráficamente la función de probabilidad y la de acumulación.


b) Determine la probabilidad de que en el próximo mes la demanda sea de 45
o más teclados.
c) Calcule la media y desviación estándar de la variable y analice.

6.-La probabilidad de que una casa de cierto tipo quede destruida por un incendio
en cualquier período de 12 meses es 0.005.
Una empresa aseguradora ofrece vender al propietario de esa casa una póliza
de seguro contra incendio por $20.000 a un año y por una prima de $150. ¿Cuál
es la ganancia esperada de la empresa?

7.-Dada la función de probabilidad:


f(x) = 0.25 para x = 1,2,3,4

a) Determine la media y desviación estándar de la variable.


b) Calcule la probabilidad de que la variable x asuma valores menores que 3.
c) Calcule la probabilidad de que la variable x asuma valores mayores que 2.
d) Calcule la probabilidad de que la variable asuma valor 4.

8.-Con las siguientes distribuciones:

DISTRIBUCIÓN A DISTRIBUCIÓN B
x f(x) x f(x)
0 0.20 0 0.10
1 0.20 1 0.20
2 0.20 2 0.40
3 0.20 3 0.20
4 0.20 4 0.10

a) Calcule la esperanza matemática para cada distribución.


b) Calcule la desviación estándar para cada distribución.
c) Compare los resultados a y b, comente.

EDUBP | MARKETING | estadística aplicada I - pag.124


9.- Una firma conoce que el 30% de sus cuentas por cobrar a otras empresas
están vencidas. Si el contador de la empresa escoge aleatoriamente una muestra
de 5 de las mencionadas cuentas, determine cuál es la probabilidad de que:

a) Ninguna de las cuentas esté vencida.


b) Exactamente dos cuentas estén vencidas.
c) La mayoría de las cuentas estén vencidas.
d) Exactamente el 20% de las cuentas estén vencidas.
e) Que se obtengan 2 ó más pero no más de 4 que no estén vencidas.

10.- De 20 estudiantes de una clase, 16 no están satisfechos con el texto utilizado.


Si se pregunta por el texto a una muestra aleatoria de 4 estudiantes, determine
la probabilidad de que:

a) Exactamente 3 no estén satisfechos con el texto.


b) Por los menos 2 estén satisfechos con el texto.

11.- Sea x una variable aleatoria con distribución binomial, para la cual se toma
una muestra de n = 20 y una probabilidad de éxito, p = 0,4. Calcule:

a) P (x = 6) b) P [x = E(x)]
c) P (x < 10) d) P (2 < x < 16)
e) P [x > E (x)]

12.- Los registros de servicio indican que el 40% de todos los automóviles nuevos
de determinada marca necesitan cierto tipo de reparación dentro del plazo de
garantía. Se tomó una muestra aleatoria de 12 automóviles nuevos. Se pide que
calcule:

a) La probabilidad de que no más de 2 de ellos necesiten reparación dentro del


período de garantía.
b) La probabilidad de que entre 7 y 10 de ellos, inclusive, no necesiten
reparación durante el período de garantía.

13.- En un examen de contabilidad, de 100 alumnos que se presentaron a rendir,


30 de ellos no aprobaron el examen. Si se eligen en forma aleatoria del listado
de alumnos 10 de ellos, ¿cuál es la probabilidad de que:

a) tres estén reprobados?


b) cuatro o cinco de ellos no hayan aprobado?
c) menos de tres no hayan aprobado?
d) ninguno esté reprobado?
e) cuatro o más hayan reprobado?
f) más de tres pero menos de cinco hayan reprobado?
g) exactamente seis hayan aprobado?
h) dos o más hayan aprobado?
i) cinco o menos hayan aprobado?
j) ninguno haya aprobado?
k) que hayan aprobado exactamente la mitad?
Calcule la esperanza matemática y desviación estándar para la variable x =
alumnos aprobados.

EDUBP | MARKETING | estadística aplicada I - pag. 125


14.- La escasez de glóbulos rojos puede determinarse examinando en un
microscopio una muestra de sangre. Suponiendo que un volumen pequeño
contenga en término medio 20 glóbulos rojos en personas normales, ¿cuál es la
probabilidad de que una persona normal seleccionada al azar tenga menos de
12 glóbulos rojos?

15.- Una ART ha estimado que sólo el 0,1% de la población tiene cierto accidente
por año. Si se selecciona al azar 10.000 asegurados, se pide calcular la
probabilidad de que:

a) 3 de estos clientes se accidenten el año próximo.


b) Menos de 3 clientes sufran un accidente de este tipo el año próximo.
c) Entre 2 y 4 clientes tengan un accidente de este tipo el año próximo.

16.- En promedio 6 personas por hora utilizan un autoservicio bancario durante


las horas principales de compras en un hipermercado. ¿Cuál es la probabilidad
de que:

a) 6 personas utilicen el servicio durante una hora seleccionada al azar?


b) menos de 4 personas utilicen el servicio durante una hora seleccionada al
azar?
c) nadie utilice el servicio durante 10 minutos?
d) más de 3 personas utilicen el servicio durante un intervalo de 20 minutos?

17.- El número promedio de reclamos por hora presentados a una compañía


de seguros por pérdidas sufridas durante las mudanzas es de 3,1. ¿Cuál es la
probabilidad de que en cualquier hora se presenten:

a) menos de tres reclamos?


b) exactamente tres reclamos?
c) no menos de tres pero no más de seis reclamos?
d) en un período de dos horas, ¿cuál es la probabilidad de que se produzcan
más de cinco reclamos?
e) en un lapso de dos horas se produzcan menos de siete reclamos?

18.- En promedio, cada hora seis clientes de un banco de capitales extranjeros


realizan transacciones telefónicas. Suponiendo que las llamadas de esas
personas tienen un comportamiento independiente e igualmente probable, en el
período analizado.

a) ¿Cuál es la probabilidad de que sólo 3 personas realicen operaciones con el


banco por teléfono?
b) ¿Cuál es la probabilidad de que más de 10 clientes realicen transacciones
con su banco por teléfono?
c) ¿Cuál es la probabilidad de que entre 3 y cinco clientes inclusive realicen ese
tipo de operaciones?
d) ¿Cuál es la probabilidad de que menos de 10 personas realicen operaciones
con el banco en un período de dos horas?
e) En un lapso de dos horas, ¿cuál es la probabilidad de que seis clientes
operen con el banco por teléfono?

EDUBP | MARKETING | estadística aplicada I - pag.126


19.- El centro educativo de computación de una universidad tiene 300 terminales
de computadoras preparadas para uso diario de los estudiantes. La probabilidad
de que alguna terminal requiera servicio determinado día es de 0,015.

a) ¿Cuál es la probabilidad de que en un día en particular:


1- cuando mucho dos terminales requieran el servicio?
2- tres o cuatro terminales requieran servicio?

b) ¿Cuál es la probabilidad de que en un período de dos días en particular:


1- por lo menos 5 requieran servicio?
2- exactamente dos requieran servicio?

20.- Se eligen al azar 6 artículos de un grupo de 10, sin reposición. De los 6


artículos extraídos, 4 son defectuosos. Se pide que calcule la probabilidad de
encontrar en esa muestra exactamente dos artículos defectuosos.

21.- El director de una escuela desea crear una Junta Directiva con 20 miembros
de los 100 que trabajan en el establecimiento. La selección debe ser aleatoria y
en la escuela hay 25 profesores del área matemáticas y contabilidad.

¿Cuál es la probabilidad APROXIMADA de que la junta directiva incluya:

a) por lo menos dos profesores del área de matemáticas y contabilidad?


b) entre dos y seis sean del área de matemáticas y contabilidad?

c) ¿Cuántos profesores se podría esperar que sean del área de matemáticas y


contabilidad?

22.-Durante un determinado año, el 60% de las acciones negociadas en la bolsa


aumentó su cotización. Un servicio de asesoría bursátil seleccionó 12 clases
de acciones como especialmente recomendables. Si la selección se considera
aleatoria, ¿cuál es la probabilidad de que el próximo año aumenten su cotización:
a) 10 de las acciones seleccionadas?
b) entre 7 y 10 (inclusive) de las acciones seleccionadas?
c) más de 9 de las acciones seleccionadas?
d) menos de 7 de las acciones seleccionadas?

Le proponemos, a fin de ampliar el espectro de práctica, resolver las actividades


propuestas para el tema en libro básico recomendado.

EDUBP | MARKETING | estadística aplicada I - pag. 127


m5 glosario

Desviación estándar: La raíz cuadrada positiva de la varianza.

Distribución binomial de probabilidad: Una distribución de probabilidad que


muestra la probabilidad de x éxitos en n intentos, en un experimento binomial.

Distribución de probabilidad: Descripción de cómo se distribuyen las


probabilidades entre los valores que puede asumir la variable aleatoria.

Distribución de probabilidad de Poisson: Una distribución de probabilidad


que muestra la probabilidad de x ocurrencias de un evento en un intervalo
especificado de tiempo o de espacio.

Experimento binomial: Experimento probabilístico que tiene las cuatro


propiedades descritas: a) el experimento consiste en una sucesión de n intentos
o ensayos idénticos; b) en cada intento son posibles dos resultados. A uno
lo llamamos éxito y al otro fracaso; c) la probabilidad del éxito, representada
por p, no cambia de un intento a otro. En consecuencia, la probabilidad de
fracaso, representada por 1- p, no cambia de un intento a otro; d) los intentos
son independientes.

Función de probabilidad: Una función, representada por f(x), que determina


la probabilidad de que x asuma un valor determinado de una variable aleatoria
discreta.

Función de probabilidad binomial: La función que se usa para calcular las


probabilidades en un experimento binomial.

Función de probabilidad de Poisson: La función que se usa para calcular las


probabilidades de Poisson.

Función hipergeométrica de probabilidad: La función que se usa para calcular


la probabilidad de x éxitos en n intentos, cuando éstos son dependientes.

Valor esperado: Medida de la media o localización central de una variable


aleatoria.

Variable aleatoria: Descripción numérica del resultado de un experimento.

Variable aleatoria continua: Una variable aleatoria que puede asumir cualquier
valor en un intervalo o conjunto de intervalos.

Variable aleatoria discreta: Una variable aleatoria que sólo puede asumir una
sucesión finita o infinita de valores.

Varianza: Medida de la dispersión o variabilidad de una variable aleatoria.

Recomendamos la ampliación del presente glosario con el glosario del material


básico sugerido.

EDUBP | MARKETING | estadística aplicada I - pag.128


m ó dulos

m6

m6 microobjetivos

• Reconocer las características importantes de la distribución normal


con la finalidad de identificar aquellas situaciones que se presenten
en el mundo de los negocios y puedan modelizarse a través de esta
distribución.

• Definir la normal estándar y aplicarla con la finalidad de poder dar


respuesta a las situaciones que se presenten en donde las combinaciones
entre la media y la varianza sean infinitas.

• Determinar la probabilidad, usando la distribución normal estándar, con


la finalidad de resolver aquellos casos que una observación, sea mayor
o menor que un valor específico o se encuentre entre dos puntos.

• Utilizar la distribución normal para resolver casos con características


binomial, con la finalidad de aplicar la aproximación como alternativa de
solución.

m6 contenidos

Distribuciones continuas de probabilidad

Los temas que desarrollaremos en el presente módulo son los siguientes:

1. Función de probabilidad continua


2. Esperanza matemática
3. Medidas de dispersión
4. Distribuciones de probabilidad: Normal
5. Tablas
6. Aproximación normal a la distribución binomial

EDUBP | MARKETING | estadística aplicada I - pag. 129


1. Función de probabilidad continua:

2. Esperanza matemática

4. Distribución normal:

 Caracterización del experimento:

1.- La distribución normal tiene forma de campana y es perfectamente simétrica


respecto a
su media.

2.- La distribución normal está determinada por su media y por su desviación


estándar. Existirán tantas curvas normales como combinaciones entre la media
y la desviación estándar podríamos realizar. Por ello, no se hablará de una curva
normal única sino que se dirá que existe una familia de curvas normales.

3.- La distribución normal se extiende hasta infinito en ambas direcciones a partir


de la media y lo hace de manera asintótica a la abscisa.

4.- La distribución normal se mide en una escala continua.

5.- El área total bajo la curva es igual a 1 ó 100%. Como la distribución es

EDUBP | MARKETING | estadística aplicada I - pag.130


simétrica, hacia un lado de la media tendremos 0,50 ó 50% y lo mismo sucede
hacia el otro lado de la media.

 Función de probabilidad o densidad.

 Parámetros:

Al existir infinitas combinaciones entre y σ existirían infinitas tablas normales,


lo cual sería prácticamente imposible. Afortunadamente, este problema se
puede resolver transformando cualquier distribución normal en la distribución
normal estándar, que tiene la característica de tener media igual a 0 y desviación
estándar igual a 1, con lo cual tendremos una única tabla. Trabajaremos en la
transformación con la variable Z.

El presente módulo adjunta las tablas de la normal acumulada estandarizada


con la finalidad de poder utilizarla y simplificar los cálculos. Si Ud. se siente
más a gusto trabajando con la tabla que el texto principal propone, también
puede hacerlo. Los resultados a los que llegue DEBERÁN ser los mismos, lo que
cambia son los pasos intermedios.

EDUBP | MARKETING | estadística aplicada I - pag. 131


5. Tabla Normal que se propone utilizar:

ver tabla Normal IC 1

• La columna Z expresa la puntuación típica (entre -3 y +3).

• La columna P expresa la proporción acumulada


entre menos infinito y la Z correspondiente.
Por ejemplo, una puntuación típica de -2.97 deja por debajo de sí
0.00154.

• Esta es una tabla de cola izquierda de la curva o ley normal que acumula
probabilidad desde menos infinito a un punto.

• Hay muchos formatos distintos de tablas de curva o ley normal y el


usuario debe conocer bien la tabla que utiliza.

Desarrollaremos un ejemplo para enseñar el uso de dicha tabla:

a) Cual es la probabilidad: P (Z < − 1,32)

Gráficamente:

Buscaremos en la tabla sugerida (tabla1), en la séptima columna aparece el valor


de Z que buscamos y el valor a su derecha es la probabilidad que le corresponde
0,093.

P (Z < − 1,32)=0,09342

EDUBP | MARKETING | estadística aplicada I - pag.132


b) Cual es la probabilidad: P (Z > 1,32)

Cómo la tabla acumula de -∞ a un punto, necesitaremos realizar una


transformación para utilizar la tabla:

P (Z > 1,32) = 1- P (Z < 1,32)= 1- 0,90658 = 0,09342

c) Cual es la probabilidad: P (0,50 < Z < 1,32)

P (0,50 < Z < 1,32)= P (Z<1,32)-P (Z<0,50) = 0,90658-0,69146=0,21512

d) Calcular la probabilidad de que x < 3,14 para una distribución normal de


media 0,19 y desviación típica 1,25.

Xi − µ
P(X < 3,14) recordemos que Z=
σ

Tipificando resulta:

EDUBP | MARKETING | estadística aplicada I - pag. 133


Operando:

Buscando 2,36 en la tabla, tenemos:

6. Aproximación normal a la distribución binomial

Se pueden presentar dos situaciones especiales:

a) Cuando “n” es muy grande y “p” es muy chico o muy grande, de manera
que np≤ 5 ó
nq ≤ 5 la distribución de Poisson proporciona una buena aproximación a la
distribución
binomial.

b) Cuando “n” es muy grande pero “p” no es ni muy chico ni muy grande (es
cercano a
0,50) y en donde np > 5 ó nq >5 la distribución normal proporciona una
buena explicación a la distribución binomial.

Veamos un ejemplo:

El bibliotecario de la universidad donde Ud. estudia elige 100 libros al azar de las
repisas e inspecciona sus condiciones físicas. En su última inspección el 40%
de los libros se encontraban en situación no satisfactoria. Suponiendo que este
porcentaje se mantiene ¿cuál es la probabilidad de que el bibliotecario considere
no satisfactorios al menos el 50% de los libros de la muestra?

Ésta, es una situación binomial ya que un libro está en buen estado o no lo está y
la independencia en las selecciones queda asegurada por el muestreo aleatorio,
al problema binomial podremos presentarlo de la siguiente manera:

P (X≥50 n=100 p1*=0,40) np=40 siendo mayor a 5

La curva normal puede proporcionar una aproximación a la respuesta binomial


correcta, ya que n es muy grande para las tablas binomiales y p=0,40 es muy
grande para usar la aproximación de Poisson, paso seguido entonces deberá
calcular la media o esperanza matemática y la desviación estándar de la binomial:

µ = np =100. 0,40 =40 σ= n. p (1 − p ) = 100 .0,40 .0,60


100.0,40.0,60 =4,9

Usaremos el factor de corrección por continuidad dado que pasamos de trabajar


con una variable discreta a una continua (remitirse a pág.244 del texto básico
sugerido).

*
Nota: lo que en este material se simboliza como p, el texto básico sugerido lo llama π

EDUBP | MARKETING | estadística aplicada I - pag.134


Z= (49,5-40)/4,9 =1,94 P(Z>1,94)=1- P(Z<1,94)= 1- 0,97381= 0,02619

Existe una pequeña probabilidad 0,02619, es decir el 2,62%, de que 50 o más de


los libros muestreados se encuentren en condiciones no satisfactorias.

m6 |contenidos | IC

información complementaria 1

Para visualizar esta información complementaria dirijasé al sector respectivo en


la Plataforma.

m6 material

Material Básico:

• LIND D., MARCHAL, W. y WATHEN, S. (2008): Estadística Aplicada a los


Negocios y a la Economía Ed. McGraw Hill. Capítulo Nº 7.

Material Complementario:

• ANDERSON, DAVID R.; SWEENEY, DENNIS J.; WILLIAMS, THOMAS


A. (2008): Estadística para administración y economía. Ed. THOMSON
INTERNATIONAL
• LEVINE, DAVID M.; BERENSON, MARK L.; KREHBIEL, TIMOTHY C.
(2006): Estadística para administración. Ed. Pearson
• ME
• VISAUTA VINACUA BIENVENIDO (2007): Análisis estadístico con SPSS
14. Estadística Básica Ed. McGraw Hill

m6 actividades

m6 | actividad 1

Una cuestión de tiempo

A 1

El responsable del departamento de marketing de la consultora en la cual


usted trabaja le informa que el tiempo que transcurre para que un cliente tome
la decisión de renovar una de las líneas de controladores fiscales –máquinas

EDUBP | MARKETING | estadística aplicada I - pag. 135


registradoras– tiene la siguiente función de densidad:

f (x) = 3 x2 0< x < 5


125

Le pregunta: “Con la información que le hemos proporcionado, ¿podría


decirnos qué tan probable es que uno de los clientes que adquirió uno de estos
controladores fiscales demore menos de 3 años en renovar el equipo? Además,
¿podría incorporar en el informe el tiempo esperado para el cambio de equipos y
la dispersión del mismo? De su respuesta dependerán en gran parte las próximas
acciones”.

Usted se pone a trabajar para responder por escrito la pregunta planteada.

C 1

m6 |actividad 1 | AA

asistente académico 1

A) Antes de trabajar con una supuesta función de densidad de tipo continuo


debe comprobar que lo es, para lo cual debe comprobar las dos condiciones:

EDUBP | MARKETING | estadística aplicada I - pag.136


m6 |actividad 1 | CC

clave de corrección 1

m6 | actividad 2

Sobre el tiempo de entrega

A 1

Uno de los especialistas de su área le comenta lo siguiente: “¿Recuerda que


semanas atrás estuvo analizando la viabilidad de terciarizar el área reparaciones
de Technology punto com SRL? A esta altura de los acontecimientos ya
conocemos que esta sería la decisión más conveniente, pero tenemos algunas
otras inquietudes derivadas de la decisión anterior. Es importante el ingreso
ofrecido a Technology punto com SRL por esta nueva empresa que se
encargaría de las reparaciones, pero no es menos relevante estudiar los tiempos
que la misma demorará en entregar los equipos reparados, ya que si bien la
rentabilidad que estaba proporcionando el sector no era la deseada, era óptimo
el servicio de entrega que se ofrecía.

EDUBP | MARKETING | estadística aplicada I - pag. 137


Por estudios realizados en el área en la cual usted trabaja, se ha llegado
a establecer que el tiempo de entrega de los equipos sigue una distribución
normal, con un tiempo medio de 4 días y una variabilidad de 1 día. La empresa
que ofrece los servicios de terciarización promete entregarlos en un plazo de 3
días, a lo sumo.
Desearíamos que estableciera qué tan probable es que esto ocurra. Por otro
lado y dado que posee la información para hacerlo, quisiéramos conocer otras
probabilidades tales como: ¿qué probabilidad hay de que se exceda de los 5 días
de entrega?; por otro lado, ¿qué tan probable es que el tiempo de entrega esté
comprendido entre 1 día y 3 días?”

¿Cuál es la respuesta a las preguntas de su cliente? Prepare el informe.

C 1

m6 |actividad 2 | AA

asistente académico 1

Deberá recordar que existen infinitas curvas normales, tantas como combinaciones
posibles entre µ y σ se puedan realizar. Como las tablas que nos proporcionan
los distintos textos y que nos facilitarán los cálculos corresponden a una variable
normal estandarizada en donde la esperanza es igual a cero y la desviación
estándar es 1, deberemos estandarizar la variable del caso propuesto.
Recuerde que:

z= x - µ
σ

m6 |actividad 2 | CC

clave de corrección 1

a) P( x< 3 ) = P (z < (3- 4)/ 1) = 0,1587


b) P( x > 5 ) = P ( z > (5 - 4 )/1 ) = 0,1587
c) P (1< x < 3) = 0,1574

EDUBP | MARKETING | estadística aplicada I - pag.138


m6 | actividad 3

La empresa está en problemas

A 1

La empresa Technology punto com SRL sigue con algunos problemas. El


gerente financiero le ha comentado su preocupación ante el retroceso que han
sufrido los ingresos de la empresa en los últimos meses. Uno de los socios ha
encontrado que los ingresos mensuales medios de las distintas sucursales en
los últimos seis meses son de 90 mil pesos, con una variabilidad de 25 mil pesos.

En Marzo último, una de las sucursales declaró ingresos de 70 mil pesos. Ante
esta situación, el socio en cuestión le manifestó su descontento al gerente
financiero. En ese momento se le argumentó que no era poco habitual que los
ingresos fueran así de bajos. Le dice el gerente financiero: “Se me ha solicitado
que justifique mi opinión, y esa es la razón de mi contacto con usted. ¿Podría
ayudarme a defender mi opinión ante él con argumentos sólidos sobre el tema?
A su vez, si los socios de Technology punto com SRL pudieran determinar qué
sucursales informan ingresos en el 15% más bajo, se podrían tomar medidas al
respecto cuanto antes. ¿Qué niveles de ingreso deberá superar una sucursal
para evitar que los socios se impacienten? Es de mi interés leer material técnico,
pero no he tenido ninguna educación formal en estadística, así que usted tendrá
que exponerme sus ideas con claridad”.

Por estudios previos realizados, usted sabe que existe normalidad en la


distribución de ingresos mensuales. Se pone a trabajar para ofrecer una
respuesta al gerente financiero.

C 1

m6 |actividad 3 | AA

asistente académico 1

1.- Las aclaraciones realizadas en el asistente académico de la actividad 2 son


válidas para esta nueva actividad.

2.- Dentro de un mismo caso, son varias las cuestiones sobre las cuales se le
pide colaboración:

a) ¿Cuál es la probabilidad de que los ingresos estén por debajo de 70 mil


pesos?

b) El segundo punto a tratar deberá plantearse de manera algo diferente de lo


que se vienen planteando las actividades anteriores. El dato que se le está
proporcionando en esta oportunidad es la probabilidad (0,15), por lo que se
le sugiere que encuentre primero que nada el valor de z y, en segundo lugar,
de la fórmula de estandarización deberá despejar el valor de x.

EDUBP | MARKETING | estadística aplicada I - pag. 139


m6 |actividad 3 | CC

clave de corrección 1

m6 | actividad 4

Pedido de informes

A 1

Una mañana más llega a su oficina y sobre su escritorio encuentra un pedido de


informes proveniente del área contable de la consultora:

Estimado:

A raíz de los estudios que se están realizando sobre la conveniencia de terciarizar


el servicio de reparación de Technology punto com SRL y ante el compromiso
asumido por la empresa interesada en la terciarización de que el tiempo de
entrega de los equipos sea a lo sumo de 3 días a partir de la fecha de la orden de
trabajo, se necesita saber lo siguiente:
Si se seleccionaran 30 equipos con distintos tipos de desperfectos al azar, ¿qué
tan probable es que como mínimo 10 equipos sean entregados como máximo a
los 3 días de entrega?

Quedamos a la espera de su informe.

Atte.
Soteras.

¿Qué respuesta le dará al pedido?

C 1

EDUBP | MARKETING | estadística aplicada I - pag.140


m6 |actividad 4 | AA

asistente académico 1

Como primera medida debería comenzar a identificar algunos aspectos del caso:

a) El caso admite dos posibles eventos: uno de ellos es que “los equipos se
entreguen a lo sumo en tres días” y el otro es que “los equipos se entreguen
después de los tres días”. La independencia queda asegurada por el
muestreo aleatorio. ¿Qué distribución cree apropiada utilizar en este caso?

b) Correcto, la distribución binomial es la adecuada; pero ¿qué sucede con


“n”? Es grande.
La distribución normal puede proporcionar una aproximación correcta.
Deberá encontrar la media y la desviación estándar para la binomial.

c) Proceda a estandarizar la variable. Recuerde: el valor de µ y de σ son los


que encontró
en el punto anterior.

m6 |actividad 4 | CC

clave de corrección 1

P ( x > 10 ; n= 30 ; p =0,15 ) = P ( z > ( 9,5- 4,5)/ 1,95 ) = 0,0052

m6 | actividad 5

Poniendo las barbas en remojo

1.- Dada la siguiente función:

4kx 0 < x < 5


f (x)
0 para todo otro x

a) Determine el valor de k para que f (x) sea función de densidad.


b) Obtenga la función de acumulación.
c) Encuentre la esperanza matemática.

EDUBP | MARKETING | estadística aplicada I - pag. 141


2.- Dada la siguiente función:

0 x< 0
F(x) 2

x 0<x< 1

1 x >1

a) Obtenga la esperanza y la varianza.


b) Calcule la P (-0,3 < x < 0,5)
c) Obtenga la P ( ¼ < x < ½ )

3.- Continuando con el ejercicio 1:

a) Calcule la varianza de la variable.


b) Calcule P (2 < x < 5)
c) Calcule P (3 < x < 8)

4.- Dada la siguiente función:

bx 0 < x < 4
f(x) 0 para todo otro x

a) Determine el valor de b para que la función sea de probabilidad.


b) Calcule la esperanza.
c) Obtenga la función de acumulación.
d) Calcule P (2 < x < 5)

5.- Sea x una variable aleatoria con distribución normal, con media 40 y
desviación 5. Se pide calcular:

a) P ( x > 50 )
b) P ( 44 < x < 48 )
c) P ( x < 54)

6.- Dada la variable z con distribución normal (0; 1), se pide calcular el área bajo
la curva normal en los siguientes casos:

a) P (z > 0,23)
b) P (z < - 1, 05)
c) P (z > 7)
d) P (-0,95 < z < 2,10)
e) P (-1,82 < z < - 1,02)
f) P (0,55 < z < 3,13)
g) P (-3 < z < 3)
h) P (0 < z < 2,11)
i) P (z > -1,57)

EDUBP | MARKETING | estadística aplicada I - pag.142


7.- En los siguientes casos encuentre el valor de z* tal que:

a) P (z > z*) = 0,025


b) P (z < z*) = 0,2981
c) P (z < z*) = 0,9251
d) P (z > z*) = 0,9750
e) P (-z* < z < z*) = 0,8262
f) P (-z* < z < z*) = 0,05

8.- Una variable x tiene una distribución normal con media = 1,30 y
desviación estándar = 0,15.
Encuentre las probabilidades siguientes:

a) P (1 < x< 1,25)


b) P (1,32 < x < 1,58)
c) P (x > 1,37)
d) P (x < -2,06)

9.- En una determinada provincia, que posee 3.050 comercios de venta de


prendas deportivas, el número de personas ocupadas como vendedores en los
locales comerciales se distribuye aproximadamente normal con una media de 10
personas y una varianza de 36 personas. ¿Cuántos locales se estima que poseen
más de 7 personas ocupadas?

10.- Las ventas semanales de un lavadero automático de nuestra ciudad tienen


una distribución de probabilidad que es aproximadamente normal con una media
de $ 470 por semana y una desviación estándar de $ 90. Se desea calcular:

a) La probabilidad de que en una semana se produzcan ventas superiores a $


600.
b) La probabilidad de que en una semana se produzcan ventas inferiores al
promedio.

11.- Encontrar el valor de z* en una distribución normal (0; 1), tal que:

a) El área a la izquierda de z* sea 0,9788


b) El área a la derecha de z* sea 0,2611
c) El área a la izquierda de z* sea 0,0102
d) El área entre -z* y z* sea 0,6578

12.- El sueldo de 3.000 empleados de una empresa se distribuye normal con


media de $400 y desviación estándar de $80.

a- Determinar el número de empleados que perciben sueldos superiores a $480.


b- Determinar el número de empleados que perciben sueldos entre $240 y $520.
c- Determinar los valores de la variable sueldo que abarca el 90% del personal.

13.- El gasto promedio mensual por alimentos para familias de cuatro personas
es de $ 420, con una desviación estándar de $ 80.
Suponiendo que los gastos mensuales por alimentos estén distribuidos en forma
normal, ¿qué porcentajes:

EDUBP | MARKETING | estadística aplicada I - pag. 143


a) de estos gastos son inferiores a $ 350?
b) de estos gastos se encuentran entre $ 250 y $ 450?
c) de estos gastos son inferiores a $ 250 o mayores a $ 450?
d) Determine cuál es el valor de los gastos para el primer cuartil.

14.-El sueldo de 5.000 empleados de la Universidad Nacional con 20 años de


servicio se distribuye aproximadamente normal con media de 50 años y varianza
de 64 años. Hallar el número de empleados que tenga:

a) Entre 46 y 58 años.
b) Menos de 42 ó más de 54 años.
c) Si el 20.05% de los trabajadores tiene menos de cierta edad, ¿cuál es esa
edad?

15.- Se sabe que gran parte de la población tiene problemas de presión arterial.
Un laboratorio de medicamentos ha lanzado al mercado un nuevo fármaco
que asegura que en el 90% de los casos de pacientes tratados con el mismo
no se registran los efectos colaterales que normalmente se presentan con los
medicamentos recetados hasta el momento. Una clínica privada de nuestra
ciudad ha decidido medicar a sus pacientes con problemas arteriales con el
nuevo remedio; para ello ha comenzado con el tratamiento con 75 pacientes.
¿Cuál es la probabilidad de que 10 o menos de dichos pacientes experimenten
los efectos colaterales comunes a este tipo de medicamentos?

16.- De estudios realizados en una repartición pública se concluyó que el 25% de


las llamadas realizadas por los empleados de la misma, en el mes, son llamadas
particulares. Si en dicha repartición se realizan 250 llamadas mensuales, ¿cuál
es la probabilidad de que más de 40 sean por motivos particulares?

17.- Se conoce que la proporción de estudiantes de otras provincias que asisten


a una determinada facultad es del 10% de los alumnos inscriptos. Este año se
tomó una muestra de 80 estudiantes que ingresaron a dicha facultad. Se pide:

a) Encontrar la probabilidad de que más de 15 estudiantes sean de otra


provincia.
b) Encontrar la probabilidad de que más de 5 estudiantes sean locales.

18.- En base a la experiencia anterior, el 40% de los clientes de la estación de


servicios automotriz Méndez S.A., paga sus compras con tarjetas de créditos.

Si se selecciona una muestra de 200 clientes, cuál es la probabilidad


aproximada de que:

a) por lo menos 75 paguen con tarjetas de créditos.


b) no más de 70 paguen con tarjetas de créditos.
c) entre 70 y 75 clientes, inclusive, paguen con tarjetas de créditos.

A fin de complementar las ejercitaciones propuestas, le proponemos resolver


las actividades propuestas por el autor del material básico bajo los títulos: “Auto
evaluaciones” y “Ejercicios del capítulo” (Capítulo 7).

EDUBP | MARKETING | estadística aplicada I - pag.144


m6 glosario

Distribución normal de probabilidad: Una distribución continua de probabilidad.


Su función de densidad tiene forma de campana y está determinada por la media
y la desviación estándar.

Distribución normal estándar de probabilidad: Una distribución normal con


media 0 y desviación estándar 1.

Factor de corrección por continuidad: Valor de 0.5 que se suma o resta de un


valor de x cuando se usa la distribución normal para aproximar distribuciones
discretas.

Función de densidad: La función que define la distribución de probabilidades


de una variable aleatoria continua.

Le sugerimos complementar el presente glosario con el que se encuentra en el


capítulo correspondiente del material básico.

m ó dulos

m7

m7 microobjetivos

• Comprender el concepto de distribuciones muestrales con la finalidad de


conocer uno de los conceptos más importantes de la estadística, dado
que siempre que se toma una muestra a partir de una población, un
estadístico calculado con ésta debe verse como si se hubiera obtenido
de la distribución de todos los estadísticos muestrales posibles.

• Construir una distribución de la muestra con las medias muestrales, con


la finalidad de conocer todos los valores posibles que puede tomar un
estadístico, en este caso la media muestral, para un tamaño de muestra
dada.

• Construir una distribución de la muestra con las proporciones muestrales


con la finalidad de conocer todos los valores posibles que puede tomar
un estadístico, en este caso la proporción muestral, para un tamaño de
muestra dada.

• Reconocer la importancia del estudio del teorema central del límite para
la toma de decisiones en el contexto de la estadística, con la finalidad de
comprender que las distribuciones muestrales con forma de campana
no son casualidad.

EDUBP | MARKETING | estadística aplicada I - pag. 145


m7 contenidos

Distribuciones continuas de probabilidad

Los temas que desarrollaremos en el presente módulo son los siguientes:

1. Distribución muestral
2. Distribución de medias muestrales
3. Teorema central del límite (TCL)
4. Distribución de proporciones muestrales
5. Factor de corrección para poblaciones finitas

1. Distribución muestral

A partir de una población pueden tomarse muchas muestras diferentes del


mismo tamaño; de esas muestras se obtendrán estadísticos muestrales (media,
proporción, varianza, etc.). El estadístico que nos interese obtener podrá asumir
distintos valores, a partir de los cuales se obtendrá lo que denominaremos
distribución muestral, que incluye todos los valores posibles que puede tomar
un estadístico, para un tamaño de muestra dado.

Si bien en situaciones reales las poblaciones y las muestras con que se trabajan
son grandes, y se torna complejo formular todos los valores muestrales posibles
de un estadístico, a efectos de comprender mejor el tema trabajaremos con un
ejemplo:

2. Distribución de medias muestrales

Suponga que tenemos las edades de 4 niños (las cuales conforman una
población); las mismas son 2, 4, 3, 6. Decidimos trabajar con una muestra
aleatoria de tamaño 2; el muestreo se hace con reemplazo y se calculará la
media muestral:

Distribución muestral de medias:

Edades muestrales Media de la


muestra
2 -2 2
2 -4 3
2 -3 2,5
2 -6 4
4- 2 3
4 -4 4
4 -3 3,5
4 -6 5
3 -2 2,5
3 -4 3,5

EDUBP | MARKETING | estadística aplicada I - pag.146


3 -3 3
3 -6 4,5
6 -2 4
6 -4 5
6 -3 4,5
6 -6 6

A continuación, y a partir de la distribución anterior, nos preguntaremos: ¿qué


valores puede asumir el estadístico media muestral? A partir de la respuesta que
obtengamos generaremos la distribución de probabilidad de las medias:

(C1) (C2) (C3) (C4) (C5)


Media muestral Frecuencia Probabilidad (C1) (C3) (C4) (C1)
2 1 0.0625 0,125 0,25
2,5 2 0,125 0,3125 0,78125
3 3 0,1875 0,5625 1,6875
3,5 2 0,125 0,4375 1,53125
4 3 0,1875 0,75 3
4,5 2 0,125 0,5625 2,53125
5 2 0,125 0,625 3,125
6 1 0.0625 0,375 2,25
16 1 3,75 15,15625

Como observará en la tabla anterior, los valores de la media muestral son varios.
Al ser numerosos los valores que puede asumir la media muestral nos interesará
conocer la media de todos los valores posibles de la media muestral.
¿Recuerda la expresión de esperanza matemática para variables aleatorias
discretas?

E (x) = ∑ x f(x)
_ _
Para esta nueva situación la expresión anterior adaptada será E (x) = ∑ x f(x)
Para llegar a ella deberemos realizar entonces el producto entre (C1) y (C3) y
luego sumar dichos valores, con lo cual obtendremos la esperanza de la media
muestral, la cual será igual a 3,75.

Ahora bien, ¿qué valor tiene µ (el parámetro poblacional)?

µ = (2+ 4+ 3 +6)/ 4 = 3,75 Idéntico valor que la esperanza de la media


muestral
_
Por lo que diremos que E (x)= µ

Lo anterior es válido para cualquier tamaño de población o de muestra y se


esperaría entonces, que las medias muestrales se agruparan alrededor de la
media poblacional.

Veamos qué sucede con la desviación estándar. Recordemos que la varianza


para una variable aleatoria discreta es igual a:

EDUBP | MARKETING | estadística aplicada I - pag. 147


V(x) = E( x2 ) - [ E( x ) ] 2
; La E( x2 ) = ∑ x2 f( x)

Para el caso de las medias muestrales será:

_ _ _ _ _
V(x) = E( x2 ) - [ E( x ) ] 2 ; La E( x2 ) = ∑ x f( x) (Columna 5 -C5-)

_
V(x) = 15,15625 - 14,0625 =1,09375

La desviación estándar de la media muestral es 1,045825

La pregunta que a continuación deberíamos realizarnos es: ¿cuál es la desviación


estándar poblacional?

σ x = 1,4790

Observe que la desviación estándar de las distribuciones muestrales es menor


que la desviación estándar de la población. Es razonable suponer que las
medias de las muestras de dos valores tenderían a estar más cerca de la media
poblacional de lo que estarían los valores individuales (x).

A continuación calcularemos la desviación estándar de la distribución muestral


de las medias, sin necesitar el listado de todos los valores posibles de las medias
muestrales:
σx
σ − =
x n

Error estándar de la media

El error estándar de la media es igual a la desviación estándar de la distribución


muestral de las medias de las muestras.
_
Para nuestro ejemplo será igual a:

σx 1,4790
σ − = = = 1,04582
x n 1,4142135

Observe que el error estándar de la media muestral es directamente proporcional


a la desviación estándar poblacional e inversamente proporcional a la raíz
cuadrada del tamaño de la muestra.

3. Teorema central del límite

Si x1, x2 ha sido una muestra aleatoria proveniente de una población con


distribución− normal de media µ y varianza sigma al cuadrado, la variable media
muestral ( x ) también tiene distribución normal, donde la variable estandarizada
z tendrá la siguiente expresión:

EDUBP | MARKETING | estadística aplicada I - pag.148


Z= x−µ la cual tiene distribución normal estándar. Sin embargo, este


σ x
n

resultado es aproximadamente correcto aún en poblaciones no normales, como


se establece en el teorema central del límite. La importancia de este teorema
es que nos proporciona un medio para trabajar con la media muestral de una
muestra aleatoria de tamaño n, aun si desconocemos qué distribución tiene x.
El TCL puede describirse de la siguiente manera:

Si ( x ) es la media de una muestra aleatoria de tamaño n que se toma de una
población con media µ y varianza sigma cuadrado, entonces la variable z tiende
a la normal estándar a medida que n tiende a infinito

Z= x−µ
σ x
n

4. Distribución de proporciones muestrales

Una consecuencia del TCL es la que atañe a la distribución de la proporción



muestral p . En muchos casos nos interesará por ejemplo conocer las cuentas
corrientes pendientes de pago, el número de mujeres que estudian, la cantidad
de artículos defectuosos que produce una máquina, etc. (observe que en
todos los casos hablamos de dos resultados posibles: ¿con qué distribución lo
relaciona?); en otras circunstancias, lo que nos interesa investigar es sobre la
proporción de cuentas corrientes pendientes de pago, la proporción de mujeres
que fuman, la proporción de artículos defectuosos producidos por una máquina,
etc... ¿Logra detectar la diferencia?

Aplicando el TCL diremos “Sea p la proporción muestral asociada a una
característica, la cual se presenta en una proporción p poblacional. Entonces:

− pq
pq − − pq
pq
p ∼ N (p, ) En donde E ( p )=p V( p )=
n n
_
p− p
La variable estandarizada z será igual a Z= “
pq
pq
n

5. Factor de corrección para poblaciones finitas

El factor de corrección para poblaciones finitas (FCPF) se utiliza para modificar


la fórmula de error estándar de cualquier estadístico: media muestral, proporción
muestral, etc. de manera que refleje probabilidades que cambian, cuando el

EDUBP | MARKETING | estadística aplicada I - pag. 149


muestreo se hace sin reemplazo partiendo de una población finita y cuando el
tamaño de la muestra excede el 5% de la población (n/N> 0,05).
___________
FCPF =√ (N - n)/(N -1)

Con la presentación de estos temas, se concluye el desarrollo teórico de la


asignatura.
Recuerde ampliar los conceptos estudiando el contenido del libro básico y
realizando las actividades propuestas.

m7 material

Material Básico:

• LIND, D., MARCHAL, W. y WATHEN, S. Estadística Aplicada a los Negocios


y a la Economía. Ed. McGraw Hill (2008). Capítulo Nº 8, capítulo Nº 9.

Material Complementario:

• ANDERSON, DAVID R.; SWEENEY, DENNIS J.; WILLIAMS, THOMAS


A. (2008) Estadística para administración y economía. Ed. THOMSON
INTERNATIONAL
• LEVINE, DAVID M.; BERENSON, MARK L.; KREHBIEL, TIMOTHY C.
(2006) Estadística para administración. Ed. Pearson
• MENDENHALL, WILLIAM; BEAUER, BARBARA M. ; BEAUER, ROBERT
J. (2007) Introducción a la probabilidad y estadística Ed. THOMSON
INTERNATIONAL
• VISAUTA VINACUA, BIENVENIDO. (2007) Análisis estadístico con SPSS
14. Estadística Básica. Ed. McGraw Hill

m7 actividades

m7 | actividad 1

Una nueva inquietud se presenta…

Para ver el mundo en un grano de arena


Blake, Cantos de inocencia

EDUBP | MARKETING | estadística aplicada I - pag.150


A 1

Afortunadamente, el gerente financiero de Technology punto com SRL, a través


del informe que usted le ha proporcionado, ha logrado dar respuesta a las dudas
e inquietudes que le había planteado uno de los socios. Pero luego de entender
con mayor claridad el tema que les había generado algunas divergencias, le
han surgido otras dudas que el mismo gerente le plantea: “En conversaciones
con directivos de la empresa se plantearon algunas inquietudes, ya no sobre
los ingresos en sí sino sobre el promedio de dichos montos. ¿Usted nos podría
subsanar algunas dudas que nos han surgido al respecto? Por ejemplo, una de
nuestras sucursales, cuando realizamos el pedido de informe, nos respondió
no en términos de ingresos sino en términos de ingresos promedio, declarando
un monto de 75 mil pesos. En realidad, no sabemos si es una situación similar
o diferente de la que le planteamos anteriormente cuando hablábamos de una
sucursal que tenía ingresos de 70 mil pesos. De ser distinta desearíamos, como
en el caso anterior, que nos dijera por un lado, qué tan probable es que las
sucursales presenten ingresos promedios por debajo de los 75 mil pesos; y por
el otro, qué tan probable es que los ingresos promedios se encuentren entre los
70 y 90 mil pesos. ¡Ah!, me olvidaba... para realizar el estudio trabajaríamos con
los ingresos correspondientes a 36 meses”.

Continúa siendo válida la información proporcionada en la actividad 3 del módulo


6. Está ampliamente vinculada con la actividad actual en lo que respecta a que
los ingresos mensuales medios de las distintas sucursales en los últimos seis
meses, son de 90 mil pesos, con una variabilidad de 25 mil pesos, sabiendo que
existe normalidad en la distribución de ingresos mensuales.

Usted se pone a trabajar para dar respuesta a las nuevas dudas surgidas.

C 1

m7 |actividad 1 | AA

asistente académico 1

Primero debe identificarse claramente que las situaciones sobre las cuales
se consulta son diferentes, ya que las variables no son las mismas; cuando
hablamos de ingresos nos referimos a una variable
− x, en cambio cuando se
refieren a ingresos promedio, la variable es x . por lo que los planteos que
realicen deberán ser diferentes.
En unidades anteriores no se tomaban muestras y el valor de interés era una sola
observación. En esas situaciones utilizábamos la fórmula de z para transformar
todas las distribuciones normales de valores x a una forma estándar única.
En el nuevo caso que se plantea, la variable tipificada o estandarizada adopta la
siguiente expresión:

Z= x−µ
σ x
n

EDUBP | MARKETING | estadística aplicada I - pag. 151


m7 |actividad 1 | CC

clave de corrección 1

_
a) P ( x < 75 )= P ( z < ( 75 - 90)/ (25/6) ) = P ( z < -3,61 ) = 0

_
b) P (70 < x < 90) = P (-4,80 < z < 0) = 0,50

m7 | actividad 2

Emprendimiento comercial

A 1

El área marketing de la consultora está estudiando la viabilidad de instalar dentro


del supermercado de ARTIN SA el rubro carnicería, pero su gerente tiene algunas
dudas al respecto, sobre todo después de realizar algunas investigaciones sobre
el sector. Llega a su área y le comenta: “Por investigaciones propias y de
datos secundarios provenientes de publicaciones vinculadas al área de los
negocios, sabemos que los comercios tradicionales han ganado presencia
en el rubro alimentos frescos. Por ejemplo, cuando se trata de comprar
carnes, el canal preferido por los argentinos es la carnicería de barrio; los
supermercados y los hipermercados vieron reducir su espacio de 33,9% a
30,4% en los dos últimos años; esa tendencia se agudizó en Córdoba donde
en el último año ese porcentaje ha sido del 20,3%. ¿Usted podría establecer
qué tan probable es que, seleccionando una muestra aleatoria de 100 clientes,
encontremos entre un 20% y un 15% que prefieran realizar sus compras
en la carnicería de su barrio y no en el supermercado? Si la probabilidad
obtenida es menor de 0,40 tendríamos algunas otras alternativas, como por
ejemplo pensar directamente en terciarizar el rubro o bien analizar un rubro
alternativo que sea más conveniente”.

Recuerde que el emprendimiento comercial se llevará a cabo en Córdoba.

¡Adelante con su respuesta requerida!

C 1

EDUBP | MARKETING | estadística aplicada I - pag.152


m7 |actividad 2 | AA

asistente académico 1

Para resolver el caso que se le plantea es importante que usted tome en


consideración lo siguiente:

1.- ¿Recuerda que la distribución binomial trabaja con diferentes números de


éxitos?

2.- Frecuentemente es conveniente investigar la proporción de éxitos y no el


número de éxitos.

3.- Al número de éxitos lo habíamos representado como x y a la proporción de


éxitos la definiremos como el cociente entre el número de éxitos y el número de
pruebas n.

4.- En unidades anteriores usted ha visto que la distribución normal proporciona


una aproximación de la distribución binomial cuando n es grande y p ni chica
ni grande. En los casos planteados sobre proporción, se utilizará la distribución
normal cuando np ≥ 5 y nq≥5.

5.- Tenga presente que la variable tipificada para proporciones muestrales es:

_
p− p
Z=
pq
pq
n

m7 |actividad 2 | CC

clave de corrección 1

_
P ( 0,15 < p < 0,20 ) = P( -1,33 < z < -0,07) = 0,3803

EDUBP | MARKETING | estadística aplicada I - pag. 153


m7 | actividad 3

Una serie de ejercicios

1.- Indique si las siguientes afirmaciones son VERDADERAS o FALSAS:

a) Una muestra es una parte representativa de la población.


b) La diferencia entre un estadístico y un parámetro poblacional se llama error
del muestreo.
c) La media de todas las medias muestrales siempre es menor que la media
poblacional.

2.- ¿Qué efectos tiene cada uno de los siguientes cambios sobre el error estándar
de la media?

a) Un aumento en la media de la población.


b) Una disminución en la desviación estándar de la población.
c) Un aumento en el tamaño de la muestra.

3.- Explique la diferencia entre: “el número de éxitos en un experimento binomial”


y “la proporción de éxitos”.

4.- ¿Por qué es relevante el estudio del teorema central del límite?

5.- Considere el conjunto de los números impares (3, 5, 7).

a) Haga una lista de todas las muestras posibles de tamaño 2 que puedan ser
seleccionadas de este conjunto, trabajando con reposición.
b) Calcule la media muestral para cada muestra y conforme su distribución de
probabilidad.
c) Calcule la esperanza y varianza de la media muestral y compare con los
parámetros poblacionales.
d) Resuelva los ítems a, b, y c; trabajando sin reposición.

6.- Si consideramos una población de 4 alumnos (A, B, C, D) de un mismo


curso, los que tienen realizados cursos de perfeccionamiento anteriores con las
siguientes cantidades: 4, 8, 10, 14, respectivamente; además, se conoce que los
tres primeros están de acuerdo con los contenidos del curso actual:

a) Determine todas las muestras posibles de tamaño 2 que pueden extraerse


de esta población. (Trabaje sin reposición).
b) Obtenga la proporción poblacional de personas que están de acuerdo con
el curso actual.
c) Obtenga la distribución de probabilidad de la proporción muestral de
personas que están de acuerdo con el curso actual.
d) Calcule la esperanza y varianza de la proporción muestral, y compare con
los parámetros poblacionales.
e) Obtenga la distribución por muestreo del promedio de cursos realizados
anteriormente por los alumnos seleccionados en la muestra de tamaño dos
del punto a. Calcule la esperanza y varianza comparando con los parámetros
poblacionales.

EDUBP | MARKETING | estadística aplicada I - pag.154


7. Se encontró que las calificaciones de un curso de informática tienen distribución
normal con media de 57 puntos, y desviación estándar de 9 puntos.

a) ¿Qué porcentaje de estudiantes calificó entre 55 y 59 puntos?


b) Si se toma una muestra de 36 estudiantes, ¿qué porcentaje de estudiantes
tendrá una calificación media comprendida entre 55 y 59 puntos?

8.-El sueldo de los empleados de comercio se distribuye normal con media de


$400 y desvío estándar de $ 50.

a) Si se elige una persona al azar del total de empleados de comercio, ¿cuál


es la probabilidad de que sus ingresos mensuales sean superiores a $425?
b) Si se elige una muestra de 64 empleados, ¿cuál es la probabilidad de que el
sueldo promedio de la muestra sea mayor que $425?

9.-Se conoce que en una población de tres habitantes A, B, y C, dos de ellos


prefieren la marca “Refrechs” para su desodorante, de modo que:

A prefiere “Refrechs”.
B “ “Refrechs”.
C “ “Onix”.

a) Calcule todas las muestras posibles de tamaño 2 que puedan seleccionarse


en esa población trabajando con reposición.
b) Determine para cada muestra la proporción muestral de los que prefieren la
marca “Refrechs” y conforme su distribución de probabilidad.
c) Calcule la esperanza y varianza de la proporción muestral, comparando con
los parámetros poblacionales.
d) Resuelva los puntos a), b) y c), trabajando sin reposición.

10.- El dueño de una inmobiliaria considera que de las 3.000 cuentas de la


empresa, un 60% se halla en excelente estado. Si pretende seleccionar una
muestra de n = 150 cuentas:

a) Determine la esperanza y la varianza de la proporción muestral de cuentas


en excelente estado, con muestras de n=150. (con reposición).
b) Calcule la probabilidad de que la proporción de cuentas en excelente estado
sea superior a 0.80, considerando muestras de tamaño 150.
c) Resuelva los ítems anteriores suponiendo muestreo sin reposición.

11.- Un remedio muy conocido para el catarro anuncia en su publicidad que alivia
las molestias alrededor de las 12 hs. promedio, con una desviación estándar de
3hs. Suponiendo que esta aseveración es cierta, si se da esta medicina a una
muestra de 50 personas con catarro, averigüe la probabilidad de que el alivio
promedio dure:

a) Entre 11,5 hs. y 12,5hs.


b) Más de 13hs.
c) Menos de 10hs.

EDUBP | MARKETING | estadística aplicada I - pag. 155


12.- El año pasado, el 75% de las compras con tarjeta de crédito en un
Hipermercado local fue por lo menos de $550. En una muestra aleatoria de 200
compras con tarjeta de crédito, qué probabilidad hay de que las compras de
menos de $550 constituyan:

a) Entre el 70% y el 80%


b) Más del 80%
c) Más del 20%
d) Menos del 60%

13.- Supongamos que los ingresos mensuales de los empleados de una aerolínea
tienen distribución Normal, con media de $ 1.300 y desviación estandar de $ 700.

I) Obtener las siguientes probabilidades:

a) Probabilidad que los ingresos sean inferiores a $1.500.


b) Probabilidad que los ingresos estén por encima de los $1.000
c) Si se selecciona una muestra de 10 salarios ¿cuál es la probabilidad de
encontrar entre 3 y 7 salarios con ingresos inferiores a $1.500? (Utilice la
probabilidad encontrada en el punto a).
d) Probabilidad de que los ingresos promedios estén comprendidos entre
$1.200 y $1.600, trabajando con una muestra de tamaño 100.

II)

a) ¿Por debajo de qué valor de ingresos estará el 20% de los salarios?


b) ¿Entre qué valores se espera se encuentre el 95% de las observaciones
centrales?

Este ejercicio aborda temas del módulo 6 y 7.

A fin de ampliar el espectro de práctica, le proponemos resolver las actividades


del libro recomendado como bibliografía básica y que se presentan bajo los
títulos: “Auto evaluaciones” y” Ejercicios del capítulo”

m7 glosario

Distribución muestral: Una distribución de probabilidades que consta de todos


los valores posibles de un estadístico de muestra.

Error estándar: La desviación estándar de un estimador puntual.

Estadístico de muestra: Es una característica de la muestra, como la media


de la muestra, la desviación estándar de muestra s, la proporción muestral, etc.
El valor del estadístico de muestra se usa para estimar el valor del parámetro
poblacional.

Estimado puntual: Un valor numérico único que se usa como estimado de un

EDUBP | MARKETING | estadística aplicada I - pag.156


parámetro poblacional.

Estimador puntual: El estadístico de muestra, como x, s, y p, que produce el


estimado puntual del parámetro poblacional.

Factor de corrección por población finita: El término V(N -n) I(N- 1) que se
usa en las fórmulas del error estándar de la media muestral y de la proporción
muestral, cuando se selecciona una muestra de una población finita (no de una
población infinita). La regla fácil que generalmente se acepta es no tomar en
cuenta el factor de corrección por población finita siempre que nIN < 0.5.

lnsesgo: Propiedad de un estimador puntual cuando su valor esperado es igual


al parámetro poblacional que estima.

Teorema central del límite: Teorema que permite usar la distribución normal
de probabilidades para aproximar la distribución de la media muestral y de la
proporción de la muestra cuando el tamaño de la muestra es grande.

Recomendamos la ampliación del presente glosario con el del material básico


sugerido.

e v a l u ación

La versión impresa no incluye las actividades obligatorias. Las mismas se


encuentran disponibles directamente en Plataforma.

EDUBP | MARKETING | estadística aplicada I - pag. 157

También podría gustarte