Unidad 3 - Medidas de Tendencia Central y de Dispersion - Estadistica 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 23

E st ad i st ica Buscar en este sitio

1
Estadistica 1 Unidad 2: descripcion de los conjuntos de datos >
unidad 1: el papel de
la Estadistica
Unidad 3: Medidas de Tendencia
Unidad 2: descripcion Central y de Dispersion
de los conjuntos de
datos
Unidad 3: Medidas
de Tendencia 3. INTRDUCCIÓN
Central y de
Dispersion
Las medias de tendencia central o posición nos indican donde se
Unidad
4:Distribuciones de sitúa un dato dentro de una distribución de datos. Las medidas de
probabilidad
dispersión, variabilidad o variación nos indican si esos datos están
Mapa del sitio
próximos entre sí o sí están dispersos, es decir, nos indican cuán
esparcidos se encuentran los datos. Estas medidas de dispersión
nos permiten apreciar la distancia que existe entre los datos a un
cierto valor central e identificar la concentración de los mismos en
un cierto sector de la distribución, es decir, permiten estimar cuán
dispersas están dos o más distribuciones de datos. Estas medidas
permiten evaluar la confiabilidad del valor del dato central de un
conjunto de datos, siendo la media aritmética el dato central más
utilizado. Cuando existe una dispersión pequeña se dice que los
datos están dispersos o acumulados cercanamente respecto a un
valor central, en este caso el dato central es un valor muy
representativo. En el caso que la dispersión sea grande el valor
central no es muy confiable. Cuando una distribución de datos
tiene poca dispersión toma el nombre de distribución homogénea y
si su dispersión es alta se llama heterogénea.

Las medidas de tendencia central se utilizan con bastante


frecuencia para resumir un conjunto de cantidades o datos
numéricos a fin de describir los datos cuantitativos que los forman.
:
Ejemplos de ello, pueden ser: la edad promedio o la estatura
promedio de los estudiantes de la universidad o el peso promedio
de las bolsas de cereal que son llenadas por una determinada
máquina en un proceso de producción o las ventas de un negocio.

3.2. MEDIDAS DE TENDENCIAL A PARTIR DE


DATOS NO AGRUPADOS: LA MEDIA, LA
MEDIANA, LA MODA, LA MEDIA PONDERADA,
LA GEOMÉTRICA
Las medidas de tendencia central son también frecuentemente
usadas para comparar un grupo de datos con otro, por ejemplo: el
promedio de ventas obtenido por un grupo de vendedores de una
zona comparado con el promedio de ventas otro grupo de
vendedores de otra zona, el promedio de reclamos de clientes de
una sucursal, comparado con el promedio de reclamos de otra
sucursal.

Otras características generales de las medidas de tendencia central


son las siguientes:

Permiten apreciar qué tanto se parecen lo grupos entre sí.

Son valores que se calculan para un grupo de datos y que


se utiliza para describirlos de alguna manera

Normalmente se desea que el valor sea representativo de


todos los valores incluidos en el grupo.

Es el valor más representativo o típico de un grupo de


datos, no es el valor más pequeño o el más grande, sino un
valor que está en algún punto intermedio del grupo, más
exactamente, se acerca a estar al centro de todos los
valores, por ello se les llama medidas de tendencia central.

Se utilizan como mecanismo para resumir una


característica de un grupo de datos en particular.
:
También para comparar un grupo de datos contra otro.

El cálculo de las medidas de tendencia central se hace


mediante fórmulas, las cuales cambian según como se encuentren
los datos del grupo con el que se va a trabajar, esto es si están
como Datos no agrupados o como Datos agrupados
(Distribuciones de frecuencias).

Un campo fundamental de la estadística es el de las llamadas


medidas de centralización y de dispersión, que son las que se usan
para resumir o describir una colección más o menos numerosa de
datos numéricos. En inglés las medidas de centralización se
denominan averages e incluyen lo que en castellano llamamos
media, mediana y moda, a las que en conjunto suele denominarse
«promedios» (Tapia Granados 2001)

Las medidas de tendencia central que se van a tratar en esta unidad


son:

Media Aritmética

Mediana

Moda

Media Geométrica

Media Armónica

Media aritmética

La media es un concepto estadístico básico que representa en un


valor las características que presenta una variable de un conjunto
de datos, y sólo puede usarse con variables cuantitativas. La media
puede considerarse un concepto base para la comprensión de
variable aleatoria y sus distribuciones, ya que la distribución se
caracteriza principalmente por las medidas de tendencia central y
de dispersión, siendo frecuentemente la media uno de los
parámetros de las distribuciones. (Estrella 2016)
:
La media aritmética, o promedio aritmético, es la suma de los
valores del grupo de datos dividida entre la cantidad de valores. Su
fórmula se puede describir de la siguiente manera:
:
MEDIANA

Es el valor del elemento central del conjunto. Para encontrar la


mediana, primero arreglar los valores del conjunto de acuerdo a su
magnitud; es decir, arreglar los valores del más pequeño al más
grande o del más grande al más pequeño y después localizar el
valor central, es decir, el número de valores sobre la mediana es el
mismo que el número de valores debajo de la mediana. Si el
número de valores en un conjunto de datos no agrupados es par, no
hay mediana verdadera.
:
TecnologiadelaprovinciadeElOro. Me

Internet 19417

Computadora 36618 38610

TelevisiónporCable 40602

Teléfonocelular 127943

Valorescentrales
Me=

36618÷40602 77220
Me=
2 2

Me=38610

R//LaMediadelusodetecnologiaenlaProvinciadeElOroes38610

MODA

También llamada modo o promedio típico de un conjunto de


valores; la moda es el valor el cual ocurre más frecuentemente en
:
el conjunto. Si un valor es seleccionado al azar del conjunto dado,
un valor modal es el valor más probable a ser seleccionado. Así, la
moda es generalmente considerada como el valor más típico en
una serie de datos la cual es llamada, por esa razón, UNIMODAL.

Un conjunto pequeño de datos en el que no se repiten valores


medidos carece de moda. Cuando dos valores no adyacentes son
casi iguales en cuanto a frecuencias máximas asociadas con ellos,
la distribución se llama BIMODAL, aquéllas con varias modas se
llaman multimodales.

En el presente ejemplo existe una moda


Unimodal la cual es 10, ya que dentro de las variables el número
que se repite es el 10.
:
R// La Moda de los minutos de atraso al examen de matemáticas
de los estudiantes de primer nivel de economía de la Universidad
Técnica de Machala es 10.

MEDIA GEOMÉTRICA

La media geométrica G, de un conjunto de valores es la raíz n-


ésima del producto de los valores de dicho conjunto: Si hay dos
valores, la raíz cuadrada del producto de estos dos; si son tres, es
la raíz cúbica del producto de los tres valores. La fórmula general
es:

G=W(X1)(X2)...(Xn)

Usandologaritmoslafórmulaqueda:

Elogx
logG
:
3.3. COMPARACIÓN ENTRE MEDIA, MEDIANA Y
MODA

Las distribuciones simétricas tienen el mismo valor para la


media, la mediana y la moda.

En una distribución con sesgo positivo, la moda se halla en


el punto más alto de la distribución, la mediana está hacia la
:
derecha de la moda y la media más a la derecha. Es decir
Mo < Me < x.

En una distribución con sesgo negativo, la moda es el punto


más alto, la mediana está a la izquierda de la moda y la
media está a la izquierda de la mediana. Es decir, x < Me <
Mo.

Cuando la población tiene una distribución sesgada, con


frecuencia la mediana resulta ser la mejor medida de
posición, debido a que está siempre entre la media y la
moda. La mediana no se ve altamente influida por la
frecuencia de aparición de un solo valor como es el caso de
la moda, ni se distorsiona con la presencia de valores
extremos como la media.

La selección de la media, la mediana o la moda, depende de


la aplicación. Por ejemplo, se habla del salario promedio
(media); el precio mediano de una casa nueva.

Media 'Moda Media Moda


Mediana Mediana
Moda
Asimétricahacia Simétrica Asimé
laizquierda la

3.4. MEDIDAS DE DISPERSIÓN PARA DATOS NO


AGRUPADOS
:
Los estudios estadísticos permiten hacer inferencias de una
característica de una población a partir de la información
contenida en una muestra. Los métodos numéricos que describen a
los conjuntos de observaciones tienen como objetivo dar una
imagen mental de la distribución de frecuencias.

Una vez localizado el centro de la distribución de un conjunto


de datos, lo que procede es buscar una medida de dispersión de los
datos.

La dispersión o variación es una característica importante de un


conjunto de datos porque intenta dar una idea de cuán esparcidos
se encuentran éstos.

Existen diversas medidas de dispersión, algunas de ellas son:

• Rango

• Desviación estándar

• Varianza

A continuación, se explican cada una de ellas.

RANGO: El rango de un conjunto de números es la


diferencia entre el mayor y el menor de todos ellos. Hay 2 maneras
de expresar ésta medida:

La diferencia entre los valores mayores y menor.

Los valores mayor y menor del grupo.


:
Rango=(Max-Min)

EJEMPLO
CANTONES HOMBRES A

CHILLA 1274
LASLAJAS 2489

MARCABELI 2781

ATAHUALPA 3010 5051


BALSAS 3558

PORTOVELO 6325

TOTAL 19437

Fuente:InstitutoNacIonaldeestadisticaycensos

A=Xmavor-Xmenor

A=67325-1274

A=18163

DESVIACION ESTANDAR: La desviación típica


o desviación estándar (denotada con el símbolo σ o s,
dependiendo de la procedencia del conjunto de datos) es una
medida de dispersión para variables de razón (variables
cuantitativas o cantidades racionales) y de intervalo. Se
define como la raíz cuadrada de la varianza de la variable.
:
:
VARIANZA: Encontramos varianza, que es como la
mayor parte de los textos científicos en castellano se refieren a la
media aritmética de los cuadrados de las desviaciones de cada
valor respecto de la media aritmética de los datos (por lo que a
veces también se denomina desviación cuadrática media). La
desviación estándar es la raíz cuadrada de la varianza. En algunos
textos en castellano se ve variancia en vez de varianza, pero esta
:
grafía se usa muy poco, pese a ser la recomendada por la Real
Academia.

La varianza es la media aritmética de los cuadrados de las


desviaciones respecto a la media aritmética, es decir, es el
promedio de las desviaciones de la media elevadas al cuadrado.
:
3.5. MEDIDAS DE TENDENCIA CENTRAL CON
DATOS AGRUPADOS.

MEDIA ARITMÉTICA
Es una medida de localización central.
Datos agrupados

Los datos obtenidos normalmente se organizan en distribución


de frecuencias. Es el producto de cada valor diferente por el
número de veces que ha ocurrido y sumando después los
productos así obtenidos. (Tapia Granados, La estadística y el
castellano. La terminología estadística en la nueva edición del
Diccionario de uso 2001) Su fórmula es:
:
MEDIANA
Es el valor que queda en la parte central de un grupo de
observaciones arregladas en orden de magnitud.
Datos agrupados
Cuando los datos se han organizado en una distribución de
frecuencias, la mediana (MD) es el conjunto de n observaciones
que se determina mediante la fórmula:
:
MODA

Valor o clase que tiene la mayor frecuencia en un conjunto de


observaciones. La moda puede no existir o no ser única en caso de
que exista. Una distribución con moda única se dice unimodal. Si
los datos tienen exactamente dos modas, se dice que son datos
bimodales; si tienen más de dos modas, son multimodales.

Datos agrupados

La moda puede deducirse de una distribución de frecuencias o de


:
un histograma a partir de la siguiente fórmula:

LA MEDIA GEOMÉTRICA
La media geométrica G, de un conjunto de valores es la raíz n-
ésima del producto de los valores de dicho conjunto: Si hay dos
:
valores, la raíz cuadrada del producto de estos dos; si son tres, es
la raíz cúbica del producto de los tres valores. La fórmula general
es:

3.6. MEDIDAS DE DISPERSIÓN DE DATOS


AGRUPADOS
Rango

El rango de un grupo de números es la diferencia


entre el número mayor y el menor del grupo.

Varianza
:
De una distribución de frecuencia la varianza
puede ser obtenida de la fórmula.

Desviación Estándar
La desviación estándar se define como:

Coeficiente de variación

La variación real o dispersión determinada a partir de la


desviación estándar u otra medida de dispersión, es llamada la
dispersión absoluta.

Si la dispersión absoluta es la desviación estándar S y el


promedio, la dispersión relativa se llama coeficiente de variación o
coeficiente de dispersión.

Ejemplo:

ACTIVIDADESREALIZADASPORLOSHABITANTESDELAPROVI
DELORO2010

3,7 4.5 7.65 :8.47 :4.2 4,2


4,6 3,7 :4.5 :3.7 3,8 :3.7
8.5 6,5 :3.6 :3.6 4.1 4.2
7.63 6.3 :36.5 :4,2 4,2
8,3 8,2 7,2 7,6 6,7 6,4
:
3.7. TEOREMA DE CHESBYSHEV

El teorema de Chebyshev en honor del matemático ruso del XIX,


P. L Chebyshev.

Definición. (Teorema de Chebyshev) Si µ y son la media y la


desviación estándar de una variable aleatoria X, entonces para
cualquiera constante positiva k la probabilidad es al menos 1 -
1/k al cuadrado que x asumirá un valor dentro de k desviaciones
estándar de la media; simbólicamente.
:
Comentarios

Iniciar sesión | Actividad reciente del sitio | Notificar uso inadecuado | Imprimir página | Con la tecnología de Google Sites
:

También podría gustarte