Variables Estadisticas
Variables Estadisticas
Variables Estadisticas
Unidad 2
2.1 Introducción.
Casi todos los trabajos que se hacen en estadística comienzan con el proceso de
recolección de datos necesarios para formar con ellos un conjunto que se utilizará en el
estudio. Para propósitos generales, se adoptará la suposición conveniente de que esta
labor, con frecuencia tediosa, ya ha sido realizada y que los datos están disponibles.
Esta recolección de datos originales revela muy poco por sí sola. Es extremadamente
difícil determinar el verdadero significado de un grupo de número que simplemente se
han registrado en un papel. Nuestra labor es organizar y describir tales datos de manera
concisa y significativa. Para determinar su significancia, los datos se organizan de
manera que, con un simple vistazo, se pueda tener una idea de lo que pueden decirnos.
Por otro, los datos, al igual que los estudiantes, se congregan alrededor de sus puntos de
encuentro favoritos. Parece que los estudiantes acuden en masa a sitios tales como
partidos de fútbol, bares populares y otros sitios de reunión y en raras ocasiones hasta la
biblioteca. De igual forma, los números parecen disfrutar de la compañía de otros
números y están propensos a reunirse alrededor de un punto central denominado
medida de la tendencia central o, más comúnmente, media. Una medida de tendencia
central ubica e identifica el punto alrededor del cual se centran los datos.
Un conjunto grande de datos puede ser rápidamente descrito de manera sucinta con un
solo número. Si el profesor dice que el promedio de la clase en el último examen de
estadística fue de 17, esto significa algo. Si se dice que el promedio fue de 08, esto
indica algo totalmente diferente.
Además, las medidas de dispersión indican el punto hasta el cual las observaciones
individuales se esparcen alrededor de su punto central. Miden la dispersión o la
variabilidad de los datos y reflejan la tendencia de las observaciones individuales a
desviarse de dicho punto central.
Una vez que se tienen los datos organizados mediante esa distribución hay que iniciar el
proceso de análisis de la variable. En este proceso de análisis de una variable hay que
definir ciertos instrumentos que nos permitan estudiar sus características más relevantes.
Entre las mismas cabe destacar las siguientes: medidas de posición (valor central o
promedios) y dispersión.
Ejemplo 2.1. Supóngase que ante la pregunta del número de hijos por familia (variable
X) una muestra de 20 hogares, marcó las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
Para elaborar la tabla de frecuencia 2.1 y el grafico 2.1 mediante el software SPSS,
debemos seguir la secuencia:
Analizar > Estadísticas descriptivas > Frecuencias > hacer Clic en: Mostrar tablas de
frecuencias > En gráficos… > Tipo de gráfico: Gráfico de barras > Continuar > Aceptar.
Gráfico.
Número de familias 4
0
0 1 2 3 4
Número de hijos
Ejemplo 2.2. Como Administrador residente de Pigs and People (P&P) Airlines, el
gerente general le pide recolectar y agrupar los datos sobre el número de pasajeros que
han decidido viajar con P&P. Tales datos correspondientes a los últimos 50 días (del 10
de Octubre al 30 de Noviembre de 2016) aparecen a continuación:
68 72 50 70 65 83 77 78 80 93 71 74 60 84 72 84 73 81
84 92 77 57 70 59 85 74 78 79 91 102 83 67 66 75 79 82
93 90 101 80 79 69 76 94 71 97 95 83 86 69.
Sin embargo, con estos datos en bruto, es improbable que el gerente pueda obtener
información útil y significativa respecto a las operaciones de vuelo. Los datos no están
organizados y es difícil llegar a una conclusión significativa simplemente revisando una
serie de números anotados en un papel. Es preciso agrupar y presentar los datos de
manera concisa y reveladora para facilitar el acceso a la información que contienen.
Utilice una distribución de frecuencia para organizar el conjunto de datos.
Solución.
1º. Debemos de determinar el rango ( R ) de variación de los datos que se define por:
R = Xmax - Xmin
En nuestro ejemplo, tenemos:
2º. Tenemos que calcular ¿cuantas clases deben formarse?. Para eso se usa la fórmula de
Sturges:
K 1 3.322 log n
donde:
K = número de clases
n = número de elementos en la muestra (tamaño de la muestra).
Está formula es muy útil porque orienta al principiante. Sin embargo, es un poco
conservador y tiende a dar un número de clases un poco menor del que se utiliza en
la práctica.
En nuestro ejemplo: K = ? , n = 50
Nota.- por razones extraídas de la práctica, se adoptan los siguientes límites para K.
5 K 15
3º. La idea es resumir los valores con el fin de percibir algunas características o
propiedades de los datos que no aparecen a simple vista. Para esto vamos a
clasificar los 50 vuelos en 7 clases, de acuerdo con la formula de Sturges.
La amplitud de cada intervalo de clase que representamos con la letra c, se obtiene
por medio de la formula:
R
c
K
52
c 7.42857
Aplicando los datos a la fórmula anterior, se tiene: 7
Redondeamos a 8.
R c K 8 7 56
4º. Teniendo en cuenta que este recorrido es mayor que el recorrido original,
buscaremos el exceso:
Exceso = 56 – 52 = 4 pasajeros
Debemos repartir este exceso a los dos extremos del recorrido original, mitad a
cada lado, en este caso 2 a cada extremo. Sumamos el número 2 al valor máximo:
102 + 2 = 104 y restamos el número 2 al valor mínimo: 50 - 2 = 48.
48 56 64 72 80 88 96 104
Figura 2.2
Sin embargo una dificultad se presenta cuando algunos de los datos coincide con
cualquiera de los puntos de división: 56, 64, 72, 80, 88 y 96.
5º. Supongamos que un dato es 56 ¿dónde lo colocamos?- ¿en el primer intervalo cuyos
extremos son 48 y 56?- (ver Fig. 2.2) ó ¿en el segundo intervalo que tiene por
extremos 56 y 64?-
Para aclarar está ambigüedad adoptamos, el intervalo abierto por la izquierda que
no incluye al valor 48 (límite inferior del intervalo) y cerrado por la derecha que
incluye al valor 56 (límite superior del intervalo). Este tipo de intervalo se
representa matemáticamente por: ( Yi1 Yi , donde Yi1 representa el límite
inferior del intervalo y Yi representa el límite superior.
Nota. También existen otros dos tipos de intervalos de clases, definidas como:
[ Yi1 Yi ) Intervalo semi-cerrado. Este intervalo es cerrado por la izquierda (incluye
al límite inferior del intervalo) y abierto por la derecha (no incluye al límite superior del
intervalo).
Yi1 Y Intervalo cerrado. Este intervalo incluye a ambos límites del intervalo.
6º. Es conveniente que todos y cada uno de los datos que se hallen dentro de un mismo
intervalo, estén representados por un mismo valor. Este valor caracteriza a la clase
y por eso se llama marca de clase, se obtiene promediando los límites de cada
intervalo. Una fórmula para calcular la marca de clase de un intervalo es:
Y Yi
Yi i 1
2
7º. A continuación debemos realizar la clasificación y conteo de los datos (ver tabla
2.2), es decir, colocar cada uno de ellos dentro de su clase, todos representados por
un mismo signo: una tarja.
Tabla 2.2.
Interpretación.
n2 = 3, significa que en 3 días de vuelos de la aerolínea P&P viajaron un número mayor
a 56 y menor o igual a 64 pasajeros.
N4 = 29, significa que 29 días de vuelos de P&P viajaron un número mayor a 48 y menor
o igual a 80 pasajeros, o también significa que durante 29 días de vuelos de la
aerolínea P&P viajaron un número menor o igual que 80 pasajeros.
h3 = 0.22, significa que el 22% de los días de vuelos de P&P viajaron un número mayor
de 64 y menor o igual a 72 pasajeros.
H5 = 0.78, significa que el 78% del total de días de vuelos de P&P, viajaron un número
mayor a 48 y menor o igual a 88 pasajeros, o también significa que el 78% del
total de días de vuelos de P&P viajaron un número de pasajeros menor o igual que
88.
N6 - N2 = 47 - 4 = 43 días de vuelos de P&P viajaron un número mayor que 64 y menor
o igual que 96 pasajeros.
A partir de la tabla de frecuencias 2.3, por ejemplo, ahora se puede ver fácilmente que
en 14 de los 50 días, entre 72 y 80 pasajeros volaron en P&P. En ningún momento la
lista de pasajeros diarios excedió de 104. La aerolínea rara vez transportó menos 56
pasajeros. El gerente puede ahora detectar características que no eran evidentes en el
análisis de datos en bruto. Estas características son útiles para la toma de decisiones
inteligentes y bien informadas respecto a las operaciones de vuelo.
Ejercicio 1. Usando el software estadístico SPSS (Statistical Package for the Social
Sciences), primero crear la columna de datos, que llamaremos Número pasajeros.
Enseguida debemos Recodificar la variable Número de pasajeros, mediante la
secuencia:
Luego Aceptar.
Analizar > Estadísticas descriptivas > Frecuencias > hacer Clic en: Mostrar tablas de
frecuencias > Aceptar.
pasajero1
Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
(48 - 56] 1 2.0 2.0 2.0
(56 - 64] 3 6.0 6.0 8.0
(64 - 72] 12 24.0 24.0 32.0
(72 - 80] 14 28.0 28.0 60.0
Válidos (80 - 88] 10 20.0 20.0 80.0
(88 - 96] 7 14.0 14.0 94.0
(96 - 104] 3 6.0 6.0 100.0
Total 50 100.0 100.0
Histograma.
Es una representación gráfica de una distribución de frecuencias agrupadas en intervalos
de clase, mediante una serie de rectángulos contiguos que tienen:
- Sus bases sobre un eje horizontal y cuya longitud será igual al tamaño de los
intervalos de clase.
- Las alturas proporcionales a la frecuencia (absoluta o relativa).
12
0
48 56 64 72 80 88 96 104
Número de pasajeros
Analizar > Estadísticas descriptivas > Frecuencias > hacer Clic en: Gráficos > Tipo de
gráfico: Histogramas > continuar > Aceptar.
Ejemplo 2.3. En una encuesta realizada sólo a 40 gerentes de empresas que fuman
cigarrillos frecuentemente, durante su participación en un fórum realizado en la cuidad
de Piura, arrojo los datos siguientes acerca de las marcas de cigarrillos que prefieren:
D, NO, NO, H, NE, D, NO, NE, NO, H, H, NO, NO, NE, H, D, H, D, H, NO. D, NO,
NO, H, D, NO, H, H, NO, NO, NO, H, H, D, NO, NO, H, D, NE, NO.
Tabla 2.4. Distribución de gerentes de empresas según la marca de cigarrillo que fuman
frecuentemente.
Número de Frecuencias Frecuencias
Marca de cigarrillo
Gerentes, ni relativas: hi Porcentajes: hi(%)
DUCAL 8 0.20 20
HAMILTON 12 0.30 30
NEVADA 4 0.10 10
NORTON 16 0.40 40
Total 40 1.00 100
Gráficos.
Los gráficos más comunes para la distribución de frecuencias de variable cualitativa son
el de diagrama de barras y el de sectores circulares.
Ejemplo 2.4. Con el SPSS obtener el diagrama de barras para los datos del ejemplo
2.3, mediante la secuencia:
Analizar > Estadísticos descriptivos > Frecuencias > Tipo de gráfico: escoger
gráficos de barras.
Diagrama de sectores.
En un gráfico circular, los datos de cada categoría se representan por un sector circular.
Es utilizado principalmente cuando se pretende comparar cada valor de la variable con
el total. Para construir se divide el circulo en sectores, cuyas áreas serán proporcionales
a los valores de la variable. Está división es obtenida a través de la regla de 3 simples.
Total 360o
Parte xo
Ejemplo 2.5. Con la información del ejemplo 2.3, utilizando el programa SPSS,
construya el diagrama de sectores circulares. Seguir la secuencia:
Analizar > Datos Estadísticos descriptivos > Frecuencias > Tipo de gráfico: escoger
gráficos de sectores circulares
Así, por ejemplo, imaginemos que los elementos observados son las empresas. En ellas
se puede observar de forma conjunta los beneficios (X) y los costos de las mismas (Y) o
cualquier otro par de caracteres. Así podríamos pensar en los gastos en publicidad (X) y
sus beneficios (Y), o los costos y el número de empleados. El número de ejemplos que
podríamos dar es tan amplio que no merece la pena seguir mencionándolos.
Si, además de los ingresos netos y gastos totales al mes en el estudio de la economía de
una muestra de familias, obtenemos de cada familia el número de los miembros que la
componen (Z), cada observación es un valor de la variable estadística tridimensional (X,
Y, Z), etc. Por ser el caso más frecuente, en lo sucesivo nos referiremos exclusivamente
a las variables estadísticas bidimensionales o bivariados.
o valores de Y
Modalidades
=
o valores de X
x1 n11 n12 ... n1j ... n1q n1.
x2 n21 n22 ... n2j ... n2q n2.
... ... ... ... ... ... ...
xi ni1 ni2 ... nij ... niq ni.
... ... ... ... ... ... ...
xp np1 np2 ... npj ... npq np.
Totales verticales p q
p n.1 n.2 ... n.j ... n.q n n ij n
n
i 1
ij n j i 1 j 1
donde:
nij = el número de veces que aparece repetido el par (xi, yj) y se llama frecuencia
absoluta del par (xi, yj) , i =1, 2, ..., p ; j =1, 2, ..., q.
q
n i n ij
j 1 = suma total de las frecuencias absolutas nij según el índice j, y se llama
frecuencia marginal del valor xi.
p
n j n ij
i 1 = suma total de las frecuencias absolutas nij según el índice i, y se llama
frecuencia marginal del valor yj.
p q
n ij n
i 1 j1 = suma de las frecuencias absolutas nij observadas es igual al número de
pares observados, n.
51 Secundari Sierra
Tabla 2.6 52 a Costa
53 Secundari Costa
Trabajado Grado de 54 Región de a Selva
r Nº instrucción55 procedencia
Secundari Selva
1 Superior 56 Costa a Costa
2 Primaria 57 Sierra
Secundari Costa
3 Primaria 58 Selva a Sierra
4 Secundari59 SelvaSuperior Sierra
5 a 60 SelvaSuperior Costa
6 Secundari61 CostaSuperior Selva
7 a 62 CostaSuperior Costa
8 Secundari63 Sierra
Secundari Sierra
9 a 64 Selva a Costa
10 Superior 65 Costa
Secundari Selva
11 Primaria 66 Sierra a Selva
12 Secundari67 Sierra
Secundari Costa
13 a 68 Costa a Selva
14 Secundari69 SelvaSuperior Selva
15 a 70 SelvaSuperior Sierra
16 Superior 71 Selva
Secundari Costa
17 Superior 72 Sierra a Costa
18 Primaria 73 Sierra
Secundari Costa
19 Secundari74 Selva a Costa
20 a 75 Costa
Secundari Selva
21 Secundari76 Selva a Sierra
22 a 77 Sierra
Secundari Sierra
23 Primaria 78 Costa a Sierra
24 Primaria 79 CostaPrimaria Costa
25 Primaria 80 Sierra
Superior Selva
26 Secundari81 SelvaSuperior Selva
27 a 82 Costa
Secundari Sierra
28 Secundari83 Selva a Costa
29 a 84 Sierra
Secundari Costa
30 Secundari85 Costa a Sierra
31 a 86 CostaSuperior Costa
32 Secundari87 SelvaSuperior Selva
33 a 88 SelvaSuperior Sierra
34 Superior 89 Costa
Secundari Costa
35 Superior 90 Costa a Costa
36 Superior 91 Sierra
Secundari Sierra
37 Superior 92 Sierra a Sierra
38 Secundari93 CostaPrimaria Selva
39 a 94 Selva
Secundari Selva
40 Secundari95 Costa a Costa
41 a 96 Sierra
Secundari Selva
42 Secundari97 Costa a Sierra
43 a 98 SelvaPrimaria Costa
44 Superior 99 SelvaSuperior Selva
45 Superior 100 CostaSuperior Sierra
46 Secundari Costa
Secundari
47 a Selva a
48 Secundari Sierra
secundaria
49 a CostaSuperior
50 Secundari costaSuperior
a Superior
Secundari Secundari
a a
Primaria Secundari
Superior a
Superior Primaria
Secundari Superior
a Superior
Secundari Superior
a Secundari
Secundari a
a Secundari
Superior a
Superior Primaria
Primaria Superior
Secundari Superior
a secundaria
Superior
Superior
Secundari
a
Primaria
Superior
Solución.
Tabla 2.7. Distribución conjunta de las frecuencias de las variables, Grado de instrucción
(X) y Región de procedencia (Y).
Región de
Procedencia , Y
Grado de Costa Sierra Selva Total
Instrucción, X
Primaria Completa 2 7 6 15
Secundaria Completa 20 10 17 47
Superior 18 9 11 38
40 26 34 100
Total
número de vuelos en los que se registran cada año. Ambas variables pueden verse en
detalle mediante una tabla de contingencia que enumera el número de vuelos en la parte
superior (columna) y las edades debajo (filas), tal como se muestra en la tabla 2.8. Al
dividir la edad en cuatro categorías y los vuelos en tres categorías, se han creado 12
celadas en la tabla. Ahora se puede determinar si estas dos características están
relacionadas (como se verá en la prueba de independencia, unidad 4)
Se puede observar por ejemplo, en la última columna que el número más grande de
pasajeros, 15 o 30%, está en la categoría de edad comprendida entre los 40 y los 65 años
y vuelan más de cinco veces al año. El número más pequeño de pasajeros, tan sólo 4
personas, son menores de 25 años o tienen 65 años o más. Una mayoría, 28 personas,
toma de forma típica más de 5 vuelos cada año.
En la sección anterior estudiamos de qué manera los datos podrían ser presentados en
forma compacta, comprensible mediante tablas y gráficos. Sin embargo, con frecuencia
necesitamos resumir aún más para facilitar el análisis e interpretación de la información.
Cuando la variable en estudio es cuantitativa, el investigador puede estar interesado en
encontrar un solo valor, que pueda caracterizar más nítidamente la naturaleza de los
datos que se están midiendo.
Un valor que refleje la tendencia de los datos puede darse mediante las medidas de
tendencia central. Las medidas más importantes y muy usadas para identificar el centro
de un conjunto de datos, son: la media aritmética o media, la mediana, la moda y la
media geométrica.
a) Datos no agrupados.
Sea x1, x2,..., xn valores de la variable X. La media aritmética simple de X representada
por X es dado por:
x i
X i 1
xi ni n ni
X i 1 i 1
n , donde .
y i ni
3920
Y i 1
78.4
n 50 pasajeros por día
2.4.2. La Mediana.
Cálculo de la mediana
a) Datos no agrupados.
Para calcular el valor de la mediana de los datos x1, x2, ...,xn se tendrá en cuenta el
siguiente procedimiento:
Ejemplo 2.9. Las siguientes cifras son los importes del consumo (en soles) de 13
personas en un restaurante:
13, 15, 20, 20, 25, 35 25, 40, 44, 48, 50, 44, 30.
Determinar la mediana de estos importes.
Solución.
13, 15, 20, 20, 25, 25, 30, 35, 40, 44, 44, 48, 50.
Como el número de datos es impar (n = 13), se tiene que la posición de la mediana es:
n 1 ~
7 X Med(x)
2 , luego la mediana de los importes es: soles
Esto significa que el 50% de las personas (es decir, 6 de ellos) tienen un importe menor
o igual que 30 soles y el 50% restante de las personas tienen un importe mayor que 30
soles.
b) Datos agrupados.
En este caso el problema consiste en determinar un punto dentro del intervalo en que
está comprendida la mediana.
Procedimiento:
n
1º. Calcular la posición de orden 2 .
2º. Por las frecuencias acumuladas se identifica la clase que contiene a la mediana, esto
es, la clase para el cual se cumple:
n
N j1 Nj
2 ,
Con lo cual la mediana estará en la clase que tiene como frecuencia acumulada Ni.
3º. Utilizar la formula:
n
2 N j1
Me Xj1 c·
N j N j1
donde:
X j1 = límite inferior de la clase que contiene a la mediana.
n = tamaño de la muestra.
c = amplitud de la clase que contiene a la mediana.
Nj = frecuencia acumulada de la clase que contiene a la mediana.
Nj-1 = frecuencia acumulada de la clase inmediatamente anterior a la clase que
contiene a la mediana.
Solución.
( Yi1 Yi Yi ni Ni
48 - 56 52 1 1
56 - 64 60 3 4
64 - 72 68 11 15
72 - 80 76 14 29
80 - 88 84 10 39
88 - 96 92 8 47
96 - 104 100 3 50
Total 50
n 50
25 vo
1º. 2 2 posición
2º. Se identifica la clase que contiene a la mediana por la frecuencia acumulada, esto es,
a través de la desigualdad: N 3 15 25 N 4 29
vo
25 15
Me 72 8 77.71
29 15 Pasajeros.
Interpretación. Este valor mediano significa, que el 50% de los días de vuelo viajaron
un número menor o igual que 78 pasajeros, en tanto que el otro 50% de los días viajaron
un número mayor que 78 pasajeros.
Ventajas de la mediana.
1. Algunas veces es un valor más representativo de un conjunto de datos que otros
promedios (por ejemplo, que la media aritmética), gracias a su independencia, a sus
valores extremos.
2. La mediana se puede calcular aun cuando los intervalos de clase de la distribución
de frecuencias son de límites abiertos.
2.4.3. La Moda.-
μ
Ejemplo 2.12. Los ingresos por ventas mensuales (miles de $) para 15 meses son:
63, 67, 70, 69, 81, 57, 63, 73, 68, 63, 71, 71, 71, 83.
La moda de estas observaciones es:
Mo ....... kilos y Mo ....... kilos
donde:
Solución.
3
Mo 72 8 75.43
3 4 pasajeros.
Este valor modal significa que: el número de pasajeros más frecuente por día, que viajan
con P&P es de 75; o también que en la mayoría de los días de vuelo viajan con
frecuencia un número de pasajeros igual a 75.
( Yi1 Yi Yi ni
48 - 56 52 1
56 - 64 60 3
64 - 72 68 11
72 - 80 76 14
80 - 88 84 10
88 - 96 92 8
96 - 104 100 3
Total 50
Todos los valores representativos discutidos en las secciones precedentes han sido una
especie de promedio o medida de posición. Sin embargo, el uso de un solo valor para
describir una distribución oculta muchos fenómenos importantes. Por ejemplo, dos
grupos separados de datos pueden contener la misma media, pero un grupo puede estar
más disperso o esparcido alrededor del valor promedio que el otro.
Las medidas de dispersión que se utilizan con mayor frecuencia son: la varianza, la
desviación estándar y el coeficiente de variación.
2.5.1. La varianza.-
Definición 1. (Para datos no agrupados). La varianza de una muestra x1, x2, ..., xn de la
variable X, es dado por:
n
(x i x) 2
S2 i 1
n 1
Definición 2. (Para datos agrupados). La varianza de los valores una muestra y1, y2,
..., yk de Y con frecuencias absolutas n1, n2, ..., nk respectivamente, es dado por:
k
(y i y) 2 n i
V(Y) S 2 i 1
n 1
Observaciones.
(x i μ) 2
σ2 i 1
N
donde N es el tamaño de la población.
n
2
xi
1 n 2
S
2
x i i1n
n 1 i 1
para datos no agrupados.
y
k
2
xini
1 k 2
S
2
x i n i i 1
n 1 i 1 n
para datos agrupados.
( Yi1 Yi Yi ni (y i y) 2 (y i y) 2 ni
48 - 56 52 1 696.96 696.96
56 - 64 60 3 338.56 1015.68
64 - 72 68 11 108.16 1189.76
72 - 80 76 14 5.76 80.64
80 - 88 84 10 31.36 313.6
88 - 96 92 8 184.96 1479.68
96 - 104 100 3 466.56 1399.68
Total 50 6176
Solución.
a) Aplicando la formula de la definición.
y 78.4 pasajeros
n (y i i y) 2
6176
S2 i 1
126.0408
n 1 49 pasajeros al cuadrado.
Luego tenemos:
Yi ni
48 - 56 52 1 52 2704
56 - 64 60 3 180 10800
64 - 72 68 11 748 50864
72 - 80 76 14 1064 80864
80 - 88 84 10 840 70560
88 - 96 92 8 736 67712
96 - 104 100 3 300 30000
Total 50 3920 313504
k
2
yi n i
1 313504 3920 126.0408
2
1 k 2 i1
S
2
i i
n 1 i1
y n
n 49 50
En la unidad 1 ( ver página 22, inciso 1.5.1.1) hemos visto que las variables según su
grado de complejidad no todas se pueden descomponer en más de un elemento
(dimensiones), este es el caso de las variables simples, las cuales se manifiestan
directamente a través de un indicador o unidad de medida.
Ejemplo 2.15. Se desea evaluar el servicio que presenta el Hotel Paraíso, el cual tiene
una organización bastante amplia y compleja, por lo que se decide descomponer la
variable calidad de servicio en función de las principales áreas que prestan atención en
el mencionado hotel.
Variable Dimensiones
Por otra parte, una vez que han sido establecidas las dimensiones de la variable, todavía
faltan los elementos o evidencias que muestren cómo se comporta dicha variable o
dimensión. Estos elementos son los indicadores, aquellos que representan un indicio,
señal o medida que permite estudiar o cuantificar una variable o sus dimensiones.
Dimensiones Indicadores
- Atención permanente: 24 horas.
Calidad del servicio en la - Tiempo que demora el huésped en registrase.
recepción. - Responsabilidad.
- Dominio de varios idiomas.
- Limpieza
Calidad de servicio en las - Equipamiento básico: TV, aire acondicionado.
habitaciones - Tiempo de respuesta a solicitudes.
- - Trato cortés y amable.
Calidad de servicio en el restaurante - Rapidez del servicio.
- Calidad de la comida. Niveles de medición de las
variables
2.7. El tránsito de la variable al ítem.
Autonomía Grado de libertad percibida En esta empresa tengo libertad para tomar
para tomar decisiones y decisiones que tienen que ver con mi
realizar el trabajo. trabajo.
5. Totalmente de acuerdo.
4. De acuerdo.
3. ni de acuerdo ni en desacuerdo.
2. En desacuerdo.
1. Totalmente en desacuerdo
Nota.
1. Es importante que a las opciones de repuestas (las categorías) de cada ítem se les asignen valores
numérico o símbolo (codificación de los datos) que los represente.
2. Asimismo, es muy importante indicar el nivel de medición de cada ítem y, por ende, el de las
variables, porque es parte de la codificación y dependiendo de dicho nivel se selecciona uno u otro
tipo de análisis estadístico (por ejemplo, la prueba estadística para correlacionar dos variables de
intervalo es muy distinta de la prueba para correlacionar dos variables ordinales). Así, es necesario
hacer una relación de variables, ítems y niveles de medición.
La matriz de consistencia.
3. La hipótesis
El problema sería:
¿Cómo el comercio electrónico influye en las exportaciones de textil carmelita
S.A.C del distrito de villa el salvador en el año 2017?
Para nuestro ejemplo, vamos a elegir el verbo infinitivo que va con el propósito del
estudio. En este caso el objetivo general sería:
Deben recordar que los indicadores son base para elaborar los ítems de los instrumentos
de recolección de datos.
Definición
Variable (s) Definición operacional Dimensiones Indicadores
conceptual
Métodos Análisis
financiero
Son los métodos que Pronóstico
a través de los financiero
PLANIFICACIÓN presupuestos Presupuestos Ventas
operativos permite Será medida a través
FINANCIERA operativos Costo de
alcanzar los de la revisión y
servicio
objetivos propuestos análisis documental
Compras
por la organización. de información
económica Gastos
Siendo de gran administrativos
importancia para el financiera de la
empresa. Gastos de
funcionamiento y la ventas
supervivencia de la Gastos
misma. financieros
cobranzas
Objetivos Corto plazo
Largo plazo
Recuerde que estos indicadores nos van a servir de base para elaborar los instrumentos
de recolección de datos, los ítems de revisión, el análisis documental y la obtención de
la información económica financiera de la empresa.
¿Cómo se relaciona la motivación laboral con el desempeño del personal asignado a los
Núcleos Distritales de Gestión Educativa de Morropón, 2019?
OE.1. Dimensión
PE.1. HE.1.
¿Cómo se relaciona Determinar la satisfacción
Existe relación
la dimensión relación entre la significativa entre la
intrínseca con el dimensión Intrínseca dimensión Intrínseca y
desempeño laboral con el desempeño
el desempeño laboral
del personal laboral del personal
del personal.
asignado a los asignado a los
Núcleos Distritales
Intrínseca. Estabilidad y
Variable N° 1: 5) Totalmente de Población:
beneficios del trabajo: 4
(4, 9, 11, 18). acuerdo. Constituida por los
4) De acuerdo.
Motivación 50 trabajadores
Ambiente social de 3) Indiferente
laboral. trabajo.(clima social 5 2) En desacuerdo. asignados a los
del entorno laboral : 1) Totalmente en Núcleos de Gestión
(1, 2, 5, 21,22). desacuerdo.
Educativa Local del
Promoción y ámbito de UGEL
reconocimientos: 5
(3, 7, 14, 16, 19) Morropón.
NIVELES:
Bajo ( )
Muestra:
Medio ( )
El 100 % de la
Alto ( ) población por ser una
Extrínseca
Características de la cantidad mínima de
tarea: 4
(10, 12, 13,20). estudio siendo un
total de 50
Autonomía e
independencia: trabajadores
(6, 15, 23). 3
asignados.
Conocimientos y
habilidades que
involucra la tarea: 3
(8, 17,24)
Eficiencia 6 5) Siempre
Uso de los Recursos:
laboral 4) Casi siempre
Compromiso 7
institucional:
(11,19, 21,25, 26, 27,28,)
Satisfacción con el
clima laboral: 4
(33, 43, 44,45).
¿En qué medida el PDP se relaciona con el desempeño laboral de los servidores de
UGEL Morropón 2019?
FORMULACIÓN
HIPÓTESIS OBJETIVOS VARIABLES E INDICADORES
DEL PROBLEMA
PROBLEMA HIPÓTESIS OBJETIVO Variable: PLAN DE DESARROLLO DE
GENERAL: GENERAL: GENERAL: PERSONAS
El PDP se relaciona Determinar en qué Escala de
Dimensiones Indicadores
significativamente medida el Plan de medición
¿En qué medida el con el desempeño Desarrollo de Diagnóstico de Matriz del
PDP se relaciona con laboral de los Personas – PDP se Necesidades de diagnóstico
el desempeño laboral servidores públicos relaciona con el Capacitación
de los servidores de de UGEL desempeño laboral (DNC)
UGEL Morropón Morropón, 2019. de los servidores (DNC)
2019? públicos de UGEL
HIPÓTESIS Morropón, 2019 Nivel de
ESPECÍFICAS: crecimiento
Desarrollo de
Nominal
Ordinal
n de
medida el Plan de
conflictos
Desarrollo de
Empatía
Personas – PDP se
Buen
relaciona con el trato al
logro de metas de Relaciones usuario
los servidores humanas
públicos de UGEL
Morropón, 2019. Orientaci
ón a los
usuarios
Planificac
ión
Logro de
metas Cumplim
iento de
normas.
Metas
alcanzadas
2.9. Baremacion.
Baremar es construir un baremo; esto es, una escala de puntuaciones obtenidas con un
instrumento de medida que permite su interpretación, mediante la atribución a cada una
de ellas de un determinado valor.
Procedimiento
1. Hallar los puntajes directos con respeto al total de cada uno de las variables y/o de
cada dimensión.
2. Determinar los percentiles los percentiles 20, 40, 60 y 80 en comparación al total de
datos.
3. Establecer los rangos para los niveles de desarrollo del total y para cada variable,
según lo siguiente (por ejemplo):
Menor o igual que el percentil 20 (muy bajo), entre los percentiles 21 y 40 (bajo),
entre los percentiles 41 y 60 (alto) y mayor que el percentil 80 (muy alto).
Ejemplo 2.18. Efectuar la Baremación para las variables del ejemplo 2.16.
Podemos utilizar el Software SPSS 20 para obtener la suma de los totales de ítems por
individuo, sus valores mínimo y máximo, y así como los valores de los percentiles P30 y
P80. Posteriormente realizar la baremacion para cada una de las variables y sus
dimensiones.
A continuación en la casilla = Expresión matemática hay sumar las variables que tienen
relación con la variable MOTIVACION LABORAL
Damos clic en aceptar y aparece la nueva variable con el nombre SUMA_ML, cuyos
valores corresponden a la suma de las variables consideradas en la expresión
matemática.
Estadísticos
SUMA_ML
N Válidos 50
Perdidos 0
Mínimo 70
Máximo 117
30 80,00
Percentiles
80 93,80
Con esta información de la última tabla, podemos construir valores de los rangos y su
respectiva categoría para los totales obtenidos (en la variable SUMA_ ML) en las 24
preguntas.
Rango Categoría
s
70 - 80 Bajo
81 - 93 Medio
94 - Alto
117
Ahora, tomando en cuenta las categorías debemos designar valores a los rangos o
intervalos que contienen a los valores de la variable SUMA_ML, mediante el SPSS.
Debemos seguir la secuencia:
80 Bajo
93 Mediano
SUPERIOR Alto
Note que 80 es límite superior de la categoría cuya etiqueta es: Bajo, 93 es el límite
superior de la categoría cuya etiqueta es: Mediano. En la casilla valor Superior (el SPSS
asume por defecto que es el valor máximo, en este ejemplo 117) y se etiqueta como:
Alto.
Las especificaciones de agrupación van a crear una variable que aparece en la vista de
datos.
Resulta: