Guia de Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 23

PRINCIPALES DEFINICIONES

1. ESTADÍSTICA

Ciencia que proporciona un conjunto de métodos y técnicas que se utilizan para


recolectar, organizar, presentar, analizar e interpretar el comportamiento de los
datos con respecto a una característica materia de estudio e investigación. En
primer lugar se encarga de obtener información, describirla y luego en base a esta
información, realizar predicciones y una óptima toma de decisiones frente a la
incertidumbre.

El objeto de estudio de la Estadística ES EL ESTUDIO DE LOS DATOS: Hacer una


inferencia óptima a partir de los datos, para la toma de decisiones.

1.1. DIVISIÓN DE LA ESTADÍSTICA: El campo de la estadística generalmente está


divido en dos grandes áreas: Estadística Descriptiva o Deductiva y Estadística
Inferencial o Inductiva.

1.1.1. ESTADÍSTICA DESCRIPTIVA:

Es el conjunto de métodos que implican la recolección, presentación y


caracterización de un conjunto de datos a fin de describir en forma apropiada
las diversas características de estas. Es decir, un estudio estadístico se
considera “descriptivo” cuando sólo se analiza y describe un conjunto
datos de una muestra o de una población sin sacar conclusiones de tipo
general.

1.1.2. ESTADÍSTICA INFERENCIAL:


La inferencia estadística es un conjunto de métodos o técnicas que posibilitan
la generalización o toma de decisiones en base a una información parcial
obtenida mediante técnicas descriptivas.

Es el conjunto de todos los individuos, objetos u observaciones que


poseen alguna característica observable en común. Conjunto
POBLACIÓN (N)
formado por todas las unidades de análisis (elementos) que son
cobertura de la investigación planteada
Es una parte o subconjunto representativo de la población que poseen
MUESTRA (n) la misma característica observable en común y al proceso de obtener
la muestra se le llama muestreo.

TIPOS DE MUESTREO. Pueden ser probabilísticos y no probabilísticos.

MUESTREO PROBABILÍSTICO.

Muestreo Aleatorio Simple.


Es el método de muestreo que asegura que cada una de las unidades de análisis tiene igual
probabilidad de ser incluida en la muestra, igualmente, cada una de las muestras posibles
tendrá la misma probabilidad de ser elegida; esta característica asegura la representatividad e
imparcialidad de la muestra elegida para el estudio.

1
Procedimiento:

Elabore el marco de muestreo.

Determine un tamaño de muestra “n”.

Seleccione “n” números aleatorios “sin reemplazo” de la tabla de números aleatorios o
generados por un computador.
 Recopile la información de cada una de las unidades de análisis seleccionadas.
 Estimar: Promedios, totales o porcentajes y su error estándar respectivo.
Ejemplo.
Población de alumnos matriculados en 5to. Año de secundaria (N). N = 7 154 alumnos1.
Conociendo la población de alumnos matriculados en 5to. Año de secundaria.
La muestra inicial estaría dado por:
Muestra inicial:
Z 2∗p∗q∗N
n0 = 2
e ( N−1 ) + Z2∗p∗q
Donde:
N = tamaño de la población. Entonces: N = 7 154
Z = Valor tabular de una distribución normal estandarizado, dado un nivel de confianza, con
probabilidad (1 – α). Para un 95% de nivel de confianza; entonces: Z = 1.96

Como se desconoce la probabilidad de éxito esperada, se tendría que utilizar el criterio


conservador (p = q = 0.5), lo cual maximiza el tamaño de muestra.
p = probabilidad de éxito. p = 0.5
(1-p) = q = probabilidad de fracaso. (1 – p) = (1 – 0.5) = 0.5
e = error de muestreo o precisión (Error máximo admisible) = 5%

Reemplazando:
1.962∗0.5∗0.5∗7 154
n0 = 2 2
=365 Alumnos
0.05 ( 7 154−1 ) +1.96 ∗0.5∗0.5

Muestra final corregida a encuestar:


n
n= 0
n0
1+
N

365
n= =347 Alumnos.
365
1+
7154
Se requeriría encuestar a no menos de 347 estudiantes del 5to año de secundaria para poder
tener una seguridad del 95%.
UNIDAD DE Es el elemento u objeto de la población que será analizado y sobre los
ANÁLISIS cuales se obtendrán los datos.
Son aquellas medidas que describen numéricamente las características de
PARÁMETROS. una población.
Ejemplo: La media poblacional (m), la desviación estándar poblacional
(s), la varianza poblacional (s² )
Son aquellas medidas que describen numéricamente las características de
ESTADÍGRA
una muestra. También conocido como estimador puntual. Por ejemplo: La
FOS.
media aritmética, la mediana (Me), la moda (Mo).
VARIABLE.
1
[Fuente:  MINISTERIO DE EDUCACIÓN - Censo Escolar./ http://escale.minedu.gob.pe/magnitudes]

2
Es una característica de la población que se va investigar y que puede tomar diferentes
valores.
Ejemplo.
Las horas extras trabajadas por los trabajadores de una empresa y los valores de esta
variable vendrían dadas por las diferentes horas trabajados por cada trabajador fuera de
la jornada normal: ninguna, una, dos, tres, ……….
Las variables se clasifican por su naturaleza en: cuantitativas y cualitativas.

VARIABLE CUANTITATIVA:
Es el resultado de un proceso que cuantifica, es decir, surgen cuando se puede establecer
cuanto o en qué cantidad se posee una determinada característica y es numérico.

Ejemplo:
Ingreso por familia
Número de ventas diarias de cierto establecimiento.
Longitud, tiempo, etc.
Las variables cuantitativas se dividen por su tipo en discretas y continuas.

VARIABLE CUANTITATIVA DISCRETA. Cuando el valor de la variable está


representado solo por números enteros (positivos).
Ejemplo.
El número de hijos por familia.
Número de estudiantes por colegio, universidad.
VARIABLE CUANTITATIVA CONTINUA. Cuando el valor de la variable puede
tomar cualquier valor dentro de un rango dado o intervalo dado, por tanto se expresa por
cualquier número real.
Ejemplo.
El peso, la estatura, la tensión arterial de las personas, los ingresos, el tiempo de servicio,
precio en soles, etc.
En general, todas las magnitudes relacionadas con el tiempo (edad, duración de un
fenómeno,...), la masa (volumen; peso,….), el espacio (longitud, superficie,…) o una
combinación de estos (velocidad, densidad, capacidad,…) son variables continuas.

VARIABLE CUALITATIVA.
Cuando la variable está asociada a una característica cualitativa. Es decir, son variables
cuyos valores son cualidades, categorías o atributos, que presenta la población.

Ejemplos.
Régimen de tenencia de la vivienda (Propia, Alquilada)

Estas variables se clasifican por su tipo en: Nominales y ordinales

VARIABLE CUALITATIVA NOMINAL: Son aquellos que establecen distinción de


los elementos en las categorías sin implicar orden entre ellos.
Ejemplo.
El sexo de una determinada persona
VARIABLE CUALITATIVA ORDINAL.
Son aquellos datos que agrupan a los objetos, individuos, en categorías ordenadas, para
establecer relaciones comparativas. Es decir, se puede establecer un orden entre sus
atributos o jerarquía.
Ejemplo.
Calidad de servicio del supermercado (Malo, Bueno, Muy Bueno, Excelente)
Nivel de educación (primaria, secundaria, superior).
PRÁCTICA.

3
1. Clasifique las siguientes variables según su naturaleza (cuantitativa, cualitativa) e identifique el tipo
de variable (nominal u ordinal), a la que pertenecen:

a. Diámetro en (cm) de tallo de plantas de cacao……Variable cuantitativa continua


b. El plantón de capirona es alta… Variable cualitativa ordinal
c. Número de mazorcas por planta de cacao…Variable cuantitativa discreta
d. El número de larvas encontrados en las plantas de sangre de grado… Variable cuantitativa
discreta
e. La producción anual de harina de plátano en kilos por hectárea en el Valle del Monzón Variable
cuantitativa continua
f. El contenido de látex de sangre de grado……Variable cuantitativa continua
g. Las variedades de cedro…Variable cualitativa nominal
h. El color de frutos de papaya……………………Variable cualitativa nominal
i. El número de hijuelos del bambú……Variable cuantitativa continua
j. La descarga del Río Monzón en el Huallaga…Variable cuantitativa continua
2. La oficina de gestión de calidad de la UNAS está realizando un estudio para conocer, según el
criterio de los profesores, que tan importante es la aplicación de un modelo de planeamiento de
largo plazo en la mejora de la calidad en las instituciones de educación superior. De los 200
profesores consultados, el 30% lo consideró poco importante, el 50% importante y el 20% muy
importante. Determine:

Población Todos los profesores

Muestra 200 profesores

Unidad de análisis El Profesor

Variable Modelo de planeamiento de largo plazo

Tipo de variable

3. Estudios realizados sobre la contaminación ambiental coinciden en que los principales causantes de
la contaminación del aire son la combustión en los vehículos con motores diesel y la falta de un
mantenimiento técnico. Para tener información cuantitativa de lo mencionado anteriormente, se
ha tomado una encuesta a una muestra de 30 choferes de la ruta Portada del Sol-Santa Anita (Línea
P) encontrándose los siguientes resultados:
 El número promedio de veces que los choferes realizan una revisión técnica a sus vehículos
es 1.36 veces al año.
 La ganancia promedio por día es de 97.73 nuevos soles
 20 choferes poseen un grado de instrucción secundario, 5 choferes poseen primaria
completa, 5 choferes poseen nivel universitario. Determine:

Población

Muestra

Unidad de análisis

Variable

Tipo de variable

4
ACTIVIDAD DE APRENDIZAJE I
Caso I:
1. Los siguientes datos pertenecen a una muestra aleatoria de 30 cibernautas de la
ciudad de Chimbote, según modo de conexión al chat a través de internet mediante una
encuesta realizada por la comunidad virtual Profesional de Marketing en enero del 2007.
C C T T T C C Cl O Cl
T T O Cl Cl Cl C Cl O Cl
C C Cl T O O Cl Cl Cl Cl

Donde:
C: “Casa” T: “Trabajo” Cl: “Cibercafé” O: Otros
a) Identificar la unidad de observación y la variable en estudio.
b) Construir una distribución de frecuencias absolutas y porcentuales.
c) Interpretar f3 y h4%
d) Construir un gráfico de barras simples para frecuencias absolutas.
e) Construir un gráfico de sectores y comentar.
Solución:
a)
 Unidad de observación: El cibernauta.
 Variable en estudio: modo de conexión al al chat a través de internet
b)
Distribución de cibernautas según el modo de conexión al chat a través de internet. Ciudad
de Chimbote. Enero de 2007.
Modo de
N° de cibernautas
conexión hi hi%
fi
(Xi)
Casa (C) 7 0.23 23%
Trabajo (T) 6 0.20 20%
Cibercafé (Cl) 12 0.40 40%
Otros (O) 5 0.17 17%
Total: 30 1.0 100%
Fuente: Encuesta – Comunidad Virtual Profesional de Marketing
c) Interpretación:
f3 = 12: Existen 12 de cibernautas de la ciudad de Chimbote que acceden al internet por el
modo de conexión a través de un Cibercafé.
h4% = 17%: Existe un 17% de los cibernautas de la ciudad de Chimbote que acceden al
internet por el modo de conexión a través de otras modalidades.
d)
Grafico N°03: Distribución de cibernautas según el modo de conexión al chat a través de
internet. Ciudad de Chimbote. Enero de 2007.

5
14
12
12

10

8
7
6
6
5

0
Casa (C) Trabajo (T) Cibercafé (Cl) Otros (O)
Fuente: Encuesta – Comunidad Virtual Profesional de Marketing.
e)
Grafico N°04: Distribución de cibernautas según el modo de conexión al chat a través de
internet. Ciudad de Chimbote. Enero de 2007.
Otros (O) Casa (C)
17% 23%

Cibercafé (Cl) Trabajo (T)


40% 20%

Fuente: Encuesta – Comunidad Virtual Profesional de Marketing.


Comentario:
Del gráfico se puede observar que existe un 40% de los cibernautas que acceden por el modo
de conexión al chat a través de internet desde un cibercafé y un 17% a través de Otros
medios en la Ciudad de Chimbote.

Caso II.
2. La siguiente tabla muestra la cantidad de clientes que entran en el horario de 14 a 15
horas en 60 importantes locales de ventas de automóviles de cierta ciudad:

0 2 5 0 1 4 1 0 2 1 5 0 1 3 0 0 2 1 3 1
1 4 0 2 4 1 2 4 0 4 3 5 0 1 3 6 4 2 0 2
0 2 3 0 4 2 5 1 1 2 2 1 6 5 0 3 3 0 0 4
a) Determinar la variable a analizar e indicar cuál es su Naturaleza y tipo de
variable.
b) Construir un cuadro de distribución de frecuencias relativas y relativas
porcentuales e interpretar el significado de la cuarta frecuencia.

Caso III.
3. Los siguientes datos corresponden a una muestra aleatoria de 20 trabajadores del
banco de crédito del Perú según sus retenciones al sistema privado de pensiones en
febrero del 2011.
100 200 150 160 179 130 135 150 155 158
180 190 170 175 120 115 140 139 145 144
Los datos fueron brindados por el departamento de personal de dicha institución.
Se pide:

6
a) Identificar la unidad de análisis y la variable en estudio.
b) Construya un cuadro de distribución de frecuencias ampliada. Utilice la regla
de Sturges.
c) Interprete f3, h3%, F3 y H3%.
d) Determinar qué porcentaje de trabajadores tienen una retención de 140 soles
o más, pero menos de 180 soles.
e) Determinar cuántos trabajadores tienen una retención de 160 a 200 soles.
f) Construir un histograma de frecuencias porcentuales y comente.
Solución.
a)
 Unidad de observación: El trabajador del BCP.
 Variable en estudio: Retenciones al Sistema Privado de Pensiones (SPP).

b) Procedimiento para la construcción de cuadros de frecuencia, cuando la variable


Cuantitativa Continua.
Paso 1: Determinamos el Rango.
Rango (R) = Valor Máximo – Valor R = 200 – 100 = 100
Mínimo
Paso 2: Determinamos el Número de intervalos (m), Aplicando la regla de Sturges:
N° de intervalos (m) = 1 + m = 1+ 3.322*log(20) = 5.293 ≈ 5
3.322*log(n)
Paso 3: Determinamos la Amplitud (C).
Amplitud (C) = C = 100/5 = 20
R/m

Cuadro N° 01: Distribución de los trabajadores según sus Retenciones al Sistema Privado de
Pensiones (SPP). Banco de Crédito del Perú. Febrero de 2006.
[Li – Ls> Xi fi Fi hi Hi hi% Hi%
[100 – 120> 110 2 2 0.10 0.10 10% 10%
[120 – 140> 130 4 6 0.20 0.30 20% 30%
[140 – 160> 150 7 13 0.35 0.65 35% 65%
[160 – 180> 170 4 17 0.20 0.85 20% 85%
[180 – 200] 190 3 20 0.15 1.0 15% 100%
Total: 20 1.0 100%
Fuente: Departamento de personal del BCP.

c) Interpretación:
f3 = 7: Existen 7 trabajadores que sus retenciones al Sistema Privado de Pensiones se
encuentran de 140 soles a más y a menos de 160 nuevos soles.
h3% = 35%: Existe un 35% de los trabajadores que sus retenciones al Sistema Privado de
Pensiones se encuentran de 140 soles a más y a menos de 160 soles.
F3 = 13: Existen 13 trabajadores que sus retenciones al Sistema Privado de Pensiones se
encuentran de 100 soles a más y a menos de 160 soles.
H3% = 65%: Existe un 65% de los trabajadores que sus retenciones al Sistema Privado de
Pensiones se encuentran de 100 soles a más y a menos de 160 soles.

d) [ 140 – 180>: Entonces el porcentaje de trabajadores = 35% + 20% = 55%.


e) [ 160 – 200]: Entonces el N° de trabajadores = 4 + 3 = 7 Trabajadores.
f) Histograma.

Gráfico N° 01: Distribución porcentual de los trabajadores según sus Retenciones al Sistema
Privado de Pensiones (SPP). Banco de Crédito del Perú. Febrero de 2006.

7
35%
35%

30%

25%
20% 20%
20%
15%
15%
10%
10%

5%

0%
[100 – 120> [120 – 140> [140 – 160> [160 – 180> [180 – 200]

Fuente: Departamento de personal del BCP.

Comentario:
Del gráfico se puede observar que existe un 35% de los trabajadores que sus retenciones al
Sistema Privado de Pensiones se encuentran de 140 soles a más y a menos de 160 soles y
existe un 10% de los trabajadores que sus retenciones al Sistema Privado de Pensiones se
encuentra de 100 soles a más y a menos de 120 soles.
PRÁCTICA. 02

RECOPILACIÓN DE DATOS.

ENCUESTA A AGRICULTORES DE LA PROVINCIA DE LEONCIO PRADO.

Numero de encuesta: …………………

1. Nombre del encuestado:……………………………………………………………………………………..


2. Lugar de evaluación: Coordenadas UTM Este:…………………. Norte:…………………..
3. Clase textural del suelo
Arcilloso Limoso F. Arenoso Arenoso
4. Calidad de suelo.
Muy Bueno Bueno Regular
5. Indique el número de objetos(sólidos) flotantes por minuto en el rio:……………………...
6. Medir el caudal del rio en m3/segundo:………………………………
7. Color de agua
Claro Oscuro
8. Porcentaje de carbono:………………………….
9. Ph:…………………………..

8
MATRIZ DE DATOS

Después de realizar las mediciones y encuesta, mediante muestreo aleatorio simple, en parcelas de
35 agricultores acerca de algunas variables de la zona, en la Provincia de Leoncio Prado, se
obtuvieron los siguientes resultados.

N_muestr C_textura C_suel N_solido Cauda C_agu p_car


a l o s l a b ph
4.
1 2 3 2 30.0 1 1.6 9
3.
2 1 1 1 35.3 1 1.3 8
3.
3 1 1 3 48.4 2 0.9 6
3.
4 1 2 3 50.1 2 0.9 1
5.
5 1 1 1 55.3 1 1.4 2
5.
6 3 3 2 57.2 2 1.4 0
4.
7 1 2 3 58.1 1 1.0 7
4.
8 2 1 1 60.4 2 0.9 3
4.
9 2 1 2 65.3 2 1.6 6
4.
10 1 1 0 66.0 2 1.2 5
4.
11 1 1 2 68.0 2 0.7 3
4.
12 3 2 1 69.1 1 0.5 0
4.
13 3 1 3 70.2 1 2.2 1
4.
14 1 2 0 72.5 2 1.9 3

9
3.
15 1 1 2 73.1 2 1.2 7
3.
16 1 1 1 75.3 2 0.4 8
5.
17 1 3 3 77.2 2 1.6 1
4.
18 1 1 0 79.1 1 0.4 9
4.
19 1 1 2 82.7 1 0.3 6
4.
20 2 2 3 84.3 1 0.2 1
5.
21 2 2 2 86.0 2 2.3 3
5.
22 1 1 3 90.3 1 1.3 0
4.
23 1 2 2 95.2 1 1.2 7
4.
24 3 1 2 100.1 1 0.7 5
5.
25 1 1 3 101.2 1 2.1 3
5.
26 1 1 4 102.2 2 1.4 5
5.
27 3 3 2 102.2 1 0.8 8
5.
28 1 2 4 104.2 1 0.8 7
4.
29 1 1 3 110.1 2 1.1 9
4.
30 1 1 2 115.3 1 1.0 9
4.
31 1 2 3 118.4 1 0.8 7
4.
32 1 2 4 119.1 2 0.8 6
5.
33 1 1 3 125.1 1 1.9 3
5.
34 2 2 2 130.2 1 0.7 1
5.
35 2 1 4 140.0 2 0.6 1

Solución:

10
Del
PASOS PARA AGRUPAR DATOS Función en Excel
Ejemplo
Tamaño de muestra: ( n ) = CONTAR(Seleccionar BD[1])  
Valor Máximo = MAX()  
Valor Mínimo = MIN()  
Rango (R)= Valor Máximo - Valor Mínimo  
Aplicando la regla de STURGES:    
Nº de intervalos (m) = 1+3.3*log (n)  
m redondeado = REDONDEAR()  
Amplitud (C ) = R/[m = redondeado]  

Cuadro N° 01:

mi [Li Ls > Xi fi Fi hi Hi hi% Hi%


                 
                 
                 
                 
                 
                 
Total.      
Fuente:

Gráfico N° 01:

Determine e interprete:

Xi fi (Xi * fi) ~ Promedio muestral ( X́ ¿.


   
   
   
   
   
   
   
Apellidos y

   
n

∑ ( Xi ¿¿ fi) ¿ =  
i=1

nombres:Adrian Eduardo V.
11
n

∑ ( Xi ¿¿ fi)
X́ = i=1 ¿ ~ Media armónica ( X́ h)
n

X́ =¿ ¿ n n
X h= =
f 1 f2 f m
fi
Interpretación:
+ +. . ..+ m
x 1 x2 xm ∑
i=1
( ) xi

X́ h= ________________________
~ Mediana muestral (Me): Interpretación:
n
Me=L +
( 2
−F )
∗C
i−1

i i
fk

Me=¿ ¿

Interpretación:

~ Moda muestral (Mo):

d1
Mo=Li +
[ ]
d 1+ d 2
∗Ci

Donde: d 1=( f i−f i−1 )


d 2=( f i−f i +1)
~ Varianza Muestral ( S2 ):
Mo = __________________
…………………………………………Grupo………… n
∑ ( X i −X ) 2∗f i
Interpretación: S 2 = i=1
n−1

S2 = ____________________
Interpretación:

~ Media geométrica ( X́ G ):

X́ G =anti log ¿

X́ G =¿ ______________________  Desviación estándar (S):

Interpretación: S= √ S2
S= _______________________

Interpretación:

12
Coeficiente de variación porcentual
(CV%):

S
CV %= ∗100
X
Interpretación:

Construya los siguientes cuadros de


distribución de frecuencias para la
variable:

Práctica 3
Muchas de las personas que invierten en bolsa lo hacen para conseguir
beneficios rápidos, por ello el tiempo en que mantienen las acciones es
relativamente breve. Preguntada una muestra de 35 inversores habituales sobre
el tiempo en meses que han mantenido sus últimas inversiones se recogieron
los siguientes datos

30. 65. 79. 100. 115. 58. 57. 86.


50.1 69.1 75.3
0 3 1 1 3 1 2 0 140
35. 66. 82. 101. 118. 60. 72. 90. 104. 125.
55.3 70.2
3 0 7 2 4 4 5 3 2 1
48. 68. 84. 102. 119. 73. 95. 102. 130. 77. 110.
4 0 3 2 1 1 2 2 2 2 1  
Construya una tabla de frecuencias que recoja adecuadamente esta
información, y haga también alguna representación gráfica.
Solución.

PASOS PARA AGRUPAR DATOS Función en Excel Del Ejemplo


Tamaño de muestra: ( n ) = CONTAR(Seleccionar BD[1]) 35
Valor Máximo = MAX() 140.0

13
Valor Mínimo = MIN() 30.0
Valor Máximo - Valor
Rango (R)=
Mínimo
110.0
Aplicando la regla de STURGES:    
Nº de intervalos (m) = 1+3.3*log (n) 6.095425
m redondeado = REDONDEAR() 6.00
Amplitud (C ) = R/[m = redondeado] 18.3

mi Li Ls Xi fi Fi hi Hi hi% Hi%
1 30.0 48.3 39.2 2 2 0.06 0.06 6% 6%
2 48.3 66.7 57.5 8 10 0.23 0.29 23% 29%
3 66.7 85.0 75.8 10 20 0.29 0.57 29% 57%
4 85.0 103.3 94.2 7 27 0.20 0.77 20% 77%
5 103.3 121.7 112.5 5 32 0.14 0.91 14% 91%
6 121.7 140.0 130.8 3 35 0.09 1.00 9% 100%
Total: 35 1.00 100%

12
10
10
8
8 7
6 5
4 3
2
2

0
1 2 3 4 5 6
Ejercicios propuestos

1. De las siguientes Variables, Identifique la naturaleza y tipo de variable:


1.1. Peso del contenido de un paquete de cereal……………………………………………….
1.2. Número de artículos defectuosos producidos……………………………………………..
1.3. Número de individuos en un área geográfica que reciben beneficios de desempleo……..
1.4. Unidades de un artículo en un inventario…………………………………………………
1.5. Número de componentes ensamblados defectuosos………………………………………
1.6. Tiempo transcurrido antes de la primera falla de un aparato……………………………...
1.7. Nivel de estudios de una determinada persona……………………………………………
1.8. Tipo enfermedad en un plantón de Cacao………………………………………………...

2. La altura de diámetro de pecho de capirona se organizaron en una distribución de


frecuencia, cuyos resultados incompletos se dan en la siguiente tabla:
Marca de clase Frecuencia relativa simple Frecuencia relativa
[Li Ls>
Xi hi acumulada Hi

14
0.15
6 0.45
0.70
13.5
0.10
Total

3. Los siguientes datos corresponden a la inversión real anual en miles de dólares de un grupo
de pequeñas empresas. Completar la siguiente tabla de distribución de frecuencia.
[ Li - Ls > Xi fi Fi hi Hi
[20 - 24 > 0.10
[24 - 28 > 0.25
[ - 32 > 11 0.55
[32 - > 0.85
[ - 40] 1
Total
a) Identificar la unidad de análisis y la variable en estudio.
b) Interpretar el f4 y el h4%.

4. En base a la siguiente información que corresponden a la inversión real anual en miles de


dólares de un grupo de pequeñas empresas. Construir la tabla de distribución de frecuencia.
X2=550; X5=850; h6 =2/50 = H1; m=6; h2=0.14; H4 = 0.76; h5=0.20; H3-h2 =0.26 y c =
constante
a) Reconstruir la tabla de frecuencias e intérprete los puntos más importantes.
b) Calcule e interprete la desviación estándar, mediana y moda.

5. En una tabla de distribución simétrica con siete intervalos de clase de igual longitud, se
conocen los datos siguientes: C =10, f 1=8 y X3*f3=1260; f2 + f5 = 62; h3=0.21, H6 =
0.96.
Reconstruir la tabla de frecuencias y determinar la media geométrica.

6. Sabiendo que la siguiente tabla de frecuencias, es simétrica, completar con los datos, dados.
Si además se sabe que la mediana es igual a 27.5. Reconstruir la tabla de frecuencias y
calcular la media aritmética.
[Li Ls> Xi fi Fi hi Hi

0.2
0.65

50 0.95

Total 60

7. Los intervalos y las frecuencias absolutas de los salarios quincenales de 45 empleados


desarrollan en el cuadro siguiente:

Intervalos Frecuencias
de salarios
Absolutas Acumulada Relativas Porcentual
($)
fi Fi hi hi%
[Li - Ls>

15
[26 - 34> 1 0.022 2.2%
[34 - 42> 2 0.044 4.4%
[42 - 50> 4 0.089 8.9%
[50 - 58> 10 0.222 22.2%
[58 - 66> 16 0.356 35.6%
[66 - 74> 8 0.178 17.8%
[74 - 82] 4 0.089 8.9%
Total: 45 1.000 100.0%
g) Calcule el porcentaje de empleados que tienen salarios entre $52 y $75.
h) Obtenga el salario que divide en dos partes iguales.

8. La tabla muestra la distribución del ingreso familiar correspondiente a 80 familias.


Reconstruir la tabla de distribución de frecuencias en intervalos de clases
[ Li −Ls ) fi Fi hi
160 – 170
170 – 180 48 60
180 – 190 0.125
190 – 200 0.075
200 – 210
Total:
a) Construir la tabla de distribución de frecuencias.
b) Elabore su gráfica respectiva.
c) Determinar el número de familias que ganan menos de 195 nuevos soles.
d) ¿Cuántas familias tienen ingresos de 173 a 205 nuevos soles?
9. Se tiene la siguiente distribución simétrica.
[ Li −Ls ) fi Fi hi
- 8
12 -
- 1/5
- 24 17
-
Si el ancho de clase es constante. ¿Cuántos datos habrá en el intervalo [12 – 20>?

10. Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200


familias.
[ Li −Ls ) fi Fi
- 12
- 270
- 300 30 90
- 126
330 -
- 50
¿Cuántas familias tienen un ingreso comprendido entre 260 y 320?

11. En una prueba de estadística se evaluaron a “n” estudiantes y se obtuvo el


siguiente cuadro estadístico.
Marc
6
a de 45 55 75 85
5
clase

16
Frecu
2n 3n/ n/ 3n n/
encia
/2 10 5 /5 10
relativ
5 0 0 0 0
a
¿Qué porcentaje de estudiantes obtuvieron una nota menor que 60 puntos o mayor
o igual a 80 puntos?
12. Dado el siguiente cuadro estadístico referente a los pesos de cierto número de
pacientes en un hospital.
[ Li −Ls ) f i
0 – 12 5
12 – 24 24
24 – 36 18
36 – 48 36
48 - 60 17
¿Cuántos pacientes pesan más de 19 y menos de 38 kilos?
13. En una investigación agrícola en Tulumayo- Tingo María, en Julio de 2011, se determinó la
producción total (en kilogramos) de un cierto cultivo, el cual fue sembrado en parcelas
experimentales. Los datos se tabularon en una distribución de frecuencias simétrica de cinco
intervalos de igual amplitud, siendo las frecuencias: f4 – f5 = 10, f4 – f3 – f1 = 0, el límite
superior en el cuarto intervalo por f4 es igual a 975, el límite inferior en el primer intervalo
es igual a 12.5 y n = 110.
i) Reconstruir el cuadro de frecuencias.
j) Calcular e interpretar la mediana (Me), moda (Mo).

14. Las notas de 50 alumnos de la UNAS – Tingo María, se clasifican en una tabla de
distribución de frecuencias con cuatro intervalos de clase de igual amplitud. Sabiendo
además que: X2 = 50, f1 =4, F2 = 20, f3 = 25, x́ = 62.4.
k) Calcular e interpretar la mediana (Me).
l) Determine la proporción de estudiantes cuyos puntajes se encuentran por lo
menos de 35 puntos, pero a lo más 65 puntos.

15. Un ingeniero agrónomo visita 25 cooperativas agrarias de naranjas en la ciudad de Tingo


María y en cada uno anotó el número de plantas atacadas por cierto hongo de la cual
resultaron los siguientes datos:
1 20 25 15 16 1 18 18 16 19 1 17 18
5 8 7
1 18 15 18 17 2 18 19 17 16 1 19
9 0 7
m) Identifique la variable en estudio y el tipo de variable.
n) Construya un cuadro de distribución de frecuencia adecuada a este conjunto
de datos.
o) ¿Cuántas cooperativas agrarias tiene a lo más 20 plantas atacadas por
hongos?
p) ¿Cuántas cooperativas agrarias tienen por lo menos 17 plantas atacadas por
hongos?
q) ¿Qué proporción de cooperativas bajo estudio tienen 18 plantas atacadas por
hongos?
r) ¿Qué proporción de cooperativas tienen 18 o menos plantas atacadas por
hongos?

17
s) ¿Qué porcentaje de cooperativas tienen 18 o menos plantas atacadas por
hongos?

16.Completar la siguiente tabla:

[Li-1, Ls> Xi fi Fi hi Hi
[0,10>   2 2 0.05 0.05
[10,20>         0.15
[20,30>         0.4
[30,40>   15     0.775
[40,50]         1
Total:        
17.Construya la tabla de frecuencias relacionada con el siguiente gráfico, donde se
resumen datos recogidos sobre 50 personas

0.6
0.5
0.5
0.4
0.3
0.2 0.2
0.2
0.1
0.1
0
0–1 1–2 2–3 3–4

18.Construye la tabla de frecuencias a partir del siguiente gráfico de frecuencias


absolutas acumuladas, sabiendo que tenemos una variable discreta.
35
30
30
25
25
20
20
15
15
10 10
10
5
5
0
2 3 4 5 6 7 8

19.Se desea realizar un estudio sobre el número de hijos por familia en la


provincia de Leoncio Prado.
- Población: familias de Ciudad Real.
- Individuo: cada una de las familias.
- Muestra: elegimos una muestra aleatoria (al azar) de 1000 familias
distribuidas por toda la provincia.
- Tamaño de la muestra: 1000
- Variable: número de hijos. Es una variable cuantitativa y discreta.

18
20.El gobierno desea saber si el número medio de hijos por familia ha descendido
respecto a la década anterior. Para ello ha encuestado a 50 familias respecto al
número de hijos y ha obtenido los siguientes datos:

2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1

a) Construye la tabla de frecuencias a partir de estos datos.


b) ¿Cuántas familias tienen exactamente tres hijos?
c) ¿Qué porcentaje de familias tienen exactamente 3 hijos?
d) ¿Qué porcentaje de las familias de la muestra tienen más de dos hijos?
¿Y menos de 3?
e) Construye el grafico que consideres más adecuado con las frecuencias no
acumuladas
f) Construye el gráfico que consideres más adecuado con las frecuencias
acumuladas.

Práctica en Laboratorio.

21. El diámetro en (mm) de algunos árboles de dos tipos de bosque, fue medido en un
inventario forestal, en el parque nacional de la ciudad de Tingo María en octubre del 2017,
se muestran en la siguiente tabla:
Bosque A
26 15 18 25 18 28 31 29 28 26 17 19 31 15 28 19
21 23 14 20 28 24 23 26 27 19 18 17 20 27 30 23
31 20 22 17 32 17 28 27 27 20 30 30 29 32 32 31
32 20 22 14 30 17 28 17 23 24 28 21 23 23 19 27
15 29 14 21 25 17 24 18 17 18 25 21 29 28 21 24
16 25 28 25 31 27 16 32 18 23 25 14 25 29 30 25
24 29 20 20 19 28 16 17 22 28 32 19 26 16 26 15
14 30 22 14 19 25 20 20 20 29 22 18 28 29 28 25
31 19 16 29 27 26 19 17 15 23 25 20 19 18 15 31
24 31 19 17 16 32 17 31 21 25 21 28 30 30 22 20
23 25 20 17 21 18 28 25 22 14 32 14 17 20 17 19
17 31 24 21 22 15 19 15 24 29 29 17 24 21 16 23
29 16 16 15 31 28 20 22 26 21 22 21 26 31 17 19
26 31 21 24 25 14 25 25 18 14 25 26 20 32 16 17
22 23 25 24 17 30 30 24 24 32 25 20 18 14 31 21
17 28 26 23 17 19 21 21 20 27 21 27 19 24 19 15

Bosque B
26 19 19 18 22 30 19 26 21 32 21 20 14 18 29
29 16 23 29 14 19 23 30 22 25 16 16 23 17 27
21 14 14 26 31 23 30 14 26 18 16 23 17 14 19
24 29 27 18 19 27 22 23 23 16 18 19 24 18 32
22 25 23 20 32 28 26 18 21 29 16 28 21 18 17
16 25 18 21 24 16 25 32 23 32 24 20 22 32 17

19
29 29 22 28 22 15 19 29 24 24 23 16 16 23 27
23 16 26 15 25 15 22 19 25 18 28 14 14 25 18
17 29 29 21 23 21 21 23 23 25 27 16 16 24 28
15 20 21 20 22 29 24 32 30 17 15 25 32 27 17
17 22 25 14 22 22 24 17 22 14 16 29 29 20 32
17 27 25 15 22 16 25 16 29 24 21 26 24 28 19
27 24 28 19 29 25 16 27 28 31 26 19 29 27 30
22 29 28 30 14 17 23 20 21 18 21 28 30 20 16
16 23 26 28 29 24 16 25 17 30 28 16 15 19 24
26 22 32 14 25 24 17 21 20 14 17 28 19 31 28
Determine e interprete, las medidas de tendencia central y dispersión para la variable de
interés.

22. Fueron tomadas dos muestras de tamaños iguales de observaciones, de


crecimiento de pseudobulbo, en cm, de la especie de orquídea Laelia purpurata, bajo
condiciones de luminosidad (con luz directa y con luz indirecta). Los datos se presentan en
la tabla siguiente:
3 5 8 3 12 12 11 12 15 2 2 14 9 14 4 12 12 12 3 18
3 8 8 14 6 15 12 13 11 16 11 9 8 18 18 4 11 7 5 17
2 16 13 7 13 14 7 7 12 12 11 9 15 17 3 8 10 4 18 4
Luz 18 9 9 6 14 17 14 9 12 18 12 8 9 8 10 12 4 13 4 8
directa 18 3 9 7 18 4 7 15 3 2 6 4 5 4 2 15 5 5 18 12
2 2 16 16 12 9 5 14 17 10 4 11 14 15 14 13 11 16 9 3
12 8 13 13 17 17 11 9 11 12 13 2 4 6 11 9 3 3 10 18
12 14 11 15 10 5 14 14 8 15 16 5 18 3 16 12 17 12 8 7

12 13 16 20 13 15 26 16 4 12 17 22 24 5 2 26 2 24 15 8
20 12 15 23 26 13 15 26 16 3 18 21 23 11 12 17 13 20 2 11
6 24 23 12 5 21 22 16 11 19 18 4 11 12 11 19 5 4 13 10
Luz 18 6 13 7 15 2 15 10 25 11 4 7 13 17 4 12 24 24 4 25
indirecta 10 16 24 18 19 23 13 11 12 17 2 23 21 20 9 6 23 25 6 5
26 21 25 9 17 2 22 2 17 24 9 7 14 3 15 20 10 13 4 5
13 4 26 7 8 16 3 22 5 13 12 23 8 16 2 23 5 16 19 4
12 25 17 5 16 19 14 18 6 18 10 13 9 26 7 3 8 13 18 3
Los datos fueron brindados por el MINAG en agosto del 2017.

Determine, las medidas de tendencia central y dispersión para la variable de interés.

22. La siguiente información presenta los resultados observados, del número de plántulas de
malezas por m2 en una muestra aleatoria.
5 8 4 7 4 3 4 7 5 7 4 3 4 7 4 3 4 7 5 7 4 4
7 5 3 5 8 4 7 4 7 5 8 4 7 5 8 4 7 4 7 5 3 3
1 4 5 8 1 4 5 8 5 8 1 4 5 8 1 4 5 8 5 8 1 1
1 1 4 5 8 1 4 5 8 5 8 1 4 5 8 1 4 5 8 5 8 4
9 7 5 3 5 8 4 7 4 7 5 8 4 7 5 8 4 7 4 7 5 5
5 1 4 5 8 1 4 5 8 5 8 1 4 5 8 1 4 5 8 5 8 8
4 7 5 3 5 7 5 3 5 3 5 7 5 3 5 7 5 3 5 3 5 5

20
Los datos fueron obtenidos del banco de germoplasmas de la UNAS en junio del 2017.
a) Determine e interprete: la media, mediana y moda.

23. Cinco pluviómetros fueron distribuidos en una cuenca hidrográfica de 19.4 km2. El área de
influencia de cada pluviómetro y la precipitación pluvial (en mm) reportada por cada uno
de ellos, se presenta en el cuadro siguiente:
Pluviómetro Precipitación (mm) Área (Km2)
1 1200 1.2
2 1350 5.4
3 1412 4.9
4 1387 3.7
5 1296 4.2
Calcule la precipitación pluvial promedio de la cuenca hidrográfica

24. De una plantación de Eucalyptus grandis, plantada en un área de 800 ha, se desea saber
cuántas parcelas de 420 m 2 deben ser muestreadas. Inicialmente fueron medidas 34
parcelas (muestra piloto), en la tabla siguiente se presentan los volúmenes (expresados en
m3/parcela) obtenidos.
Parcela Volumen (m3) Parcela Volumen (m3) Parcela Volumen (m3)
1 5.68 13 6.66 25 12.15
2 5.23 14 7.80 26 11.65
3 5.67 15 8.95 27 12.55
4 5.22 16 8.50 28 7.00
5 5.50 17 8.12 29 7.97
6 7.00 18 7.95 30 7.11
7 6.50 19 8.55 31 7.34
8 6.80 20 8.11 32 7.71
9 6.40 21 11.90 33 7.41
10 6.03 22 12.40 34 7.57
11 6.23 23 12.00
12 7.78 24 12.23

Calcule las medidas de tendencia central y de dispersión para datos sin agrupar. Contruya
un box plot y discuta los resultados los resultados, en términos prácticos.

25. Un estudiante de la escuela profesional de forestales de la FRNR, está realizando un


diagnóstico de una comunidad del municipio de Leoncio Prado. Consulta los archivos del
puesto de salud de la comunidad y anota el número de hijos por familia que ha utilizado el
puesto. Los datos son los siguientes:

3 4 3 4 5 1 6 3 5 5 5 5 6 11 10
4 5 3 4 3 3 4 3 1 2 3 1 5 2 2
a) Determine e interprete: la media, mediana y moda.

21
26. Los rendimientos comerciales de frutos de tomate (expresados en Kg/ha) en parcelas
experimentales localizados en el valle del Monzón, son presentados en la siguiente tabla:
22 12 21 14 11 10 12 14 22 23 12 22 23 16 22 19 16
7 3 4 2 3 6 5 0 2 3 2 6 1 6 0 7 6
13 16 20 10 14 15 19 19 14 16 22 13 18 15 14 23 17
2 5 3 4 7 6 2 7 3 7 1 1 8 7 8 2 2
12 10 13 22 10 16 12 14 12 11 20 16 15 16 14 22 12
8 3 3 4 4 3 0 5 8 8 9 5 2 4 5 5 5
16 19 11 23 19 18 20 19 10 10 20 13 16 23 23 11 21
6 4 0 0 3 4 1 4 7 2 1 3 0 8 7 4 9
19 20 19 13 19 22 16 10 12 13 11 22 20 20 18 10 12
7 1 6 7 6 3 1 9 5 7 7 6 7 1 0 3 4
18 13 22 13 11 20 23 12 20 15 23 20 23 17 21 15 14
5 0 4 0 7 3 7 0 9 9 2 4 5 4 2 4 2
12 10 10 17 20 15 18 22 11 12 20 19 17 15 20 23 18
3 2 4 3 1 1 9 8 0 0 5 3 7 1 8 7 1
15 15 11 18 14 20 15 12 12 13 14 19 12 22 15 16 18
6 0 3 0 1 8 9 6 9 6 7 0 7 6 9 0 2
14 22 10 15 13 12 16 23 19 19 18 10 16 13 16 15 18
2 6 2 0 6 9 9 5 8 5 2 9 6 4 3 0 3
16 10 15 10 13 17 12 22 20 19 19 23 13 16 23 10 20
2 9 1 3 9 4 9 1 1 8 1 2 3 2 8 5 5
Determine, las medidas de tendencia central y dispersión para la variable de interés.
Realice un histograma con su respectiva ojiva e interprete.

27. A continuación, se presenta la distribución por clase diamétrica del número de árboles por
hectárea de dos especies de pino. P. maximinoii H.E Moore y P. caribaea Morelet:

Calcule las medidas de tendencia central y de dispersión, compare y analice ambas


distribuciones. Además, construya un histograma y un polígono de frecuencias para ambas
distribuciones.

22
28. Se toman muestras aleatorias de tamaño n = 100 de cada uno de tres estadios larvales de
una especie de polilla forestal. Cada individuo es pesado y los resultados se presentan en la
tabla siguiente:

Tabla 01: Peso (mg) de 100 larvas de cada estadio de una polilla forestal
Estadio 1 Estadio 2 Estadio 3
0.47 2.87 0.06 2.40 4.85 3.09 22.74 7.96 10.03
0.05 0.24 0.63 3.48 4.46 9.22 3.63 11.19 4.54
0.25 0.00 0.86 3.69 10.67 5.28 8.17 15.34 10.88
1.43 0.00 0.00 5.35 1.75 2.25 9.82 5.14 4.68
0.49 0.28 0.04 3.01 0.92 2.19 7.59 11.01 5.32
4.52 0.39 0.00 1.98 1.46 3.97 8.33 7.48 14.40
2.92 1.06 0.47 1.88 4.51 4.15 12.49 10.19 10.83
0.14 0.11 0.12 12.47 2.35 2.81 7.74 10.95 5.54
1.76 1.00 0.07 11.24 5.47 3.75 23.73 12.87 9.75
0.18 0.01 2.94 5.43 4.07 0.73 6.79 13.67 6.51
0.69 0.37 0.92 7.29 14.67 2.59 8.28 7.56 9.93
0.00 0.56 0.03 3.88 1.40 3.83 6.46 9.12 9.10
0.20 1.20 0.01 4.19 5.07 2.92 11.99 10.93 11.80
0.75 0.40 0.05 3.34 3.43 6.40 14.52 22.87 15.05
3.02 3.77 0.76 11.69 9.01 5.50 18.25 4.57 12.49
0.29 0.28 0.39 2.98 6.09 7.22 13.62 11.30 5.48
1.68 0.46 1.06 1.36 5.31 5.60 8.74 8.56 6.68
0.37 0.31 0.84 2.97 9.54 4.29 8.53 3.93 10.45
0.06 0.84 0.12 1.93 7.55 4.68 9.61 23.12 11.35
0.72 0.91 0.51 3.84 8.33 2.32 2.83 5.44 9.58
0.09 0.23 1.87 2.33 2.89 3.93 13.69 14.41 5.56
0.10 0.06 0.75 3.02 4.64 5.11 10.83 2.63 8.52
0.69 0.27 0.03 5.02 9.59 3.03 8.10 6.52 7.73
0.00 1.87 1.80 6.25 7.13 3.46 9.49 17.35 7.02
0.77 1.26 0.56 9.29 3.29 2.05 3.16 10.24 5.56
0.10 0.82 0.85 2.83 7.16 1.67 10.64 12.34 16.14
0.14 0.00 0.05 6.31 0.35 4.45 5.13 6.81 10.95
0.90 0.00 0.05 1.61 2.81 3.47 10.18 4.17 5.22
0.00 1.57 0.53 5.89 9.33 5.76 4.18 8.38 11.05
1.25 0.04 0.02 6.49 3.01 1.75 6.04 4.87 20.70
2.50 0.36 0.01 8.35 6.65 1.97 17.87 5.46 10.24
2.05 0.01 0.04 4.22 6.44 9.41 5.97 10.45 7.97
1.82 0.20 2.95 5.94 5.18 17.90
1.76 0.00 2.61 5.43 10.19 3.44

a) Construya una tabla de frecuencias para datos agrupados.


b) Construya un histograma y un diagrama de caja y bigotes.
c) ¿Qué valor de la variable es superado por el 50% de las observaciones?
d) ¿Cuál es el valor de la variable que se presenta un mayor número de veces?
e) Utilice todos los datos y la tabla de frecuencias para encontrar la media, la
desviación estándar y el coeficiente de variación de los pesos de las larvas.
f) ¿Cuál es la distribución que siguen los pesos de las larvas?

23

También podría gustarte