1 Pra-Proba1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Universidad Católica Boliviana "San Pablo"

Probabilidad y Estadística I
Práctica No.1
Yuri Miranda Gonzáles
Agosto 2020

Contenido
1 Introducción a la Estadística y Análisis de datos 1
1.1 Experiencia con R, descripción de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Probabilidad 4
2.1 Experiencia con R, probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3 Variables Aleatorias 5
3.1 Experiencia con R, variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1 Introducción a la Estadística y Análisis de datos


1. Con relación a la bibliografía proporcionada: "Probabilidad y estadística para ingeniería y ciencias",
Walpole Myers, realizar los siguientes ejercicios: 1.13 a 1.19 (no realizar el ejercicio 1.15).
2. Indique, si cada una de las siguientes variables es cualitativa (de cadena) ó cuantitativa (numérica)
y también especi…car la escala de medición (nominal, ordinal, discreta o continua). a) Número de
mensajes de correo electrónico enviados diariamente por un plani…cador …nanciero; b) Costo efectivo
de los libros de texto de un estudiante para un semestre; c) El coto de su factura mensual de electricidad.
d) Las categorías de licencia de conducir e) Peso del …erro para un puente de 200(m) en la ciudad. f)
Número de artículos publicitados en internet para una empresa. f) Edad de una persona con: i) de 0 a
10 años ii) de 11 a 20 años iii) de 21 a 30 años iv) mas de 40 años.
3. Se tiene la boleta de la encuesta respresentada en el archivo Base01.xlsx . Indique, si cada una de
las preguntas si es cualitativa (de cadena) ó cuantitativa (numérica) y también especi…car la escala de
medición (nominal, ordinal, discreta o continua).
4. Se registran las siguientes mediciones para el tiempo de secado (en horas) de cierta marca de pintura
esmaltada.
3.4 2.5 4.8 2.9 3.6 2.7 3.4
2.8 3.3 5.6 3.7 2.8 4.4 9.9
4.4 4.0 5.2 3.0 4.8 10.5 10.2
Suponga que las mediciones constituyen una muestra aleatoria simple.

(a) Calcule la media de la muestra para estos datos.


(b) Calcule la mediana de la muestra.
(c) Calcule la media recortada al 10%
(d) ¿Cuál media usted usaria para describir los datos?
1
5. Según la revista Chemical Engineering, una propiedad importante de una …bra es su absorción del agua.
Se toma una muestra aleatoria de 20 pedazos de …bra de algodón y se mide la absorción de cada uno.
Los valores de absorción son los siguientes:
18.71; 21.41; 20.72; 21.81; 19.29; 22.43; 20.17; 23.71; 19.44; 20.50; 18.92; 20.33; 23.00; 22.85; 19.25;
21.77; 22.11; 19.77; 18.04 y 21.12

(a) Calcule la media y la mediana muestrales para los valores de la muestra anterior.
(b) Calcule la media recortada al 10%.
(c) Si se utilizan sólo los valores de la media, la mediana y la media recortada, ¿hay evidencia de
valores extremos en los datos?

6. Se tiene 45 ingresos diarios en bolivianos de los trabajadores de una empresa.

63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60

(a) Hallar una tabla de distribución de frecuencias con 6 intérvalos de igual amplitud, para poder
describir los anteriores datos (para la clasi…cación puede usar R o una aplicación para celular)
(b) Interpretar:n4 ; N4 ; h6 ; H6
(c) Gra…car: el histograma, polígono de frecuencias.

7. Los representantes de clase de una distribución de frecuencias con intervalos de igual amplitud son: 46,
55, 64, 73, 82, 91. Hallar: El rango y los intérvalos de clase.
8. Una cadena de grandes almacenes eligió aleatoriamente 10 establecimientos situados en una región.
Tras exameniar los datos de ventas, observó que ese año se habían conseguido en las Navidades, los
siguientes aumentos porcentuales de las ventas en dólares con respecto al año anterior: 11, 6, 14, 7, 13,
8, 12, 9, 11, 10.

(a) Calcular la media, moda y mediana y comentar la simetría.


(b) Hallar el resumen de 5 números.
(c) Hallar la varianza y desviación estándar de los 10 datos.

9. Se han analizado las notas de Probabilidad y Estadística de 2 secciones, y se ha obtenido lo siguiente:


la nota modal de la sección A es de 15, la nota media es de 12.8 y la mediana es de 13.5; en la clase B
la nota modal es de 11, la nota media 14 y la mediana 13.5.

(a) Bosquejar una curva que represente la información dada, para cada sección, suponiendo que las
distribuciones son unimodales.
(b) Sería posible en la sección A, más de la mitad de los estudiantes obtenga más que la nota media?
(c) Sería posible en la sección B, más de la mitad de los estudiantes obtenga menos que la nota media?

10. Se registra la resistencia a la tensión del caucho de silicio, mediante la temperatura en grados centígrados
y los valores son los siguientes:
19.44; 20.50; 18.92; 20.33; 23.00; 22.85; 19.25;20.17.

(a) Calcule la media y la mediana muestrales para los valores de la muestra anterior.
(b) Calcule la media recortada al 20%.
(c) Hallar el resumen de 5 numeros y mostrar el diagrama de box plot
(d) Hallar la desviación estándar.
2
11. Un fabricante de neumáticos quiere determinar el diámetro interior de un neumático de cierto grado
de calidad. Idealmente el diámetro sería de 570mm. Los datos son los siguientes: 572, 573, 572, 568,
569, 575, 565, 570

(a) Hallar la media, mediana


(b) Hallar la varianza y la desviación estandar de la muestra.
(c) Hallar el resumen de 5 numeros y mostrar la grá…ca de caja y bigote (box plot) de la muestra.
n
X
12. Muestre que los n primeros términos de información en (xi x)2 no son independientes, es decir,
i=1
n
X
demuestre que: (xi x) = 0
i=1

1.1 Experiencia con R, descripción de datos


1. Descargar R y Rstudio.
2. Escribir el script para realizar las siguientes operaciones:

(a) 2+5
(b) (2+7)/8
(c) Almacenar en un vector con el nombre vector1, una secuencia de números de 1 al 20
(d) Sumar 10, a cada valor del vector1 y almacenar en nuevo vector, con el nombre de vector2
(e) Multiplicar 10, a cada valor del vector1 y almacenar en nuevo vector, con el nombre de vector3
(f) Almacenar en un vector con el nombre vector4 los siguientes datos 1.2, 0.5, 3, 6, 0, 6, 4, 7, 12, 10,
7. Hallar la media, mediana, mínimo, máximo y la desviación estándar.

3. Almacenar en un vector con el nombre de vector1, los siguientes valores:

75; 73; 70; 69; 65; 87; 75; 70; 87; 80; 79; 80

(a) Calcule la media y la varianza de la muestra.


(b) Obtenga la varianza, la desviación estándar y el rango de la muestra
(c) Gra…car el diagrama de boxplot.

4. Un fabricante de neumáticos quiere determinar el diámetro interior de un neumático de cierto grado


de calidad. Idealmente el diámetro sería de 570mm. Los datos son los siguientes:

577; 574; 573; 569; 565; 571; 575; 570

(a) Calcule la media y la varianza de la muestra.


(b) Obtenga la varianza, la desviación estándar y el rango de la muestra

5. Los siguientes datos indican los minutos (redondeados al entero superior) que ocuparon sus asientos 50
clientes de una cafetería:
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 47 55 60 76 75 69 35 45 63
3
(a) Transcribir los datos a una hoja en Excel y luego, desde Rstudio o R, importar los mismos en una
variable con el nombre de X
(b) Mediante Rstudio hallar la media, mediana y varianza de la variable X
(c) Veri…car las propiedades de la media y la varianza mediante:
i. La suma de 5 minutos a cada uno de los valores de X y luego hallar la nueva media y varianza.
ii. La multiplicación por 4 a cada uno de los valores de X y luego hallar la nueva media y varianza.
(d) Construya una tabla de distribución de frecuencias con 5 intérvalos de igual amplitud
(e) Gra…car el histograma.

6. Con referencia a la base datos del archivo base02.xlsx correspondiente a la encuesta realizada por el
curso. Hallar un cuadro de distribución de frecuencias para las siguientes variables: Carrera, Género,
Usted: al terminar su carrera piensa estudiar una maestría en el área de su interés?
7. Hallar una tabla de distribución de frecuenicas, que describa el cruce de variables entre: género y carrera
8. Recodi…car la variable nota en tres categorias: Baja=A, Media=B y Alta=C.
9. Realizar un cruce de variables entre carrera y nota recodi…cada. Interpretar los porcentajes …la y
columna
10. Realizar un cruce de variables entre género y nota recodi…cada. Interpretar los porcentajes …la y
columna

2 Probabilidad
1. Con relación a la bibliografía proporcionada: "Probabilidad y estadística para ingeniería y ciencias",
Walpole Myers, realizar los siguientes ejercicios: 2.14 al 2.19 - Ejercicios de 2.21 a 2.34 - Ejercicios pares
de: 2.52 a 2.60 - Ejercicios pares de 2.74 a 2.86 - Ejercicios de 2.95 a 2.102.
2. Una gran pregunta en una …esta es « ¿qué probabilidades hay de que al menos dos personas de las que se
encuentran en esta habitación hayan nacido el mismo día?» . Desgraciadamente, será difícil compartir
con los asistentes a la …esta el método para hallar la solución. Para que el problema sea manejable,
asignar todos los nacidos el 29 de febrero al 1 de marzo y suponer que los 365 días del año son igual de
probables en el conjunto de la población. También suponer, que las personas que hay en la habitación
son una muestra aleatoria, con respecto a las fechas de nacimiento de la población en general (estas
simpli…caciones apenas afectan a los resultados numéricos). Con estos detalles, hallar la probabilidad
de que al menos dos personas de las que se encuentran en la …esta hayan nacido el mismo día.
3. El 40% de la población activa de un país se dedica al sector agropecuario, el 20% al extractivo y un
10% al sector industrial. La tasa de desocupación en el sector agropecuario es de 10%, en el sector
extractivo es 28%, en la industria del 30% y en los servicios es del 10%. Determinar la probabilidad de
que un desocupado elegido al azar pertenesca al sector industrial.
4. De los alumnos del primer año de un determinado programa academico, se sabe que el 40% asistio a
centros secundarios privados y el 60% asistio a centros estatales. El registro de matriculas señala que al
…nal del curso alcanzaron un nota media A, el 30 % de los alumnos que asistieron a centros secundarios
privados y solo el 20 % de los que asistieron a centros estatales. al …nal del ciclo, se elige al azar un
alumno de dicho curso y tiene un a nota media A. Cual es la probabilidad que el alumno hubiera
asistido a un centro estatal.
5. Una empresa manufacturera tiene 3 operarios para una máquina que produce ciertos componentes. El
operario A tiene una tasa de defectos del 5%; el operario B tiene una tasa del 3%, y el operario C
tiene una tasa del 2%. Los 3 operarios producen el mismo numero de componentes. Suponga que un
componente seleccionado al azar resulta defectuoso. Calcule la probabiliodad de que el componente
haya sido producido por A.
4
2.1 Experiencia con R, probabilidades
1. Descargar la base de datos Base01.xlsx de la página www.yurimiranda.com . El archivo corresponde a
información recolectada en el cuestionario del archivo Cuestionario.pdf
2. Importar desde R o SPSS el archivo Base01.xlsx
3. En R o SPSS, escribir el script para realizar las siguientes tareas:

(a) Hallar un cruce de variables entre las preguntas género y carrera


(b) Hallar la probabilidad de que un estudiante elegido al azar, sea mujer y que sea de Ing. Comercial
(c) Hallar la probabilidad de que sea mujer dado que estudia Administración de empresas.
(d) Se elige un estudiante al azar y resulta que estudia Administración de Empresas. Hallar la prob-
abilidad de que sea hombre.
(e) Se elige un estudiante al azar y resulta que estudia Administración de Empresas. Hallar la prob-
abilidad de que sea mujer.
(f) Se elige un estudiante al azar y resulta que estudia Mecatrónica. Hallar la probabilidad de que
sea mujer.

4. Si se elige al azar un estudiante del curso, y se sabe que estudia más de 3 horas al dia, ¿cuál es la
probabilidad de que sea repitente en la materia?
5. Si se elige al azar un estudiante del curso, y se sabe que estudia más de 3 horas al dia, hallar la
probabilidad de que no sea repitente en la materia.

3 Variables Aleatorias
1. Realizar los ejercicios pares de 3.13 a 3.24 - Ejercicios de 3.37 a 3.45.
2. Sea Y una variable aleatoria de…nida como: "el número de caras menos el número de sellos", en
tres lanzamientos de una moneda. Hallar todos los elementos del espacio muestral para los tres
lanzamientos de la moneda y asigne un valor de Y a cada punto muestral.
3. Para de…nir el comportamiento de una variable aleatoria es necesario explicarla mediante una función
de probabilidades, expresada como un múltiplo de una constante, una vez obtenida el comportamiento
determinístico. De esta manera se tiene las siguientes expresiones para el comportamiento de dos
variables aleatorias. Determine el valor de la constante c, de modo que cada una de ellas puedan servir
como distribución de probabilidades de X.

(a) p(x) = c(x2 + 4); x = 1; 2; :::6


4 3
(b) p(x) = c x 3 x ; x = 1; 2; 3

4. La distribución de probabilidad de X, el número de imperfecciones que se encuentran en cada 10 metros


de una tela sintética, que viene en rollos continuos de ancho uniforme, está dada por:

X 0 1 2 3 4
f (x) 0:04 0:16 0:30 0:10 0:40

(a) Hallar la P (X > 3)


(b) P (1 X < 4)

5. Un supervisor en una planta manufacturera tiene tres hombres y tres mujeres trabajando para él y
desea escoger dos trabajadores para un trabajo especial. No queriendo mostrar sesgo en su selección,
decide seleccionar los dos trabajadores al azar. Denote con Y el número de mujeres en su selección.
Encuentre la función de probabilidad para Y.
5
6. En una tarea de laboratorio, si el equipo está funcionando, la función de densidad del resultado obser-
vado X, es: 8
< 2(1 x) 0<x<1
f (x) =
:
0 en otro caso (e.o.c.)

(a) Hallar y de…nir la función acumulada F (x)


(b) Usando la función de probabilidades acumulada F (x) calcule P (X > 13)
(c) Dado que X 0:6 ¿cuál es la probabilidad de que X se mayor que 0.3?

7. La vida útil de un cable de construcción expresada en dias es una v.a. que tiene la función de densidad:
8 200
< (x+200)2 x > 0
f (x) =
:
0 e:o:c:

(a) Hallar la probabilidad de que un cable de construcción tenga una vida util de al memos 200 dias.
(b) Hallar la probabilidad de que un cable de construcción dure entre 80 a 120.

8. El tiempo en horas que una persona es efectivamente productiva en una determinada tarea, tiene un
comportamiento acelerado al inicio, pero después de un cierto tiempo la productividad baja, incluso
a ser explicada por una pendiente negativa (debido a efectos externos) produciendo que al …nal el
rendimiento no sea el mismo, este comportamiento puede ser aproximado mediante la siguiente función
de probabilidades: 8
< x 0<x<1
f (x) = 2 x 1 x<2
:
0 e:o:c:

(a) Encuentre la probabilidad de que el tiempo trascurrido sea de al menos 0.8 horas.
(b) Encuentre la probabilidad de que el tiempo está entre 0.5 y 1.5 horas.
(c) Encuentre geométricamente los resultados de los anteriores incisos.

9. La proporción de personas que responden a cierta encuesta enviada por correo, es una variable aleatoria
continua X que tiene la función de densidad:
8 2(x+2)
< 5 0<x<1
y=
:
0 e:o:c:

(a) Demostrar que la P (0 < X < 1) = 1


1 1
(b) Encuentre la probabilidad de que mas de 4 pero menos de 2 de las personas contactadas respondan
a esta encuesta.

10. Suponga que: 8 9


< 0 ; y<0 =
FY (y) = y ; 0 y 1
: ;
1 ; y>1
Encuentre la función de densidad de probabilidad para Y y grafícar.
11. Para medir la inteligencia de ratones, se les toma el tiempo que tardan para pasar por un laberinto
para llegar a una recompensa de alimento. El tiempo (en segundos) necesario para cualquier ratón es
una variable aleatoria Y con una función de densidad dada por
b
y2 ; y b
fY (y) =
0 ; e:o:c:
6
(a) Donde b es el tiempo mínimo posible necesario para recorrer el laberinto. Demuestre que f (y)
tiene las propiedades de una función de densidad.
(b) Encuentre F(y).
(c) Encuentre P(Y > b + c) para una constante positiva c.
(d) Si c y d son constantes positivas, tales que d > c, encuentre P(Y > b + d jY > b + c).

12. El tiempo en horas que pasa, antes de que una parte de un equípo electrónico que se utiliza para fabricar
un reproductor de DVD, empiece a fallar tiene la siguiente función de densidad:
1 x
2000 e ; x 0
2000
f (x) =
0 ; x<0

(a) Calcule F(x)


(b) Utilizando la función F(x), determine la probabilidad de que el componente funcione menos de
1000 horas antes de que sea necesario reemplazar el componente.
(c) Utilizando F(x), determine la probabilidad de que el componente falle después de 2000 horas

13. Se tiene función la siguiente funcion de distribución acumulada


8
>
> 0 ; y 0
< y ; 0<y <2
8
FY (y) = y2
>
> ; 2 y <4
: 16
1 ; y 4

(a) Encuentre la función de probabilidades y demuestre que cumple las propiedades de una f p.
(b) Encuentre la probabilidad de Y este entre 0.5 y 2.5 horas.
(c) Encuentre la probabilidad de Y tome valores de por lo menos 0.5
(d) Encuentre geométricamente los resultados de los anteriores incisos.

3.1 Experiencia con R, variables aleatorias


1. Descargar la base de datos Base01.xlsx de la página www.yurimiranda.com . El archivo corresponde a
información recolectada en el cuestionario del archivo Cuestionario.pdf
2. Importar desde R el archivo Base01.xlsx
3. Hallar la distribución de probabilidad de la variable aleatoria X ="Cali…cación a la infraestructura de
los cursos donde pasa clases"
4. Comparar grá…camente la función de probabilidades de la variable X , para mujeres y hombres.
5. Gra…car el kernel de la distribución de probabilidades, de la variable horas de estudio.
6. Hallar la distribución de frecuencias de la la variable X = edad, considerar la frecuencia relativa para
suponer la distribución de probabilidades de dicha variable.

(a) Hallar la P (X > 21)


(b) P (20 X < 25)
(c) Gra…car la distribución de probabilidades
(d) En excel hallar y gra…car la función de probabilidades acumulada.

También podría gustarte