Primera Evaluación Taller I

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 14

PRIMERA EVALUACIÓN TALLER I

Análisis Estadístico para Ingeniería Sección A


Coordinación A-3
Profesora: Madeleine Clerc Ayudante: Ariel Sanhueza
mail: madeleine.clerc@usach.cl mail: ariel.sanhueza@usach.cl
GRUPO 1:
Estudiantes Nombre RUT

1 Ignacio Pizarro 18.087.640-5

2 Sebastian Alarcón 19.608.465-7

3 Joaquín Mery 19.348.808-0

PROBLEMA 1

El responsable en control de calidad de una empresa debe evaluar un prototipo de


dispositivo electrónico, para ello se dispone de las duraciones de 200 dispositivos.
Los datos se presentan a continuación:

X = duración en horas del dispositivo (tiempo hasta fallo en horas)


Duración 600 - 700 700 - 800 800 - 900 900 - 1000 1000-1100 Total
Frecuencia 60 49 42 32 17 200

1.1. Determine el porcentaje de dispositivos con duraciones entre 720 y 980


horas. Justifique utilizando medidas adecuadas.

Basandonos en la formula de percentil:

1° calculamos los porcentajes de 720 y 980:


200
𝑘1( )−60
➢ 720 = 700 + 100
∙ 100 ----------→ 34.9% = 𝑘 1
49

200
𝑘(100)−151
➢ 980= 900 + ∙ 100 ---------→ 88.3% = k2
32
2° Resolvemos las diferencias de percentiles para hallar el valor intermedio:

➢ k2 – k1= 88.3 – 34.9 = 53.4%

Respuesta:
El resultado del porcentaje de dispositivos con duraciones entre 720 y 980 horas
corresponde a 53.4%

1.2. Analice la asimetría de la distribución de los datos a través de Coeficiente de


asimetría de Pearson CAP:

Determine su valor numérico e interprete el CAP

Para determinar el promedio procedemos a utilizar la siguiente formula:

fi = frecuencia absoluta
Xi = marca de clase
n = frecuencia total acumulada

60 ∗ 650 + 49 ∗ 750 + 42 ∗ 850 + 32 ∗ 950 + 17 ∗ 1050


200

= 798,5

Para determinar la moda entre datos agrupados procedemos a utilizar la


siguiente formula:
60 − 0
𝑀𝑜 = 600 + ∗ 100
(60 − 0) + (60 − 49)

Mo = 684,5070

Para determinar la desviación estandar procedemos a utilizar la siguiente


tabla, elaborada previamente en Excel:

Duración 600 - 700 700 - 800 800 - 900 900 - 1000 1000-1100 Total
Frecuencia 60 49 42 32 17 200
MX 650 750 850 950 1050
-148,5 -48,5 51,5 151,5 251,5
22052,25 2352,25 2652,25 22952,25 63252,25
1323135 115260,25 111394,5 734472 1075288,25

3359550
varianza 16882,1608
desviación estandar 129,9313696

Nota: Entiendase que varianza de una muestra corresponde al cuociente entre suma total
de suma total de f*[(X - )2] y la frecuencia absoluta acumulada menos 1. Así mismo, la
desviación estándar es la raíz de la variación.

Finalmente procedemos a insertar los valores en la fórmula de CAP:

798,5 − 684,5070
𝐶𝐴𝑝 =
129,9313

𝐶𝐴𝑝 = 0,8773
Respuesta:
Podemos concluir que el coeficiente de asimetría de Pearson corresponde a
0,8773. Por lo tanto, nos indica que la media se encuentra por sobre la moda,
debido a que corresponde a una asimetría positiva.

1.3. Determine e interprete la medida de tendencia central adecuada para


representar los datos de la variable X. Justifique su respuesta.

A continuación, colocamos los datos ya realizados y, posteriormente,


realizaremos el cálculo de la Mediana.

Moda (Mo) = 684,5070


Promedio ( ) = 798,5
Para calcular la mediana utilizaremos la siguiente fórmula:

200
− 60
𝑀𝑒 = 700 + 2 ∗ 100
49

Me = 781,6326

Respuesta:
Podemos concluir que, en conocimiento de las medidas de tendencia central, la
más adecuada para representar los datos de la variable X corresponde al
PROMEDIO y a la MEDIANA, ya que sus resultados son muy similares en este
caso.

PROBLEMA 2

El producto estrella de la Fábrica F1, de iluminación, es una ampolleta LED de 10


w que según el fabricante, sus ampolletas superan en duración el funcionamiento
ininterrumpido al modelo similar de otra Fabrica F2, mucho más barato.
Para comparar la duración de ambas ampolletas, en el laboratorio de iluminación
de la fábrica F1, probaron muestras de 30 ampolletas de cada fabricante, los
resultados en meses se muestran a continuación:

Fábrica F1

Duración en meses de las ampolletas LED de 10 w

46,2 42,9 40,4 45,4 46,7 43,6 39,9 46,0 40,2 44,3

46,5 49,3 53,3 44,5 42,5 45,5 47,3 43,9 45,7 47,9

50,2 45,5 52,7 48,4 50,4 45,9 40,1 41,8 44,0 53,4
Fábrica F2

Duración en meses de las ampolletas LED de 10 w

35,6 35,7 36,1 37,1 37,2 37,3 37,4 38,3 38,3 39,1

39,1 39,5 39,6 39,9 40,0 40,4 40,7 40,7 40,8 41,1

41,4 41,8 42,0 42,2 44,1 44,2 45,9 46,2 47,9 50,1

A usted como estudiante en práctica en la fábrica F1, le asignaron la tarea de


realizar el análisis exploratorio de datos, que permita comparar las ampolletas de
ambas fábricas, su informe debe contener:

i. Definición y clasificación según tamaño del recorrido y nivel de medición de


la variable de interés, indicando unidad de información.

Respuesta:
Podemos concluir que nos encontramos frente a clasificación de información
cuantitativa de tipo continua, ya que sus valores son numéricos y los valores entre
dos datos pueden ser infinitos valores intermedios. En cuanto a la escala
correspondiente es la de razón, debido a que en una escala de razón existe el cero
(0) empírico, por lo cual se puede efectuar cualquier operación aritmética con los
números de la escala (X= duración de ampolletas en meses).

ii. Las medidas de tendencia central y de dispersión. Interpretación en el contexto


del problema.

fabrica 1 fabrica 2
Mo 45,5 38,3
Me 45,6 40,2
45,81333333 40,6566667
S(x) 3,752767561 3,55931835
S²(x) 14,08326437 12,6687471
CV(x) 0,081914309 0,08754575
Q1 43,675 38,3
Q2 45,6 40,2
Q3 47,75 41,95
RIC 4,075 3,65
Rango 3 3
Donde:

Mo = moda Q3 = Cuartil 3
Me = Mediana S(x) = Desviación Estándar
( ) = Promedio muestral
RIC = Rango intercuartílico S2(x).= Varianza muestral
Q1= Cuartil 1 CV(x)= coeficiente de variación

iii. Análisis de existencia de datos atípicos según regla de Tukey.

Basándonos en la fórmula de datos atípicos según regla de Tukey:

Ya conociendo los valores previamente calculados en el Excel, procedemos


a insertar los valores correspondientes.

Los valores atípicos de la fábrica 1 corresponde a:

𝑀𝑖𝑛 = 43,675 − 1,5 ∗ 4,075 = 37,5625


𝑀𝑎𝑥 = 47,75 + 1,5 ∗ 4,075 = 53,8625

Los valores atípicos de la fábrica 2 corresponde a:

𝑀𝑖𝑛 = 38,3 − 1,5 ∗ 3,65 = 32,825


𝑀𝑎𝑥 = 41,95 + 1,5 ∗ 3,65 = 47,425
Respuesta:
Podemos concluir que los datos atípicos de la fábrica 1 corresponden a todos los datos que
se encuentre fuera del rango entre 37,5625 y 53,8625. Mientras que en la fábrica 2 el rango
corresponde a 32,825 y 47,425.
iv. Presentación y organización de los datos en una tabla de frecuencias y
construcción de un gráfico adecuado (comience el primer intervalo en 35,5;
con amplitud de las clases de 3 meses. Ver ejemplo pág. 30 y de otras,
apunte Generalidades y Estadística Descriptiva. Unidad I)

Marcas de Frecuencias absolutas


MESES
clases f1 f2
35,5 -38,5 37 0 9
38,5 - 41-5 40 4 12
41,5- 44-5 43 7 5
44,5 - 47,5 46 11 2
47,5 - 50,5 49 5 2
50,5 - 53,5 52 3 0
f1= frecuencia absoluta de la fabrica 1
f2= frecuencia absoluta de la fabrica 2

Duración en meses de las ampolletas LED


12
11
Número de ampolletas LED

12
9
10
7
8
5 5
6 4
3
4 2 2
2 0 0
0
35,5 -38,5 38,5 - 41- 41,5- 44-5 44,5 - 47,5 47,5 - 50,5 50,5 - 53,5
5
Duración de ampolletas LED (meses)

Fabrica 1 Fabrica 2

v. Conclusión final del análisis descriptivo de datos.

Respuesta:
Podemos concluir que, basados en las medidas de dispersión de ambas industrias, más
específicamente en el coeficiente de variación, evidenciamos que industria E2 posee un
mejor rendimiento que la industria E1, ya que su coeficiente de variación es más bajo que
la otra. Explicado de otra manera, significa que presenta datos más homogéneos que la
otra empresa.
PROBLEMA 3

Una red de comunicaciones está formada por cuatro componentes que funciona de
forma independiente, los cuales estan conectados de la siguiente manera

Los conponestes C1, C2 y C3 cada una funcionan con probabilidad 0,88, mientras
que el componente C4 depende de la velocidad de transmisión. Si la velocidad de
transmición es alta, este funciona con probabilidad 0,95, y si es baja, este funciona
con probabilidad 0,8. Se sabe que la velocidad de trasnmisión es alta con
probabilidad 0,65.

La red de comunicación funciona entre A y B, si es posible encontrar al menos uno


de los caminos de comunicación que funcione.

Determine la probailidad de que la red de comunicaciones funcione.

Se definen las variables:

Sea:

• P(C1) = Probabilidad que el componente C1 funcione


• P(C2) = Probabilidad que el componente C2 funcione
• P(C3) = Probabilidad que el componente C3 funcione
• P(C1) = P(C2) = P(C3) = 0,88 ( todas son independientes)
• A = velocidad baja
• B = velocidad alta
• P(A)= 0,65
• P(C4/A) = 0,95
• P(C4/B) = 0,80

P(A)= 0,64 → P(B)= 1- P(A) = 0,35

P(C4) = P(A)*P(C4/A)+P(B)*P(C4/B)

P(C4) = (0,65 *0,95) +(0,35*0,8)

P(C4) = 0,8975

P{(C1ΠC2ΠC3)U(C4)} = P{(C1ΠC2ΠC3) + (C4)} = P{(C1ΠC2ΠC3) Π (C4)}


=(0,88)3+0,8975-(0,883 *0,8975) = 0,9673 = 96,73%

Respuesta:
Podemos concluir que la probabilidad de que la red de comunicaciones funcione es del
96,73%

PROBLEMA 4

Una empresa dispone de dos máquinas (A1 y A2) para la fabricación de cierta pieza
metálica, que producen el 35% y 65% de las piezas respectivamente.
De las piezas fabricadas por la máquina A1 el 86% funcionan bien, el 4% se
desechan y el 10% restante necesitan una reparación, de la cuales el 70% funcionan
bien y el resto se desechan.
En la máquina A2 los porcentajes anteriores son 80%, 6% y 14% respectivamente
y entre las piezas que deben ser reparadas únicamente el 65% funcionan bien.
a. Si se sabe que una pieza fue desechada ¿cuál es la probabilidad de que
proceda de la máquina A2?

Primero que todo, procedemos a realizar el diagrama del árbol, basado en el


teorema de la probabilidad total
93%
A1
35%
7%
100%
89,1%
A2
65%
10,9%

Recolección de datos: (Maquinas A1,A2 ;encargadas de fabricar piezas metálicas)


A1 = Producción de 35% => 0.35
A2 = Producción del 65%=> 0.65
(*) Análisis e interpretación:
A1: Se tiene que un 93% se considerara como piezas funcionales y por otro lado
un 7% de piezas desechadas
A2: Se tiene un 89.1% se considerara como piezas funcionales y por otro lado un
10.9% piezas desechadas.
Trasformando los % en cifras:
7%= 0.07
10.9%=0.109
Bajo el siguiente análisis se procede a calcular utilizando (*) Diagrama de árbol;
respaldado con la imagen adjuntada.
Desarrollo:
(0.65)∗(0.109) 0.07085
P(A2/x) = = = 0.7430  74.3%
((0.65)∗(0.109)+(0.35)∗(0.07)) 0.09535

Sabiendo que una pieza fue desechada la probabilidad de que esta proceda
de la maquina A2 es de un (0.7430  74.3%).

Respuesta:
Podemos concluir que la probabilidad de que la pieza desechada provenga de maquina
A2 es de un 74,3%

b. De las piezas que funcionan bien, se seleccionan hasta encontrar una que
haya sido reparada, ¿Cuál es la probabilidad que se deban seleccionar por
lo menos 5 piezas?

Para responder la siguiente pregunta utilizamos, en primer lugar, el Teorema de


Bayes

B = Bueno
M = Malo
R = Reparados
NR = No Reparado
(𝐴1 ∗ 𝐵 ∗ 𝑅) + (𝐴2 ∗ 𝐵 ∗ 𝑅𝐵)
𝑃(𝐵|𝑅) =
(𝐴1 ∗ 𝐵) + (𝐴2 ∗ 𝐵)

(0,35 ∗ 0,93 ∗ 0,0752) + (0,65 ∗ 0,891 ∗ 0,1021)


𝑃(𝐵|𝑅) =
(0,35 ∗ 0,93) + (0,65 ∗ 0,891)

𝑃(𝐵|𝑅) = 0,09242 = 9,242%

En segundo lugar, procedemos a utilizar la distribución geométrica:

X = número de intentos para encontrar una pieza buena que haya sido reparada

A continueación utilizamos la probabilidad de P antes calculada (0,09242) y


calculamos el complemento de P (q = 1- P = 0,907579)

Ahora lo insertamos en la distrubución geometrica.

X~Geom(p,q) para las 5 piezas correspondientes

5
P(x ≤ 5) = ∑1 P(x)= P(1)+P(2)+P(3)+P(4)+P(5)

P(1) = 0,092421
P(2) = 0,08388
P(3) = 0,0766127
P(4) = 0,06909134
P(5) = 0,062706

∑ 𝑃(𝑥 ) = p(q)x-1 = 0,3842 = 38,42%


1

Respuesta:
La probabilidad de encontrar una pieza reparada y que funcione bien entre 5 piezas
seleccionadas es de 38;42%
PROBLEMA 5

Se sabe que un generador eólico de 1,5 MW, de cierto modelo, en promedio


presenta 0,4 fallas cada tres meses de funcionamiento. Suponga válidos los
supuestos de un Proceso de Poisson.

5.1. ¿Cuál es la probabilidad que el generador presente por lo menos 5 fallas en


dos años?
Sea un proceso de Poisson:

X ~ Poisson (λ=3,2 [fallas/ 24 meses]) ~ p(x) = p(X=x)

En el cual el recorrido seria desde cero fallas hasta 4 fallas posibles, ya que
queremos encontrar por lo menos 5 fallas posibles, representado por el
complemento de la probabilidad .
Por lo tanto:

𝑃(𝑥 ≥ 5) = 1. −𝑃(𝑥 < 5)

Luego, comenzamos a ingresar valores:

Sea x =(0,1,2,3,4) entonces:


P(0) = 0,0407
P(1) = 0,1304
P(2) = 0,2087
P(3) = 0,2226
P(4) = 0,1280

Finalmente sumamos todos los valores de P(x) y procedemos, luego, a


calcular el complemento.

∑ 𝑃(𝑋) = 0,7806

1 − ∑ 𝑃(𝑋) = 0,21938
Respuesta:
Podemos decir que la probabilidad que el generador presente por lo menos 5 fallas en 24
meses es de 0,21938.
5.2. El costo C de mantención de un generador en unidades monetarias (um)
está dado por: C = 900X2 + 300X, donde X representa la cantidad de fallas
del generador en un año.
Determine el costo esperado de mantención en un año.

A continuación, utilizaremos Poisson:

Poisson ~x (λ*0,4 fallas/3 meses = 1,6 fallas/ 12 meses)

λ =1,6 F(x) = C = 900X2 + 300X

E(λ2)= 1,6 +1,62 = 4,16


En donde: E= esperanza

Luego finalmente:
C(x) = 4220 um.

Respuesta:
Podemos decir que el costo de la mantención en un año es de 4220 um.

5.3. Una gran minera del norte adquiere ocho generadores eólicos del modelo
descrito anteriormente, cada uno de proveedores distintos. ¿Cuál es la
probabilidad que a lo más tres generadores presenten una falla durante el
primer año de operación?

Para realizar este ejercicio utilizaremos Poisson


falla falla
Poisson ~ x (λ = 0,4* = 1,6 )
3 meses 12 meses

En donde x corresponde al numero de fallas presentes en un generador el primer


año (12 meses)
A continuación, calculamos el valor de que presente una falla en el primer año
(x=1)

P(1) = e-1,6 *1,6 = 0,323034


Una vez ya calculado la probabilidad cuando x=1, procedemos a calcular el
complemento (q = 1 – p = 0,676965)

Luego calculamos utilizando distribución binomial

g ~ Bin(n= 8; P(1) = 0,323034, q= 0,676965)

Donde g corresponde al número de generadores que presenten fallas

n 8
P(g) = ( ) pn qn-g = ( ) (0,323034)8 (0,676965)8-g
g g

Luego, procedemos a calcular la probabilidad P(g) a partir del enunciado, donde


se refiere que a lo más 3 generadores presenten una falla (g = 0,1,2,3). Una vez
ya obtenido los resultados, realizamos la sumatoria de aquellos.

P(0) = (80)(0,323034)8 (0,676965)8 = 0,044109776


P(1) = (81)(0,323034)8 (0,676965)8-1 = 0,168386093
P(2) = (82)(0,323034)8 (0,676965)8-2 = 0,281226113
P(3) = (83)(0,323034)8 (0,676965)8-3 = 0,268390425
3

∑ P(g) = 076211 = 76,21%


0
Respuesta:
Podemos decir que la probabilidad que a lo más tres generadores presenten una falla
durante el primer año de operación es del 76,21%

También podría gustarte