Prueba 1 Pauta

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 9

ING201 Investigación de Operaciones

Prueba 1
V. Godoy Villalobos, R. Murrugarra Munare, R. Cominetti Cotti-Cometti
G. Lagos Barrios, G. Pinto Espinosa, O. Matus Jofré,

23 de septiembre de 2021

Instrucciones:

1. La prueba tiene 2 preguntas.

2. Usted tiene hasta las 21.00 hrs para subir un único archivo con el desarrollo de su prueba.

3. Cada minuto después de las 21.00 hrs. implicará un descuento de 10 puntos de prueba.

4. Durante la evaluación cada alumna/o debe tener encendida su cámara, a la vez que silenciado
su micrófono. Esto se debe mantener durante todo el desarrollo de la evaluación, hasta que el
documento de respuestas de la prueba esté subido a webcursos.

5. Está permitido el uso de apuntes durante la evaluación. Ası́ como Excel y programas que
permitan la resolución de sistemas de ecuaciones.

6. En los primeros 20 minutos de la prueba se podrán realizar, vı́a chat privado al profesor,
preguntas de enunciado. El profesor podrá establecer otro momento en la evaluación donde
realizar dudas si lo estima necesario. Fuera de estos tiempos, no hay consultas de ningún tipo.
Si hay algo que usted considera que falta, haga un supuesto razonable e indı́quelo claramente
en su respuesta.

7. La prueba tiene un total de 60 puntos.

8. Para la entrega se debe subir un único archivo a webcursos. Este archivo puede ser un compilado
en formato .zip o .rar de diferentes archivos.

AL RENDIR ESTA ESTA PRUEBA USTED ESTÁ SUJETO AL CÓDIGO DE HONOR POR LO QUE:

“El alumno que sea sorprendido usando o intentando usar procedimientos ilı́citos durante el
desarrollo de interrogaciones o en la realización de trabajos, será calificado con la nota mı́nima uno
(1,0) en dicha interrogación o trabajo, y su caso será enviado a la dirección de la Universidad. En
caso de reincidencia en el transcurso de sus estudios, se aplicarán sanciones adicionales, las que
podrán llegar hasta su eliminación de la Universidad”.

1
1. Decisión Bajo Incertidumbre [30 puntos]

Una importante tienda de retail debe decidir cuánto comprar de un cierto producto para su temporada de verano.
Este producto se vende en lotes, los cuales se compran antes que se inicie la temporada, sin posibilidad de
reordenar nuevos lotes posteriormente. Por polı́tica del proveedor, la tienda puede comprar como máximo tres
lotes.
Una vez la tienda adquiere los productos y los pone a la venta, las demandas del producto son inciertas, pudiendo
ser altas, medias o bajas. La cantidad demandada en el caso de demanda alta es de 3 lotes, en demanda media es
de 2 lotes y en demanda baja es de 1 lote. Las probabilidades de cada escenario de demanda son de 0,3; 0,3 y 0,4
para alta, media y baja, respectivamente.
El costo de compra al proveedor es de 50 UM/lote, el ingreso por venta en tienda es de 90 UM/lote, el costo
por demanda insatisfecha (quiebre de stock) es de 10 UM/lote, mientras que el valor de liquidación al final de la
temporada es de 20 UM/lote. Considere que todas las unidades sobrantes a final de temporada se liquidan.

[10 pts.] (a) Determine la función de recompensa y la matriz de recompensas


Solución:
Siendo R la función de recompensa, x la cantidad de lotes a comprar, y D la demanda de lotes, entonces

R(x, D) = −50x + 90 mı́n(x, D) − 10 máx(0, D − x) + 20 máx(0, x − D).


De forma equivalente, se puede escribir como:

 −50x + 90x − 10(D − x) si x<D
R(x, D) = −50x + 90x si x=D
−50x + 90D + 20(x − D) si x>D

En ambos casos la matriz de recompensas queda dada por:


x\D 1 2 3
1 40 30 20
2 10 80 70
3 -20 50 120
Criterio de Corrección:
1 punto por el sumando del costo de adquisición
2 puntos por el sumando de ingreso por venta
2 puntos por el sumando de costo de demanda insatisfecha
2 puntos por el sumando del ingreso por liquidación
3 puntos por la matriz de recompensas con sus valores correctos. Descontar un punto por cada valor
incorrecto, en caso de tener 3 o más asignar 0 puntos por la matriz.

[5 pts.] (b) Encuentre la cantidad recomendada de lotes a pedir según el criterio del valor esperado.
Solución:
Es posible determinar lo pedido usando una matriz de recomempensas o un árbol de decisión.
En caso de usar la matriz, tenemos que
Probabilidad
0.4 0.3 0.3
x\D 1 2 3 R. Esperada
1 40 30 20 31
2 10 80 70 49
3 -20 50 120 43
mientras que si se usa un árbol de decisión el resultado es

Página 2 de 9
En cualquiera de los dos casos, notamos que la mayor recompensa esperada se da en el caso en donde se
compran 2 lotes.
Criterio de Corrección:
2 puntos por los valores correctos de la tabla o el árbol.
2 puntos por calcular las recompensas esperadas.
1 punto por la polı́tica a seguir.

Página 3 de 9
En cada junta de ventas de pretemporada, el consultor de la empresa opina sobre la relación con la demanda
potencial de este producto. Debido a su naturaleza optimista, sus predicciones de la situación de mercado han
sido “excelentes” o “muy buenas”. Las probabilidades condicionales para cada estado de la naturaleza son las
siguientes:

Estado de la naturaleza Predicción excelente Predicción muy buena


Demanda alta 0,80 0,20
Demanda media 0,75 0,25
Demanda baja 0,60 0,40

De esta forma, por ejemplo, la probabilidad de que se haya hecho una predicción Excelente dado que la demanda
resultó ser alta es de 0,8.

[15 pts.] (c) Determine, a través de un árbol o una tabla de decisión, la polı́tica óptima a seguir considerando las
predicciones del consultor. Determine también, el valor de la información del consultor.
Solución:
Partiremos determinando las probabilidades necesarias.
Sea DA : demanda alta, DM : demanda media, DB : demanda baja y E : predicción excelente y V :
predicción muy buena, entonces del enunciado se tiene que

1. P(E|DA) = 0,80 3. P(E|DM ) = 0,75 5. P(E|DB) = 0,60


2. P(V |DA) = 0,20 4. P(V |DM ) = 0,25 6. P(V |DB) = 0,40

Luego, usando probabilidades totales tenemos que

P(E) = P(E|DA)P(DA) + P(E|DM )P(DM ) + P(E|DB)P(DB)


= 0,8 · 0,3 + 0,75 · 0,3 + 0,6 · 0,4
141
= .
200
59
Ası́, tenemos que P(V ) = .
200
Utilizando Teorema de Bayes, tenemos que

P(E|DA)P(DA) 0,8 · 0,3 16


P(DA|E) = = =
P(E) 141 47
200
De forma análoga, se puede obtener que
15 31
P(DM |E) = P(DB|E) =
47 47

12 15 32
P(DB|B) = P(DB|B) = P(DB|B) =
59 59 59

Luego, podemos estructurar el árbol de decisión que se adjunta en la figura 2.

Página 4 de 9
Notemos que con la información del consultor el valor de la recompensa esperada sigue siendo 49. De hecho,
independiente de la información entregada por el consultor, la decisión sigue siendo la misma que con la
información original. Ası́, la información del consultor no tiene valor.

Página 5 de 9
Criterio de Corrección:
2 puntos por las probabilidades de la predicción del consultor.
3 puntos por la determinación de las probabilidades condicionadas.
3 puntos por la estructura del árbol.
2 puntos por las recompensas finales de las ramas.
2 puntos por completar correctamente los valores esperados de los nodos.
3 puntos por concluir que la información del consultor no tiene valor.

Página 6 de 9
2. Programación dinámica [30 puntos]
Juan está regresando del trabajo (nodo 1) a su casa (nodo 7). Él desea llegar a su casa lo más rápido posible,
pero está lloviendo copiosamente y existe la probabilidad de que haya accidentes en la ruta. Él sabe que, si se
encuentra con un accidente en una calle, el tiempo que le tomará transitar por esa calle será el doble del tiempo
que usualmente demora.
El gráfico muestra la red de calles (arcos) desde su trabajo a la casa, indicando los tiempos de viaje en cada calle
en condiciones sin accidentes. Ası́ mismo, se muestra la probabilidad de que haya un accidente en dicha calle.

Para lograr el objetivo, se posee el siguiente modelo de programación dinámica


Etapas
3
Variable de decisión:
Xi : nodo hacia donde se dirige Juan en la etapa i.
Variables de estado:
Si : nodo donde se encuentra Juan al inicio de la etapa i.
Regla de transformación
Si+1 = Xi
Función de recursividad/beneficios

fi (Si , Xi ) = T (Si , Xi ) · (1 − P (Si , Xi )) + 2T (Si , Xi ) · P (Si , Xi ) + fi+1 (Si+1 ) para todo i, donde:
T (Si , Xi ): es el tiempo que toma Juan en ir desde el nodo Si al nodo Xi sin accidentes
P (Si , Xi ): la probabilidad de que existe un accidente en la calle que va entre el nodo Si y el Xi .
Función objetivo
fi∗ (Si ) = mı́n(fi (Si , Xi )) para todo i.
Xi
Condiciones
S1 = 1
S4 = 7
f4∗ (S4 ) = 0
Restricciones
Xi , Si ∈ {1, 2, 3, 4, 5, 6, 7}, para todo i.

Página 7 de 9
[10 pts.] (a) Resuelva el modelo de programación dinámica y determine tanto la polı́tica a seguir como el tiempo esperado
siguiendo esa polı́tica.
Solución:
Etapa 3
S3 \X3 7 F3∗ X3∗
5 9,9 9,9 7
6 9,6 9,6 7

Etapa 2
S2 \X2 5 6 F2∗ X2∗
2 24,3 - 24,3 5
3 21,1 20,8 20,8 6
4 20,7 29,1 20,7 5

Etapa 1
S1 \X1 2 3 4 F1∗ X1∗
1 33,4 31,2 28,7 28,7 4

La polı́tica óptima implica ir desde el nodo 1 al nodo 4, del nodo 4 al nodo 5 y del nodo 5 al nodo 7, es
decir, la ruta 1, 4, 5, 7. Siguiendo esta ruta el tiempo esperado es de 28,7 minutos.
Criterio de Corrección:
2 puntos por la etapa 3.
2 puntos por la etapa 2.
2 puntos por la etapa 1.
2 puntos por la polı́tica.
2 puntos por el tiempo de la polı́tica óptima.

[5 pts.] (b) Modifique la formulación del modelo presentado de modo que el objetivo ahora sea maximizar la probabilidad
de no encontrarse con accidentes (uno o más) en la ruta. (No resuelva el modelo)
Solución:
Hacemos las siguientes modificaciones
Función de recursividad/beneficios

fi (Si , Xi ) = (1 − P (Si , Xi )) · fi+1 (Si+1 ) para todo i.
Función objetivo
fi∗ (Si ) = máx(fi (Si , Xi )) para todo i.
Xi
Condiciones
f4 (S4 ) = 1
Criterio de Corrección:
3 puntos por la función de recursividad.
1 punto por la función objetivo.
1 punto por la condición de borde.

[5 pts.] (c) Considere que Juan ha resuelto el modelo de b) y ha determinado que la ruta óptima para ese modelo es
1, 2, 5, 7.
Determine para cada una de las rutas (la obtenida de (a) y la del modelo de (b)) el tiempo esperado que
demorará Juan y la probabilidad de no encontrar accidentes. Analice la situación, realice una comparación
entre las rutas y escriba una recomendación para Juan.
Solución:
Para la ruta de (a), es decir, 1, 4, 5, 7, el tiempo esperado es de 28,7 minutos. La probabilidad de no
encontrar accidentes es 0,288.

Página 8 de 9
Para la ruta (b), es decir, 1, 2, 5, 7, el tiempo esperado es de 33,4 minutos. La probabilidad de no encontrar
accidentes es 0,504.
Se pueden dar múltiples recomendaciones, siempre que estén bien justificadas.
Una de ellas corresponde a recomendar la ruta (b) ya que el tiempo es aproximadamente 1,16 veces respecto
al óptimo, pero óptima en cuánto a la probabilidad de que no hayan accidentes. En cambio, la ruta (a),
óptima en tiempo esperado, tiene una probabilidad de 0,57 veces la probabilidad óptima de no encontrar
accidentes.
Criterio de Corrección:
1 punto por la probabilidad de no encontrar accidentes en la primera ruta.
1 punto por el tiempo esperado de la segunda ruta.
1 punto por la probabilidad de no encontrar accidentes en la segunda ruta
2 puntos por la recomendación bien justificada.

[10 pts.] (d) Considere ahora que Juan tiene 30 minutos para llegar a su casa porque va a empezar la transmisión del
partido de fútbol donde Chile se juega la clasificación al mundial de Catar, y no se quiere perder ni un
minuto.
Modifique la formulación del modelo presentado en (a) de modo que el objetivo sea maximizar la probabilidad
de llegar a su casa antes de que empiece la transmisión. (No resuelva el modelo)
Solución:
Debemos agregar una nueva variable de estado
Yi : tiempo acumulado de viaje hasta al inicio de la etapa i.
Definimos su regla de transformación

Yi + T (Si , Xi ) con probabilidad P (Si , Xi )
Yi+1 =
Yi + 2T (Si , Xi ) con probabilidad 1 − P (Si , Xi )
Modificamos la función recursiva y la función objetivo
∗ ∗
fi (Si , Xi , Yi ) = P (Si , Xi )fi+1 (Si+1 , Yi + T (Si , Xi )) + (1 − P (Si , Xi ))fi+1 (Si+1 , Yi + 2T (Si , Xi ))
Modificamos la función objetivo
fi∗ (Si , Yi ) = máx(fi (Si , Yi , Xi )) para todo i.
Agregamos la condición inicial
Yi = 0
Agregamos la condición de borde

1 si Y4 ≤ 30
f4 (S4 , Y4 ) =
0 si Y4 > 30
Note que también se puede modificar la función recursiva y la función objetivo de la siguiente forma

fi (Si , Xi , Yi ) = fi+1 (Si+1 , Yi+1 )

fi (Si , Yi ) = máx E(fi (Si , Yi , Xi )) para todo i.
Criterio de Corrección:
1 punto por la nueva variable de estado.
2 puntos por la regla de transformación.
2 puntos por la función recursiva.
2 puntos por la función objetivo. Se asigna el puntaje únicamente cuando es correcta y consistente
con la función recursiva definida.
1 punto por la condición inicial.
2 puntos por la condición final.

Página 9 de 9

También podría gustarte