Apuntes MOEGe 20180904

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 134

Métodos Operativos y Estadı́sticos

de Gestión

César Beltrán Royo

4 de septiembre de 2018
URJC-DEIO C. Beltrán 2
Índice general

1. Introducción 1
1.1. La empresa y sus fines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Organización y estructura de la empresa . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. El papel de la investigación de operaciones en la organización de empresas. . . . . . 4

2. Programación lineal 7
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Modelos de la programación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2.1. Modelos de asignación de recursos . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.2. Modelos de mezclas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.3. Modelos de planificación de operaciones . . . . . . . . . . . . . . . . . . . 12
2.2.4. Modelos de gestión de personal . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.5. Modelos de planificación multiperiodo . . . . . . . . . . . . . . . . . . . . 15
2.3. Introducción a las técnicas de resolución de un PL . . . . . . . . . . . . . . . . . . . 17
2.3.1. Resolución geométrica de un PL . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.2. Problema PL en formato estandar . . . . . . . . . . . . . . . . . . . . . . . 27
2.4. Formulación del problema dual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.1. Formulación del problema dual . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.2. Dual del dual de un PL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.5. Relaciones primal-dual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5.1. Teoremas de dualidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5.2. Casos factible, infactible y no acotado . . . . . . . . . . . . . . . . . . . . . 33

3. Programación no lineal sin restricciones 35


3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2. Modelos de optimización no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

I
Índice general

3.2.1. Diseño óptimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35


3.2.2. Ajuste de curvas y problemas de regresión . . . . . . . . . . . . . . . . . . . 37
3.2.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3. Métodos de optimización unidimensional . . . . . . . . . . . . . . . . . . . . . . . 39
3.3.1. Método analı́tico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3.2. Método de Newton (unidimensional) . . . . . . . . . . . . . . . . . . . . . 40
3.3.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.4. Gradiente y matriz hessiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5. Métodos de optimización multidimensional . . . . . . . . . . . . . . . . . . . . . . 45
3.5.1. Método del gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.2. Método de Newton (multidimensional) . . . . . . . . . . . . . . . . . . . . 47
3.5.3. Método del gradiente vs. método de Newton . . . . . . . . . . . . . . . . . 49
3.5.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4. Teorı́a de la decisión: Decisiones multiobjetivo 55


4.1. Introducción al análisis de decisiones . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2. Puntos eficientes y frontera eficiente . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.3. Optimización multiobjetivo por suma ponderada de objetivos . . . . . . . . . . . . . 64
4.4. Optimización multiobjetivo por metas . . . . . . . . . . . . . . . . . . . . . . . . . 70

5. Gestión de proyectos 77
5.1. Método del camino crı́tico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.2. Gestión de proyectos mediante programación lineal . . . . . . . . . . . . . . . . . . 84
5.2.1. Gestión de los tiempos de un proyecto mediante programación lineal . . . . 84
5.3. Diagrama de Gantt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.4. Contexto aleatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

6. Control estadı́stico de la calidad 89


6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.2. Gráficos de control X y R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
6.3. Capacidad de un proceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
6.3.1. Capacidad de un proceso con la media centrada . . . . . . . . . . . . . . . . 102
6.3.2. Capacidad de un proceso con la media no centrada . . . . . . . . . . . . . . 105
6.4. Metodologı́a Seis Sigma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

URJC-DEIO C. Beltrán II
Índice general

7. Diseño de experimentos en ingenierı́a 111


7.1. Diseño de experimentos y control de la calidad . . . . . . . . . . . . . . . . . . . . 111
7.2. Introducción a los experimentos factoriales . . . . . . . . . . . . . . . . . . . . . . 112
7.3. Experimentos factoriales y regresión . . . . . . . . . . . . . . . . . . . . . . . . . . 117
7.3.1. Modelo de regresión (no lineal) . . . . . . . . . . . . . . . . . . . . . . . . 117
7.3.2. Inferencia sobre el modelo de regresión . . . . . . . . . . . . . . . . . . . . 120

8. Apéndice 125

URJC-DEIO C. Beltrán III


Índice general

URJC-DEIO C. Beltrán IV
Capı́tulo 1

Introducción

Este capı́tulo está estructurado en la siguientes secciones:

La empresa y sus fines.

Organización y estructura de la empresa.

El papel de la investigación de operaciones en la organización de empresas.

1.1. La empresa y sus fines

Definición: Una empresa es una organización o entidad que ha sido creada por personas, en las
que se unen una serie de factores o recursos, materiales, técnicos, financieros y humanos, para
realizar actividades y que persigue unos fines que suelen contemplar el afán de lucro.

• Existen distintas definiciones desde los puntos de vista legal, financiero, sociológico, co-
mercial, sus objetivos o de sus actividades
• Por un lado existen gran cantidad de formas legales para una empresa, que van desde
las grandes multinacionales (por ejemplo Movistar) hasta las microempresas donde el
propietario es el único trabajador.

Objetivo: La mayorı́a de las empresas tienen como objetivo la obtención de beneficio económi-
co, pero existen organizaciones, como las empresas públicas, cuyo objetivo es prestar un servi-
cio público y donde el beneficio es algo secundario, por ejemplo la corporación RTVE, Renfe,
Sociedad Estatal de Correos y Telecomunicaciones, etc.

Actividades: Comerciales, financieras, industriales o de servicios, pudiendo mezclar varios tipos


de actividades en muchas ocasiones.

Grupos de interés (stakeholders): Se refiere a los grupos que tienen interés en una empresa,
dado que pueden afectar o ser afectados por las actividades de la empresa. Dentro de los grupos
de interés podemos encontrar:

• Propietarios: pueden tener varios objetivos como la rentabilidad de la empresa, su expan-


sión, la sostenibilidad de la empresa a largo plazo, etc.
• Inversores: su objetivo es rentabilizar su inversión.

1
1.2. Organización y estructura de la empresa

• Trabajadores: su objetivo es el mantenimiento de su puesto de trabajo y el cobro de sus


remuneraciones.
• Acreedores: su objetivo es el cobro de las cantidades adeudadas por la empresa (dentro de
éstos podemos incluir a los Bancos).
• Administración: su objetivo es el cobro de impuestos y el mantenimiento de la empresa
(por su generación de riqueza económica, puestos de trabajo y el servicio prestado a la
sociedad).
• Directivos: su objetivo es el crecimiento de la empresa y su beneficio (gran parte de sus
ingresos dependen de los bonus que obtienen por ello).
• Clientes: su objetivo es el mantenimiento y mejora de los productos que compra a la
empresa.
• Ciudadanos en general: sus objetivos pasan por la corrección medioambiental de las em-
presas y la generación de puestos de trabajo / riqueza.

El objetivo de una empresa depende de los objetivos de sus grupos de interés en proporción
directa a la fuerza que cada grupo tenga en la empresa.

Ejemplo: En el caso de una empresa cooperativa, donde los propietarios son los trabajadores
(por lo que son el principal grupo de poder), el objetivo fundamental es la permanencia de los
puestos de trabajo y el pago de las nóminas.

Ejemplo: En una empresa cuya titularidad es pública (propiedad de una Administración) el fin
es la prestación de un servicio público.

Ejemplo: En una empresa donde los directivos tienen mucho poder (no tienen porqué ser pro-
pietarios, como ocurrirı́a en una empresa que cotice en Bolsa) el fin es el crecimiento, etc.

1.2. Organización y estructura de la empresa

La empresa debe organizar los recursos materiales, humanos, financieros y tecnológicos de los
que dispone para la realización de sus actividades.

Esta organización se realizará a través de una estructura espacio-temporal que será diferente
para cada entidad y que por supuesto irá evolucionando con el paso del tiempo.

Normalmente las empresas suelen organizarse por funciones, a través de departamentos, que se
encargan de una serie de tareas definidas previamente. Sin embargo, hay ocasiones en las que
las empresas se organizan departamentalmente por ubicaciones geográficas (por Ej. en multi-
nacionales), por tipologı́a de clientes (por Ej. las constructoras), por producto, por operaciones,
etc.

La escala organizativa de una empresa se suele representar a través de un esquema en forma de


pirámide donde se indica los tres niveles organizativos, el flujo de información y las decisiones
a tomar (Figura. 1.1). Se organiza en los siguientes niveles:

• Nivel inferior: nivel Operativo, formado por aquellos que desarrollan las actividades del
negocio de la empresa.
• Nivel medio: nivel Ejecutivo, que toma decisiones a corto plazo y conforme con las direc-
trices y planificación a medio y largo plazo establecidas en la compañı́a.

URJC-DEIO C. Beltrán 2
1.2. Organización y estructura de la empresa

Figura 1.1: Pirámide organizativa.

URJC-DEIO C. Beltrán 3
1.3. El papel de la investigación de operaciones en la organización de empresas.

• Nivel superior: nivel Directivo o Polı́tico, que marca las directrices de la compañı́a y rea-
liza la planificación a largo plazo.

La información deberá fluir de cada uno de estos niveles tanto en dirección ascendente como
descendente, aunque las necesidades de datos no son las mismas en todos los niveles. De la
misma forma también en todos los niveles se deberán tomar decisiones, pero no serán del mismo
tipo, ni con los mismos efectos en la empresa.

Otro tipo de organización de empresas es a través de Departamentos funcionales, que se encar-


gan de una serie de tareas definidas previamente.

Tradicionalmente los Departamentos funcionales más comunes son: Aprovisionamiento, Pro-


ducción, Marketing y Administración, aunque hay empresas que también cuentan con Departa-
mentos de Control de Calidad, I+D, Personal, etc.

El número y tamaño de los Departamentos funcionales dependerá de cada empresa, condicio-


nados por el tamaño, sector e importancia de las funciones de la compañı́a y sobre todo de la
estructura planteada por el nivel Polı́tico.

En muchos casos se mezclan estructuras departamentales funcionales con estructuras de otro


tipo, como las de ubicación geográfica, las de tipo de producto o de cliente. Estas situaciones
suelen ocurrir en empresas de tamaño muy grande, en las que es necesaria una especialización
importante y en las que un control centralizado (en muy pocas manos) serı́a imposible.

1.3. El papel de la investigación de operaciones en la organización de


empresas.

Los métodos operativos de gestión que se explican en esta asignatura pertenecen al área cientı́fico-
técnica denominada ‘Investigación de Operaciones’.

La investigación de operaciones, también llamada, Investigación Operativa (IO) se encarga de


la aplicación de herramientas y métodos matemáticos y estadı́sticos para la resolución de pro-
blemas sobre organización, planificación y control en cualquier tipo de sistema, sea artificial
como una empresa o natural como pueda ser un rı́o.

El objeto fundamental de la IO es el de servir como ayuda en la toma de decisiones complejas


o muy complejas, de cara a tomar la mejor decisión posible en cada momento.

En el caso de las empresas, el papel de la IO es fundamental en la toma de decisiones a corto


plazo, pero sobre todo, en la toma de decisiones a medio y largo plazo a través de la planificación
estratégica de las compañı́as.

Las principales cuestiones sobre las que utilizaremos las técnicas de IO dentro de la organiza-
ción y gestión en las empresas serán:

• Toma de decisiones, ya sea a través de la optimización como a través de los procesos


decisorios.
• Planificación y gestión a corto, medio y largo plazo
• Gestión de la Calidad en la empresa

URJC-DEIO C. Beltrán 4
1.3. El papel de la investigación de operaciones en la organización de empresas.

A continuación pasaremos a describir en qué consiste cada uno de estos temas que posterior-
mente iremos desarrollando a lo largo del curso.

Toma de Decisiones:

• Son fundamentales para la correcta gestión de la empresa, ya que una decisión mala pone
en riesgo la solvencia de la compañı́a y disminuye su rentabilidad.
• Los procesos de Toma de Decisiones se pueden producir a través de la utilización de
herramientas de optimización, que buscan maximizar los conceptos positivos (ingresos,
ventas, beneficios, etc.) y minimizar los negativos (costes, sanciones, etc.)
• También pueden apoyarse en herramientas de Análisis de Decisiones, ya sea para casos en
los que se considera un único criterio o para aquellos otros en los que se consideran varios
criterios.

Planificación:

• El realizar planes a corto, medio o largo plazo es algo fundamental en una empresa, ya
que muchas inversiones son productivas al termino de plazos medios o largos.
• En nuestro caso vamos a estudiar con mayor profundidad la planificación de la gestión de
proyectos.
• La planificación de la gestión de proyectos es una herramienta fundamental tanto para
el desarrollo de proyectos de cara a clientes, como para el desarrollo de proyectos de
inversión.
• En general la planificación es una herramienta fundamental para el desarrollo futuro y
presente de cualquier compañı́a, sobre todo de cara al crecimiento y rentabilidad futura.

Gestión de la Calidad:

• Hoy en dı́a nadie puede dudar de la importancia de la existencia de sistemas de control


y gestión de calidad en cualquier empresa. Han representado uno de los grandes avances
industriales del siglo XX y deberán desarrollarse durante el actual siglo.
• Por un lado aumentan la rentabilidad, aumentando las ventas y disminuyendo los costes
(por las menores devoluciones y demandas).
• Por otro lado garantizan la competitividad con el entorno, haciendo el producto más atrac-
tivo hacia el cliente y dejando la puerta siempre abierta de la ingenierı́a de procesos y de
la gestión del cambio.

URJC-DEIO C. Beltrán 5
1.3. El papel de la investigación de operaciones en la organización de empresas.

URJC-DEIO C. Beltrán 6
Capı́tulo 2

Programación lineal

2.1. Introducción

Este capı́tulo está estructurado en la siguientes secciones:

Modelos de la programación lineal.

Introducción a las técnicas de resolución.

Postoptimización.

Nota. Este tema también se puede consultar y/o ampliar en los Capı́tulos 4 y 5 del siguiente libro:
Rardin, R. L., ‘Optimization in operations research’, Editorial Prentice Hall, 1998.

2.2. Modelos de la programación lineal

Objetivo:

El objetivo de esta sección es aprender a formular problemas de ‘programación lineal’ (PL),


también llamada ‘optimización lineal’.

Notar que plantearemos los problemas pero no los resolveremos. En la sección siguiente vere-
mos cómo se pueden resolver.

A menudo simplificaremos la expresión ‘tenemos un problema de PL’ por ‘tenemos un PL’.

Apartados:

Modelos de asignación de recursos

Modelos de mezclas

Modelos de planificación de operaciones

Modelos de gestión de personal

Modelos temporales (multiperiodo)

7
2.2. Modelos de la programación lineal

2.2.1. Modelos de asignación de recursos

Ejemplo 1

Objetivo: Juan, estudiante de ingenierı́a, quiere maximizar sus resultados académicos.

Datos:

Número total de horas disponibles para estudiar: 30 h.

La estimación del incremento de la nota de cada materia aportado por cada hora de estu-
dio viene dado en la siguiente tabla:

Investigación Operativa (IO) 2%


Ingenierı́a Económica (IE) 3%
Estadı́stica (ES) 1%
Programación (PR) 5%

Juan quiere:

• Que el número de horas de estudio dedicadas a IO sea igual o superior al resto.


• Un máximo de 10 h de estudio por materia.

Operaciones 1:

Definimos las siguiente variables de decisión:

xj := Horas dedicadas a cada materia,

j ∈ {IO, IE, ES, PR}.

La formulación como problema de programación lineal (PL) es:

• Maximizar el incremento acumulado de las notas de Juan (en %):

z(x) = 2 xIO + 3 xIE + 1 xES + 5 xP R .

• Sujeto a las siguientes restricciones:

URJC-DEIO C. Beltrán 8
2.2. Modelos de la programación lineal

xIO + xIE + xES + xP R = 30 (asignación de las horas)

xIO ≥ xIE (IO la que más)

xIO ≥ xES

xIO ≥ xP R

xIO ≤ 10 (máximo 10 h)

xIE ≤ 10

xES ≤ 10

xP R ≤ 10

xIO ≥ 0 (mı́nimo 0 h)

xIE ≥ 0

xES ≥ 0

xP R ≥ 0

De forma compacta podemos escribir:

max z = 2 xIO + 3 xIE + 1 xES + 5 xP R , (incremento total)

s. a. xIO + xIE + xES + xP R = 30, (asignación)

xIO ≥ xj , j ∈ {IE, ES, PR} (IO la que más)

xj ≤ 10, j ∈ {IO, IE, ES, PR} (máximo 10 h)

xj ≥ 0 j ∈ {IO, IE, ES, PR} (mı́nimo 0 h)

donde ‘max’ significa ‘Maximizar’ y ‘s. a.’ significa ‘Sujeto a (las siguientes restriccio-

nes)’.

Solución:
Más adelante veremos cómo se puede resolver este tipo de problemas de optimización.
De momento nos tenemos que conformar con saber que una solución óptima vendrı́a
dada por el siguiente número de horas:
x∗IO = 10, x∗IE = 10, x∗ES = 0, x∗P R = 10.

Con esta asignación óptima el incremento acumulado para todas las notas de Juan serı́a
z ∗ = 100 %:
z ∗ = 2 · 10 + 3 · 10 + 1 · 0 + 5 · 10 = 100.

URJC-DEIO C. Beltrán 9
2.2. Modelos de la programación lineal

Notar que para indicar valores óptimos usamos los sı́mbolos x∗ y z ∗ .

General

Modelos de asignación:

• Repartimos un recurso entre varias actividades.


• En el ejemplo anterior hemos repartido 30 horas de estudio entre varias asignaturas.

Variables de decisión:

• Determinan qué cantidad de recurso asignamos a cada actividad.

Problema de Programación Lineal (PL):

• El modelo o problema de asignación es un caso particular de PL.


• Un problema de optimización es un PL si su función objetivo z(x) y sus restricciones son
funciones lineales.

min z(x) = c1 x1 + . . . + cn xn (función objetivo)


s. a. a11 x1 + . . . + a1n xn = b1 (restricciones)
..
.
am1 x1 + . . . + amn xn = bm
xi ≥ 0 ∀i ∈ {1, . . . , n}

• En este PL tenemos sólo restricciones de igualdad. En general un PL puede tener restric-


ciones tanto de igualdad como de desigualdad.
• En un PL nos puede interesar maximizar un beneficio (dinero, fiabilidad, seguridad, etc.)
o minimizar un coste (dinero, tiempo, distancia, etc.). Escribiremos ‘min’ o ‘max’ según
cada caso.

Expresión matricial de un PL:

• Notar que en el anterior PL usando el producto escalar podemos escribir la función


objetivo como
z(x) = c| x.

• Usando el producto de matriz por vector podemos escribir las anteriores restricciones en
formato matricial
Ax = b,
donde la matriz A y el vector b están definidos a partir de los coeficientes aij y bi ,
respectivamente.
• De esta forma podemos escribir el anterior PL en formato matricial como sigue:

min c| x (función objetivo)


s. a. Ax = b (restricciones)
x ≥ 0. (restricciones de no negatividad)

URJC-DEIO C. Beltrán 10
2.2. Modelos de la programación lineal

2.2.2. Modelos de mezclas

Ejemplo 2 (Problema de la dieta)

Objetivo:

Una compañı́a quiere decidir la composición de mı́nimo coste de un pienso para gallinas.
Formula este problema de optimización como un PL (no hay que resolverlo).

Datos:

La compañı́a debe fabricar 10.000 Kg de pienso.


Cada Kg de pienso debe contener:
• Como máximo 10 mg de sodio.
• Al menos 50 g de fibra.
• Al menos 400 g de maı́z.
El pienso se va a fabricar a partir de tres ingredientes: maı́z, trigo y avena.
La composición y precio por Kg de cada ingrediente es:

Ingrediente g Fibra / Kg mg de Sodio / Kg Euros / Kg


Maı́z (1) 40 10 0,15
Trigo (2) 90 15 0,12
Avena (3) 30 5 0,20

Operaciones 2:

Aunque la compañı́a debe fabricar 10.000 Kg de pienso, es suficiente calcular la compo-

sición de 1 Kg y luego aplicar la composición resultante a todo el proceso de fabricación.

Definimos las variables de decisión siguientes:

xj := Kg del ingrediente j por cada Kg de pienso,

∀j ∈ {1, 2, 3}.

Tenemos que minimizar la siguiente función objetivo que nos da el coste en euros de un

Kg de pienso:

z(x) = 0, 15 x1 + 0, 12 x2 + 0, 20 x3 .

Tenemos que imponer las siguientes restricciones a nuestro PL:

• La mezcla de los ingredientes debe pesar 1 Kg:

x1 + x2 + x3 = 1 Kg.

URJC-DEIO C. Beltrán 11
2.2. Modelos de la programación lineal

• Cada Kg de pienso contiene como máximo 10 mg de sodio.

10x1 + 15x2 + 5x3 ≤ 10 mg.

• El pienso debe contener al menos 50 g de fibra.

40x1 + 90x2 + 30x3 ≥ 50 g.

• El pienso contiene al menos 400 g de maı́z.

x1 ≥ 0, 4 Kg.

• La cantidad de cada ingrediente debe ser positiva:

xj ≥ 0, ∀j ∈ {1, 2, 3}.

Solución: El PL para calcular la composición de mı́nimo coste corresponde a:

min z = 0, 15 x1 + 0, 12 x2 + 0, 20 x3 (coste)
s. a. x1 + x2 + x3 = 1 (composición de 1 kg)
10x1 + 15x2 + 5x3 ≤ 10 (sodio)
40x1 + 90x2 + 30x3 ≥ 50 (fibra)
x1 ≥ 0, 4 (maiz)
xi ≥ 0 i ∈ {1, 2, 3} (no negatividad)

General

Modelos de mezclas: En los modelos de asignación repartimos un recurso. En los modelos de


mezclas los combinamos.

Variables de decisión: Determinan qué cantidad de cada recurso incluimos en la mezcla.

Restricciones de composición: Determinan cotas superiores y/o inferiores a las propiedades


de la mezcla resultante.

2.2.3. Modelos de planificación de operaciones

Ejemplo 3

Objetivo:

Una compañı́a quiere planificar su producción de zumo de naranja para maximizar su


beneficio.
Formula este problema de optimización como un PL (no hay que resolverlo).

Datos:

URJC-DEIO C. Beltrán 12
2.2. Modelos de la programación lineal

El precio de venta al público del zumo fabricado es de 1500 Euros/Tonelada.


La compañı́a estima que tiene una demanda de 15000 toneladas (T) de zumo.
La compañı́a fabrica su zumo a partir de naranjas y/o concentrado de zumo de naranja
(CZN).

Producto Precio Efectividad Existencias


(Euros/ T) (T. de zumo / T. de producto) (T)
Naranjas 200 0,2 10000
CZN 1600 2 Sin lı́mite

Operaciones 3:

Definimos las siguientes variables de decisión:

• x1 := Toneladas de naranjas.

• x2 := Toneladas de concentrado de zumo de naranja.

• x3 := Toneladas de zumo de naranja producido.

La formulación como problema de PL es:

max z = −200x1 − 1600x2 + 1500x3 (beneficio)

s. a. 0, 2x1 + 2x2 = x3 (ecuación de balance)

x1 ≤ 10000 (lı́mite de existencias)

x3 ≤ 15000 (lı́mite de ventas)

xi ≥ 0 i ∈ {1, 2, 3}

Solución: Ver apartado ‘Operaciones’.

General

Modelos de planificación de operaciones: Debemos decidir qué hacer, cuando y donde.

Variables de decisión: Las variables de decisión enteras y de gran magnitud se suelen tratar
como variables continuas para simplificar la resolución del problemas.

Restricciones de balance: El flujo entrante de materias primas debe ser igual al flujo saliente
de productos manufacturados (ecuación de balance). Intervienen factores de conversión.

URJC-DEIO C. Beltrán 13
2.2. Modelos de la programación lineal

2.2.4. Modelos de gestión de personal

Ejemplo 4

Objetivo:

Una agencia estatal quiere optimizar el número de operarios de su plantilla, pero cubrien-
do sus necesidades operativas.
Formula este problema de optimización como un PL (no hay que resolverlo).

Datos:

De los 5 dı́as laborables, los empleados trabajan 4 dı́as a razón de 10 h/dı́a y tienen un
dı́a libre, según su turno.

Turno Dı́a libre


1 Martes
2 Miércoles
3 Jueves
El número de empleados requeridos cada dı́a de la semana se detalla a continuación.

L M Mx J V
10 7 7 7 9

Operaciones 4:

Definimos las siguientes variables de decisión:

xi := Número de empleados según el turno i, i ∈ {1, 2, 3}.

La formulación como problema de PL es:

min z = x1 + x2 + x3 (personal total)

s. a. x1 + x2 + x3 ≥ 10 (cubrimos el lunes)

x2 + x3 ≥ 7 (cubrimos el martes)

x1 + x3 ≥ 7 (cubrimos el miércoles)

x1 + x2 ≥ 7 (cubrimos el jueves)

x1 + x2 + x3 ≥ 9 (cubrimos el viernes)

xi ≥ 0 i ∈ {1, 2, 3}

Solución: Ver apartado ‘Operaciones’.

URJC-DEIO C. Beltrán 14
2.2. Modelos de la programación lineal

General

Modelos de gestión de personal:

• Los modelos de gestión de operaciones deciden qué tarea realizar en cada momento de
forma que los recursos sean usados eficientemente.
• En la gestión de personal decidimos qué tipo de empleado y cuántos de cada tipo deben
realizar cada tarea.

Restricciones de cubrimiento:

• En la planificación de los turnos debemos asegurar que el número de operarios asignados


cubre las necesidades de cada periodo.
• Para ello imponemos la siguiente restricción de cubrimiento:

X
(Producción / Operario) × (Operarios en servicio)
turnos
≥ Necesidades del periodo.

2.2.5. Modelos de planificación multiperiodo

Ejemplo 5

Objetivo:

Una compañı́a de fabricación de palas para la nieve quiere optimizar su producción y


almacenaje.
Formula este problema de optimización como un PL (no hay que resolverlo).

Datos:

El coste de fabricación y almacenamiento de las palas para cada trimestre se detalla en


la siguiente tabla (en miles de euros por cada mil palas):

T1 T2 T3 T4
13 12 11 10
El stock de palas al principio del primer trimestre es de 0 palas.
La demanda en miles de palas para cada trimestre se detalla en la siguiente tabla:

T1 T2 T3 T4
11 48 64 15

Operaciones 5:

Definimos las siguientes variables de decisión:

• xt := Miles de palas fabricadas durante el trimestre t ∈ T := {1, 2, 3, 4}.

URJC-DEIO C. Beltrán 15
2.2. Modelos de la programación lineal

• st := Miles de palas en stock, al final del trimestre t ∈ T .

Tenemos que minimizar el coste de fabricación y almacenamiento de las palas (miles

euros):

z(x) = 13 x1 + 12 x2 + 11 x3 + 10 x4 .

La formulación de las ecuaciones de balance para los 4 trimestres es (s0 = 0):

s0 + x1 = 11 + s1 (primer trimestre)

s1 + x2 = 48 + s2 (segundo trimestre)

s2 + x3 = 64 + s3 (tercer trimestre)

s3 + x4 = 15 + s4 (cuarto trimestre)

Solución: El PL para optimizar la producción y almacenamiento de las palas corresponde a:


min z = 13 x1 + 12 x2 + 11 x3 + 10 x4 (coste)
s. a. s0 = 0 (stock inicial)
s0 + x1 = 11 + s1 (primer trimestre)
s1 + x2 = 48 + s2 (segundo trimestre)
s2 + x3 = 64 + s3 (tercer trimestre)
s3 + x4 = 15 + s4 (cuarto trimestre)
st ≥ 0 t ∈ T (no negatividad)
xt ≥ 0 t ∈ T (no negatividad)

General

Modelos de planificación multiperiodo:

• Los modelos estudiados hasta ahora se han limitado a un solo periodo (modelos estáticos).
• En muchas ocasiones hay que planificar en un horizonte de tiempo que abarca varios
periodos (modelos dinámicos o multiperiodo).

Variables de decisión: En estos problemas, muchas variables de decisión tiene una versión
para cada periodo.

Restricciones de balance:

• Describen la evolución temporal de una magnitud.


• A menudo es suficiente describir la evolución experimentada entre dos periodos conse-
cutivos.
Situaciónt + Cambiost = Situaciónt+1 .

URJC-DEIO C. Beltrán 16
2.3. Introducción a las técnicas de resolución de un PL

2.3. Introducción a las técnicas de resolución de un PL

En esta sección veremos dos apartados:

Resolución geométrica de un problema PL.

Problema PL en formato estandar.

2.3.1. Resolución geométrica de un PL

Ejemplo 6 (Representación de rectas)

Datos:

Consideramos la recta Rk definida por la siguiente ecuación:

2x1 + 3x2 = k.

Una notación más compacta consiste en decir: Consideramos la recta Rk

Rk ≡ 2x1 + 3x2 = k.

Objetivo:

1. Representa las rectas Rk para k = 6, 12, 18.


2. Supongamos que en un PL su función objetivo es

z(x) = 2x1 + 3x2

¿Cuánto vale la función objetivo para todos los puntos que están sobre la recta R6 ? ¿Y
los que están en R12 ? ¿Y en R18 ?
3. Supongamos que en el anterior PL estamos maximizando un beneficio. ¿En cuál de las
anteriores rectas la función objetivo alcanza un mejor valor?
4. Escribe la función objetivo como producto escalar c| x.
5. ¿Qué ángulo forma el vector c con las rectas anteriores?

Operaciones 6:

1. Podemos resolver la primera cuestión como sigue:

Una forma sencilla de representar una recta es calcular dos puntos por donde pasa

dicha recta.

En la tabla siguiente tenemos dos puntos para cada recta Rk para k = 6, 12, 18.

URJC-DEIO C. Beltrán 17
2.3. Introducción a las técnicas de resolución de un PL

k x1 x2
6 0 2
3 0
12 0 4
6 0
18 0 6
9 0
0 0 0
3 -2

Notar que también tenemos la recta correspondiente a k = 0, que siempre pasa por

el origen de coordenadas (caso especial).

A continuación representamos las correspondientes rectas.

Figura 2.1: Las tres rectas son paralelas.

2. Para todos los puntos que están sobre R6 , R12 ó R18 la función objetivo vale 6, 12 ó 18

respectivamente.

3. La función objetivo alcanza mejor valor en los puntos que están en R18 que en los puntos

que están en las otras dos rectas.

4. Podemos escribir la función objetivo usando el producto escalar:

z(x) = 2x1 + 3x2 = c| x

x1
donde c| = (2, 3) y x =

x2 .

5. En la Figura 2.2 observamos que el vector c es perpendicular a las tres rectas.

URJC-DEIO C. Beltrán 18
2.3. Introducción a las técnicas de resolución de un PL

Figura 2.2: c es perpendicular a las tres rectas.

Solución:
1. Ver apartado ‘Operaciones’ (cuestión 1).
2. Para todos los puntos que están sobre R6 , R12 o R18 la función objetivo vale 6, 12 ó 18,
respectivamente.
3. La función objetivo alcanza mejor valor en los puntos que están en R18 .
4. z(x) = c| x donde c| = (2, 3) y x = xx12 .


5. 90o .

General (Curvas de nivel en un PL)

Consideramos un PL de dimensión dos, cuya función objetivo es

z(x) = c| x,
x1
donde c| = (c1 , c2 ) y x =

x2 .

Para todos los puntos sobre la recta

Rk ≡ c| x = k

el valor de la función objetivo es k.

Las rectas Rk son perpendiculares a c y por tanto paralelas entre ellas.

La ‘curva de nivel k’ de z(x) es la curva que cumple

z(x) = k.

Notar que las curvas de nivel asociadas a una función lineal son en realidad rectas.

Por lo tanto, las curvas de nivel de z(x) son las rectas Rk para todo k ∈ R.

Ejemplo 7 (Representación de semiplanos)

Datos: Consideramos los semiplanos S1 y S2 definidos por la siguientes inecuaciones

S1 ≡ 2x1 + x2 ≤ 6

S2 ≡ x1 + 2x2 ≤ 6.

URJC-DEIO C. Beltrán 19
2.3. Introducción a las técnicas de resolución de un PL

Objetivo:

1. Representa la región del primer cuadrante del plano que cumple la primera inecuación.
Nota: el primer cuadrante es la región del plano con x1 ≥ 0 y x2 ≥ 0.
2. Representa la región del primer cuadrante del plano que cumple las dos inecuaciones
anteriores.

Operaciones 7:

1. Podemos resolver la primera cuestión como sigue:

En primer lugar representamos la recta determinada por la ecuación 2x1 + x2 = 6.

k x1 x2
6 0 6
3 0

Esta recta divide el plano en en dos semiplanos: el semiplano A que contiene el

punto (0, 0) y el semiplano B que no lo contiene.

S1 sólo puede ser A o B.

Dado que el punto (0, 0) cumple la inecuación que define S1

2·0+0=0≤6

podemos concluir que S1 coincide con A.

En caso contrario concluirı́amos que S1 coincide con B.

Ver Figura 2.3.

Figura 2.3: Región determinada por S1 .

URJC-DEIO C. Beltrán 20
2.3. Introducción a las técnicas de resolución de un PL

2. Podemos resolver la segunda cuestión como sigue:

En primer lugar representamos los semiplanos S1 y S2 en el primer cuadrante.

La región que nos piden corresponde a la intersección de S1 y S2 en el primer

cuadrante.

Ver Figura 2.4.

Figura 2.4: Región determinada por S1 y S2 .

Solución: Ver apartado ‘Operaciones’.

General (Semiplanos en un PL)

Consideramos un PL de dimensión dos cuyas restricciones son todas de desigualdad y con


variables positivas.

Cada una de dichas desigualdades corresponde a una inecuación que determina un semiplano.

La región factible del PL corresponde a la región determinada por los puntos que cumplen
todas las restricciones.

En este caso, la región factible corresponde a la región del primer cuadrante donde intersectan
todos los semiplanos asociados a las restricciones del PL.

Ejemplo 8 (Resolución gráfica de un PL)

Datos: Consideramos el siguiente PL

max z = 2x1 + 3x2


s.a. 2x1 + x2 ≤ 6 (Semiplano S1 )
x1 + 2x2 ≤ 6 (Semiplano S2 )
x ≥ 0.

Objetivo:

URJC-DEIO C. Beltrán 21
2.3. Introducción a las técnicas de resolución de un PL

1. Resuelve este PL de forma gráfica.


2. ¿Qué solución obtendrı́amos si en vez de maximizar, quisiéramos minimizar z?

Operaciones 8: El primer objetivo podemos resolverlo como sigue:

En primer lugar representamos la región factible y la mejor curva de nivel asociada a la

función objetivo. Ver Figura 2.5.

El punto óptimo x∗ corresponde a la intersección de las rectas que determinan los semi-

planos S1 y S2 .

Por lo tanto, podemos obtener x∗ resolviendo el siguiente sistema de ecuaciones lineales:

2x1 + x2 = 6

x1 + 2x2 = 6

La solución de este sistema es x∗ = (2 2)| y por tanto z ∗ = c| x∗ = 2 · 2 + 3 · 2 = 10.

Figura 2.5: Maximización: Resolución gráfica.

El segundo objetivo podemos resolverlo de forma análoga:

Sin embargo, en caso de minimización debemos movernos en la dirección de −c para

buscar el mejor punto.

En la Figura 2.6 podemos ver que ahora el mejor punto es el origen de coordenadas.

Por tanto la solución óptima es x∗ = (0 0)| y z ∗ = c| x∗ = 2 · 0 + 3 · 0 = 0.

URJC-DEIO C. Beltrán 22
2.3. Introducción a las técnicas de resolución de un PL

Figura 2.6: Minimización: Resolución gráfica.

Solución:

1. El mejor punto es x∗ = (2 2)| con valor de la función objetivo z ∗ = 10.


2. El mejor punto es x∗ = (0 0)| con valor de la función objetivo z ∗ = 0.

General (Resolución gráfica de un PL)

Consideramos un PL de dimensión dos, donde se quiere maximizar z(x) = c| x.

Para resolverlo de forma gráfica podemos seguir los siguientes pasos:

1. Representar el conjunto factible.


2. Representar el vector c.
3. Representar la recta Rk∗ ≡ c| x = k ∗ tal que:
a) Es perpendicular a c.
b) Intersecta con el conjunto factible,
c) k ∗ tiene el valor máximo posible.
4. Elegir un vértice factible que pertenezca a Rk∗ y que llamamos x∗ .
5. Determinar las coordenadas exactas de x∗ resolviendo el sistema lineal asociado a las
restricciones que determinan x∗ .
6. El punto óptimo del PL es x∗ y el beneficio óptimo es z(x∗ ).

En caso de minimizar, hacemos lo mismo salvo que en el anterior algoritmo debemos sustituir
c por −c.

Ejemplo 9 (Fabricación de trofeos)

Datos:

Una compañı́a produce trofeos para fútbol y trofeos para tenis.

URJC-DEIO C. Beltrán 23
2.3. Introducción a las técnicas de resolución de un PL

Tipo Beneficio Madera


de trofeo (Euros/trofeo) (pies/trofeo)
Fútbol 12 4
Tenis 9 2

Un pie maderero corresponde a una pieza cuadrada de 1 pie x 1 pie x 1 pulgada (aproxi-
madamente 30 x 30 x 2,5 cm).
En el almacén tenemos:
• 1000 adornos para el trofeo de fútbol,
• 1500 adornos para el trofeo de tenis,
• 1750 placas para la inscripción de cada trofeo,
• 4800 pies de madera
Se supone que se vende toda la producción.
Objetivo:
Esta compañı́a quiere maximizar sus beneficios. ¿Cuántos trofeos de cada tipo deberı́a
fabricar? ¿Cuánto serı́a su beneficio?
Buscar una buena solución por tanteo.
Operaciones: Se deja al lector.

Ejemplo 10 (Fabricación de trofeos - continuación)

Objetivo:
1. Formular este problema de optimización como un PL.
2. Resolverlo de forma gráfica.
Datos: Ver ejemplo anterior.

Operaciones 10:

1. Podemos resolver la primera cuestión como sigue:

URJC-DEIO C. Beltrán 24
2.3. Introducción a las técnicas de resolución de un PL

Definimos las variables de decisión

xj := Número de trofeos a producir del deporte j,

j ∈ J := {1, 2} = {Fútbol, Tenis}.

Finalidad del PL: Decidir los valores de xj , j ∈ J, para maximizar el beneficio.

La formulación como problema de PL es:

max z = 12x1 + 9x2 (ganancia total)


s. a. x1 ≤ 1000 (adornos fútbol)
x2 ≤ 1500 (adornos tenis)
x1 + x2 ≤ 1750 (placas)
4x1 + 2x2 ≤ 4800 (madera)
x1 , x2 ≥ 0

2. Podemos resolver la segunda cuestión como sigue:

En primer lugar representamos la región factible (ver Fig. 2.7).

En segundo lugar representamos las curvas de nivel asociadas a la función objetivo

(Fig. 2.7).

Estas curvas de nivel son las rectas Rk perpendiculares al vector c| = (12, 9).

El punto óptimo corresponde a la intersección de la región factible con la recta Rk

con un k ∗ máximo.

A simple vista no sabemos cuanto vale k ∗ .

Sin embargo, en la Fig. 2.7 observamos que el punto óptimo corresponde al vértice

de la región factible determinado por la intersección de las restricciones etiquetadas

como ‘placas’ y ‘madera’ (ver la formulación del PL).

Para determinar con exactitud las coordenadas de este punto tenemos que resolver el

sistema lineal asociado:

x1 + x2 = 1750

4x1 + 2x2 = 4800

Resolviéndolo obtenemos el punto óptimo

x∗ = (650, 1100).

URJC-DEIO C. Beltrán 25
2.3. Introducción a las técnicas de resolución de un PL

Figura 2.7: Región factible.

Para obtener el beneficio óptimo calculamos

z(x∗ ) = 12 · 650 + 9 · 1100 = 17700.

Notar que en este caso la mejor curva de nivel es R17700 .

Solución:
1. Ver apartado 1.
2. La solución óptima corresponde a fabricar 650 y 1100 trofeos de fútbol y de tenis,
respectivamente. El beneficio óptimo es de 17700 euros.

General (Tipos de puntos en un PL)

Tipos de puntos:

• Factible: Cumple todas las restricciones.


• Infactible: No es factible.
• Frontera: En al menos una desigualdad se cumple la igualdad.
• Interior: Punto factible que no es punto frontera.
• Extremo: No están contenidos en ningún segmento factible. Son los vértices del conjunto
factible.
• Óptimo: Punto factible con el mejor valor de la función objetivo.

Tipos de conjuntos: Con los puntos anteriores, podemos formar:

URJC-DEIO C. Beltrán 26
2.3. Introducción a las técnicas de resolución de un PL

• El conjunto factible.
• La frontera del conjunto factible.
• El interior del conjunto factible.
• El conjunto óptimo.
Propiedades de los puntos óptimos:
• Todo punto óptimo de un PL está en la frontera.
• Un PL puede tener 0, 1 ó infinitos puntos óptimos:
◦ 0 puntos óptimos: Ocurre cuando el PL es infactible o no acotado.
◦ 1 punto óptimo: Necesariamente es un punto extremo del conjunto factible.
◦ Infinitos puntos óptimos: Algunos de ellos son puntos extremos y el resto no.

2.3.2. Problema PL en formato estandar

Ejemplo 11 (Rardin, pag. 181, Ejercicio 5.3 b)

Objetivo: Pasar a formato estandar el siguiente PL.


Datos:
min z = 15(2x1 + 8x2 ) − 4x3
s. a. 2(10 − x1 ) + x2 + 5(9 − x3 ) ≥ 10
x1 + 2x3 ≤ x3
2x2 + 18x3 = 50
x1 , x2 , x3 ≥ 0
Operaciones 11:
min z = 30x1 + 120x2 − 4x3
s. a. −2x1 + x2 − 5x3 ≥ −55
x1 + x3 ≤0
2x2 + 18x3 = 50
x1 , x2 , x3 ≥ 0

Solución:
min z = 30x1 + 120x2 − 4x3
s. a. −2x1 + x2 − 5x3 − x4 = −55
x1 + x3 + x5 =0
2x2 + 18x3 = 50
x1 , x2 , x3 , x4 , x5 ≥ 0

General

PL en formato estandar (versión expandida):


min c1 x1 + . . . + cn xn (función objetivo)
s. a. a11 x1 + . . . + a1n xn = b1 (m restricciones)
..
.
am1 x1 + . . . + amn xn = bm
xj ≥ 0 j = 1, 2, . . . , n (restricciones
de no negatividad)

URJC-DEIO C. Beltrán 27
2.3. Introducción a las técnicas de resolución de un PL

donde:

xj variable de decisión,
cj coste de xj ,
aij coeficiente de la i-ésima restricción correspondiente a xj ,
bi término derecho de la restricción i (en inglés: Right-hand side, RHS).
m número de restricciones,
n número de variables de decisión.

PL en formato estándar (versión sumatorio):


n
X
min cj xj
j=1
Xn
s. a. aij xj = bi para todo i = 1, 2, . . . , m
j=1
xj ≥ 0 para todo j = 1, 2, . . . , n

PL en formato estándar (versión matricial): (Repaso de matrices: Rardin, pag. 185.)

min c0 x
s. a. Ax = b
x≥0

Cotas superiores: Un PL con variables acotadas superiormente por el vector u, tiene el siguien-
te formato:
min c0 x
s. a. Ax = b
0≤x≤u

PL de maximización y software:

• A menudo al usar software para resolver un PL sólo tenemos la opción de minimizar.


• En este caso para resolver un PL de maximización podemos usar el siguiente procedi-
miento:
1. Transformar nuestro PL de maximización en un PL de minimización, es decir, en
vez de resolver ‘max c| x’ resolvemos ‘min [−c| x]’
2. Si z ∗ es el valor óptimo del problema de minimización, entonces el valor óptimo del
problema de maximización original es −z ∗ .
• Este procedimiento se basa en la siguiente propiedad

max c| x = − min [−c| x]

URJC-DEIO C. Beltrán 28
2.4. Formulación del problema dual

2.4. Formulación del problema dual

Ref: Rardin, pag. 324.

Asociado a cada PL (primal) hay un problema que lo denominamos dual.

El problema dual también tiene estructura de programa lineal (PL).

Por cada restricción primal tenemos una variable dual vi .

2.4.1. Formulación del problema dual

Ejemplo 12

Objetivo: Dado el siguiente PL (primal) formula su dual.

Datos:
(P ) mı́n +7x1 +44x3
s. a. −2x1 −4x2 +1x3 ≤ 15,
+1x1 +4x2 ≥ 5,
+5x1 −1x2 +3x3 = −11,
x1 ≤ 0, x2 ≷ 0, x3 ≥ 0.

Operaciones 12:
(D) máx +15v1 +5v2 −11v3
s. a. −2v1 +1v2 +5v3 ≥ 7,
−4v1 +4v2 −1v3 = 0,
+1v1 +3v3 ≤ 44,
v1 ≤ 0, v2 ≥ 0, v3 ≷ 0.

Solución: El dual de (P ) es (D).

General (Formato expandido)

(P ) P (D)
mı́n c x
P
Pj j j máx i bi vi
s. a. a x = bi , i ∈ I1 s. a. vi ≶ 0, i ∈ I1
Pj ij j
a x ≤ bi , i ∈ I2 vi ≤ 0, i ∈ I2
Pj ij j
j aij xj ≥ bi , i ∈ I3 i ≥ 0,
vP i ∈ I3
xj ≥ 0, j∈J i aij vi ≤ cj , j∈J
P
máx c x
P
Pj j j mı́n i bi vi
s. a. a x = bi , i ∈ I1 s. a. vi ≶ 0, i ∈ I1
Pj ij j
a x ≤ bi , i ∈ I2 vi ≥ 0, i ∈ I2
Pj ij j
j aij xj ≥ bi , i ∈ I3 i ≤ 0,
vP i ∈ I3
xj ≥ 0, j∈J i aij vi ≥ cj , j∈J

Ejemplo 13

URJC-DEIO C. Beltrán 29
2.4. Formulación del problema dual

Tabla 2.1: Relación entre las restricciones de los PL primal y dual.

Objetivo: Dado el siguiente PL formula su dual.


Datos: 
(P ) mı́n  +7 +0 +44  x  
−2 −4 +1 15
s. a.  +1 +4 0  x =  5 
+5 −1 +3 −11
x≥0
Operaciones 13: 
(D) máx  +15 +5 −11 v  
−2 +1 +5 7
s. a.  −4 +4 −1  v ≤  0 
+1 0 +3 44
v≷0

Solución: El dual de (P ) es (D).

General Formato matricial:


(P ) (D)

mı́n c0 x máx b0 v
s. a. Ax = b s. a. v, sin restricción de signo
x≥0 A0 v ≤ c

máx c0 x mı́n b0 v
s. a. Ax = b s. a. v, sin restricción de signo
x≥0 A0 v ≥ c

2.4.2. Dual del dual de un PL

Ejemplo 14

Objetivo: Obtener el dual del dual de un PL estandar.

URJC-DEIO C. Beltrán 30
2.5. Relaciones primal-dual

Operaciones 14:

(P ) (D) (D2 )

mı́n c0 x máx b0 v mı́n c0 x


s. a. Ax = b s. a. v ≶ 0 s. a. Ax = b
x≥0 A0 v ≤ c x≥0

Solución: El dual del dual de (P ) es (D2 ) = (P ).

General Dado un PL, el dual del dual es el primal, (D2 ) = (P ).

2.5. Relaciones primal-dual

Las relaciones primal-dual que veremos en esta sección son las siguientes (Ref: Rardin, pag. 329).

Teoremas de dualidad en programación lineal.

Casos factible, infactible y no acotado.

2.5.1. Teoremas de dualidad

Teorema débil de dualidad:

• Consideramos un PL versión minimización (P ) y su dual (D).


• Consideramos x̄ y v̄ soluciones factibles de (P ) y (D), respectivamente.
• Entonces, la función objetivo dual en v̄ es una cota inferior a la función objetivo primal
en x̄ y viceversa:
b0 v̄ ≤ c0 x̄.

Teorema fuerte de dualidad:

• Consideramos un PL versión minimización (P ) y su dual (D).


• (P) tiene una solución óptima, digamos x∗ ⇔ (D) tiene una solución óptima, digamos v ∗ .
• En ese caso, sus valores óptimos coinciden:

b0 v ∗ = c0 x∗ .

Ejemplo 15

Datos:
(P ) mı́n +30x1 +5x3
s. a. 1x1 −1x2 +1x3 ≥ 1,
+3x1 +1x2 = 4,
+4x2 +1x3 ≤ 10,
x1 ≥ 0, x2 ≥ 0, x3 ≥ 0.

URJC-DEIO C. Beltrán 31
2.5. Relaciones primal-dual

(D) máx +1v1 +4v2 +10v3


s. a. +1v1 +3v2 ≤ 30,
−1v1 +1v2 +4v3 ≤ 0,
+1v1 +1v3 ≤ 5,
v1 ≥ 0, v2 ≷ 0, v3 ≤ 0.

x̄ = (1 1 1)
v̄ = (2 6 −1)

Objetivo:

1. Comprueba el teorema débil de dualidad con x̄ y v̄.


2. ¿ Son óptimos los puntos x̄ y v̄ ?

Operaciones 15:

1. Vamos a comprobar el teorema débil de dualidad

El punto x̄ es factible primal pues:

• x̄ ≥ 0.

• Además, x̄ cumple las restricciones:

+1(1) −1(1) +1(1) = 1 ≥ 1,


+3(1) +1(1) = 4,
+4(1) +1(1) = 5 ≤ 10,

Análogamente se ve que v̄ es factible dual.

Teorema débil de dualidad: ¿b0 v̄ ≤ c0 x̄?

b0 v̄ = 1(2) +4(6) +10(−1) = 16


c0 x̄ = 30(1) +5(1) = 35

2. Por el teorema fuerte de dualidad, los puntos x̄ y v̄ no pueden ser óptimo primal y óptimo

dual simultáneamente pues

c0 x̄ 6= b0 v̄.

(Sin embargo, eso no descarta que cada uno de ellos pudiera ser óptimo.)

Solución:
1. Observamos que los puntos x̄ y v̄ cumplen el teorema débil de dualidad.
2. Por el teorema fuerte de dualidad, al menos uno de los dos puntos no es óptimo.

URJC-DEIO C. Beltrán 32
2.5. Relaciones primal-dual

2.5.2. Casos factible, infactible y no acotado

Como consecuencia de los teoremas de dualidad, dado un PL (P ) (versión minimización) y su dual


(D):

La función objetivo de (P ) tiene un valor óptimo finito. ⇔ La función objetivo de (D) tiene
un valor óptimo finito.

La función objetivo de (P ) no está acotada (inferiormente). ⇒ El problema (D) es infactible.

La función objetivo de (D) no está acotada (superiormente). ⇒ El problema (P ) es infactible.

URJC-DEIO C. Beltrán 33
2.5. Relaciones primal-dual

URJC-DEIO C. Beltrán 34
Capı́tulo 3

Programación no lineal sin restricciones

3.1. Introducción

Este capı́tulo está estructurado en la siguientes secciones:

Modelos de optimización no lineal.

Métodos de optimización unidimensional.

Gradiente y matriz hessiana.

Métodos de optimización multidimensional.

3.2. Modelos de optimización no lineal

Objetivo: Aprender a formular los problemas de optimización donde algún elemento es no lineal.

Apartados:

Diseño óptimo.
Ajuste de curvas y problemas de regresión.

3.2.1. Diseño óptimo

Ejemplo 16 (Cercado de área máxima)

Objetivo: Un ganadero quiere diseñar el cercado rectangular de área máxima.

Datos:

Dispone de un rollo de valla metálica de 100 m (suponemos que el ganadero quiere


utilizar todo el rollo).
Para hacer el cercado quiere aprovechar (total o parcialmente) un muro que mide 100 m.
Las variables de decisión son: La base b y la altura h del rectángulo.

35
3.2. Modelos de optimización no lineal

El área del rectángulo es:


A(b, h) = b h

Operaciones 16:

Nos conviene expresar A(b, h) en función sólo de h.

• Dado que el ganadero quiere aprovechar el muro, repartirá los 100 m de valla en

una base y dos alturas:

b + 2h = 100m ⇒ b = 100 − 2h.

• Por tanto

A(b, h) = b h = (100 − 2h) h ⇒ A(h) = −2h2 + 100h

El problema que queremos resolver se puede expresar como un problema de optimiza-

ción:

máx A(h)
h∈R1

• Tenemos que

A(0) = 0, A(25) = 1250 y A(50) = 0.

• Es fácil ver gráficamente que la altura óptima es h∗ = 25 m.

Solución: El cercado de área máxima tiene dimensiones 50 m × 25 m y su área es de 1250 m2 .

General

Problemas de Optimización No Lineal sin restricciones (ONL): El problema del cercado es un


ejemplo de problema ONL:
mı́nn f (x)
x∈R

Problemas de decisión: La mayorı́a de problemas de decisión pueden verse como un problema de


optimización (tomamos una decisión óptima).

Criterio de decisión: Una decisión se toma en base a un criterio (costes, beneficios, etc.). Este
criterio viene recogido en la función objetivo f (x).

Variables de decisión: Tomar una decisión equivale a elegir unos valores para los parámetros, que
definen una decisión.

URJC-DEIO C. Beltrán 36
3.2. Modelos de optimización no lineal

Figura 3.1: Nube de puntos (pi , qi ) = (No de estaciones, Precio por estación).

Decisión óptima (relativa al criterio f (x)): Una decisión x∗ es óptima si

f (x∗ ) ≤ f (x) para cualquier x ∈ Rn .

¿Minimización o maximización?: Optimizar una función corresponderá a minimizarla o maximizar-


la según estemos en un contexto de costes o beneficios, respectivamente.

Equivalencia entre minimización y maximización: Todo problema de maximización es equivalente


a uno de minimización (y viceversa):

máxn f (x) = − mı́nn − f (x) .
x∈R x∈R

3.2.2. Ajuste de curvas y problemas de regresión

Ejemplo 17 (Polı́tica de precios para las estaciones de trabajo IBM (Rardin, pag. 718) )

Objetivo: Ajustar la curva ‘No de estaciones / Precio por estación’, para facilitar futuras ofertas de
venta (ver Fig. 3.1).

Datos:

El precio por estación de trabajo que se ha cobrado a cada cliente ha dependido, entre
otras cosas, del número de estaciones que componen el sistema.
Tenemos datos de m = 12 sistemas informáticos vendidos recientemente.
i ı́ndice para cada venta, i ∈ I = {1, . . . , 12}.
pi número de estaciones de trabajo del sistema i ∈ I.
qi precio (en miles de Euros) por estación de trabajo del sistema i ∈ I.

URJC-DEIO C. Beltrán 37
3.2. Modelos de optimización no lineal

Operaciones 17:

Queremos determinar una función precio r(p) tal que

r(pi ) ≈ qi para cada i ∈ I.

Medimos la bondad de r con el error o residuo f (r):

f (r) = kq − r̄(p)k2 ,

donde q 0 = (q1 , . . . , qm ) y r̄(p)0 = (r(p1 ), . . . , r(pm )).

La familia de curvas exponenciales r(x | a, b) = axb con b negativo parece una buena

candidata dada la forma de la nube de puntos. Recordar la forma de:

1
r(p) =
p

Dado que para nosotros las variables de decisión son a y b hacemos un cambio de

notación. Escribimos r(p | x1 , x2 ) = x1 px2 en vez de r(p | a, b) = apb .

Nuestro problema de ajuste puede formularse como un problema de optimización no

lineal sin restricciones:

mı́n f (x) := kq − r̄(p | x1 , x2 )k2


x∈R2

Equivalentemente:
X
mı́n f (x) = (qi − x1 (pi )x2 )2
x∈R2
i∈I

Propiedad: Si f (x) = ax entonces f 0 (x) = ax ln(a).

Para optimizar, buscaremos los puntos de ‘derivada nula’ de f (x):

∂f X
= −2 [qi − x1 (pi )x2 ](pi )x2 = 0,
∂x1
i∈I

∂f X
= −2 [qi − x1 (pi )x2 ][x1 (pi )x2 ] ln(pi ) = 0.
∂x2
i∈I

Este sistema no lineal no es fácil de resolver...

Sin embargo, el tener una expresión para las derivadas nos acelerará el proceso de solución

de nuestro problema por métodos de optimización numéricos.

URJC-DEIO C. Beltrán 38
3.3. Métodos de optimización unidimensional

Solución: Mediante métodos numéricos se obtiene una curva óptima.

x∗1 = 40,69 y x∗2 = −0,6024 ⇒ r(p) = 40,69p−0,6024

3.2.3. Ejercicios

1. Queremos fabricar latas de Coca-Cola de 333 cm3 minimizando la cantidad de aluminio utili-
zado, es decir, queremos minimizar el área de la lata. Ayuda: área del cı́rculo = πr2 , longitud
de la circunferencia = 2πr, volumen del cilindro = πr2 h.

a) Calcula el área de la anterior lata A(r, h) en función de su altura h y de su radio r.


b) Calcula el área de la anterior lata A(r) en función sólo de su radio r.
c) Representa A(r).
d) Calcula las dimensiones (h∗ , r∗ ) de la lata de menor área. ¿Que área tiene?

3.3. Métodos de optimización unidimensional

Objetivo: Aprender a resolver problemas ONL unidimensionales:

mı́n f (x).
x∈R

Apartados:

Método analı́tico.
Método de Newton.

3.3.1. Método analı́tico

Ejemplo 18 (Cercado de área máxima - Cont.)

Objetivo: Maximizar la función área A(h) analı́ticamente.

Datos: A(h) = −2h2 + 100h m2

Operaciones 18:

Tenemos que resolver A0 (h) = 0:

−4h + 100 = 0.

Su única solución es h∗ = 25.

Dado que A00 (h) = −4, tenemos que A00 (25) = −4 y por lo tanto 25 es un maximizador

de A(h).

URJC-DEIO C. Beltrán 39
3.3. Métodos de optimización unidimensional

Solución: h∗ = 25m maximiza A(h) y A∗ = 1250 m2 .

General

Método analı́tico: Resolución analı́tica de

mı́n f (x),
x∈R

1. Resolvemos la ecuación f 0 (x) = 0 y obtenemos x∗ .


2. Si f 00 (x∗ ) > 0, x∗ es un minimizador (local) de f .
3. Si f 00 (x∗ ) < 0, x∗ es un maximizador (local) de f .
4. Si f 00 (x∗ ) = 0, repetir el proceso anterior resolviendo f 000 (x) = 0 y analizando el signo
de la cuarta derivada....

Métodos de optimización numéricos:

Cuando la optimización analı́tica es difı́cil o imposible, recurrimos a métodos de optimi-


zación numéricos (ejem. método de Newton).
Además del método de Newton existen otros métodos, como por ejemplo el ‘Método de
la sección áurea’ (Rardin, pag. 726).
El método de Newton es uno de los más rápidos.

3.3.2. Método de Newton (unidimensional)

Ejemplo 19 (Método de Newton)

Objetivo: Minimizar la función f (x).

Datos:
f (x) = x4 + 4x3 − 11x2 − 36x + 118

Operaciones 19:

Para minimizar f resolvemos f 0 (x) = 0:

4x3 + 12x2 − 22x − 36 = 0.

Aunque, en este ejemplo podrı́amos resolver esta ecuación analı́ticamente, en general no

siempre es posible.

En caso de no poder minimizar analı́ticamente, podemos minimizar mediante métodos

numéricos.

Si nuestra función es dos veces derivable, podemos aplicar el método de Newton.

URJC-DEIO C. Beltrán 40
3.3. Métodos de optimización unidimensional

Figura 3.2: Idea intuitiva del método de Newton.

El método de Newton minimiza una función unidimensional aplicando el siguiente pro-

ceso iterativo
f 0 (xk )
xk+1 = xk −
f 00 (xk )

En nuestro caso partiendo arbitrariamente de x0 = 1 tenemos:


k xk f 0 (xk ) f 00 (xk )
0 1 -42 14
1 4 324 266
.. .. .. ..
. . . .
5 2.0001 0.0080 74.0078
6 2.0000 0.0000 74.0000

Notar que f 0 (2) = 0 y f 00 (2) > 0.

Solución:
x∗ = 2 es un minimizador (local) de f (x).
f(2) = 50 es un mı́nimo (local) de f (x).

General

Método de Newton (idea): Para calcular xk+1 , el método de Newton aproxima f (x) en xk mediante
una parábola (ver Fig. 3.2).

Método de Newton (algoritmo): Resolución numérica de

mı́n f (x),
x∈R

donde f es dos veces derivable.

1. Seleccionamos:
Un punto inicial x0 .

URJC-DEIO C. Beltrán 41
3.4. Gradiente y matriz hessiana

Figura 3.3: f (x) = x3 − 9x2 + 24x − 14.

Una tolerancia  > 0 para el criterio de parada.


2. Mientras se cumpla | f 0 (xk ) |> , iterar según:

f 0 (xk )
xk+1 = xk −
f 00 (xk )

3.3.3. Ejercicios

1. (Ref. Rardin 13-17). Consideramos la función

70
f (x) = 10x + .
x
Minimiza f (x) utilizando los siguientes métodos:

a) Método analı́tico.
b) Método de Newton. Tomar el punto inicial x0 = 1 y una tolerancia  = 10−4 para el
criterio de parada. Se recomienda el uso de una hoja de cálculo.

3.4. Gradiente y matriz hessiana

Ejemplo 20

Objetivo: Interpretar la primera y segunda derivada de f (x) en x = 4 (Fig. 3.3).

Datos:
f (x) = x3 − 9x2 + 24x − 14.

URJC-DEIO C. Beltrán 42
3.4. Gradiente y matriz hessiana

Figura 3.4: f (x) = 40 + x31 (x1 − 4) + 3(x2 − 5)2 .

Operaciones 20:

f 0 (x) = 3x2 − 18x + 24 ⇒ f 0 (4) = 0.

f 00 (x) = 6x − 18 ⇒ f 00 (4) = 6.

Solución: En x = 4, la pendiente de f es 0 y su curvatura es positiva (el signo de la curvatura


viene dado por el signo de la segunda derivada).

General (Curvatura de una función unidimensional)

Curvatura y segunda derivada coinciden en signo: Dada la función y = f (x), su curvatura


viene dada por:
y 00
.
(1 + (y 0 )2 )2/3
Para optimizar lo que realmente nos interesa es el signo de la curvatura.

Por ejemplo f (x) = x2 es una función de curvatura positiva en todo R pues f 00 (x) = 2.

Ejemplo 21

Datos: En la Fig. 3.4 tenemos la representación de f (x).

f (x) = 40 + x31 (x1 − 4) + 3(x2 − 5)2 .

Objetivo: Calcular el vector gradiente y la matriz hessiana de f (x) en

x = (3, 5)|

Operaciones 21:

URJC-DEIO C. Beltrán 43
3.4. Gradiente y matriz hessiana

Podemos expresar f como:

f (x) = 40 + x41 − 4x31 + 3(x2 − 5)2 .

El gradiente de f corresponde a:
∂f |
   |
∂f
∇f (x) = = 4x31 − 12x21 6(x2 − 5) ,
∂x1 ∂x2
y por tanto

∇f (3, 5) = (0, 0)|

La matriz hessiana de f corresponde a:


∂2f ∂2f
 
 ∂2x ∂x1 ∂x2  12x21 − 24x1
 
 1  0
H(x) = 
  = ,
 ∂2f
 0 6
∂2f 
∂x2 ∂x1 ∂ 2 x2
y por tanto
 
36 0
H(3, 5) =
0 6

General (Gradiente y matriz hessiana)

Gradiente de f : Rn → R:
Generaliza el concepto de derivada.
Se calcula:  |
∂f ∂f
∇f (x) = ... .
∂x1 ∂xn x=x
Describe la pendiente o razón de cambio de f en las direcciones principales (ejes coor-
denados).
En el caso unidimensional (n = 1) el gradiente corresponde a la derivada:
 
df
∇f (x) = = f 0 (x).
dx x=x
Matriz hessiana de f : Rn → R:
Generaliza el concepto de segunda derivada.
Se calcula:
∂2f ∂2f
 
...
 ∂ 2 x1 ∂x1 ∂xn 
H(x) = 
 .. .. 
.
. .

 
 ∂2f ∂2f 
...
∂xn ∂x1 ∂ 2 xn x=x
Nota: Otra notación muy usada para H(x) es ∇2 f (x).
En el caso unidimensional (n = 1) la matriz hessiana corresponde a la segunda derivada:
 2 
d f
H(x) = = f 00 (x).
d2 x x=x

URJC-DEIO C. Beltrán 44
3.5. Métodos de optimización multidimensional

3.5. Métodos de optimización multidimensional

Objetivo: Resolver el problema ONL multidimensional

mı́n f (x),
x∈Rn

mediante métodos numéricos (Rardin, pag. 757).

Apartados:

Método del gradiente.


Método de Newton (multidimensional).

3.5.1. Método del gradiente

Idea: Para un problema de minimización, mejoramos el punto actual xk siguiendo la dirección de


máximo descenso dk , que viene dada por:

dk = −∇f (xk ).

Nota: En el anterior algoritmo, también podemos usar una longitud de paso constante y pequeña
λt+1 > 0 (por ejemplo λt+1 = 0, 1).

Ejemplo 22

Objetivo: Realizar una iteración del método del gradiente para minimizar f (x), tomando el punto
inicial x0 = (0 0)| .

URJC-DEIO C. Beltrán 45
3.5. Métodos de optimización multidimensional

Datos:
f (x) = (x1 − 1)2 + (x2 − 3)2 .

Operaciones 22:

Paso 0: Seleccionamos x0 = (0 0)| ,  = 0,1 e inicializamos k = 0.

Paso 1:
 
0 −2
∇f (x ) = .
−6

Paso 2: Dado que

p √
k∇f (x0 )k = (−2)2 + (−6)2 = 40 6< 0,1.

x0 no es un punto estacionario y por tanto no es un punto óptimo.

Paso 3:
 
0 2 0
d = −∇f (x ) =
6

Paso 4:

• El siguiente punto depende de λ

x1 (λ) = x 0
 +
0
 λd  
0 2
= +λ
0  6

=

• Tenemos que buscar el λ que nos dé el mejor x1 . (búsqueda lineal).

• Es decir, tenemos que resolver

mı́n f (x1 (λ)),


λ>0

donde

f (x1 (λ)) = (2λ − 1)2 + (6λ − 3)2

• Resolviendo la anterior minimización unidimensional, obtenemos que el mejor λ es

λ0 = 0,5.

URJC-DEIO C. Beltrán 46
3.5. Métodos de optimización multidimensional

Paso 5: El nuevo punto es por tanto

x1 = x 0
 +
0 0
λ d  
0 2
= + 0,5
0 6
1
=
3

Paso 6: Actualizar el contador: k = 1 y volver al Paso 1.

Solución:

El nuevo punto dado por el método del gradiente es

x1 = (1, 3)| .

La función objetivo ha pasado de valer f (x0 ) = 10 a valer f (x1 ) = 0.


Es fácil ver que x1 es ya un punto óptimo.
Normalmente, el método del gradiente requerirá varias iteraciones para obtener un punto
óptimo.

3.5.2. Método de Newton (multidimensional)

Idea: Para minimizar f (x), mejoramos el punto actual xk tomando el minimizador de la aproxima-
ción cuadrática de f en xk .

Ejemplo 23

Objetivo: Realizar una iteración del método de Newton para minimizar f (x), tomando el punto
inicial x0 = (0 1)| .

URJC-DEIO C. Beltrán 47
3.5. Métodos de optimización multidimensional

Datos:
f (x1 , x2 ) = (x1 + 1)4 + x1 x2 + (x2 + 1)4 .

Operaciones 23:

Paso 0: Seleccionamos x0 = (0 1)| ,  = 0,1 e inicializamos k = 0.

Paso 1:
4(x1 + 1)3 + x2
   
0 5
∇f (x ) = = .
x1 + 4(x2 + 1)3 x=x0 32

Paso 2:
p √
k∇f (x0 )k = 12 + 322 = 1025 6< 0,1.

x0 no es un punto óptimo pues no es un punto estacionario.

Paso 3:

• La hessiana en el punto actual es

12(x1 + 1)2
   
0 1 12 1
H(x ) = = .
1 12(x2 + 1)2 x=x0
1 48

• Para obtener la dirección de Newton d0 resolvemos el sistema lineal:

H(x0 ) dk = −∇f (x0 ).

• Es decir:
d01
    
12 1 −5
= .
1 48 d02 −32

• Su solución es
 
0 −0,3617
d = .
−0,6591

Paso 4: El nuevo punto es por tanto

x1 = x 0
 +
0
d  
0 −0,3617
= +
1 −0,6591

−0,3617
= .
+0,3409

Paso 5: Hacer k = 1 y volver al Paso 1.

Solución:

URJC-DEIO C. Beltrán 48
3.5. Métodos de optimización multidimensional

Figura 3.5: Nube de puntos (pi , qi ) = (No de estaciones, Precio por estación).

El nuevo punto dado por el método de Newton es


(−0,3617, +0,3409).

La función objetivo ha pasado de valer f (x0 ) = 17 a valer f (x1 ) = 3,28.


Notar que en el método de Newton no hay que calcular la longitud de paso λk pues
siempre vale 1.

3.5.3. Método del gradiente vs. método de Newton

Ejemplo 24 (Polı́tica de precios para las estaciones de trabajo IBM (Rardin, pag. 718) )

Objetivo: Ajustar la curva ‘No de estaciones / Precio por estación’, para facilitar la determinación
de precios en futuras ofertas de venta (ver Fig. 3.5).

Datos:

El precio por estación de trabajo que se ha cobrado a cada cliente ha dependido, entre
otras cosas, del número de estaciones que componen el sistema.
Tenemos datos de m = 12 sistemas informáticos vendidos recientemente.
i ı́ndice para cada venta, i ∈ I = {1, . . . , 12}.
pi número de estaciones de trabajo del sistema i ∈ I.
qi precio (en miles de Euros) por estación de trabajo del sistema i ∈ I.

Operaciones 24:

Queremos determinar la una función que ajuste lo mejor posible la nube de puntos (nues-

tros datos).

URJC-DEIO C. Beltrán 49
3.5. Métodos de optimización multidimensional

Es decir, queremos determinar una función r(p) tal que

r(pi ) ≈ qi para cada i ∈ I.

La función
1
r(p) = = p−1
p

parece una buena primera aproximación, dada la forma de la nube de puntos.

La familia de curvas r(p | a, b) = apb (con b < 0) parece, por tanto, una buena opción

para buscar nuestra curva.

Para medir la calidad de r, compararemos el vector de precios observados q con el vector

de precios propuestos r̄(p), donde

q = (q1 , . . . , qm )

r̄(p) = (r(p1 ), . . . , r(pm )).

Por tanto, podemos medir la bondad de ajuste de r con el error o residuo f (r):

f (r) = kq − r̄(p)k2 ,

Dado que para nosotros las variables de decisión son a y b, hacemos un cambio de

notación. Escribimos

r(p | x1 , x2 ) = x1 px2

en vez de

r(p | a, b) = apb .

Nuestro problema de ajuste puede formularse como un problema de ONL:

mı́n f (x) := kq − r̄(p | x1 , x2 )k2


x∈R2

12
X 2
mı́n qi − x1 (pi )x2 .
x∈R2
i=1

URJC-DEIO C. Beltrán 50
3.5. Métodos de optimización multidimensional

Tabla 3.1: Iteraciones del método del gradiente.

Solución: Ajustar la curva ‘No de estaciones / Precio por estación’ equivale a resolver el problema
ONL:
mı́n f (x1 , x2 ),
x∈R2
donde
12
X 2
f (x1 , x2 ) = qi − x1 (pi )x2
i=1
(qi , pi son datos conocidos).

Ejemplo 25 (Resolución por el método del gradiente)

Objetivo: Resolver mediante el método del gradiente:


mı́n f (x1 , x2 ),
x∈R2

donde
12
X 2
f (x1 , x2 ) = qi − x1 (pi )x2
i=1
(qi , pi son datos conocidos).

Operaciones 25:

La trayectoria de los puntos generados por el método del gradiente pueden verse en la

Figura 3.6.

URJC-DEIO C. Beltrán 51
3.5. Métodos de optimización multidimensional

Figura 3.6: Representación de las iteraciones del método del gradiente.

El método del gradiente converge después de 27 iteraciones, si partimos del punto

x0 = (32, −0,4) y con una tolerancia para el criterio de parada  = 0,1 (Tabla 3.1).

Solución: La curva óptima obtenida con el método del gradiente corresponde a

x∗1 = 40,66 y x∗2 = −0,6020 ⇒ r(p) = 40,66p−0,6020

Ejemplo 26 (Resolución por el método de Newton)

Objetivo: Resolver mediante el método de Newton:

mı́n f (x1 , x2 ),
x∈R2

donde
12
X 2
f (x1 , x2 ) = qi − x1 (pi )x2
i=1

(qi , pi son datos conocidos).

Operaciones 26:

El método de Newton converge después de 3 iteraciones, si partimos del punto x0 =

(32, −0,4)| y con una tolerancia para el criterio de parada  = 0,01 (Tabla 3.2).

La trayectoria de los puntos generados por el método de Newton pueden verse en la

Figura 3.7.

URJC-DEIO C. Beltrán 52
3.5. Métodos de optimización multidimensional

Tabla 3.2: Iteraciones del método de Newton.

Figura 3.7: Representación de las iteraciones del método de Newton.

URJC-DEIO C. Beltrán 53
3.5. Métodos de optimización multidimensional

Solución: La curva óptima obtenida con el método de Newton corresponde a

x∗1 = 40,69 y x∗2 = −0,6024 ⇒ r(p) = 40,69p−0,6024

General (Ventajas (+) y desventajas (−))

Método del gradiente:

+ Convergencia a un óptimo garantizada.


+ En las primeras iteraciones, el progreso hacia el óptimo es bueno.
− Después de las primeras iteraciones, la convergencia pude ser lenta: puede avanzar hacia
el óptimo siguiendo una trayectoria en forma de zig-zag.
+ Cada iteración es computacionalmente ligera (en tiempo de CPU y en requerimientos de
memoria RAM): en cada iteración calculamos el gradiente (dimensión n) y la longitud de
paso.

Método de Newton:

− Convergencia garantizada sólo si empezamos ‘suficientemente’ cerca del óptimo.


+ La convergencia es rápida (pocas iteraciones).
− Cada iteración es computacionalmente cara (en tiempo de CPU y en requerimientos de
memoria RAM): en cada iteración calculamos la hessiana (dimensión n2 ) y resolvemos
un sistema lineal.

Estrategia mixta: Usar un método u otro dependerá del problema. Una buena alternativa es combi-
nar los dos métodos:

Usar el método del gradiente en una primera fase para ‘acercarnos’ al óptimo.
Cuando el progreso del método del gradiente es lento, empezar una segunda fase con el
método de Newton que nos lleve en pocas iteraciones al óptimo.

3.5.4. Ejercicios

1. Dada la función f (x) = (x1 − 2)4 + (x1 − 2x2 )2 , realiza una iteración del método de Newton
para resolver el problema,
mı́n f (x),
x∈R2

tomando x0 = (0 3) como punto inicial y  = 0,1 para el criterio de parada.

URJC-DEIO C. Beltrán 54
Capı́tulo 4

Teorı́a de la decisión: Decisiones


multiobjetivo

4.1. Introducción al análisis de decisiones

El ‘Análisis de decisiones’ y la ‘Optimización’ están ı́ntimamente relacionadas.

En general se desea tomar la ‘mejor’ decisión según uno o varios criterios, es decir, se desea
tomar la decisión óptima según uno o varios criterios.

Por lo tanto, los métodos de optimización de los capı́tulos anteriores (programación lineal (PL)
y programación lineal entera (PLE)) pueden ser de gran ayuda a la hora de tomar decisiones.

Tanto la PL como la PLE son métodos de optimización monoobjetivo, pues consideran sólo
un criterio u objetivo (coste, beneficio, etc.).

Sin embargo, tal como veremos en el próximo ejemplo, en muchos casos la toma de decisiones
implica considerar varios criterios u objetivos (decisiones multiobjetivo).

Nota. Este tema también se puede consultar y/o ampliar en:

El Capı́tulo 8 del siguiente libro: Rardin, R. L., ‘Optimization in operations research’, Editorial
Prentice Hall, 1998.

Los Capı́tulos 2 y 4 del siguiente libro: C. Beltran-Royo. ‘Decisiones Óptimas: Cómo Optimizar
las Cuestiones de la Vida Cotidiana’, CreateSpace (Amazon), EEUU, 2013.

Ejemplo 27

Datos:

Marı́a es representante comercial de una prestigiosa marca de relojes suizos.


Su trabajo consiste en visitar a los diferentes clientes que la firma posee en las principales
ciudades de España y Portugal.
Por ese motivo Marı́a debe recorrer alrededor de 30000 Km de autovı́a o autopista cada
año.

55
4.1. Introducción al análisis de decisiones

Marı́a, por un lado estima que cada hora de conducción tiene un valor de 40 euros.
Por otro lado, sabe que el consumo de su coche es de 8,0, 11,5 ó 15,7 litros cada 100 Km
viajando a una velocidad de 100, 120 ó 140 Km/h, respectivamente.
El precio del gasoil está en 1,50 euros/litro.

Objetivo: El objetivo de Marı́a es decidir qué velocidad le conviene más al hacer sus despla-
zamientos por autovı́a o autopista, teniendo en cuenta el consumo de gasoil y el tiempo de
desplazamiento.

Operaciones 27:

Para tomar la anterior decisión, Marı́a se dispone a calcular la velocidad media óptima

teniendo en cuenta el consumo de gasoil y el ‘consumo’ de tiempo.

Para simplificar sólo va a considerar tres velocidades: 100, 120 y 140 km/h.

En la Tabla 4.1 tenemos el coste anual en euros (gasoil y tiempo) para cada una de las

tres velocidades.

F1 F2 F3
Velocidad Coste Coste Coste
del gasoil del tiempo global
100 3600 12000 15600
120 5175 10000 15175
140 7065 8571 15636

Tabla 4.1: Coste anual global (euros) en función de la velocidad (Km/h).

La función objetivo F3 se calcula como se detalla a continuación:

• F1 = 1,50 · ( 30000 / 100 ) · Consumo asociado a la velocidad

• F2 = 40 · ( 30000 / Velocidad )

• F3 = F1 + F2

Por ejemplo para la velocidad 120 Km/h:

• F1 = 1,50 · ( 30000 / 100 ) · 11,5 = 5175 euros.

• F2 = 40 · ( 30000 / 120 ) = 10000 euros.

• F3 = 5175 + 10000 = 15175 euros.

Comparando los tres valores de F3 en la Tabla 4.1 vemos que la mejor solución es 120

Km/h.

URJC-DEIO C. Beltrán 56
4.1. Introducción al análisis de decisiones

Solución: Con los datos de Marı́a, la velocidad media óptima para viajar por autovı́a, es de 120
Km/h, ocasionándole un gasto de 15175 euros/año.

General (Decisiones multiobjetivo)

Como ya hemos mencionado, en muchos casos la toma de decisiones implica considerar varios
objetivos simultáneamente (decisiones multiobjetivo).

En el ejemplo anterior ha sido posible transformar un problema con dos criterios (consumo de
gasoil y consumo de tiempo) en un problema con un único criterio (consumo de euros).

La idea ha sido expresar en la misma unidad (euros) el coste del gasoil y el coste del tiempo
de trabajo de Marı́a.

Por lo tanto, en algunos casos es posible transformar los objetivos involucrados en un único
objetivo y utilizar la optimización monoobjetivo.

En otros, tal como veremos en el siguiente ejemplo, es difı́cil o imposible transformar todos
los criterios involucrados en un único criterio.

Ejemplo 28 (Banco Trébol)

Datos:

El Banco Trébol tiene los siguientes recursos (en millones de euros):


• capital propio: 20,
• capital en cuentas corrientes: 150,
• capital en depósitos a plazo fijo: 80.
Está planificando su estrategia de inversión y en la Tabla 4.2 ha recopilado los datos de
los posibles tipos de inversión:

Tipo de Tasa de Tasa de Tasa de


Inversión j Rendimiento Liquidez Reservas ¿Riego?
( %) ( %) ( %)
1: Dinero en caja 0,0 100,0 0,0 No
2: Inversiones a corto plazo 4,0 99,5 0,5 No
3: Bonos del Estado (1 a 5 años) 4,5 96,0 4,0 No
4: Bonos del Estado (6 a 10 años) 5,5 90,0 5,0 No
5: Bonos del Estado (más de 10 años) 7,0 85,0 7,5 No
6: Préstamos a plazo 10,5 0,0 10,0 Sı́
7: Préstamos hipotecarios 8,5 0,0 10,0 Sı́
8: Préstamos comerciales 9,2 0,0 10,0 Sı́

Tabla 4.2: Posibles inversiones para el Banco Trébol.

• La ‘Tasa de Rendimiento’ corresponde al rendimiento anual.


• La ‘Tasa de Liquidez’ refleja el grado de disponibilidad del dinero. Por ejemplo,
una tasa del 90 % significa que sólo el 90 % del capital invertido en ese producto está
disponible de forma inmediata.

URJC-DEIO C. Beltrán 57
4.1. Introducción al análisis de decisiones

• La ‘Tasa de Reserva’ sirve para constituir un fondo de reserva. Por ejemplo, una tasa
del 10 % significa que el Banco debe dejar en el fondo de Reservas un capital igual al
10 % del capital invertido en ese producto.
• En la columna ‘¿Riesgo?’ se indica si la inversión tiene cierto nivel de riesgo.

Objetivo: Define la función objetivo para cada uno de los siguientes tres objetivos:

1. Maximizar el beneficio.
2. Minimizar el coeficiente de riesgo (CRi):
Inversiones con riesgo
CRi =
Capital propio

3. Minimizar el coeficiente de reservas (CRe):


Fondo de reserva
CRe =
Capital propio

Operaciones 28:

El primer paso es definir las variables de decisión:

xj = Millones de euros invertidos en el producto j.

A continuación vamos a expresar cada uno de los objetivos en función de las variables

de decisión.

1. Considerando la ‘Tasa de Rendimiento’ podemos expresar el beneficio como:

max z1 (x) = 0, 000x1 + 0, 040x2 + 0, 045x3 + 0, 055x4

+ 0, 070x5 + 0, 105x6 + 0, 085x7 + 0, 092x8 (Beneficio)

2. El segundo objetivo corresponde a minimizar el ‘coeficiente de riesgo’:

1
min z2 (x) = (x6 + x7 + x8 ) (Riesgo)
20

Notar que este objetivo entra en conflicto con el anterior objetivo (disminuir el riesgo

implica disminuir el beneficio).

3. Considerando la ‘Tasa de Reserva’ podemos expresar el ‘coeficiente de reserva’ como:

1
min z3 (x) = (0, 000x1 + 0, 005x2 + 0, 040x3 + 0, 050x4
20
+ 0, 075x5 + 0, 100x6 + 0, 100x7 + 0, 100x8 ) (Reservas)

URJC-DEIO C. Beltrán 58
4.1. Introducción al análisis de decisiones

Solución: Ver los anteriores apartados.

General (Decisiones multiobjetivo II)

En muchos problemas de decisión, como en el ejemplo anterior, serı́a muy complicado si no


imposible transformar todos los objetivos involucrados en un único objetivo.
En este caso podemos usar las técnicas de optimización multiobjetivo que presentaremos en
este capı́tulo.

Ejemplo 29 (Banco Trébol - continuación)

Datos:
El Banco Trébol, además de los tres objetivos del ejemplo anterior, tiene que cumplir las
siguientes restricciones:
1. El banco desea invertir todo el capital disponible.
2. Las reservas en efectivo deben ser al menos el 14 % del dinero actualmente deposi-
tado en las cuentas corrientes más el 4 % del dinero actualmente depositado a plazo
fijo.
3. La parte de la inversión considerada lı́quida deberı́a ser al menos el 47 % del dinero
actualmente depositado en las cuentas corrientes más el 36 % del dinero actualmente
depositado a plazo fijo.
4. El Banco desea invertir al menos un 5 % en cada uno de los 8 productos de cara a
diversificar su inversión.
5. Al menos el 30 % deberı́a destinarse a préstamos comerciales.
Objetivo: Formula un problema de programación lineal multiobjetivo para optimizar las inversiones
del Banco Trébol.

Operaciones 29:

max z1 (x) (Beneficio)

min z2 (x) (Riesgo)

min z3 (x) (Reservas)

s.a. x1 + . . . + x8 = 20 + 150 + 80 (Invertir todo)

x1 ≥ 0, 14 · 150 + 0, 04 · 80 (Reservas)

1, 000x1 + 0, 995x2 + 0, 960x3 + 0, 900x4 +

+ 0, 850x5 ≥ 0, 47 · 150 + 0, 36 · 80 (Liquidez)

xj ≥ 0, 05 · (20 + 150 + 80) ∀j = 1, . . . , 8 (Diversificación)

x8 ≥ 0, 30 · (20 + 150 + 80) (Prestamos)

x≥0

URJC-DEIO C. Beltrán 59
4.2. Puntos eficientes y frontera eficiente

Notar que la restricción de ‘Liquidez’ está escrita en dos lı́neas debido a su excesiva longitud.
Solución: Ver el apartado anterior.

General (Programación lineal multiobjetivo)

Un problema de programación lineal multiobjetivo se caracteriza por:

• Tener varias funciones objetivo que han de optimizarse (maximizar o minimizar según
convenga).
• La región factible es idéntica a la región factible de un problema PL monoobjetivo, es
decir, definido a partir de restricciones lineales de igualdad o de desigualdad junto con
cotas para las variables.

4.2. Puntos eficientes y frontera eficiente

General

Punto eficiente:

• Dado un problema de optimización multiobjetivo, un punto factible es eficiente si al


moverlo dentro de la región factible para mejorar algún objetivo, tenemos que empeorar
al menos otro objetivo.
• Un punto eficientes se denominan también punto óptimo de Pareto, o punto no domina-
do.
• Análogamente, un punto no eficiente de denomina también punto dominado.

Frontera eficiente:

• Es el conjunto formado por todos los puntos eficientes.


• Se denomina también frontera de Pareto.
• La frontera de Pareto que acabamos de ver está representada en el espacio de decisiones
(x1 , . . . , xn ).
• Como veremos más adelante, también podemos representar la correspondiente frontera de
Pareto en el espacio de objetivos (z1 , . . . , zm ).

Ejemplo 30

Datos:

Consideramos el PL multiobjetivo siguiente:

max z1 (x) = +3x1 + 1x2


max z2 (x) = −1x1 + 2x2
s. a x1 + x2 ≤ 4
0 ≤ x1 ≤ 3
0 ≤ x2 ≤ 3

URJC-DEIO C. Beltrán 60
4.2. Puntos eficientes y frontera eficiente

Figura 4.1: El punto y = (3, 0) es un punto dominado.

Figura 4.2: El punto x = (2, 2) es un punto eficiente.

URJC-DEIO C. Beltrán 61
4.2. Puntos eficientes y frontera eficiente

Objetivo:

1. Analiza si los puntos x = (2, 2) y y = (3, 0) son eficientes.


2. Determina la frontera eficiente para este PL multiobjetivo.

Operaciones 30:

y = (3, 0) es un punto dominado, como puede apreciarse en la Figura 4.1 o como puede

verse en el siguiente razonamiento:

• El vector de objetivos para y es z = (z1 (y), z2 (y)) = (9, −3).

• Podemos considerar el nuevo punto factible y 0 = (3, 1), cuyo vector de objetivos es

z = (z1 (y 0 ), z2 (y 0 )) = (10, −1.)

• De hecho y 0 es mejor que y en los dos objetivos.

En la Figura 4.2 vemos que x = (2, 2) es un punto eficiente (dentro de la región factible

no podemos mejorar ninguno de los dos objetivos sin empeorar el otro).

No es difı́cil ver que en este ejemplo la frontera eficiente es la lı́nea poligonal descrita

por los puntos:

(3, 1) → (1, 3) → (0, 3).

Solución: El punto x es eficiente, el punto y está dominado y la frontera eficiente corresponde a la


lı́nea poligonal descrita por los puntos:

(3, 1) → (1, 3) → (0, 3).

(ver Figura 4.2)

General (Análisis gráfico de la optimalidad de Pareto)

Dado un programa lineal multiobjetivo (PLM) con dos variables, podemos determinar si un
punto factible x es un óptimo de Pareto mediante los siguientes pasos:

1. Representamos el conjunto factible y el punto x.


2. Representamos las rectas perpendiculares a los vectores de las funciones objetivo y que
pasan por el punto x.
3. Buscamos los semiespacios de crecimiento de cada función objetivo.
4. Consideramos el cono K formado por la intersección los semiespacios de crecimiento
(su vértice es el punto x).
5. Si el cono K y la región factible tienen a x como único punto en común, entonces x es un
punto óptimo de Pareto o punto eficiente del PLM.
6. En caso contrario x es no es eficiente (está dominado por otros puntos factibles).

URJC-DEIO C. Beltrán 62
4.2. Puntos eficientes y frontera eficiente

Figura 4.3: Frontera de Pareto o frontera eficiente (en el espacio de los de los
objetivos (z1 , z2 )).

Ejemplo 31

Datos: Continuamos con el ejemplo anterior.

Objetivo: Representa la frontera de Pareto en el espacio de los objetivos (z1 (x), z2 (x)). Notar que
en el ejemplo anterior hemos calculado la frontera de Pareto en el espacio de las variables de
decisión (x1 , x2 ).

Operaciones 31:

En primer lugar resolvemos el PLM pero sólo optimizando respecto la función objetivo

z1 (x) (e ignorando z2 (x)).

Optimizando respecto z1 (x) obtenemos el punto óptimo x1 = (3, 1), cuyo valor para las

dos funciones objetivo es z 1 = (10, −1).

Hacemos lo mismo para la segunda función objetivo z2 (x), y obtenemos el punto óptimo

x2 = (0, 3) cuyo valor para las dos funciones objetivo son z 2 = (3, 6).

La frontera de Pareto en el espacio de los dos objetivos es una lı́nea poligonal que une

los puntos z 1 y z 2 y que podemos esquematizar como:

(10, −1) → (z1 (α), α) → (3, 6)

donde α varı́a en el intervalo [−1, 6].

URJC-DEIO C. Beltrán 63
4.3. Optimización multiobjetivo por suma ponderada de objetivos

Por lo tanto, una forma de obtener la frontera de Pareto, en el espacio de los objetivos

(z1 , z2 ), es resolver el siguiente problema de PL

max z1 (x)

s. a z2 (x) = α

x1 + x2 ≤ 4

0 ≤ x1 ≤ 3

0 ≤ x2 ≤ 3

para todos valores de α en el intervalo [−1, 6].

En teorı́a habrı́a que resolver una colección infinita de PLs pero en general será suficien-

te resolver el anterior problema sólo para un número finito de puntos (discretización

representativa de [−1, 6]).

Solución: En la Figura 4.3 podemos ver la frontera de Pareto ası́ obtenida.

4.3. Optimización multiobjetivo por suma ponderada de objetivos

Ejemplo 32 (Suma ponderada de objetivos)

Datos: Consideramos el siguiente PLM:

min z1 (x) = +3x1 + 1x2 (horas)


max z2 (x) = −1x1 + 2x2 (euros)
max z3 (x) = +2x1 (kg)
s. a. x1 + x2 ≤ 4
0 ≤ x1 ≤ 3
0 ≤ x2 ≤ 3.

Objetivo: Transforma el anterior PLM en un PL mediante la suma ponderada de objetivos, usando


los pesos γ1 = 2 PC / hora, γ2 = 3 PC / euro y γ3 = 10 PC / kg, donde PC significa ‘Puntos de
Coste’.

Operaciones 32:

URJC-DEIO C. Beltrán 64
4.3. Optimización multiobjetivo por suma ponderada de objetivos

En primer lugar transformamos los operadores ‘max’ en ‘min’.

min z1 (x) = +3x1 + 1x2

min −z2 (x) = +1x1 − 2x2

min −z3 (x) = −2x1

s. a x1 + x2 ≤ 4

0 ≤ x1 ≤ 3

0 ≤ x2 ≤ 3.

En segundo lugar calculamos la nueva función objetivo


3
X
z(x) = γi zi (x)
i=1
= 2z1 (x) + 3[−z2 (x)] + 10[−z3 (x)]

= 2[+3x1 + 1x2 ] + 3[+1x1 − 2x2 ] + 10[−2x1 ]

= −11x1 − 4x2 .

Notar que las unidades de z(x) son PC:

PC PC
z(x) = 2 · z1 (x) hora + 3 · [−z2 (x)] euro
hora euro
PC
+10 · [−z3 (x)] kg
kg
= −11x1 − 4x2 PC

Solución: El correspondiente PL es
min z(x) = −11x1 − 4x2 (PC)
s. a. x1 + x2 ≤ 4
0 ≤ x1 ≤ 3
0 ≤ x2 ≤ 3

General (Optimización multiobjetivo por suma ponderada de objetivos)

Consideramos el siguiente PL multiobjetivo (PLM)


min z1 (x) (Unidad1 )
..
.
min zm (x) (Unidadm )
s. a Ax ≤ b
x ≥ 0,
donde zi (x) = ci1 x1 + . . . + cin xn para cada i ∈ I = {1, . . . , m}.

URJC-DEIO C. Beltrán 65
4.3. Optimización multiobjetivo por suma ponderada de objetivos

Figura 4.4: Centrales y posibles almacenes.

Una forma de resolver este problema es usando la técnica de la suma ponderada de objetivos:
X
min z(x) = γi zi (x)
i∈I
s. a Ax ≤ b
x ≥ 0,
donde cada peso γi es un escalar estrictamente positivo para todo i ∈ I.
Los pesos γi sirven para dar mayor o menor importancia a su correspondiente objetivo zi (x).
Las unidades de cada γi son: ‘Puntos de Coste por Unidadi ’, es decir, PC / Unidadi .
Por lo tanto, las unidades de la función objetivo son ‘Puntos de Coste’ (PC).
El decisor debe seleccionar estos pesos dependiendo de su criterio y de las circunstancias.
Si en el problema tenemos el operador ‘max z(x)’ tenemos que transformarlo en ‘min [-z(x)]’,
de forma que todos los operadores del problema PLM sean de minimización.

General (Suma ponderada de objetivos y optimalidad de Pareto)


Propiedad: Toda solución óptima obtenidas mediante la suma ponderada de objetivos es solución
óptima de Pareto.

Ejemplo 33 (Eliminación de residuos peligrosos)

Datos:
Una compañı́a propietaria de siete centrales nucleares está decidiendo en coordinación
con el gobierno la localización de dos almacenes de residuos nucleares.

URJC-DEIO C. Beltrán 66
4.3. Optimización multiobjetivo por suma ponderada de objetivos

Figura 4.5: Datos sobre distancia (millas) y población (miles de personas).

En la Figura 4.4 tenemos representadas la localización de las siete centrales y las tres
posibles localizaciones para los dos almacenes nucleares.
Cuando los almacenes estén construidos, los residuos serán transportados desde las cen-
trales a los almacenes mediante camiones utilizando la red publica de carreteras.
Se persiguen dos objetivos:
• Minimizar la distancia de las centrales a los almacenes (coste transporte: combusti-
ble y tiempo empleado).
• Minimizar el tránsito por áreas con mayor población (gente expuesta al riesgo de
mercancı́as peligrosas y riesgo de accidentes de tráfico en zonas con mayor densidad
de tráfico).
En la tabla de la Figura 4.5 tenemos los siguientes parámetros:
• i = ı́ndice para las centrales, i ∈ I = {1, . . . , 7}.
• j = ı́ndice para las localizaciones, j ∈ J = {1, 2, 3}.
• k = ı́ndice para las rutas, k ∈ K = {1, 2}.
• si = (‘Supply’) cantidad (toneladas) esperada de residuos en la central i ∈ I.
• dijk = Distancia (millas) de la central i a la localización j a través de la ruta k, para
todos los i ∈ I, j ∈ J , k ∈ K.
• pijk = Población (en miles de personas) a lo largo de la ruta k que va de la central i
a la localización j, para todos los i ∈ I, j ∈ J , k ∈ K.
• Notar que para cada caso la ruta k = 1, comparada con la ruta k = 2, es más corta
pero involucra más población.

Objetivo: Formular el PL multiobjetivo para ayudar a decidir la localización los dos almacenes
de residuos nucleares.

Operaciones 33:

URJC-DEIO C. Beltrán 67
4.3. Optimización multiobjetivo por suma ponderada de objetivos

El primer paso es definir las variables de decisión:

yj = 1 si la localización j es elegida, j∈J

yj = 0 si la localización j no es elegida, j∈J

xijk = cantidad de residuo transportado de la central i

al almacén j por la ruta k

i ∈ I, j ∈ J , k ∈ K.

El segundo paso es formular el PL multiobjetivo:

XXX
min z1 (x) = dijk xijk (Distancia)
i∈I j∈J k∈K
XXX
min z2 (x) = pijk xijk (Población)
i∈I j∈J k∈K
XX
s.a. xijk = si , i∈I (Residuos)
j∈J k∈K
X
yj = 2 (2 almacenes)
j∈J

xijk ≤ si yj , i ∈ I, j ∈ J , k ∈ K

xijk ≥ 0, i ∈ I, j ∈ J , k ∈ K

yj ∈ {0, 1} j ∈ J.

Solución: Ver el apartado anterior.

Ejemplo 34 (Eliminación de residuos peligrosos - continuación)

Datos: Continuamos con el ejemplo anterior.

Objetivo:

1. Formular el anterior problema de optimización multiobjetivo como un problema monoob-


jetivo mediante la suma ponderada de sus objetivos.
2. Resolver el anterior problema comparando varias ponderaciones de las funciones objetivo
z1 (x) y z2 (x).

Operaciones 34:

1. Mediante los pesos positivos γ1 y γ2 podemos expresar en una única función objetivo los

URJC-DEIO C. Beltrán 68
4.3. Optimización multiobjetivo por suma ponderada de objetivos

objetivos ‘Distancia’ y ‘Población’.

min z(x) = γ1 z1 (x) + γ2 z2 (x) (Distancia

y población)
XX
s.a. xijk = si , i∈I (Residuos)
j∈J k∈K
X
yj = 2 (Dos almacenes)
j∈J

xijk ≤ si yj , i ∈ I, j ∈ J , k ∈ K

xijk ≥ 0, i ∈ I, j ∈ J , k ∈ K

yj ∈ {0, 1} j ∈ J.

2. Dando valores positivos a los pesos γ1 y γ2 obtenemos un PL.

En la Tabla 4.3 tenemos los resultados obtenidos para diferentes pesos (estos resulta-

dos se han obtenido mediante un solver para LP).

La etiqueta ‘Millas×Tm’ corresponde a multiplicar ‘Millas’ por ‘Toneladas’ en el

término dijk xijk que aparece en z1 (x).

La etiqueta ‘Población×Tm’ corresponde a multiplicar ‘Personas’ por ‘Toneladas’

en el término pijk xijk que aparece en z2 (x).

En el caso 1, donde el objetivo ‘distancia’ tiene un peso 10 veces superior al objetivo

‘población’, todos los residuos son enviados por las rutas con ı́ndice k = 1 (rutas

más cortas, pero con más población).

En el caso 5, ocurre lo contrario.

En todos los casos la localización óptima de los dos almacenes es en las localizacio-

nes 1 y 3, excepto para el caso 3.

Solución:

1. Ver en el apartado ‘Operaciones’.


2. Ver Tabla 4.3. Con estos datos la compañı́a, en coordinación con el gobierno, puede tomar
una decisión.

URJC-DEIO C. Beltrán 69
4.4. Optimización multiobjetivo por metas

Total Total Loc.


Caso Millas×Tm Millas×Tm Millas×Tm Población×Tm Óptimas
γ1 γ2 k=1 k=2 z1∗ z2∗
1 10 1 1155 0 1155 1334 1 3
2 10 5 754 591 1345 782 1 3
3 10 10 1046 404 1450 607 1 2
4 5 10 440 1114 1554 533 1 3
5 1 10 0 1715 1715 468 1 3

Tabla 4.3: Localización óptima de los dos almacenes en función de los pesos γ1 y γ2 .

4.4. Optimización multiobjetivo por metas

Ejemplo 35 (Optimización por metas)

Datos: Consideramos el siguiente problema multiobjetivo por metas:

meta z1 (x) = +3x1 + 1x2 ≤ 10


meta z2 (x) = −1x1 + 2x2 ≥ 5
meta z3 (x) = +2x1 = 8
s. a x1 + x2 ≤ 4
0 ≤ x1 ≤ 3
0 ≤ x2 ≤ 3.

Objetivo: Formular el anterior problema mediante un PL introduciendo variables de deficiencia


ponderadas según los siguientes pesos γ1 = 2, γ2 = 3 y γ3+ = 10, γ3− = 5.

Operaciones 35:

En primer lugar, introducimos tres variables de deficiencia di ≥ 0 :

z1 (x) = +3x1 + 1x2 − d1 ≤ 10

−z2 (x) = +1x1 − 2x2 − d2 ≤ −5


z3 (x) = +2x1 + d+
3 − d3 = 8

Notar que hemos multiplicado por −1 la segunda desigualdad para tenerla expresada en

la versión de ≤ .

Notar que para definir z3 usamos dos variables de deficiencia, por tratarse de una restric-

ción de igualdad.

URJC-DEIO C. Beltrán 70
4.4. Optimización multiobjetivo por metas

En segundo lugar definimos la función objetivo, como suma ponderada de las variables

de deficiencia:

z(d) = 2d1 + 3d2 + 10d+
3 + 5d3 .

Solución: El correspondiente PL es

min 2d1 + 3d2 + 10d+
3 + 5d3
s. a 3x1 + 1x2 − d1 ≤ 10
1x1 − 2x2 − d2 ≤ −5

+2x1 + d+3 − d3 = 8
x1 + x2 ≤ 4
0 ≤ x1 ≤ 3
0 ≤ x2 ≤ 3
d ≥ 0.

General (Optimización multiobjetivo por metas)

Las metas pueden considerarse restricciones suaves (no es imprescindible que se cumplan), es
decir, intentamos calcular una solución que las cumpla en el mayor grado posible.

Consideramos el siguiente problema multiobjetivo por metas:

meta z1 (x) ≤ m1
..
.
meta zm (x) ≤ mm
s. a Ax ≤ b
x ≥ 0,

donde zi (x) = ci1 x1 + . . . + cin xn para cada i ∈ I = {1, . . . , m}.

Podemos resolver este problema multiobjetivo transformándolo en un problema PL:

• Introducimos variables de deficiencia di mediante sendas restricciones.


• Minimizar la suma ponderada de la variables de deficiencia.

X
min z(d) = γi di (4.1)
i∈I
s. a z1 (x) − d1 ≤ m1
..
.
zm (x) − dm ≤ mm
Ax ≤ b
x ≥ 0, d ≥ 0

donde cada peso γi es un escalar estrictamente positivo para todo i ∈ I.

Los pesos γi sirven para dar mayor o menor importancia a su correspondiente meta.

URJC-DEIO C. Beltrán 71
4.4. Optimización multiobjetivo por metas

El decisor debe seleccionar los pesos y las metas dependiendo de su criterio y de las circuns-
tancias.

Si en el problema tenemos una meta con desigualdad de ≥, tenemos que transformarla en una
desigualdad de ≤ multiplicando los coeficientes de la desigualdad por −1.

Si una meta es de igualdad, por ejemplo z0 (x) = m0 , tendremos que asignarles dos variables

de deficiencia positivas: d+
0 y d0 :


z0 (x) + d+
0 − d0 = m0 .

Notar que las unidades de los pesos γi son ‘Puntos de Coste por Unidadi ’, es decir, PC / Unidadi .

Por tanto, las unidades de la función objetivo z(d) son PC.

General (optimización por metas y optimalidad de Pareto)

La optimización multiobjetivo por metas es un método popular entre los decisores, pues el
trabajar con metas resulta intuitivo.

Pero, en la optimización multiobjetivo por metas no tenemos garantı́as de que la solución


óptima obtenida sea una solución óptima de Pareto.

Explicación: una vez que las metas están satisfechas, el algoritmo no busca puntos mejores.

Ejemplo 36 (Banco Trébol - continuación)

Datos:

Consideramos de nuevo el ejemplo del Banco Trébol.

Lo que pretendemos ahora es resolver este problema multiobjetivo de forma que alcance-
mos las siguientes ‘metas’:

• Un beneficio de al menos 18,5 millones de euros.


• Un coeficiente de riesgo menor o iqual que 7,0.
• Un coeficiente de reservas menor o iqual que 0,8.

Objetivo: Introducir estas tres metas en la formulación del problema.

Operaciones 36:

URJC-DEIO C. Beltrán 72
4.4. Optimización multiobjetivo por metas

Podemos formular el problem a como sigue:

meta z1 (x) ≥ 18, 5 (Beneficio)

meta z2 (x) ≤ 7, 0 (Riesgo)

meta z3 (x) ≤ 0, 8 (Reservas)

s.a. x1 + . . . + x8 = 20 + 150 + 80 (Invertir todo)

x1 ≥ 0, 14 · 150 + 0, 04 · 80 (Reservas)

1, 000x1 + 0, 995x2 + 0, 960x3 + 0, 900x4 +

+ 0, 850x5 ≥ 0, 47 · 150 + 0, 36 · 80 (Liquidez)

xj ≥ 0, 05 · (20 + 150 + 80) j = 1, . . . , 8 (Diversificación)

x8 ≥ 0, 30 · (20 + 150 + 80) (Comerciales)

x ≥ 0,

Las funciones objetivo z1 , z2 y z3 fueron definidas al principio de este capı́tulo.

La restricción de ‘Liquidez’ está escrita en dos lı́neas debido a su excesiva longitud.

Solución: Ver el apartado ‘Operaciones’.

Ejemplo 37 (Banco Trébol - continuación)

Datos:

Vamos a concluir el ejemplo del Banco Trébol.


Recordamos que lo que pretendemos es resolver este problema multiobjetivo de forma
que alcancemos las siguientes metas :
• Un beneficio de al menos 18,5 millones de euros.
• Un coeficiente de riesgo menor que 7,0 (sin unidades).
• Un coeficiente de reservas menor que 0,8 (sin unidades).

Objetivo:

1. Formular el problema PL para resolver este problema multiobjetivo, dando igual impor-
tancia a todas las metas.
2. Calcular una solución óptima para el problema PL.
3. Repetir los dos apartados anteriores, pero dando 10 veces más importancia a la meta
‘reservas’ que a las otras dos metas.

Operaciones 37:

URJC-DEIO C. Beltrán 73
4.4. Optimización multiobjetivo por metas

1. Podemos formular el problem PL como sigue:

min z(d) = d1 + d2 + d3

s.a. − z1 (x) − d1 ≤ −18, 5 (Beneficio)

z2 (x) − d2 ≤ 7, 0 (Riesgo)

z3 (x) − d3 ≤ 0, 8 (Reservas)

x1 + . . . + x8 = 20 + 150 + 80 (Invertir todo)


..
.

x ≥ 0, d ≥ 0.

Notar que en la función objetivo tenemos de forma implı́cita los pesos γ1 = γ2 = γ3 = 1,

es decir, damos la misma importancia a todas las metas.

2. Mediante software de optimización podemos resolver el anterior problema PL (ver co-

lumna ‘Caso 1’ de la Tabla 4.4).

3. En este caso sólo tendrı́amos que actualizar la función objetivo a

z(d) = d1 + d2 + 10d3 ,

y resolver el correspondiente problema PL (ver columna ‘Caso 2’ de la Tabla 4.4).

Solución:
1. Ver apartado ‘Operaciones’.
2. Ver columna ‘Caso 1’ de la Tabla 4.4.
3. Ver columna ‘Caso 2’ de la Tabla 4.4.

URJC-DEIO C. Beltrán 74
4.4. Optimización multiobjetivo por metas

Caso 1 Caso 2
γ1 : Peso para el beneficio 1 1
γ2 : Peso para el coeficiente riesgo 1 1
γ3 : Peso para el coeficiente de reservas 1 10
z1 (x∗ ): Beneficio (≥ 18, 50) 18,50 17,53
d∗1 0,00 0,97
z2 (x∗ ): Riesgo (≤ 7, 00) 7,00 7,00
d∗2 0,00 0,00
z3 (x∗ ): Reservas (≤ 0, 80) 0,93 0,82
d∗3 0,13 0,02
x∗1 : Dinero en caja 24,20 24,20
x∗2 : Inversiones a corto plazo 16,03 48,30
x∗3 : Bonos del Estado (1 a 5 años) 12,50 12,50
x∗4 : Bonos del Estado (6 a 10 años) 12,50 12,50
x∗5 : Bonos del Estado (más de 10 años) 44,77 12,50
x∗6 : Préstamos a plazo 52,50 52,50
x∗7 : Préstamos hipotecarios 12,50 12,50
x∗8 : Préstamos comerciales 75,00 75,00

Tabla 4.4: Resultados para dos conjuntos de pesos: γ = (1, 1, 1) y γ = (1, 1, 10).

URJC-DEIO C. Beltrán 75
4.4. Optimización multiobjetivo por metas

URJC-DEIO C. Beltrán 76
Capı́tulo 5

Gestión de proyectos

5.1. Método del camino crı́tico

Nota: Este método, en inglés, se denomina ‘Critical Path Method’ (CPM).

Ejemplo 38 (Construcción de un almacén)

Datos:

Consideramos el proyecto para la construcción de un almacén.


Dicho proyecto consta de 9 actividades que siguen cierto orden de precedencia (Tabla
5.1).

k Actividad Duración Actividades


ak (dı́as) Precedentes
1 Cimientos 15 –
2 Alcantarillas 5 –
3 Base de hormigón 4 1, 2
4 Estructura y paredes 3 3
5 Tejado 7 4
6 Instalación eléctrica primaria 10 4
7 Calefacción y aire acondicionado 13 2, 4
8 Tabiques 18 4, 6, 7
9 Acabados interiores 20 5, 8

Tabla 5.1: Duración de las actividades para la construcción del almacén.

En la Tabla 5.1 tenemos ak , la duración estimada de cada actividad (dı́as).

Objetivo: Representa la red asociada a este proyecto.

Operaciones 38: En la Fig. 5.1 podemos ver la red del proyecto.

77
5.1. Método del camino crÍtico

Figura 5.1: Red del proyecto ‘Construcción de un almacén’.

Cada nodo representa una actividad.

De cada actividad k sale uno o varios arcos de longitud ak dirigidos a cada actividad

sucesora.

Los nodos que no tienen predecesores se unen al denominado ‘nodo inicial’ (nodo 0)

mediante un arco de longitud (duración) cero.

Lo nodos que no tienen sucesores se unen al denominado ‘nodo final’ .

Solución: En la Figura 5.1 tenemos representada la red del proyecto.

General (red de un proyecto)

De cara a gestionar un proyecto, nos será muy útil representar la denominada red del proyecto
donde:

• Cada nodo representa una actividad.


• De cada actividad k sale uno o varios arcos de longitud ak dirigidos a cada actividad
sucesora.
• Lo nodos que no tienen predecesores se unen al denominado ‘nodo inicial’ (nodo 0)
mediante un arco de longitud (duración) cero.
• Lo nodos que no tienen sucesores se unen al denominado ‘nodo final’.

General (tiempos de un proyecto I)

A la hora de gestionar un proyecto nos puede interesar:

• Estimar la duración total del proyecto.


• Planificar la compra de materiales.
• Planificar la contratación de los correspondientes especialistas.

URJC-DEIO C. Beltrán 78
5.1. Método del camino crÍtico

• Planificar las correspondientes licencias y estudios.


• Etc.

Por estos motivos nos interesa conocer:

• El tiempo total estimado que durará la ejecución del proyecto.


• Para cada actividad del proyecto, el tiempo mı́nimo que debe pasar antes de que podamos
iniciarla (tiempo de inicio temprano).
• Notar que si el ’tiempo de inicio temprano’ de una actividad es t dı́as significa que pode-
mos empezarla al inicio del dı́a t + 1.
• En este capı́tulo, cada dı́a corresponde a un intervalo [I, F].
• Empezamos a ejecutar cada tarea al inicio I del correspondiente dı́a.

Dada la red de un proyecto, se denomina ‘camino crı́tico’ para la actividad p al camino más
largo del nodo 0 al nodo p.

• La longitud del camino crı́tico para la actividad p nos da su tiempo de inicio temprano.
• Por lo tanto, la duración total de un proyecto, corresponde a la longitud del camino
critico más largo (camino crı́tico hasta el ‘nodo final’).

Nota. Este tema también se puede consultar y/o ampliar en el Capı́tulo 9 del siguiente libro: Rardin,
R. L., ‘Optimization in Operations Research’, Editorial Prentice Hall, 1998.
Ejemplo 39 (Construcción de un almacén - continuación)

Datos:

En la Tabla 5.1 tenemos ak la duración estimada de cada actividad (dı́as) junto con las
respectivas actividades precedentes.
El tiempo de inicio temprano para una actividad p, que denotamos por v[p], podemos
calcularlo con la siguiente fórmula recursiva:

v[p] = max{v[i] + ai | i es un predecesor de p}

Denotamos por d[p] el valor de i para el que se alcanza el anterior máximo.


d[p] es el predecesor de p en su camino crı́tico.

Objetivo: Calcula el tiempo de inicio temprano y el camino crı́tico para cada una de las actividades
requeridas para construir el almacén.

Operaciones 39:

En la Figura 5.1 tenemos la red del proyecto.

En la Tabla 5.2 tenemos el tiempo de inicio temprano y el camino crı́tico, para cada

actividad.

URJC-DEIO C. Beltrán 79
5.1. Método del camino crÍtico

k Actividad Inicio Camino Crı́tico


Temprano
1 Cimientos 0 0-1
2 Alcantarillas 0 0-2
3 Base de hormigón 15 0-1-3
4 Estructura y paredes 19 0-1-3-4
5 Tejado 22 0-1-3-4-5
6 Instalación eléctrica primaria 22 0-1-3-4-6
7 Calefacción y aire acondicionado 22 0-1-3-4-7
8 Tabiques 35 0-1-3-4-7-8
9 Acabados interiores 53 0-1-3-4-7-8-9

Tabla 5.2: Inicio temprano (dı́as) de las actividades para la construcción del almacén.

Veamos cómo se han realizado los cálculos para obtener estos resultados.

• Los tiempos de inicio temprano para las actividades 1 y 2 son 0, pues no tienen

actividades precedentes. Escribiremos

v[1] = 0 y v[2] = 0 (dı́a).

• Su nodo precedente es el nodo 0, por lo que

d[1] = 0 y d[2] = 0 (nodo).

Veamos cómo se calcula el tiempo de inicio temprano para la actividad 3.

• Las actividades que la preceden son la 1 y la 2, cuya duración es 15 y 5 dı́as,

respectivamente.

• Por lo tanto, podremos iniciar la actividad 3 como muy pronto después de 15 dı́as:

v[3] = max{v[1] + a1 , v[2] + a2 }

= max{0 + 15, 0 + 5}

= 15 dı́as

d[3] = 1.

• Ası́, el camino crı́tico de la actividad 3 es: 0 - 1 - 3.

Para la actividad 4, su camino crı́tico es 0 - 1 - 3 - 4, pues:

v[4] = max{v[3] + 4} = 19 dı́as

d[4] = 3.

URJC-DEIO C. Beltrán 80
5.1. Método del camino crÍtico

Para la actividad 7, su camino crı́tico es 0 - 1 - 3 - 4 - 7 pues:

v[7] = max{v[2] + 5, v[4] + 3}

= max{0 + 5, 19 + 3}

= 22 dı́as

d[7] = 4.

Y ası́ sucesivamente...

Solución: El tiempo de inicio temprano y el camino crı́tico para cada una de las actividades puede
encontrarse en la Tabla 5.2.

General (Método del camino crı́tico)

Input:

1. ak : duración estimada de la actividad k ∈ K = {1, . . . , K}.


2. Conjunto de actividades predecesoras de cada actividad k ∈ K.

Output:

1. v[k] : Tiempo de inicio temprano de la actividad k ∈ K.


2. d[k] : Predecesor de la actividad k en el camino crı́tico de k ∈ K.
3. Caminos crı́ticos (a partir de d[k]).
4. Duración estimada de todo el proyecto: v[K + 1], donde K + 1 es el ‘nodo final’.

Paso 0: Inicialización.

1. Numerar los nodos de forma que los arcos (i, j) de la red del proyecto cumpla i < j.
2. Inicializar v[0] = 0.

Paso 1: Criterio de parada.

1. Si ya hemos calculado el tiempo de inicio temprano para el ‘nodo final’ paramos.


2. En caso contrario, sea p el nodo no procesado con la etiqueta más pequeña.

Paso 2: Procesado.

1. Calcular el tiempo de inicio temprano para p

v[p] = max{v[i] + ai | i es un predecesor de p} (5.1)

2. Guardar en d[p] el valor de i para el que se alcanza el anterior máximo.


3. d[p] es el predecesor de p en su camino crı́tico.
4. Volver al Paso 1.

General (Tiempos de un proyecto II)

URJC-DEIO C. Beltrán 81
5.1. Método del camino crÍtico

A la hora de gestionar un proyecto también nos interesa conocer:

• La fecha lı́mite de finalización del proyecto.


• El momento en que, como muy tarde, cada actividad que compone el proyecto podrá
iniciarse (tiempo de inicio tardı́o).
• Si iniciamos cualquier actividad después de su tiempo de inicio tardı́o, no será posible
finalizar el proyecto dentro del plazo marcado por la fecha lı́mite.
• Notar que, dada una actividad con tiempos de inicio temprano y tardı́o de t0 y t1 dı́as, res-
pectivamente, el momento en que podemos iniciar dicha actividad puede ser en cualquier
dı́a del intervalo [t0 + 1, t1 + 1].

Cálculo del tiempo de inicio tardı́o:

• A partir de la longitud del camino más largo desde el nodo p hasta el nodo final, podemos
calcular el tiempo de inicio tardı́o para la actividad p.
• Para calcular el tiempo de inicio tardı́o para la actividad p, que denotamos por v̂[p],
podemos usar la siguiente fórmula recursiva:

v̂[p] = min{v̂[i] | i es un sucesor de p} − ap

Notar que ap está fuera de la minimización y no depende de i (comparar con ecuación


(5.1)).
ˆ el valor de i donde se alcanza el anterior mı́nimo.
• Denotamos por d[p]

Notación:

• v̂[k] : Tiempo de inicio tardı́o de la actividad k ∈ K.


ˆ : Sucesor de k en el camino más largo de k al nodo final, k ∈ K.
• d[k]

Holgura del tiempo de inicio:

• Denotamos por h[k] esta holgura.


• Es la diferencia entre el tiempo de inicio tardı́o y el tiempo de inicio temprano: h[k] =
v̂[k] − v[k].
• Es lo máximo que se puede retrasar una actividad para terminar el proyecto dentro de
plazo.

Actividades crı́ticas:

• Son las actividades con una holgura de tiempo de inicio igual a cero.
• El retraso en una actividad crı́tica conlleva no poder terminar el proyecto dentro de plazo.

Ejemplo 40 (Construcción de un almacén - continuación)

Datos:

Continuamos con el proyecto para construir un almacén.


Suponemos que el plazo lı́mite para ejecutar el proyecto es de 80 dı́as.

Objetivo: Para cada actividad, calcula el tiempo de inicio tardı́o, la holgura del tiempo de inicio
y analiza si alguna actividad es crı́tica.

URJC-DEIO C. Beltrán 82
5.1. Método del camino crÍtico

Operaciones 40:

En la Figura 5.1 tenemos la red del proyecto.

En la Tabla 5.3 tenemos el tiempo de inicio tardı́o y la holgura del tiempo de inicio,

para cada actividad.

k Actividad Inicio Inicio Holgura


Temprano Tardı́o
1 Cimientos 0 7 7
2 Alcantarillas 0 17 17
3 Base de hormigón 15 22 7
4 Estructura y paredes 19 26 7
5 Tejado 22 53 31
6 Instalación eléctrica primaria 22 32 10
7 Calefacción y aire acondicionado 22 29 7
8 Tabiques 35 42 7
9 Acabados interiores 53 60 7

Tabla 5.3: Holgura en dı́as del momento para iniciar las actividades.

Veamos cómo se han realizado los cálculos para obtener estos resultados.

Dado que el plazo lı́mite para ejecutar el proyecto es de 80 dı́as, el tiempo de inicio tardı́o

para el nodo final es 80 dı́as, es decir, v̂[10] = 80 dı́as.

Para la actividad 9 tenemos:

v̂[9] = min{v̂[10]} − a9 = 80 − 20 = 60 dı́as

ˆ
d[9] = 10

h[9] = v̂[9] − v[9] = 60 − 53 = 7 dı́as.

De forma análoga, los tiempos de inicio tardı́o para las actividades 5, 6, 7 y 8, son 53,

32, 29 y 42 dı́as, respectivamente (los cálculos se dejan como ejercicio).

URJC-DEIO C. Beltrán 83
5.2. Gestión de proyectos mediante programación lineal

Para la actividad 4 tenemos:

v̂[4] = min{v̂[5], v̂[6], v̂[7], v̂[8]} − a4

= min{53, 32, 29, 42} − 3

= 29 − 3 = 26 dı́as

ˆ
d[4] = 7

h[4] = v̂[4] − v[4] = 26 − 19 = 7 dı́as.

Y ası́ sucesivamente...

En la Tabla 5.3 vemos que no hay actividades con holgura de tiempo de inicio igual a

cero.

Por lo tanto no hay actividades crı́ticas.

Solución: El tiempo de inicio tardı́o y la holgura del tiempo de inicio para cada una de las activi-
dades, puede encontrarse en la Tabla 5.3, donde puede verse que no hay actividades crı́ticas.

5.2. Gestión de proyectos mediante programación lineal

Numerosos aspectos de la gestión de proyectos pueden ser abordados mediante la programa-


ción lineal (PL) y la programación lineal entera (PLE).

En particular, el cálculo de los tiempos asociados a la gestión de un proyecto pueden ser


abordados mediante PL tal como veremos en la siguiente sección.

Otros aspectos de la gestión de proyectos que también pueden ser abordados mediante PL y/o
PLE son:

• Asignación de recursos (operarios, máquinas, etc.) a las actividades de un proyecto.


• Selección de los proyectos más interesantes de un conjunto de proyectos candidatos.
• Planificación de la ejecución de un proyecto.
• Etc.

5.2.1. Gestión de los tiempos de un proyecto mediante programación lineal

Ejemplo 41 (Construcción de un almacén - continuación)

Datos: Consideramos el proyecto para la construcción de un almacén, visto en las secciones


anteriores.

Objetivo: Modeliza mediante un problema de programación lineal (PL):

URJC-DEIO C. Beltrán 84
5.2. Gestión de proyectos mediante programación lineal

1. El cálculo del tiempo de inicio temprano para la actividad 4.


2. El cálculo del tiempo de inicio tardı́o para la actividad 4.
3. El cálculo de la duración mı́nima del proyecto.

Operaciones 41:

1. La primera cuestión puede resolverse como sigue:

Sea tk el tiempo de inicio de la actividad k ∈ {0, . . . , 10} (k = 0 corresponde al

‘nodo inial’ y k = 10 corresponde al ‘nodo final’).

El cálculo del tiempo de inicio temprano para la actividad 4 puede modelizarse como

sigue:

min t4

s.a t1 ≥ 0

t2 ≥ 0

t3 ≥ t1 + 15

t3 ≥ t2 + 5

t4 ≥ t3 + 4

...

t10 ≥ t9 + 20

t10 ≤ 80

t≥0

2. Para el cálculo del tiempo de inicio tardı́o para la actividad 4 sólo harı́a falta cambiar min

por max en el anterior PL.

3. El cálculo de la duración mı́nima del proyecto, en el PL del primer caso deberı́amos

cambiar min t4 por min t10 .

Solución: Ver apartado ‘Operaciones’.

General (Gestión de tiempos mediante PL)

En las secciones anteriores hemos supuesto que la duración de una actividad era un dato.

URJC-DEIO C. Beltrán 85
5.3. Diagrama de Gantt

Sin embargo, la duración de una actividad dependerá de los recursos que destinemos para
ejecutarla (número de máquinas, número de operarios, etc.)

Al mismo tiempo, el coste de una actividad en general decrece con la duración (no hay que
pagar horas extras, etc.)

Una forma sencilla de modelizar el coste para realizar una actividad en función del tiempo de
ejecución xk es

ck (xk ) = nk − mk xk k ∈ K = {0, 1, . . . , K + 1},

donde nk y mk son positivos y xk es una variable de decisión (cuando era un dato lo hemos
llamado ak ).

Sea tk el tiempo de inicio de la actividad k ∈ K (0 corresponde al ‘nodo inial’ y K + 1


corresponde al ‘nodo final’).

Sea J (k) el conjunto de actividades predecesoras de la actividad k ∈ K.

De cara a calcular el coste mı́nimo de ejecución para un proyecto podemos definir el siguiente
PL
X
min ck (xk )
k∈K
s.a t1 ≥ 0
tk ≥ tj + xj k ∈ K, j ∈ J (k)
xk ≤ xk ≤ xk k∈K
tK+1 ≤ tK+1
t ≥ 0.

5.3. Diagrama de Gantt

General

El diagrama de Gantt es una herramienta gráfica para la gestión de proyectos (ver Figura 5.2).

Su objetivo es mostrar el tiempo de dedicación previsto para las actividades de un proyecto.

Su formato básico es:

• Representar en el eje X el tiempo.


• Representar en el eje Y las actividades del proyecto.
• Representar por medio de una barra horizontal el comienzo y la duración de cada
actividad.

Para la gestión de proyectos complejos (superiores a 25 actividades) se requiere además el uso


de técnicas basadas en redes de precedencia (como el método del camino crı́tico).

URJC-DEIO C. Beltrán 86
5.4. Contexto aleatorio

Figura 5.2: Diagrama de Gantt.

5.4. Contexto aleatorio

Todos los cálculos hechos hasta ahora se han basado en datos estimados.

Por ejemplo, ak corresponde a la duración estimada de la actividad k.

Sin embargo, la duración de una actividad está sujeta a incertidumbre por lo que puede ser
modelizada como una variable aleatoria.

En este contexto aleatorio, de cara a gestionar un proyecto podemos usar el método denominado
PERT (Project Evaluation and Review Techniques)

• El método PERT tiene los mismos objetivos que el método del camino crı́tico (tiempos
de inicio temprano y tardı́o, duración mı́nima del proyecto, etc.)
• La diferencia fundamental es que el método PERT tiene en cuenta que la duración de cada
actividad es aleatoria.
• El método PERT puede consultarse, por ejemplo, en el libro ‘Investigación de Operacio-
nes’, F. S. Hillier, G. J. Lieberman, Ed. McGraw-Hill (2002).

URJC-DEIO C. Beltrán 87
5.4. Contexto aleatorio

URJC-DEIO C. Beltrán 88
Capı́tulo 6

Control estadı́stico de la calidad

6.1. Introducción

General (Relevancia de la calidad)

Entendemos ‘calidad’ como sinónimo de ‘aptitud para el uso’ presente y futuro.

Muchos de nosotros hemos tenido experiencias de mala calidad al adquirir un producto o un


servicio.

Nuestra sensación es peor cuando los empleados no están autorizados o dispuestos a corregir
problemas de calidad.

Las consecuencia principal de tal actitud es la perdida de clientes (a corto y medio plazo).

Las empresas con éxito entienden que la calidad tiene gran impacto en sus negocios y por
esta razón fomentan polı́ticas para controlar/mejorar la calidad de sus productos.

Nota. Este tema también se puede consultar y/o ampliar en el Capı́tulo 8 del siguiente libro: Montgo-
mery, D. C., Runger, G. C., and Hubele, N. F. ‘Engineering Statistics’, Editorial Wiley, 2006.
General (Mejora de la calidad y Estadı́stica)

Para muchos consumidores dos de los factores más importantes de cara valorar un producto o
servicio son:

• Precio: los clientes buscamos el ‘low cost’.


• Calidad: tanto en el diseño como en la fabricación.

Para lograr estos dos objetivos los métodos estadı́sticos son de gran importancia. La Estadı́stica
aplicada a la mejora de la calidad se basa en dos herramientas fundamentales:

• ‘Diseño de experimentos en ingenierı́a’, útil en el proceso de desarrollo de los productos


(lo veremos en el próximo capı́tulo).
• ‘Control estadı́stico de procesos’, útil para monitorizar los procesos de producción (lo
veremos en ese capı́tulo).

General (Control estadı́stico de procesos)

89
6.1. Introducción

El ‘control estadı́stico de procesos’ es sinónimo de ‘control estadı́stico de la calidad’.

Un proceso es una combinación única de herramientas, métodos, materiales y personal dedica-


dos a la labor de producir un resultado medible.

Por ejemplo, una lı́nea de producción para ensamblar los componentes de un PC es un proceso.

Todos los procesos tienen una variabilidad inherente que puede evaluarse por medio de méto-
dos estadı́sticos. Por ejemplo:

• Los sucesivos productos fabricados en un proceso de producción no son exactamente


idénticos.

• Los tiempos que tardan los usuarios en recibir un determinado servicio tampoco son
idénticos,

• etc.

Se considera que este tipo de variación, llamada variación aleatoria, es inherente al sistema.

Hay otro tipo de variación que no es inherente al sistema. Por ejemplo:

• La averı́a de una máquina de la cadena de producción pude producir productos defec-


tuosos.

• Una materia prima defectuosa puede originar también productos defectuosos.

Este tipo de variación, llamada variación asignable, debe ser asignada a una causa para ser
corregida.

Cuando la única variación presente es aleatoria, se dice que el proceso está bajo control.

En caso contrario se dice que el proceso está fuera de control.

El objetivo del control estadı́stico de procesos consiste en monitorizar si un proceso está bajo
control.

El control estadı́stico de procesos utiliza diferentes herramientas estadı́sticas, como el histo-


grama, y especialmente los gráficos de control.

General (Gráficos de control)

En la Figura 6.1 tenemos un gráfico de control tı́pico.

URJC-DEIO C. Beltrán 90
6.1. Introducción

Figura 6.1: Gráfico de control tı́pico.

El objetivo de los gráficos de control es reconocer si un proceso particular está bajo control.

Los tipos de gráficos de control que se consideran vienen determinados por tres valores:

• Lı́mite de control superior (UCL, ‘upper control limit’).


• Lı́mite de control inferior (LCL, ‘lower control limit’).
• Lı́nea central (CL, ‘center line’).

Si para controlar un proceso industrial usamos, por ejemplo, la media muestral X̄, entonces
para utilizar los gráficos de control:

• Primero se toman diferentes muestras de la magnitud o caracterı́stica del proceso indus-


trial que se quiere estudiar.
• Después de calcula la media para cada muestra y se representa en el gráfico de control.
• Cuando una de estas medias muestrales cae fuera de los lı́mites de control se concluye que
el proceso está fuera de control.
• En este caso, los lı́mites de control se calculan como sigue:

U CL = µX̄ + k σX̄
CL = µX̄
LCL = µX̄ − k σX̄

donde habitualmente se toma k = 3, µX̄ es el valor esperado de X̄ y σX̄ su desviación


tı́pica.

En las siguientes secciones veremos los siguientes tipos de gráfico de control:

• Gráficos de control X̄ (para controlar la media).


• Gráficos de control R (para controlar la varianza).

URJC-DEIO C. Beltrán 91
6.2. Gráficos de control X y R

6.2. Gráficos de control X y R

Ejemplo 42 (Fabricación de aros para pistón)

Datos:

Consideramos la fabricación de aros para pistón de motor.


Una caracterı́stica crı́tica en la calidad de un aro es su diámetro interno.
Debido a las variaciones en su proceso de producción, podemos modelizar este diámetro
como una variable aleatoria.
Sea X la variable aleatoria ‘diámetro interno’ (en mm).
Suponemos que la distribución de X es Normal de media µ = 74 mm y desviación tı́pica
σ = 0, 01 mm. Es decir:
X ∼ N (µ = 74, σ = 0, 01).
En un control de calidad se toman 16 muestras de tamaño n = 5 y se calcula las corres-
pondientes medias muestrales (ver Tabla 6.1).

Muestra Media Muestral


i x̄i
1 73,9930
2 74,0080
3 73,9980
4 74,0060
5 73,9990
6 74,0102
7 74,0045
8 73,9870
9 74,0011
10 74,0062
11 73,9957
12 73,9946
13 74,0071
14 74,0090
15 73,9968
16 74,0081

Tabla 6.1: Media de X para las 16 muestras (en mm).

Objetivo:

1. Calcula el lı́mite de control superior (UCL), el lı́mite de control inferior (LCL), y el


valor de la lı́nea central (CL) asociados a X̄.
2. Representa el gráfico de control X̄.

Operaciones 42:

1. Podemos resolver la primera cuestión como sigue:

URJC-DEIO C. Beltrán 92
6.2. Gráficos de control X y R

En primer lugar necesitamos calcular la media y la desviación tı́pica de la media

muestral X̄ :

Sabemos que µX̄ = µ = 74 y que

σ 0, 01
σX̄ = √ = √ = 0, 0045.
n 5

Por lo tanto:

U CL = µX̄ + 3σX̄ = 74 + 3 · 0, 0045 = 74, 0135

LCL = µX̄ − 3σX̄ = 74 − 3 · 0, 0045 = 73, 9865

CL = µX̄ = µ = 74

Solución:
1. Los lı́mites pedidos son U CL = 74, 0135, LCL = 73, 9865 y LC = 74 (mm).
2. El gráfico de control X̄ lo tenemos en la Figura 6.2.

Figura 6.2: Gráfico de control X̄.

General (gráficos de control X̄ con media y desviación conocidas)

Los gráficos de control X̄ se denominan también ‘gráficos de control Shewhart’ (pronunciado


como ‘Shu-jart’) en honor al ingeniero que introdujo ente tipo de gráficos.

Se considera un proceso (fabricación, servicio, etc.) y se estudia una de sus magnitudes mode-
lizada mediante una variable aleatoria X con media µ y con desviación tı́pica σ.

El gráfico de control X̄ se utiliza para detectar posibles deslizamientos de la media µ.

En este apartado suponemos que conocemos µ y σ.

URJC-DEIO C. Beltrán 93
6.2. Gráficos de control X y R

Para representar el gráfico de control X̄ necesitamos los siguientes parámetros:

U CL = µX̄ + 3 σX̄
CL = µX̄
LCL = µX̄ − 3 σX̄

donde µX̄ es el valor esperado de X̄ y σX̄ su desviación tı́pica.

Sabemos que µX̄ = µ y que


σ
σX̄ = √
n

donde n es el tamaño muestral.

Ejemplo 43 (Fabricación de aros para pistón - continuación)

Datos: Continuamos con el ejemplo anterior.

Objetivo:

1. ¿Podemos decir que el proceso de fabricación de aros de pistón está ‘bajo control’?
2. Suponiendo que el proceso de fabricación de aros esté bajo control ¿cuál es la probabili-
dad de que la media muestral caiga fuera de los lı́mites de control?

Operaciones 43:

1. Sı́, pues como se ve en el gráfico de control X̄ (Figura 6.2) todas las medias muestrales

caen dentro de los lı́mites de control.

2. Podemos resolver la segunda cuestión como sigue:

Teniendo en cuenta que X es una variable aleatoria Normal entonces también lo es

X̄.

Además, dado que el proceso está bajo control, no ha habido cambios ni en la media

ni en la desviación tı́pica y ası́

µX̄ = µ = 74
σ 0, 01
σX̄ = √ = √ = 0, 0045.
n 5

URJC-DEIO C. Beltrán 94
6.2. Gráficos de control X y R

Por lo tanto

P (LCL ≤ X̄ ≤ U CL)

= P (73, 9865 ≤ X̄ ≤ 74, 0135)


 
73, 9865 − µX̄ X̄ − µX̄ 74, 0135 − µX̄
=P ≤ ≤
σX̄ σX̄ σX̄
= P (−3 ≤ Z ≤ 3)

= P (Z ≤ 3) − P (Z ≤ −3)

= Φ(3) − Φ(−3)

= Φ(3) − [1 − Φ(3)]

= 0, 9987 − [1 − 0, 9987]

= 0, 9974,

donde Z es una variable aleatoria Normal estándar.

En consecuencia la probabilidad de estar fuera del anterior intervalo es 1−0, 9974 =

0, 0026

Solución:

1. Sı́, pues la media muestral de cada muestra cae dentro de los lı́mites de control y de forma
aleatoria alrededor de la media.
2. La probabilidad de que la media muestral caiga fuera de los lı́mites de control es del
0, 26 % (1 de cada 385) suponiendo que el proceso de fabricación de aros está bajo control.

General (Gráficos de control X̄ y contraste de hipótesis)

En el ejemplo anterior hemos visto que aunque el sistema esté bajo control tenemos una proba-
bilidad del 0, 26 % de declararlo fuera de control (error del tipo I).

En esencia los gráficos de control equivalen a realizar una secuencia de contrastes de hipótesis
(tantos como muestras).

Para cada muestra implı́citamente realizamos el siguiente contraste de hipótesis:

H0 : media = µ (sistema bajo control)


H1 : media 6= µ (sistema fuera de control)

al nivel de significación α = P ( | Z | > 3 ) = 0, 0026.

URJC-DEIO C. Beltrán 95
6.2. Gráficos de control X y R

Recordamos que el nivel de significación α mide el riesgo de tipo I (probabilidad de equivo-


carnos al aceptar una H1 falsa), es decir,

α = P Declarar que el sistema está fuera de control,

cuando el sistema está bajo control
= 0, 0026.

General (Gráficos de control X̄ con media y desviación desconocidas)

Hasta ahora hemos supuesto que la magnitud estudiada X, tenı́a un distribución Normal con
media µ y desviación tı́pica σ conocidas.

En general, por el teorema central del lı́mite, podemos suponer la hipótesis de normalidad
(además de poder hacer los correspondientes test de normalidad).

Sin embargo, los parámetros µ y σ normalmente son desconocidos y tendremos que estimarlos.

Podemos estimar µ mediante la denominada ‘gran media’ o ‘media de medias’:


m
¯= 1
X
X̄ X̄i ,
m
i=1

donde m es el número de muestras y X̄i es la media para la muestra i.

Para cuantificar la variabilidad del proceso, aunque se puede estimar la desviación tı́pica, en
este contexto se utiliza más el rango promedio:
m
1 X
R̄ = Ri ,
m
i=1

donde Ri es el rango de la muestra i (valor mayor menos valor menor de la muestra).

En caso de desconocer µ y σ, para representar el gráfico de control X̄ necesitamos los siguien-


tes parámetros:
¯ + A2 (n) r̄
U CL = x̄
¯
CL = x̄
¯ − A2 (n) r̄
LCL = x̄
¯y
donde n es el tamaño de cada muestra, A2 (n) puede encontrarse en la Tabla Apéndice.3, x̄
r̄ son los valores observados de la gran media y del rango promedio, respectivamente.

General (Gráficos de control R)

Los gráficos de control X̄ están diseñados para detectar posibles deslizamientos de la media
poblacional µ.

Por otro lado, nos puede interesar recoger los cambios producidos en la desviación tı́pica
poblacional σ (para analizar la variabilidad del proceso).

• En estos casos se puede usar el gráfico de control S que se basa en la desviación tı́pica
muestral S (implı́citamente estamos suponiendo que desconocemos σ).

URJC-DEIO C. Beltrán 96
6.2. Gráficos de control X y R

• Sin embargo, en la práctica se usa más frecuentemente el gráfico de control R basado en


el rango, que también permite monitorizar la variabilidad.

Para representar el gráfico de control R necesitamos los siguientes parámetros:

U CL = D4 (n) r̄
CL = r̄
LCL = D3 (n) r̄

donde n es el tamaño de cada muestra, D3 (n) y D4 (n) pueden encontrarse en la Tabla Apéndi-
ce.3 y r̄ es el valor observado del rango promedio.

Ejemplo 44 (Fabricación de turbinas)

Datos:

En la fabricación de motores de avión la turbina es un elemento fundamental.

Éstas se fabrican mediante un proceso de fundición de precisión.

Una magnitud importante es la apertura de las paletas de las turbinas, que denotamos
por X.

La finalidad del siguiente control de calidad es verificar la estabilidad estadı́stica de este


proceso de fabricación de turbinas.

En la tabla de la Figura 6.3 tenemos los datos de 20 muestras aleatorias de tamaño 5 para
X.

URJC-DEIO C. Beltrán 97
6.2. Gráficos de control X y R

Figura 6.3: Apertura de las paletas de las turbinas.

Los datos de la tabla se han codificado usando los últimos dos dı́gitos de la correspon-
diente observación.
Por ejemplo el primer dato es 33 y representa el valor observado 0,5033 pulgadas.

Objetivo:

1. Representa el gráfico de control X̄.


2. Representa el gráfico de control R.

Operaciones 44:

1. La primera cuestión la podemos resolver como sigue:

Para representar el gráfico de control X̄ necesitamos los siguientes parámetros:

¯ + A2 (n) r̄ = 33, 32 + 0, 577 · 5, 8 = 36, 67


U CL = x̄

¯ = 33, 32
CL = x̄

¯ − A2 (n) r̄ = 33, 32 − 0, 577 · 5, 8 = 29, 97


LCL = x̄

URJC-DEIO C. Beltrán 98
6.2. Gráficos de control X y R

donde n = 5 es el tamaño de cada muestra.

El gráfico de control X̄ lo podemos ver en la Figura 6.4.

Figura 6.4: Gráfico de control X̄.

2. La segunda cuestión la podemos resolver como sigue:

Para representar el gráfico de control R necesitamos los siguientes parámetros:

U CL = D4 (n) r̄ = 2, 115 · 5, 8 = 12, 27

CL = r̄ = 5, 8

LCL = D3 (n) r̄ = 0 · 5, 8 = 0.

El gráfico de control R lo podemos ver en la Figura 6.5.

Figura 6.5: Gráfico de control R.

URJC-DEIO C. Beltrán 99
6.2. Gráficos de control X y R

Solución: Ver Figuras 6.4 y 6.5.

Ejemplo 45 (Fabricación de turbinas - continuación)

Datos:

En las Figuras 6.4 y 6.5 podemos observar que:


• En el gráfico de control X̄ las muestras 6, 8, 11 y 19 están fuera de los lı́mites.
• En el gráfico de control R la muestra 9 está fuera de los lı́mites.
• En total tenemos cinco observaciones patológicas entre los dos gráficos.
Supongamos que se han podido determinar las causas que han producido estas variaciones
y que se han subsanado.

Objetivo:

1. Representa el nuevo gráfico de control X̄ que no tenga en cuenta estas cinco observacio-
nes patológicas.
2. Idem para el nuevo gráfico de control R.

Operaciones 45:

1. La primera cuestión la podemos resolver como sigue:

Una vez eliminadas las cinco observaciones patológicas, los nuevos parámetros para

el gráfico X̄ son:

¯ + A2 (5) r̄ = 33, 21 + 0, 577 · 5, 0 = 36, 10


U CL = x̄

¯ = 33, 21
CL = x̄

¯ − A2 (5) r̄ = 33, 21 − 0, 577 · 5, 0 = 30, 33.


LCL = x̄

El gráfico de control X̄ actualizado lo podemos ver en la Figura 6.6.

Figura 6.6: Gráfico de control X̄ actualizado

URJC-DEIO C. Beltrán 100


6.2. Gráficos de control X y R

2. La segunda cuestión la podemos resolver como sigue:

Análogamente, una vez eliminadas las cinco observaciones patológicas, los nuevos

parámetros para el correspondiente gráfico R son:

U CL = D4 (5) r̄ = 2, 115 · 5, 0 = 10, 57

CL = r̄ = 5, 0

LCL = D3 (5) r̄ = 0 · 5, 0 = 0.

El gráfico de control R actualizado lo podemos ver en la Figura 6.7.

Figura 6.7: Gráficos de control R actualizado

Solución: Ver Figuras 6.6 y 6.7.

General (Protocolo para usar los gráficos de control X̄ y R)

Al usar estos gráficos de control normalmente necesitaremos dos etapas.

Etapa 1: En esta etapa se calibran sus parámetros.

1. Para ello usamos m muestras de tamaño n. Se recomienda tomar m entre 20 y 25, y n


entre 4 y 6.
2. Se analiza mediante un gráfico de control R si la variabilidad del proceso es constante.
Si no lo es se analizan y corrigen las causas.
3. Se analiza mediante un gráfico de control X̄ si el proceso está bajo control. Si no lo está
se analizan y corrigen las causas.
4. Si hay observaciones patológicas, en cualquiera de los gráficos, se eliminan de la muestra
(muestra actualizada) y se recalculan los parámetros de los gráficos de control a partir de
la muestra actualizada. Se vuelve a la Etapa 1,2.
5. Si no hay observaciones patológicas, se considera que el proceso está bajo control y que
el nivel de variabilidad es constante.

URJC-DEIO C. Beltrán 101


6.3. Capacidad de un proceso

Etapa 2: En esta etapa se usan los gráfico de control X̄ y R para monitorizar el estado del
proceso de fabricación.

1. Para cada nueva muestra analizada, el valor de x̄ y r̄ se representa en su correspondiente


gráfico.
2. De forma periódica se revisan los lı́mites de control de los dos gráficos.

6.3. Capacidad de un proceso

Veremos dos casos:

Caso con la media centrada.

Caso con la media no centrada.

6.3.1. Capacidad de un proceso con la media centrada

Ejemplo 46 (Fabricación de turbinas - continuación)

Datos:

Estamos considerando el proceso de fabricación de turbinas para motor de avión.


En este proceso se consideran aceptables las turbinas con una apertura de paletas nominal
de 0,5030 pulgadas y una tolerancia de ± 0,0010 pulgadas.
Por lo tanto se considera aceptable una apertura de paletas en el intervalo [0,5020 ,
0,5040] pulgadas.
Codificando los datos respecto a los dos últimos decimales (los que realmente varı́an), se
considera aceptable una apertura de paletas en el intervalo [20, 40].
Estos dos valores se denominan ‘lı́mite inferior de la especificación’ y ‘lı́mite superior
de la especificación’:
• LSL = 20 (‘Lower Specification Limit’)
• USL = 40 (‘Upper Specification Limit’)
Recordamos que el rango promedio era r̄ = 5, 0 · 10−4 pulgadas y que el tamaño de
cada muestra era n = 5.

Objetivo:

1. Dados los datos sobre la apertura de las paletas recogidos en la Tabla 6.3, representa el
correspondiente diagrama de tolerancia e histograma.
2. Estima la desviación tı́pica de la variable aleatoria X (apertura de paletas).
3. Estima el coeficiente de capacidad de este proceso.
4. Estima qué proporción del intervalo dado por las especificaciones es cubierto por los
resultados del proceso.

Operaciones 46:

URJC-DEIO C. Beltrán 102


6.3. Capacidad de un proceso

1. Ver Figuras 6.8 y 6.9.

Figura 6.8: Diagrama de tolerancia de la apertura de las paletas.

Figura 6.9: Histograma de la apertura de las paletas.

2. La desviación tı́pica puede estimarse mediante la siguiente fórmula:

r̄ 5, 0
σ̂ = = = 2, 15
d2 (n) 2, 326

donde el parámetro d2 (n) puede obtenerse en la Tabla Apéndice.3.

3. Por otro lado, el coeficiente de capacidad puede estimarse mediante la siguiente fórmula:

U SL − LSL 40 − 20
Ĉp = = = 1, 55.
6σ̂ 6 · 2, 15

4. Dado que más del 99 % de los productos fabricados pertenecen al intervalo [µ−3σ, µ+3σ]

de amplitud 6σ, la proporción pedida puede estimarse como

6σ̂ 6 · 2, 15
= = 0, 645
U SL − LSL 40 − 20

URJC-DEIO C. Beltrán 103


6.3. Capacidad de un proceso

que no es más que 1/Ĉp (ver Figura 6.9).

Solución:

1. Ver Figuras 6.8 y 6.9.


2. La estimación para la desviación tı́pica es σ̂ = 2, 15 × 10−4 pulgadas.
3. La estimación para el coeficiente de capacidad es Ĉp = 1, 55 (sin unidades).
4. El proceso ocupa un 64,5 % del intervalo de especificaciones (este valor es una estima-
ción).

General (capacidad de un proceso)

Analizar la ‘capacidad de un proceso’ significa analizar su rendimiento (suponiendo que está


operando bajo control).

Uno de sus objetivos principales es predecir la proporción de productos fabricados que cum-
plirá con las especificaciones.

Las especificaciones vienen dadas por un lı́mite inferior y un lı́mite superior: LSL y USL,
respectivamente.

Como hemos dicho, analizar la capacidad de un proceso sólo tiene sentido si el proceso está
bajo control.

Para analizar la capacidad de un proceso tenemos herramientas gráficas y numéricas.

Entre las herramientas gráficas destacamos:

• El histograma.
• El gráfico de tolerancia, donde representamos cada muestra en un eje vertical (ver Figura
6.8).
• El gráfico de tolerancia no tiene que confundirse ni mezclarse con los gráficos de control
X̄ y R.

Entre las herramientas numéricas tenemos:

• Una estimación de la media µ mediante la denominada ‘gran media’ o ‘media de medias’:


m
¯= 1
X
X̄ X̄i ,
m
i=1

donde m es el número de muestras y X̄i es la media para la muestra i.


• Una estimación de desviación tı́pica σ mediante:


σ̂ =
d2 (n)

donde n es el tamaño de cada muestra y el parámetro d2 (n) puede obtenerse en la Tabla


Apéndice.3.

URJC-DEIO C. Beltrán 104


6.3. Capacidad de un proceso

• El ‘coeficiente de capacidad del proceso’:

U SL − LSL
Cp = ,

que en caso de desconocer σ puede ser estimado por

U SL − LSL
Ĉp = .
6σ̂

◦ En inglés Cp se denomina ‘Process Capability Ratio’ (PCR) - ver Figura 6.10.

Figura 6.10: Productos defectuosos y coeficiente de capacidad Cp (PCR).

◦ Cp ≥ 1 indica que prácticamente todos los productos fabricados cumplirán con las
especificaciones (ver Figura 6.10, gráficas a) y b)).
◦ Cp < 1 indica que un número relevante de productos fabricados no cumplirán las
especificaciones(ver Figura 6.10 gráfica c)).
◦ 1/Cp tiene una interpretación natural, pues representa la proporción del intervalo
de especificaciones ocupado por los valores del proceso.

6.3.2. Capacidad de un proceso con la media no centrada

Ejemplo 47 (Fabricación de turbinas - continuación)

Datos:

En la Figura 6.9 podemos observar que el proceso no está centrado en 30, el valor nominal
para la apertura de paletas.
En este caso la capacidad real del proceso es menor que la capacidad indicada por Cp
por lo que es recomendable usar el ‘coeficiente de capacidad ajustado’ Cpk .

Objetivo:

1. Estimar el ‘coeficiente de capacidad ajustado’ de este proceso.


2. Comparar el ‘coeficiente de capacidad ajustado’ con el ‘coeficiente de capacidad’ y sacar
conclusiones.
3. Estimar qué proporción de productos fabricados no cumplirán las especificaciones.

Operaciones 47:

URJC-DEIO C. Beltrán 105


6.3. Capacidad de un proceso

1. El coeficiente de capacidad ajustado puede estimarse mediante la siguiente fórmula:

¯ x̄¯ − LSL
 
U SL − x̄
Ĉpk = min ,
3σ̂ 3σ̂
 
40 − 33, 21 33, 21 − 20
= min ,
3 · 2, 15 3 · 2, 15
= min [1, 05 , 2, 05]

= 1, 05

2. La discrepancia entre Ĉpk = 1, 05 y Ĉp = 1, 55 indica que el proceso está desplazado del

centro del intervalo de especificaciones. Hay suficientes indicios para revisar el proceso

de producción.

3. Para la tercera cuestión hemos de tener en cuenta:

La proporción de productos que están por debajo del lı́mite inferior LSL puede

estimarse con el siguiente cálculo:

¯
 
LSL − x̄
P (X < LSL) ≈ P Z <
σ̂
 
20 − 33, 21
= P Z<
2, 15
= P (Z < −6, 14)

≈ 0

La proporción de productos que están por encima del lı́mite superior USL puede

estimarse con el siguiente cálculo:

¯
 
U SL − x̄
P (X > U SL) ≈ P Z >
σ̂
 
40 − 33, 21
= P Z>
2, 15
= P (Z > 3, 16)

= 1 − 0, 9992

= 0, 0008

URJC-DEIO C. Beltrán 106


6.4. MetodologÍa Seis Sigma

Solución:
1. Una estimación del coeficiente de capacidad ajustado es Ĉpk = 1, 05.
2. El proceso está desplazado del centro del intervalo de especificaciones.
3. Se estima que un 0,08 % de las turbinas no cumplirá las especificaciones.

General (coeficiente de capacidad ajustado)

El coeficiente de capacidad Cp presupone que µ está en el centro del intervalo de especifica-


ciones (es decir µ coincide con la especificación nominal).

Cuando no se da ese caso, como en el ejemplo anterior, es mejor usar el coeficiente de capacidad
ajustado Cpk :  
U SL − µ µ − LSL
Cpk = min , ,
3σ 3σ
que en caso de desconocer µ y σ pueden ser reemplazadas por sus estimaciones x̄ ¯ y σ̂ para ası́
obtener la estimación Ĉpk .

General (Proporción de productos defectuosos)

Como ya mencionamos, uno de los objetivos principales al analizar la capacidad de un proceso


es predecir la proporción de productos defectuosos.

Un producto es defectuoso cuando la variable de control X no cumple con las especificaciones,


es decir, no está en el intervalo [LSL , U SL].

La proporción de productos defectuosos puede obtenerse sumando las dos probabilidades


siguientes:
 
LSL − µ
P (X < LSL) = P Z < (6.1)
σ
 
U SL − µ
P (X > U SL) = P Z > , (6.2)
σ
donde Z tiene una distribución normal estándar.

Si en las anteriores fórmulas desconocemos µ y σ podemos realizar un cálculo aproximando


usando su estimación x̄¯ y σ̂, respectivamente.

Por lo tanto, para controlar si la ‘variación aleatoria’ de un proceso es aceptable o no con


respecto a las especificaciones tenemos dos opciones:

1. Calcular la proporción de productos defectuosos mediante las fórmulas (6.1-6.2).


2. Calcular el coeficiente de capacidad Cp o Cpk .

6.4. Metodologı́a Seis Sigma

Ejemplo 48 (Fabricación de turbinas - continuación)

Datos: En el ejemplo anterior hemos visto que el proceso de fabricación de turbinas tiene un coefi-
ciente de capacidad ajustado Cpk = 1, 05.

URJC-DEIO C. Beltrán 107


6.4. MetodologÍa Seis Sigma

Objetivo: Analizar si este proceso de fabricación de turbinas tiene una eficiencia de 6 sigma:

1. Gráficamente.
2. Numéricamente.

Operaciones 48:

1. El primer apartado puede resolverse como sigue:

Un proceso tiene una eficiencia 6 sigma cuando la media del proceso está a una

distancia 6σ del lı́mite de especificación más cercano.

En la Figura 6.9 puede verse que la media del proceso está aproximadamente a una

distancia de 3σ del lı́mite de especificación superior.

Por lo tanto este proceso no tiene una eficiencia 6 sigma.

2. El segundo apartado puede resolverse como sigue:

Un proceso tiene una eficiencia 6 sigma cuando tiene un coeficiente de capacidad

ajustado Cpk = 2, 0.

Dado que en este proceso Cpk = 1, 05, podemos afirmar que el proceso no tiene una

eficiencia 6 sigma.

Solución: El proceso de fabricación de turbinas no tiene una eficiencia de 6 sigma.

General (Seis Sigma)

Como ya hemos mencionado, para medir si la ‘variación aleatoria’ de un proceso bajo con-
trol es aceptable o no con respecto a las especificaciones (LSL y USL), una opción es usar el
coeficiente de capacidad Cp o Cpk .

Si µ está en el centro del intervalo de especificaciones entonces podemos usar Cp e imponer


Cp ≥ 1. Muchas compañı́as añaden un margen de seguridad y usan:

• Cp = 1, 33 como valor mı́nimo aceptable.


• Cp = 1, 66 como valor mı́nimo aceptable para caracterı́sticas crı́ticas del producto (se-
guridad, resistencia, etc.)

Si µ no está en el centro del intervalo de especificaciones entonces es mejor usar Cpk :

• En general debe cumplirse que Cpk ≥ 1.


• Algunas compañı́as imponen Cpk = 2, 0 para los procesos internos y para los procesos de
los proveedores.

Proceso con eficiencia 6 sigma.

URJC-DEIO C. Beltrán 108


6.4. MetodologÍa Seis Sigma

• Un proceso con Cpk = 2, 0 se dice que tiene una eficiencia 6 sigma.


• En ese caso la distancia de µ, la media del proceso, al lı́mite de especificación más
cercano (LSL o USL) es de 6 veces σ (ver Figura 6.11).

Figura 6.11: Media de un proceso Seis Sigma desplazada 1,5 desviaciones


tı́picas.

• Bajo estas condiciones la proporción de productos defectuosos es prácticamente 0 %.


• Sin embargo, es difı́cil que la media del proceso no sufra desplazamientos.
• La ventaja de la eficiencia 6 sigma radica en que incluso si la media del proceso se
desplaza 1,5σ hacia el lı́mite de especificación más cercano:
◦ La proporción de productos defectuosos es muy baja (3,4 productos por millon)
◦ Cpk pasa de 2,0 a 1,5:
6σ − 1, 5σ
Cpk = = 1, 5.

Metodologı́a ‘Seis Sigma’:

• En inglés se denomina ‘Six Sigma’.


• Es una metodologı́a de mejora de procesos, centrada en la reducción de la variabilidad
de los mismos de cara a eliminar los defectos en productos o servicios al cliente.
• Su meta es llegar a procesos con una eficiencia 6 sigma.
• La metodologı́a Seis Sigma se caracteriza por 5 etapas concretas:
◦ Definir el problema o el defecto
◦ Medir y recopilar datos
◦ Analizar datos
◦ Mejorar
◦ Controlar
• La metodologı́a Seis Sigma se ha vuelto muy popular entre las grandes empresas debido
a sus buenos resultados.

General (Otros gráficos de control)

Hemos visto los gráficos de control X̄ y R.

Existen otros tipos de gráficos de control como por ejemplo:

• Gráficos de control P para analizar la proporción de productos defectuosos.

URJC-DEIO C. Beltrán 109


6.4. MetodologÍa Seis Sigma

• Gráficos de control U para analizar la cantidad de defectos por unidad de producto.

Para más detalles se puede consultar por ejemplo el Capı́tulo 8 del siguiente libro: Montgomery,
D. C., Runger, G. C., and Hubele, N. F. ‘Engineering Statistics’, Editorial Wiley, 2006.

URJC-DEIO C. Beltrán 110


Capı́tulo 7

Diseño de experimentos en ingenierı́a

7.1. Diseño de experimentos y control de la calidad

Ejemplo 49 (Resistencia de una fibra sintética)

Datos:

Consideramos un proceso de fabricación de una fibra sintética.


En particular estamos interesados en mejorar su resistencia a la rotura.
Conjeturamos las hipótesis de que dicha resistencia depende de dos factores: temperatura
(T) y presión (P) a la que se fabrica.

Objetivo: Diseñar un experimento en el que manipulando diferentes niveles de T y P:

Experimentemos sobre el efecto que tienen estos dos factores en la resistencia.


Analicemos los resultados con técnicas estadı́sticas.
Saquemos conclusiones sobre la validez de la hipótesis inicial.

Solución: En este tema veremos una introducción a cómo abordar este tipo de cuestiones.

General (Diseño de experimentos y control de la calidad)

Tal como hemos visto en el ejemplo anterior, muchas de las variables que intervienen en un
proceso de fabricación se pueden controlar.

Son las denominadas variables de control, como por ejemplo la presión, la temperatura, la
velocidad de la cadena de montaje, etc.

Controlando estas variables se pretende por un lado controlar y mejorar la calidad del producto:

• Productos más adecuados para realizar su función.


• Productos más fiables y duraderos.
• Productos con menos variabilidad respecto a las especificaciones nominales de fabrica-
ción (productos más homogéneos).

Por otro lado se pretende mejorar la productividad:

111
7.2. Introducción a los experimentos factoriales

• Reducir el tiempo para desarrollar de nuevos productos.


• Reducir los costes de producción:
◦ Reducir los tiempos de producción (más productos en menos tiempo).
◦ Reducir el coste de las materias primas.

Todo proceso de experimentación en ingenierı́a se compone de cuatro etapas:

1. Conjeturar una hipótesis sobre el proceso de producción.


2. Experimentar para obtener información sobre la conjetura.
3. Analizar estadı́sticamente la información del experimento para ver si es significativa.
4. Sacar conclusiones sobre si la conjetura inicial es cierta o hay que adaptarla a los resul-
tados obtenidos y quizás realizar un nuevo experimento.

Nota. Este tema también se puede consultar y/o ampliar en el Capı́tulo 7 del siguiente libro: Montgo-
mery, D. C., Runger, G. C., and Hubele, N. F. ‘Engineering Statistics’, Editorial Wiley, 2006.

7.2. Introducción a los experimentos factoriales

Ejemplo 50 (Fabricación de circuitos integrados)

Datos:

Consideramos un proceso de fabricación de circuitos integrados.


En una de las caras del circuito integrado, o substrato, se hace crecer una capa uniforme
de material semiconductor y de poco grosor, medido en micrómetros µm (1 µm = 10−6
m).
Aplicando un vapor rico en arsénico se consigue esta capa, cuyo grosor conjeturamos
que depende de dos factores:
1. El tiempo de aplicación del vapor.
2. El nivel de arsénico en el vapor aplicado.
Para estudiar esta conjetura se diseña el siguiente experimento:
• Que considera los factores: A (tiempo de aplicación) y B (nivel de arsénico).
• Para cada factor, se consideran dos niveles etiquetados con + (nivel alto) y con −
(nivel bajo):
◦ Factor A:

+ = tiempo de aplicación largo


− = tiempo de aplicación corto.

◦ Factor B:

+ = nivel de arsénico del 59 %


− = nivel de arsénico del 55 %.

• Para que el experimento sea significativo se decide tomar n = 4 muestras para cada
caso (hay que repetir el experimento 4 veces para cada caso).

URJC-DEIO C. Beltrán 112


7.2. Introducción a los experimentos factoriales

• En la Tabla 7.1 tenemos los resultados del experimento.

Combinación Grosor Grosor Grosor Grosor Suma Media Varianza


de Niveles Muestra 1 Muestra 2 Muestra 3 Muestra 4 Total (µm) (µm2 )
(1) 14,037 14,165 13,972 13,907 56,081 14,020 0,0121
a 14,821 14,757 14,843 14,878 59,299 14,825 0,0026
b 13,880 13,860 14,032 13,914 55,686 13,922 0,0059
ab 14,888 14,921 14,415 14,932 59,156 14,789 0,0625

Tabla 7.1: Grosor de la capa uniforme (en µm).

• En esta tabla los 4 sı́mbolos (1), a, b y ab tienen la siguiente interpretación:


◦ (1) corresponde al caso en que los dos factores están en su nivel bajo.
◦ a corresponde al caso en que sólo el factor A está en su nivel alto (b análoga-
mente).
◦ ab corresponde al caso en que los dos factores A y B están en su nivel alto.

Objetivo:

Estimar el efecto que el factor A (tiempo de aplicación) produce en el grosor alcanzado


por la capa del circuito integrado.
Hacer lo mismo con el factor B (nivel de arsénico).

Operaciones 50:

Definimos la variable respuesta

Y = ‘Grosor alcanzado por la capa uniforme’ (en µm).

Sea ȳA+ el grosor promedio alcanzado por la capa cuando el factor A está en su nivel

alto (ver Tabla 7.1, columna ‘Suma Total’):

a : 4 + ab : 4 59, 299 : 4 + 59, 156 : 4


ȳA+ = = = 14, 807.
2 2

Sea ȳA− el grosor promedio alcanzado por la capa cuando el factor A está en su nivel

bajo (ver Tabla 7.1, columna ‘Suma Total’):

b : 4 + (1) : 4 55, 686 : 4 + 56, 081 : 4


ȳA− = = = 13, 971.
2 2

Notar que dividimos por 4 pues hemos repetido 4 veces el experimento y por lo tanto

tenemos 4 muestras.

Podemos estimar el efecto principal del factor A mediante la siguiente fórmula:

A = ȳA+ − ȳA− = 0, 836.

URJC-DEIO C. Beltrán 113


7.2. Introducción a los experimentos factoriales

1
Análogamente el efecto principal del factor B puede calcularse como (notar que 4 es

equivalente a ‘: 4’ usado en el caso anterior):

B = ȳB+ − ȳB−
 
1 b + ab a + (1)
= −
4 2 2
 
1 55, 686 + 59, 156 59, 299 + 56, 081
= −
4 2 2
= −0, 067.

Solución:
El efecto del tiempo de aplicación del gas es considerable y positivo (A = 0, 836 µm).
Interpretación: Cambiando el tiempo de aplicación de corto a largo, aumenta el grosor
promedio de la capa uniforme en 0, 836 µm.
Sin embargo, el efecto del nivel de arsénico en el gas aplicado es bajo y negativo (B =
−0, 067 µm).
Interpretación: Cambiando el nivel de arsénico de bajo a alto, disminuye el grosor pro-
medio de la capa uniforme en 0, 067 µm.

General (Experimentos factoriales 22 )

En el ejemplo anterior hemos visto un experimento de dos factores con dos niveles (experimento
factorial 22 ).

En todo experimento factorial se define una variable respuesta Y como la magnitud que
queremos analizar.

El objetivo es analizar si la variable respuesta:

• Es afectada por los factores.


• Existe interacción (dependencia) entre los factores.

En estos experimentos se consideran dos factores A y B y dos niveles para cada factor que se
etiquetan con ‘+’ (nivel alto) y con ‘ − ’ (nivel bajo).

Debemos analizar las 22 = 4 combinaciones de los 2 niveles de cada factor que representamos
por los sı́mbolos (1), a, b y ab :

• (1) Representa que los dos factores están en su nivel bajo.


• a representa que sólo el factor A está en su nivel alto.
• b representa que sólo el factor B está en su nivel alto.
• ab representa los dos factores A y B están en su nivel alto.

El experimento se repite n veces (cuanto mayor es n los resultados del experimento son más
robustos, pero más caros...).

En cada repetición del experimento deben hacerse 4 pruebas: una para cada una de las combi-
naciones (1), a, b y ab.

URJC-DEIO C. Beltrán 114


7.2. Introducción a los experimentos factoriales

En los cálculos, los sı́mbolos (1), a, b y ab también representan la suma total de los resultados
obtenidos para cada combinación de niveles, después de haber repetido el experimento n veces
(columna ‘Suma Total’ de la Tabla 7.1).
Podemos estimar el efecto promedio del factor A mediante la siguiente fórmula:

A = ȳA+ − ȳA−
 
1 a + ab b + (1)
= −
n 2 2
1
= [a + ab − b − (1)] ,
2n
donde ȳA+ es el valor promedio de la magnitud bajo estudio cuando el factor A está en su nivel
alto (ȳA− análogamente).
Interpretación del efecto del factor A: Cambiar el factor A del nivel bajo al nivel alto produce
un cambio en la variable respuesta Y de A unidades (en promedio).
Podemos estimar el efecto promedio del factor B mediante la siguiente fórmula:

B = ȳB+ − ȳB−
 
1 b + ab a + (1)
= −
n 2 2
1
= [b + ab − a − (1)] .
2n

Interpretación del efecto del factor B: Análogamente al factor A.


Normalmente al hablar del efecto del factor A, nos estaremos refiriendo al efecto promedio
del factor A, pues los cálculos se realizan con valores promedio (análogamente para B).

Ejemplo 51 (Fabricación de circuitos integrados - cont)

Datos:
Interacción entre dos factores: Existe interacción cuando el efecto de un factor depende
del nivel del otro factor.
Ejemplo de dos factores con interacción:
• Añadir azúcar al café y remover el café (factores A y B).
• Ninguno de estos dos factores, por separado, tiene mucho efecto en el sabor más o
menos dulce del café, sin embargo la combinación de los dos sı́.
Continuamos con el ejemplo de la fabricación de circuitos integrados.
Objetivo: Estudiar el nivel de interacción entre los factores A (tiempo de aplicación) y B (nivel de
arsénico).

Operaciones 51:

Recordamos la variable respuesta

Y = ‘Grosor alcanzado por la capa uniforme’ (en µm).

URJC-DEIO C. Beltrán 115


7.2. Introducción a los experimentos factoriales

La interacción entre los factores A y B se puede estimar mediante la siguiente fórmula:

1 ∆(b | a) − ∆(b | no a)
 
AB =
4 2
 
1 ab − a − (b − (1))
=
4 2
 
1 59, 156 − 59, 299 55, 686 − 56, 081
= −
4 2 2
= 0, 032,

donde ∆(b | a) es el efecto de B con A en su nivel alto y ∆(b | no a) es el efecto de B con

A en su nivel bajo.

Solución:
La interacción entre los dos factores es AB = 0, 032 µm.
Interpretación: Cambiando el tiempo de aplicación de corto a largo (factor A), aumenta
el efecto del nivel de arsénico (factor B) en 2 · 0, 032 = 0, 064µm.
La interacción entre los dos factores (AB = 0, 032 µm), es relativamente baja, pues es
26 veces menor que el efecto del factor A (A = 0, 836 µm).

General (Interacción entre dos factores)

Interacción entre dos factores A y B: Existe interacción cuando el efecto del factor A depende
del nivel del factor B (y viceversa).

Ejemplo de dos factores con interacción:

• Fumar e inhalar polvo de amianto.


• Los dos factores, por separado, aumentan el riesgo de padecer cáncer de pulmón.
• Sin embargo, el efecto conjunto de fumar e inhalar polvo de amianto es mayor que la
suma de los dos efectos.

La interacción entre los factores A y B se puede estimar mediante la siguiente fórmula:

1 ∆(b | a) − ∆(b | no a)
 
AB =
n 2
 
1 ab − a − (b − (1))
=
n 2
1
= [ab + (1) − a − b] .
2n
donde ∆(b | a) es el efecto de B con A en su nivel alto y ∆(b | no a) es el efecto de B con A en
su nivel bajo.

Interpretación: Pasando el factor A del nivel bajo al nivel alto, aumenta el efecto del factor B
en 2 · AB unidades.

Normalmente al hablar de la interacción entre dos factores, nos estaremos refiriendo a la


interacción promedio, pues los cálculos se realizan con valores promedio.

URJC-DEIO C. Beltrán 116


7.3. Experimentos factoriales y regresión

Relevancia:

• El nivel de interacción es un parámetro importante a tener en cuenta.


• Cuando la interacción AB es grande, los correspondientes efectos individuales A y B,
tienen muy poco significado práctico.

Se verifica fácilmente que AB = BA, pues

1 ∆(a | b) − ∆(a | no b)
 
BA =
n 2
 
1 ab − b − (a − (1))
=
n 2
1
= [ab + (1) − a − b] = AB.
2n

General (Experimentos factoriales 2k )

Los experimentos factoriales 22 son un caso particular de los experimentos factoriales 2k


donde se consideran k factores y 2 niveles por factor.

En el caso de tener sólo dos niveles el diseño del experimento y su análisis es básicamente el
mismo tanto para niveles cuantitativos como para niveles cualitativos.

En un experimento factorial 2k en cada realización del experimento se analizan las 2 × 2 × · · · ×


2 = 2k posibles combinaciones de los 2 niveles de cada factor.

El diseño 2k es particularmente útil al inicio del trabajo experimental cuando habiendo muchos
posibles factores conviene descartar los que no son relevantes.

Si se consideran r > 2 niveles por factor, entonces tenemos los experimentos factoriales rk .

7.3. Experimentos factoriales y regresión

Veremos los siguientes apartados:

Modelo de regresión (no lineal).

Inferencia sobre el modelo de regresión.

7.3.1. Modelo de regresión (no lineal)

Ejemplo 52 (Fabricación de circuitos integrados - cont.)

Datos:

Continuamos con el ejemplo anterior con la finalidad de asociarle un modelo de regresión.


Consideramos el siguiente modelo de regresión (no lineal)

Y = β0 + β1 x1 + β2 x2 + β3 x1 x2 + .

URJC-DEIO C. Beltrán 117


7.3. Experimentos factoriales y regresión

En este modelo:
• Y es la variable respuesta o dependiente y las variables xj son las variables expli-
cativas o independientes.
• Y representa el grosor de la capa uniforme de material semiconductor del circuito
integrado.
• x1 representa el tiempo de aplicación del vapor rico en arsénico (factor A).
• x2 representa el nivel de arsénico en el vapor aplicado (factor B).
• En este contexto los niveles alto (+) y bajo (−) de cada factor se codifican mediante
los valores xi = +1 y xi = −1 para i = 1, 2.
• x1 x2 representa la interacción entre los dos factores A y B.
La correspondiente función de regresión tiene la siguiente expresión:

ŷ = β̂0 + β̂1 x1 + β̂2 x2 + β̂3 x1 x2 .

Objetivo:
1. Calcular los coeficientes de la función de regresión.
2. Calcular el valor de ŷ para (x1 , x2 ) = (1, 1) e interpretar el resultado con relación al
experimento factorial del ejemplo anterior donde las posibles combinaciones eran (1), a, b
y ab.

Operaciones 52:

1. La primera cuestión se puede resolver como sigue:

Se puede demostrar que en este contexto β̂0 es la media de las 4 medias (una por

cada combinación de niveles):

β̂0 = ȳ¯
4
1X
= ȳi
4
i=1
1
= (14, 020 + 14, 825 + 13, 922 + 14, 789)
4
= 14, 389.

(los valores de ȳi pueden encontrase en la Tabla 7.1, columna ‘Media’.)

También se puede demostrar que el resto de los coeficientes de regresión correspon-

den a los efectos de los factores y a la interacción divididos entre 2:

A 0, 836
β̂1 = =
2 2
B −0, 067
β̂2 = =
2 2
AB 0, 032
β̂3 = =
2 2

URJC-DEIO C. Beltrán 118


7.3. Experimentos factoriales y regresión

2. La segunda cuestión se puede resolver como sigue:

La función de regresión es:

0, 836 −0, 067 0, 032


ŷ(x) = 14, 389 + x1 + x2 + x1 x2
2 2 2

= 14, 389 + 0, 418 x1 − 0, 0335 x2 + 0, 016 x1 x2 .

Por lo tanto

ŷ(1, 1) = 14, 389 + 0, 418 − 0, 0335 + 0, 016 = 14, 789.

Por otro lado, en la Tabla 7.1 podemos observar que el grosor promedio del caso ab

es también 14,789 µm.

Solución:
1. La función de regresión tiene la siguiente expresión:

ŷ(x) = 14, 389 + 0, 418 x1 − 0, 0335 x2 + 0, 016 x1 x2 .

2. ŷ(x) es una estimación del grosor promedio asociado a los factores codificados en x.
Ası́:
ŷ(1, 1) es una estimación del grosor promedio correspondiente a la combinación ab,
ŷ(1, −1) es una estimación del grosor promedio correspondiente a la combinación a,
etc.

General (Modelo de regresión no lineal)

Asociado a todo experimento factorial 22 tenemos un modelo de regresión (no lineal):

Y = β0 + β1 x1 + β2 x2 + β3 x1 x2 + .

donde

• Y es la variable respuesta o dependiente y las variables xj son las variables explicativas o


independientes.
• Y representa la magnitud bajo estudio.
• x1 representa el factor A.
• x2 representa el factor B.
• x1 x2 representa la interacción entre los dos factores A y B.
•  es el error aleatorio cuya distribución se supone N (0, σ).

En este contexto los niveles alto (+) y bajo (−) de cada factor se codifican mediante los valores
xi = +1 y xi = −1 para i = 1, 2.

URJC-DEIO C. Beltrán 119


7.3. Experimentos factoriales y regresión

La correspondiente función de regresión tiene la siguiente expresión

ŷ(x) = β̂0 + β̂1 x1 + β̂2 x2 + β̂3 x1 x2 ,

donde ŷ(x) es una estimación del valor esperado de Y en función de x.

Se puede demostrar que en este contexto los coeficientes β̂ se pueden calcular como sigue:

• β̂0 es la gran media de las 4 medias (una por cada combinación de niveles):
4
1X
β̂0 = ȳ¯ = ȳi .
4
i=1

• El resto de los coeficientes de regresión corresponden a los efectos de los factores y a la


interacción, divididos entre 2:
A 1
β̂1 = = [a + ab − b − (1)]
2 4n
B 1
β̂2 = = [b + ab − a − (1)]
2 4n
AB 1
β̂3 = = [ab + (1) − a − b] .
2 4n

7.3.2. Inferencia sobre el modelo de regresión

Ejemplo 53 (Fabricación de circuitos integrados - cont.)

Datos: En el ejemplo anterior hemos visto que podemos estimar el promedio del grosor Y de la
capa uniforme en el circuito integrado mediante la siguiente función no lineal:

ŷ(x) = 14, 389 + 0, 418 x1 − 0, 0335 x2 + 0, 016 x1 x2

donde

x1 representa el factor A (x1 ∈ {−1, +1}).


x2 representa el factor B (x2 ∈ {−1, +1}).

Objetivo: Analizar si en esta función todos los coeficientes son relevantes (distintos de 0) o por el
contrario podemos prescindir de alguno de ellos (tomar α = 0,05).

Operaciones 53:

Para analizar la relevancia de β0 vamos a resolver el siguiente contraste:

H0 : β0 = 0

H1 : β0 6= 0.

Para resolver este contraste realizamos los siguientes pasos:

URJC-DEIO C. Beltrán 120


7.3. Experimentos factoriales y regresión

1. Calculamos σ̂ 2 (una estimación de la varianza de Y ):

4
1X 2
σ̂ 2 = σ̂i
4
i=1
1
= (0, 0121 + 0, 0026 + 0, 0059 + 0, 0625)
4
= 0, 0208

(Los valores de σ̂i2 pueden encontrarse en la columna ‘Varianza’ de la Tabla 7.1).

2. Calculamos una estimación del error estándar del coeficiente β̂0 (el mismo error

estándar para todos los coeficientes):


r r
1 σ̂ 2 1 0, 0208
se(coeficiente) = = = 0, 03605.
2 4 2 4

3. En el ejemplo anterior hemos estimado β̂0 = 14, 389.

4. Calculamos el estadı́stico

coeficiente 14, 389


t0 = = = 399.
se(coeficiente) 0, 03605

5. Para terminar de resolver el contraste necesitamos calcular el P-valor asociado a t0 .

6. Dicho P-valor se puede calcular mediante la siguiente fórmula:

 
P-valor = P T0 < − | t0 | + P T0 >| t0 | ,

donde T0 es una variable aleatoria t de Student con 4(n − 1) = 12 grados de libertad.

7. Para t0 = 399 obtenemos P-valor ≈ 0 (valor obtenido consultando la tabla de la

distribución t de Student con 12 grados de libertad - Tabla Apéndice.2).

8. Dado que el P-valor es menor que el nivel de significación α prefijado 0, 05, acepta-

mos H1 .

9. Es decir, tenemos evidencia estadı́stica de que β0 es distinto de 0 y por tanto es rele-

vante.

En la Tabla 7.2 tenemos los resultados para todos los coeficientes.

URJC-DEIO C. Beltrán 121


7.3. Experimentos factoriales y regresión

Coef. Estimación Error estándar t0 P-valor H1 : βi 6= 0


β0 14,389 0,03605 399 0,00 Aceptamos
β1 0,4180 0,03605 11,60 0,00 Aceptamos
β2 -0,0335 0,03605 -0,93 > 0,30 Rechazamos
β3 0,0160 0,03605 0,44 > 0,50 Rechazamos

Tabla 7.2: P-valor de los coeficientes de regresión.

Los resultados de la columna P-valor se han obtenido con una tabla de la distribución t

de Student (12 grados de libertad).

Por ejemplo, el P-valor asociado a β3 se ha calculado como sigue:

 
P T0 > 0, 44 > P T0 > 0, 695 = 0, 25.

Por lo tanto

P-valor de 0,44 = 2 · P T0 > 0, 44 > 0, 50,

A partir de los P-valores aceptamos que los coeficientes distintos de 0 son β0 y β1 .

Solución: Aceptamos que los coeficientes distintos de 0 son β0 y β1 , por lo que podemos simplificar
nuestro modelo de regresión a

ŷ(x) = 14, 389 + 0, 418 x1 .

Notar que en el contexto de los experimentos factoriales no nos hace falta volver a calcular β0 y β1
una vez que hemos descartado los otros coeficientes (esto en general no es cierto en todos los modelos
de regresión).
General (Relevancia de los coeficientes β)

Dado el modelo de regresión (no lineal)

Y = β0 + β1 x1 + β2 x2 + β3 x1 x2 + ,

nos puede interesar analizar si todos los coeficientes β son relevantes (distintos de 0) o por el
contrario podemos prescindir de alguno de ellos.

Podemos abordar esta cuestión mediante un contraste de hipótesis por cada coeficiente:

H0 : βi = 0
H1 : βi 6= 0

para i ∈ {0, 1, 2, 3}.

Para resolver este contraste podemos proceder como sigue:

URJC-DEIO C. Beltrán 122


7.3. Experimentos factoriales y regresión

1. Calculamos σ̂ 2 (una estimación de la varianza de Y ):


n
1 X
σ̂i2 = (yij − ȳi )2 i = 1, 2, 3, 4,
n−1
j=1
4
1 X
σ̂ 2 = σ̂i2 ,
4
i=1

donde:

n es el número de repeticiones del experimento


i es el ı́ndice para la combinación de niveles
de los factores
j es el ı́ndice para la muestra (repeticiones
del experimento).

2. Calculamos una estimación del error estándar del coeficiente β̂i (el mismo error estándar
para todos los coeficientes):
r
1 σ̂ 2
se(coeficiente) =
2 n
donde se son las siglas de ‘Standard Error’.
3. Calculamos el estadı́stico
coeficiente
t0 = .
se(coeficiente)
4. Se calcula el P-valor asociado a t0 mediante la siguiente fórmula:
 
P-valor = P T0 < − | t0 | + P T0 >| t0 | ,

donde T0 es una variable aleatoria t de Student con 4(n − 1) grados de libertad.


5. Para realizar el anterior cálculo se consulta la tabla de la distribución t de Student (ver el
Apéndice al final de estos apuntes).
6. Si el P-valor es menor o igual que el nivel de significación α, aceptamos H1 .
7. En este caso, tenemos evidencia estadı́stica de que el correspondiente coeficiente es dis-
tinto de 0 y por tanto es relevante (valores usuales para α son 0,01, 0,05 y 0,10).
8. Si el P-valor es mayor que α, rechazamos H1 , y consideramos que el correspondiente
coeficiente no es relevante (asumimos que es 0).

Recordamos que:

• El P-valor corresponde a la probabilidad de equivocarnos al aceptar H1 .


• El nivel de significación α es una cota arbitraria a la probabilidad de equivocarnos al
aceptar H1 .
• Regla de decisión: Si el P-valor no supera α, aceptamos H1 . En caso contrario, rechaza-
mos H1 .

URJC-DEIO C. Beltrán 123


7.3. Experimentos factoriales y regresión

URJC-DEIO C. Beltrán 124


Capı́tulo 8

Apéndice

En este apéndice tenemos las siguientes tablas:

Tabla Apéndice.1. Distribución Normal estándar:

Φ(z) = P (Z ≤ z).

Tabla Apéndice.2. Distribución t de Student: La tabla da el valor de c, tal que

P (T ≤ c) = 1 − α.

Tabla Apéndice.3. Factores para construir tablas de control X̄ y R.

125
URJC-DEIO C. Beltrán 126
URJC-DEIO C. Beltrán 127
URJC-DEIO C. Beltrán 128

También podría gustarte