XIII Congreso Español de Metaheuristicas

XIII Congreso Español
de Metaheurísticas,
Algoritmos Evolutivos y
Bioinspirados
(XIII MAEB)
O SCAR CORDÓN
R AFAEL M ARTÍ
Secretaría Técnica:
DANIEL M OLINA Y M ARÍA ISABEL GARCÍA
Bioinspirados
(XIII MAEB)
MAEB 1: A PLICACIONES DE
LAS M ETAHEURÍSTICAS
XIII Congreso Español en Metaheurı́sticas y Algoritmos Evolutivos y Bioinspirados
Evolving Geographically-embedded Complex

Networks using the CRO-SL Algorithm
1st Sancho Salcedo-Sanz 2nd Lucas Cuadra
Dept. of Signal Processing and Communications Dept. of Signal Processing and Communications
Universidad de Alcalá Universidad de Alcalá
Alcalá de Henares, Spain Alcalá de Henares, Spain
[email protected] [email protected]
Abstract—This paper deals with the problem of evolving CN concepts with a profuse variety of examples in both natural
geographically-embedded randomly generated complex networks (metabolic networks, gene interactions, food webs, etc.) and
aiming at fulfilling the scale-free property: the fraction of nodes artificial systems (the Internet, transport networks, or power
in the network having degree k (ki = number of links in node
ni ) follows a power law probability distribution P (k) ∼ k−γ . grids). In particular, the feasibility of using CN concepts in
Intuitively, this means that most nodes have only a few connec- power grids have been recently discussed in [2] and [3] in
tions and only a few nodes (“hubs”) have a high number of links combination with evolutionary algorithms in smart grids. More
(or connections). The scale-free property is well-known in very profound technical details about CN can be found in [4], [5],
large complex networks (with a huge number of nodes and links) [6], [7] and the references there in.
but it has received much less attention for small geographically-
embedded networks, in which the study of networks’ properties Most recent studies reveal that many CNs –such as some
is much more difficult. Regarding this, we explore the feasibility power grids or the Internet– have a heterogeneous topology
of generating geographically-embedded complex networks even [1] as the one represented in Fig. 1 (a). Note that most nodes
in the case of small networks (those with only hundred of nodes)
by means of considering a simple model for network generation
have only a few connections and only a few nodes (“hubs”)
based on distances among nodes. We state the problem as an have a high number of links. This is why the network is said
optimization task, in which each node of the network has a link to have “no scale”, so it is called “scale-free” [1]. As shown
radius assigned to conform its links to other nodes in the network. in Fig. 1 (b), the fraction of nodes having degree k (ki =
The idea is to evolve these link radius for all the nodes in the number of links in node i) exhibits a power law distribution
network, aiming at finally fulfilling the scale-free property, when
possible. Our machine learning approach for network evolution
P (k) ∼ k −γ .
is based on the recently proposed meta-heuristic called Coral
Reefs Optimization algorithm with Substrate Layer (CRO-SL).
Our experimental work shows that the proposed model is able to
generate geographically (or spatially) embedded networks with
the scale-free property. Specifically, we test the performance of
the CRO-SL approach in two different, randomly generated, 3"$
geographically-embedded networks with 200 and 400 nodes,
respectively.
Index Terms—Geographically-embedded complex networks;
Scale-free networks; Meta-heuristics; CRO-SL.
I. I NTRODUCTION
012
What do systems as different as power grids and ecosystems
have in common? Both can be described in terms of graphs:
a node represents an entity (generator/load in a power grid,
or a species in an ecosystem) that is linked with others (by
P (k)
electrical cables in the power grid or trophic relationships in

an ecosystem). These and other dissimilar systems are called
complex systems because it is extremely difficult to deduce
their emerging collective behavior from only the components
!"#$%&'()'*+,-./ k
of the system [1]. Their topological and dynamical features can 0$2
be studied using the Complex Network (CN) Science [1]. The
interested reader is referred to [1], which clearly explains of Fig. 1. (a) Example of a scale-free complex network with 400 nodes. (b) Node
degree probability density function of a network similar to that represented
This work has been partially supported by the project TIN2017-85887- in (a).
C2-2-P of the Spanish Ministerial Commission of Science and Technology
(MICYT).
497
XVIII Conferencia de la Asociación Española para la Inteligencia Artificial
In many of these CNs (for instance, citation networks) the search space and objective function of the problem. Section
position of nodes in the physical space plays no role at all IV shows the main characteristics of the CRO-SL considered
[8]. However there are other CNs (such as transportation, in this paper. Section V describes the experimental part of the
infrastructure and wireless communication networks) in which paper, with computational results over two randomly generated
nodes and links are embedded in space. In this particular networks with 200 and 400 nodes. Section VI gives some final
kind of CNs, called “spatial networks” (spatially-embedded conclusions and remarks to close the paper.
or geographically-embedded networks), nodes are located in
a space associated to a metric, usually the Euclidean distance II. G ROWING GEOGRAPHICALLY- EMBEDDED COMPLEX
[8], [9], [10]. The interested reader is referred to [8] for further NETWORKS OVER RANDOM - DISTRIBUTED NODES
details about spatial networks, which can be classified into two
categories [8]. The first one, called planar networks, are those Let us consider a model for growing geographically-
that can be drawn in the plane in such a way that their links embedded complex networks using randomly-distributed
do not intersect. The second one involves spatial non-planar nodes. The idea is to grow the network as the random
networks (for instance airline networks, cargo ship networks, nodes are being generated. Note that since we consider a
or power grids) where links (which can intersect in the plane) random location for the new generated nodes, the network is
have a cost related to their length. Although the scale-free completely constructed from scratch. We can consider many
property is well-known in very large, non-spatial complex different random ways of generating the network nodes, but in
networks (with a huge number of nodes), however it is not any case, a constraint of maximum distance from a neighbor to
the case in small geographically-embedded networks. This is others node must be fulfilled. In order to do this, we consider
because, in spatial networks, when geometric constraints are an extremely simple model for nodes generation, in which the
very strong or when the cost associated to the addition of new appearing node must be located at a minimum distance
new links is large (water and gas distribution networks, power from another neighbor node, Ra (attachment radius), to be
grids, or communication networks), the appearance of hubs attached to the network. Otherwise it will be discarded. Note
and the scale-free feature become more difficult [8]. that this radius may be characteristic of the node i currently
In this paper we show that any randomly generated network being generated so that, in this case, we will denote it as Rai .
can be constructed to very approximately follow a scale-free However, in the general case, all the nodes in the network
distribution. This result has only been previously proven for will be generated with the same Ra , this simulation parameter
geographically-embedded network in a regular lattice [10]. being thus equal for all nodes. As previously mentioned, the
To show this result, we first propose a very simple model network will be grown while random nodes are being gener-
for randomly constructing geographically-embedded networks, ated. Aiming at doing this, we propose a simple mechanism for
which consists in assigning a link radius to each new node of links generation for a new node i: let Rli be the link radius
the network. The proposed model for network construction es- associated with the recently generated node i, and let L be
tablishes that each link radius may be different for each node, the link matrix, in which Lij stands for a binary variable
and it is fully related to the network construction: when a node describing whether or not there is a link between node i and
is randomly generated, it is linked with all other existing nodes an alternative node j. Then, each time a node i is generated,
in the network which are at a distance smaller than its link it establishes links to other nodes already attached, in the
radius. In order to show that the network follows a scale-free following way:
distribution, we evolve it, i.e. we use an evolutionary-based
if d(i, j) < Rli
{
algorithm in order to assign link radius to all the nodes in the 1,
Lij = (1)
network. The objective is that, eventually, the network follows 0, otherwise
(approximately) a scale-free distribution. We state this problem
as an optimization task, with discrete-based encoding, in which where d(i, j) stands for the Euclidean distance (not the
a meta-heuristic search must be applied (since brute-force geodesic one used in non-spatial networks [8]) between node
schemes are discarded due to excessive computational cost). i and any other existing node (j). It is important to note that
Specifically, we evaluate the performance of the Coral Reefs the number of links established when the node i is finally
Optimization algorithm with Substrate Layer (CRO-SL) in this generated attached, not discarded) will only depend on Rli .
problem of complex networks evolution. We will show that the Moreover, if we want to ensure that all the nodes are connected
CRO-SL is able to lead to randomly generated geographically- with at least one other node in the network, then Rli ≥ Ra .
embedded complex networks fulfilling the scale-free property, To illustrate this, let us consider the examples shown in
and we show it in two cases with randomly generated network Fig. 2. The first one, in Fig. 2 (a), shows a random network
of 200 and 400 nodes. generated with parameters Ra = 10 and Rli = 10 (in this
The remainder of the paper has been structured in the case the same value of Rli for all the nodes generated in
following way: next section presents the model we consider the network). Note that, since Rli = Ra , each node will be
to construct geographically-embedded complex networks with attached to a very reduced number of other existing nodes in
randomly-distributed nodes. Section III describes the evolution the network. If we keep Ra = 10 in the node generation,
of the network as an optimization task, defining the encoding, but Rli takes values in [10, 15, 20, 30], depending on the node
498
generated, then we obtain the network represented in Fig. 2 here is whether or not the proposed model for complex
(b). network construction over geographically embedded random
nodes can generate scale-free networks. Note that in this case
the random situation of nodes makes impossible to obtain an
150 250
exact solution such as the one shown for square lattices in
100 200
[10]. The approach, therefore, should be stochastic due to the
50 150
nature of the considered networks, and approximate solutions
0 100
could arise.
y
y
-50 50
-100 0
IV. O PTIMIZATION METHOD : THE CRO-SL ALGORITHM
-150 -50
-200
-200 -150 -100 -50
x
0 50 100 150
-100
-100 -50 0 50 100
x
150 200 250 300 The Coral Reef Optimization algorithm (CRO) [12] (further
(a) (b)
described in [13]), is an evolutionary-type algorithm based on
the behavior of the processes occurring in a coral reef. For an
Fig. 2. Example of geographically embedded complex networks generated
illustrative description of the CRO algorithm, the interested
with the proposed simple model considering Ra and Rli ; (a) Example of reader is referred to [12], [13]. Additionally, in [14], a new
complex network with Ra = 10 and Rli = 10; (b) Example of complex version of the CRO algorithm with Substrate Layer, CRO-SL,
network with Ra = 10 and Rli ∈ [10, 15, 20, 30]. has been presented. In the CRO-SL approach, several substrate
layers (specific parts of the population) have been introduced.
In this algorithm, each substrate layer may represent different
processes (different models, operators, parameters, constraints,
III. Q UASI -S CALE F REE GEOGRAPHICALLY- EMBEDDED repairing functions, etc.). Specifically, in [15] a version of
NETWORKS WITH RANDOM NODES the CRO-SL algorithm has been recently proposed, in which
Let us consider a random-based geographically-embedded each substrate layer represents a different search procedure,
network with N nodes (“network order” = N ). This means leading to a co-evolution competitive algorithm. This version
that, after the node generation process, there will be N nodes of the CRO-SL has been successfully tested in different
in the network. Recall that the network is being constructed applications and problems such as micro-grid design [16],
dynamically, so each time a node i is generated and fulfils vibration cancellation in buildings, both with passive models
the Ra condition, then matrix L is modified to include the [17], and active models [18], or in the evaluation of novel
new node links. Let us consider a given Ra for the complete non-linear search procedures [19]. This is also the CRO-SL
network construction and specific Rli radius for each node, and algorithm used in this paper for complex network evolution.
Ra ≥ Rli . Let r = [Rl1 , . . . , RlN ] the link radius associated Regarding the algorithm’s encoding for the optimization
with the N nodes finally forming the network. The idea is to problem at hand, we consider integer vectors as solutions,
obtain a vector r∗ which makes the network have a scale-free x ∈ N. Note that using this encoding the length of each
behavior, i.e., such that it minimizes the following objective individual is equal to N . This encoding provides a compact
(fitness) function: version of the algorithm, and allows using some different
searching procedures such as Harmony Search or Differential
N
∑ Evolution. The main problem with a direct encoding of N
f (r) = (pk (r) − k −γ ) (2) integer values in the CRO-SL algorithm is that, as N grows,
k=2 the searching capabilities of the algorithm can be affected,
where pk stands for the degree distribution of the random since the search space is huge. It is possible to manage shorter
network obtained with a vector r. Note that we aim to find out encodings by using a compressed version of the encoding,
whether or not there is a r∗ leading to a power law distribution in such a way that each element of the encoding represents
with a given γ. β actual values, such as we proposed in [20]. Fig. 3 shows
This problem is therefore stated as an integer optimization an example of this compressed encoding, which reduces the
problem, in which the final network degree distribution will current encoding length l to l′ = βl . Of course, the resolution
completely depend on r. The problem is discrete, highly non- of the search space is smaller than in the original encoding
linear, and the search space size is huge when the network when the compressed encoding is applied, but on the other
order N grows, which discards exact solutions via brute hand, it is expected that the CRO-SL algorithm searches for
force algorithms. In these kind of problems meta-heuristics better solutions in this smaller search space.
approaches such as Evolutionary Computation-based algo- The considered substrates for solving the stated problem are
rithms are able to obtain very good solutions with a moderate detailed below. Note that there are general purpose substrates,
computational complexity. We therefore propose to apply a such as Differential Evolution or Harmony Search-based, and
kind of Evolutionary Algorithm, the aforementioned CRO- other specific substrates with crossovers and mutations adapted
SL approach, to solve this optimization problem associated to the chosen encoding. Five different substrates will be
with scale-free random-based networks. The question arising described and evaluated later in the experimental section.
499
consists of mutating an element of a coral with another

b b valid value (different from the previous one). Note that
the SM operator links a given coral (possible solution)
20 20 20 20 20 15 15 15 15 15
to a neighborhood of solutions which can be reached by
means of a single change is an element of the coral.
20 15 V. E XPERIMENTS AND R ESULTS

In this section we show different computational results
1 1
obtained with the CRO-SL in the evolution of two different
random networks with 200 and 400 nodes, respectively. The
Fig. 3. Compressed encoding example (β = 5), useful in the evolution of
complex networks. resulting randomly generated nodes have been represented in
Fig. 4 without the corresponding links which form the net-
work, for the sake of clarity. In both cases, a common Ra = 10
value has been considered, whereas the link radius to be
• Differential Evolution-based operator (DE): This op- assigned by the CRO-SL has been forced to fulfill the property
erator is based on the evolutionary algorithm with that 10 ≤ Rli ≤ 100. Table I shows the corresponding values for
name [22], a method with powerful global search ca- the CRO-SL parameters considered in the experiments carried
pabilities. DE introduces a differential mechanism for out.
exploring the search space. Hence, new larvae are gener-
ated by perturbing the population members using vector 150 200
differences of individuals. Perturbations are introduced by 150

100
applying the rule x′i = x1i + F (x2i − x3i ) for each encoded 100
parameter on a random basis, where x′ corresponds to 50 50
the output larva, xt are the considered parents (chosen

0
y 0 y
-50
uniformly among the population), and F determines the -50 -100
evolution factor weighting the perturbation amplitude. -100

-150
• Harmony Search-based operator (HS): Harmony -200
-150 -250
Search [23] is a population based MH that mimics the -200 -150 -100 -50
x
0 50 100 150 -200 -150 -100 -50 0
x
50 100 150 200 250
improvisation of a music orchestra while its composing a (a) (b)

melody. This method integrates concepts such as harmony
aesthetics or note pitch as an analogy for the optimization Fig. 4. Randomly-generated nodes for the N = 200 and N = 400 networks
process, resulting in a good exploratory algorithm. HS (represented without links, and with Ra = 10); (a) N = 200; (b) N = 400.
controls how new larvae are generated in one of the
following ways: i) with a probability HMCR ∈ [0, 1]
(Harmony Memory Considering Rate), the value of a
component of the new larva is drawn uniformly from TABLE I
the same values of the component in the other corals. ii) PARAMETERS OF THE CRO-SL USED IN THE EVOLUTION OF THE
with a probability PAR ∈ [0, 1] (Pitch Adjusting Rate), NETWORKS CONSIDERED . S EE [12], [13] FOR FURTHER DETAILS ABOUT
THE PARAMETERS .
subtle adjustments are applied to the values of the current
larva, replaced with any of its neighboring values (upper CRO-SL Parameters
or lower, with equal probability). Initialization Reef size = 50 × 40, ρ0 = 0.9
• Two points crossover (2Px): 2PX [21] is considered one External sexual reproduction Fb = 0.80
Substrates T = 5 substrates: HS, DE, 2Px, MPx, SM
of the standard recombination operators in evolutionary Internal sexual reproduction 1 − Fb = 0.20
algorithms. In the standard version of the operator, two Larvae setting κ=3
parents from the reef population are provided as input. A Asexual reproduction Fa = 0.05
Depredation Fd = 0.15, Pd = 0.05
recombination operation from two larvae is carried out by Stop criterion kmax = 500 iterations
randomly choosing two crossover points, interchanging
then each part of the corals between those points.
• Multi-points crossover (MPx): Similar to the 2PX, but in
this case the recombination between the parents is carried First, we have tackled the evolution of the N = 200
out considering a high number of crossover points (M ), network, from scratch by using the CRO-SL algorithm. A
and a binary template which indicates whether each part compressed encoding with β = 5 has been considered so
of one parent is interchanged with the corresponding of that the corals length is in this case l′ = 200
5 = 40. Fig. 5
the other parent. shows the results obtained by the CRO-SL in the evolution
• Standard integer Mutation (SM): This operator consists of this network. Fig. 5 (a) shows the network obtained after
of a standard mutation in integer-based encodings. It the optimization process, which has obtained an excellent
500
agreement of the network distribution node degree with a take into account that the spatial network construction depends
power law distribution k −1.55 (Fig. 5 (b)). Note that, in this on the position of the randomly generated nodes (we have
case, we have explored 12 values of the node degree k in considered geographically-embedded networks), controlled by
the network, ranging from 2 to 12, while the rest bring in Ra and also in the values of Rli , which are evolved by the
upper values of k. The best solution r∗ found by the CRO-SL CRO-SL algorithm.
algorithm has been represented in Fig. 5 (c), note the runs
of β = 5 equal values in the solution. Fig. 5 (d) shows the
0
fitness evolution of the best coral in the reef. As can be seen, 200
10
150
the CRO-SL is able to converge almost up to optimality in 100
just 500 generations, showing a fast and robust behaviour in 50 10

-1
this problem. 0
P(k)
y
-50
-2
-100 10
0 -150
10
150
-200
-3
100 -250 10
0 1 2
-200 -150 -100 -50 0 50 100 150 200 250 10 10 10
x k
50
(a) (b)
P(k)
-1
0 10 1
y
50
45 0.9
-50
40 0.8
35 0.7
-100
30 0.6
fitness
-2
-150 10 0.5
Rl
-200 -150 -100 -50 0 50 100 150 10
0
10
1
10
2 25
x k
20 0.4
(a) (b) 15 0.3
10 0.2
40 1
5 0.1
0.9
35
0 0
0.8 0 100 200 300 400 500
0 50 100 150 200 250 300 350 400
30 Node generations
0.7
25 0.6 (c) (d)

fitness
0.5
Rl
20
0.4
15
0.3 Fig. 6. Example of geographically-embedded complex network with N =
10
0.2 400 nodes, evolved with the CRO-SL algorithm; (a) Resulting geographically-
5 0.1 embedded network ; (b) Node degree distribution for the network represented
0 0
0 100 200 300 400 500
in (a): blue circles stand for the power law distribution k−1.59 , and red points
0 50 100 150 200
Node generations for the actual degree distribution of the obtained network; (c) Best solution
(c) (d) obtained with the CRO-SL; (d) CRO-SL fitness evolution.
Fig. 5. Example of geographically-embedded complex network with N =

200 nodes, evolved with the CRO-SL algorithm; (a) Resulting spatial network
obtained; (b) Node degree distribution for the network represented in (a): blue
As can be seen in the results obtained, it is possible to obtain
circles stand for the power law distribution k−1.55 , and red points for the quasi-scale-free geographically-embedded random networks,
actual degree distribution of the obtained network; (c) Best solution obtained considering a very simple model of distances between nodes.
with the CRO-SL; (d) CRO-SL fitness evolution.
It is necessary to solve an optimization problem, which is
hard, since it must optimize the link radius of all the randomly
generated nodes which form the network. We have shown how
Fig. 6 shows the results obtained by the CRO-SL in the the CRO-SL algorithm is able to successfully solve this task,
evolution of the second network considered, with a network finding near optimal solutions to the optimization problem.
order of N = 400 nodes. In this case, we have considered
a compressed encoding with β = 10, which leads to a VI. S UMMARY AND CONCLUSIONS
l′ = 400
10 = 40, similar to the N = 200 case. We have found In this paper we have shown that random geographically-
that this compressed encoding provides the best results. Fig. embedded networks can be constructed, in such a way that
6 (a) shows the resulting network generated by the CRO-SL they fulfil the scale-free property, i.e. the fraction of nodes in
algorithm, which is constructed to very approximately follow the network having degree k (ki = number of links in node ni )
a power law distribution k −1.59 . In this case we have explored follows a power law probability distribution P (k) ∼ k −γ . Up
15 values of the degree k, from 2 to 15 and a rest in upper val- until now, the scale-free property in geographically-embedded
ues of k. The best solution r∗ found by the CRO-SL algorithm network has only been studied for regular networks in a
has been displayed in Fig. 6 (c). Note the runs of β = 10 equal mesh. We have considered completely randomly generated
values in the solution. Fig. 7 shows the network evolution nodes for the networks, and we have established the on-
process in 6 steps for the best solution found by the CRO- line construction of the network, following a very simple
SL. In this figure it is possible to see the process of network model which only depends on the distances between new
construction as the nodes are being attached. It is important to generated nodes and existing nodes in the network (Rli ). We
501
R EFERENCES
200 200
150 150 [1] A.L. Barabási and M. and Pósfai, Network Science. Cambridge Univer-
100 100 sity Press, Cambridge, UK, 2016.
50 50
[2] L. Cuadra, M. del Pino, J. C. Nieto-Borge, and S. Salcedo-Sanz, “A
0 0
critical review of robustness in power grids using complex networks
concepts,” Energies, vol. 8, no. 9, pp. 9211-9265, 2015.
y
y
-50 -50
-100 -100
[3] L. Cuadra, M. del Pino, J. C. Nieto-Borge, and S. Salcedo-Sanz,
-150 -150
“Optimizing the Structure of Distribution Smart Grids with Renew-
able Generation against Abnormal Conditions: A Complex Networks
-200 -200
Approach with Evolutionary Algorithms,” Energies, vol. 10, no. 8, pp.
-250 -250
-200 -150 -100 -50 0
x
50 100 150 200 250 -200 -150 -100 -50 0
x
50 100 150 200 250 1097, 2017.
[4] S. H. Strogatz, “Exploring complex networks,” Nature, vol. 410, no.
(a) (b) 6825, pp. 268, 2001.
200 200
[5] R. Albert and A. L. Barabási, “Statistical mechanics of complex net-
150 150
works,” Reviews of modern physics, vol. 74, no. 1, pp. 47, 2002.
100 100
[6] M. E. Newman, “The structure and function of complex networks,”
50 50 SIAM review, vol. 45, no. 2, pp. 167–256, 2003.
0 0 [7] S. V. Buldyrev, R. Parshani, G. Paul, H. E. Stanley, and S. Havlin,
y
-50 -50 “Catastrophic cascade of failures in interdependent networks,” Nature,

-100 -100 vol. 45, no. 7291, pp. 1025, 2010.
-150 -150 [8] M. Barthélemy, “Spatial networks”, Physics Reports, vol. 499, no. 1-3,
-200 -200 pp. 1-101, 2011.
-250 -250 [9] M. Barthélemy, Morphogenesis of Spatial Network, Springer, 2017.
-200 -150 -100 -50 0 50 100 150 200 250 -200 -150 -100 -50 0 50 100 150 200 250
x x [10] K. Kosmidis, S. Havlin and A. Bunde, “Structural properties of spatially
(c) (d) embedded networks,” Europhysics Letters, vol. 82, no. 4, pp. 1-5, 2008.
200 200
[11] A. L. Barabási and R. Albert, “Emergence of scaling in random
150 150
networks” Science, vol. 286, pp. 509-512, 1999.
100 100
[12] S. Salcedo-Sanz, J. del Ser, I. Landa-Torres, S. Gil-López and A.
50 50
Portilla-Figueras, “The Coral Reefs Optimization algorithm: a novel
metaheuristic for efficiently solving optimization problems,” The Sci-
0 0
entific World Journal, 2014.
y
-50 -50
[13] S. Salcedo-Sanz, “A review on the coral reefs optimization algorithm:
-100 -100
new development lines and current applications,” Progress in Artificial
-150 -150
Intelligence, vol. 6, pp. 1-15, 2017.
-200 -200
[14] S. Salcedo-Sanz, J. Muñoz-Bulnes and M. Vermeij, “New coral reefs-
-250
-200 -150 -100 -50 0 50 100 150 200 250
-250
-200 -150 -100 -50 0 50 100 150 200 250 based approaches for the model type selection problem: a novel method
x x
to predict a nation’s future energy demand,” International Journal of
(e) (f) Bio-Inspired Computation, vol. 10, no. 3, pp. 145-158, 2017.
[15] S. Salcedo-Sanz, C. Camacho-Gómez, D. Molina and F. Herrera, “A
Coral Reefs Optimization algorithm with substrate layers and local
Fig. 7. Network evolution process in 6 steps for the N = 400 case (best
search for large scale global optimization,” In Proc. of the IEEE World
solution obtained with the CRO-SL algorithm).
Congress on Computational Intelligence, Vancouver, Canada, July, 2016.
[16] S. Salcedo-Sanz, C. Camacho-Gómez, R. Mallol-Poyato, S. Jiménez-
Fernández and J. del Ser, “A novel Coral Reefs Optimization algorithm
with substrate layers for optimal battery scheduling optimization in
propose then the evolution of the network with the objective micro-grids,” Soft Computing, vol. 20, pp. 4287-4300, 2016.
[17] S. Salcedo-Sanz, C. Camacho-Gómez, A. Magdaleno, E. Pereira and A.
of fulfilling the scale-free property: we have described this Lorenzana, “Structures vibration control via tuned mass dampers using
problem as an optimization task, consisting on assigning a a co-evolution coral reefs optimization algorithm,” Journal of Sound and
given link radius Rli to each node of the network, as soon Vibration, vol. 393, pp. 62-75, 2017.
[18] C. Camacho-Gómez, X. Wang, I. Dı́az, E. Pereira and S. Salcedo-Sanz,
as it is randomly generated. The optimal assignment of these “Active vibration control design using the Coral Reefs Optimization with
link radius leads to an evolution of the network to be quasi- Substrate Layer algorithm,” Computers & Structures, in press, 2017.
scale-free when it is completely constructed. We have applied [19] S. Salcedo-Sanz, “Modern meta-heuristics based on nonlinear physics
processes: A review of models and design procedures,” Physics Reports,
the modern meta-heuristic Coral Reefs Optimization with vol. 655, 1-70, 2016.
Substrate Layers (CRO-SL), which is able to combine different [20] S. Salcedo-Sanz, A. Gallardo-Antolı́n, J. M. Leiva-Murillo and C.
searching procedures within a single-population algorithm. A Bousoño-Calzón, “Off-line speaker segmentation using genetic algo-
rithms and mutual information,” IEEE Transactions on Evolutionary
discussion on the optimal problem’s encoding with different Computation, vol. 10, no. 2, pp. 175-186, 2006.
lengths using a compression procedure is also carried out. [21] A. E. Eiben and J. E. Smith. Introduction to evolutionary computing.
We have successfully tested the CRO-SL in two randomly Springer-Verlag, Natural Computing Series 1st edition, 2003.
[22] R. Storn and K. Price, “Differential Evolution - A simple and efficient
generated networks of 200 and 400 nodes, where we have heuristic for global optimization over continuous spaces, Journal of
shown that the CRO-SL is able to obtain quasi-scale free Global Optimization vol. 11, pp. 341-359, 1997.
geographically-embedded networks when it is applied. [23] Z. W. Geem, J. H. Kim and G. V. Loganathan, “A new heuristic
optimization algorithm: Harmony Search,” Simulation, vol. 76, no. 2,
pp. 60-68, 2001.
502
Metaheurı́sticas para calibración de modelos

basados en agentes en dinámicas de adopción
premium
Ignacio Moya∗ , Manuel Chica∗ ,William Rand† , Oscar Cordón∗
∗ Instituto Andaluz Interuniversitario DaSCI (Data Science and Computational Intelligence), Universidad de Granada, España
† Poole College of Management, North Carolina State University, NC, United States
Emails: [email protected], [email protected], [email protected], [email protected]
Resumen—Las aplicaciones freemium están creando nuevos la habilidad de adoptar mascotas virtuales, acceso a todos
escenarios de marketing, incentivando la adopción de servi- los avatares, y contenido reservado para usuarios premium
cios mediante la interacción entre usuarios. Para entender las como grupos y aventuras. La metodologı́a ABM [9], [10]
dinámicas de estas aplicaciones son útiles los modelos basados
en agentes, pero deben calibrarse con datos reales para poder utiliza una población de entidades autónomas llamadas agentes
ajustar su comportamiento a la realidad. Las metaheurı́sticas son que se comportan de acuerdo a reglas simples e interactúan
métodos de optimización frecuentemente usados para calibración unos con otros. Agregar estas reglas con la interacción entre
de modelos, dado que pueden ajustar los parámetros del modelo. los agentes nos permite representar dinámicas complejas y
En este artı́culo comparamos distintas metaheurı́sticas para emergentes, ası́ como definir escenarios what-if y predecir
calibrar un modelo basado en agentes que replica las dinámicas
de adopción de contenido premium usando el modelo de Bass. escenarios hipotéticos [11]. Este enfoque encaja con los patro-
Aplicamos estas metaheurı́sticas a cuatro datasets y llevamos nes de crecimiento del mercado que resultan de la interacción
a cabo un análisis de sensibilidad sobre los parámetros de las de muchos usuarios, que son más complejos que cualquier
soluciones encontradas por los algoritmos. Nuestros experimentos adopción individual [12]. Gracias a sus aplicaciones exitosas,
muestran que CMA-ES encuentra mejores soluciones que los se ha incrementado el número de trabajos que emplean ABMs,
demás algoritmos en los distintos datasets de adopción premium.
Nuestro análisis de sensibilidad muestra un amplio rango de particularmente para analizar la adopción de nuevos productos,
valores para los coeficientes de imitación e innovación del modelo polı́ticas de adopción, y estrategias de targeting [13], [14].
de Bass. Concretamente el ABM para Creature Party predice el
Index Terms—calibración de modelos, metaheurı́sticas, mode- número de usuarios básicos que adquieren contenido premium
lado basado en agentes, modelo de negocio freemium simulando periodos de tiempo especı́ficos y monitorizando el
comportamiento de los agentes. Este ABM utiliza información
I. I NTRODUCCI ÓN real de la red de usuarios para generar una red artificial [15]
El modelo de negocio freemium combina la oferta de un con una estructura similar en la que replicar el proceso social
producto o servicio sin coste con contenido premium que de adopción mediante el modelo de Bass [16]. También simula
el usuario puede adquirir de manera opcional [1]. Este mo- el comportamiento de usuarios siguiendo diferentes patrones
delo se está extendiendo en aplicaciones online [2], donde estacionales, lo que es muy relevante para las aplicaciones que
están creando nuevos escenarios de marketing dado que este muestran diferente actividad entre semana que durante fines de
contexto propicia la adopción de productos a través de la semana.
interacción entre usuarios [3]. Con estos escenarios también En general, para usar un ABM es necesario validar su
surgen distintos problemas al planear campañas de marketing: comportamiento calibrando sus parámetros. Llevamos acabo
qué individuos seleccionar para conseguir una campaña de este procedimiento utilizando data-driven automated calibra-
marketing viral, cómo lidiar con influencers, o cómo incentivar tion, que consiste en modificar los parámetros del modelo de
a los usuarios a atraer a otros mandando invitaciones a través manera automática y ası́ ajustar su salida a los datos reales.
de sus redes [4]–[7]. Entender estos y otros efectos sociales Este proceso es muy importante durante la validación del
detrás de las compras de contenido premium puede ser más modelo [12], [17], [18]. Implementamos nuestro proceso de
fácil usando un modelo basado en agentes (ABM), puesto calibración empleando metaheurı́sticas [19] como algoritmo
que permiten probar recompensas, incentivos, y polı́ticas de de búsqueda de la mejor configuración de parámetros del
targeting que incrementen el número de usuarios premium. modelo. En este artı́culo presentamos una comparación de
Un ejemplo es el ABM desarrollado para Creature Party [8]. las siguientes metaheurı́sticas: hill climbing [19], algoritmos
Esta aplicación es un juego social multiplataforma para niños genéticos [20], differential evolution [21], PSO [22], y CMA-
donde el usuario interactúa online con otros usuarios, que ES [23]. Elegimos estas metaheurı́sticas de modo que el
pueden ser premium o básicos. Un usuario básico tiene acceso grupo de métodos sea heterogéneo en cuanto a su comple-
total al juego pero un usuario premium recibe beneficios jidad, permitiendo apreciar la ganancia de rendimiento que
adicionales como una cantidad semanal de monedas del juego, consiguen métodos más avanzados. El rendimiento de las
503
metaheurı́sticas presentadas se basará en lo bien que el modelo modelo un usuario pasa de básico a premium cuando compra
calibrado replique los datos reales de Creature Party, que se en la tienda in-game. No consideraremos la transición inversa
presentan como la evolución de usuarios premium a lo largo (esto es, dejar de ser premium para ser básico, churn), dado
del tiempo. Estos datos se presentan en distintos periodos de que no hay datos disponibles y no podrı́amos calibrar este
tiempo componiendo los distintos datasets que utilizaremos comportamiento.
para validar las metaheurı́sticas para el problema. Una vez Cada agente tiene un conjunto de enlaces que representan
calibrado el modelo para Creature Party desarrollamos un las relaciones sociales entre usuarios de la aplicación. Estas
análisis de sensibilidad sobre las soluciones generadas en- relaciones son enlaces unidireccionales que habilitan el in-
focándonos en los coeficientes de adopción del modelo de tercambio de información y canalizan influencias entre ellos.
Bass y los parámetros de estacionalidad del modelo, utilizando Los enlaces de la red social se generan usando un algoritmo
técnicas de visualización de datos (scatter plots) para los basado en un grado de distribución dado [15], [25], con un
valores obtenidos. grado medio de 48,19 usuarios y una densidad de 0,0024.
En la Sección II describiremos el ABM de adopción de En cada paso del modelo, cada agente primero decide
contenido premium de Creature Party. La Sección III pre- si jugar o no siguiendo una probabilidad que depende del
senta las distintas metaheurı́sticas empleadas en el proceso dı́a de la semana. Modelamos este comportamiento usando
de calibración. Mostramos la experimentación y el análisis de dos parámetros: (a) la probabilidad de jugar entre semana
sensibilidad en la Sección IV. Por último, remarcamos nuestras (d ∈ [0, 1]) y (b) la probabilidad de jugar en fin de semana
conclusiones en la Sección V. (f ∈ [0, 1]). Si un agente juega a la aplicación, podrá decidir
II. D ESCRIPCI ÓN DEL MODELO posteriormente si adoptar contenido premium en base a la
influencia social de sus contactos (imitación) o por su propia
La Sección II-A presenta la estructura general del modelo. iniciativa (innovación). Este proceso de adopción sigue el
En la Sección II-B se describen los mecanismos y el comporta- modelo de Bass [12], [16], descrito en la Sección II-C. La
miento de los agentes, incluyendo sus interacciones sociales en probabilidad de jugar de cada agente sigue la Ecuación 1.
la aplicación. Finalmente presentamos el proceso de adopción El agente A decide jugar el dı́a t si la función jugartA (r)
seguido por el modelo en la Sección II-C. devuelve 1, donde r ∈ [0, 1) es un número aleatorio generado
A. Estructura general usando una distribución uniforme.
El modelo simula la evolución del número de usuarios 
premium durante un periodo de tiempo determinado usando un 1,
 si r < d ∧ t ∈ entre−semana,
time step diario. De este modo la salida del modelo consiste en A
jugart (r) = 1, si r < f ∧ t ∈ f in−semana, (1)
los nuevos usuarios premium para cada paso de la simulación, 
0, e.o.c.

que es el indicador principal de este tipo de mercados [24]. Ob-
servando la evolución de adopciones premium diarias podemos C. Modelo de adopción
medir como de bien se ajusta el modelo a los datos históricos El modelo de adopción elegido es la versión ABM del
de las distintas instancias. El modelo ABM para Creature modelo de Bass [8], [16]. En el modelo de adopción de Bass,
Party modela los usuarios existentes como agentes con un un agente básico puede hacerse premium con una probabilidad
factor de escala de 2:1, por lo que 20000 agentes representan que incluye tanto el efecto de la publicidad (externalidad)
los 40000 usuarios activos de la aplicación. Esta escala se como el de la influencia social o boca a boca. La probabilidad
define para reducir el coste computacional manteniendo un de que un agente se haga premium debida a la interacción con
buen nivel de representatividad. otros agentes se regula por la fracción de sus vecinos que se
Los agentes representan usuarios básicos o premium del han hecho premium en los pasos anteriores. Por tanto, en cada
total de usuarios de la aplicación, dependiendo del ratio inicial paso un agente básico i puede hacerse premium debido a dos
de usuarios premium α sobre el total de usuarios. Duran- circunstancias:
te la inicialización del modelo, cada agente es inicializado
1. Innovación: con probabilidad p̂ (coeficiente de innova-
como usuario básico o premium aleatoriamente. Debido a
ción), p̂ ∈ (0, 1), un agente básico puede hacerse premium
la aleatoriedad del modelo cada ejecución puede resultar en
debido a información externa a la red.
distintos patrones de difusión y resultados finales, por lo
2. Imitación: con probabilidad q̂ (coeficiente de imitación),
que usamos simulaciones de Monte-Carlo (MC) y ejecutamos
q̂ ∈ (0, 1), un agente básico puede hacerse premium
múltiples veces la simulación. Cada agente toma decisiones
observando el estado de sus vecinos, donde f es la
ası́ncronamente, es decir, sin mecanismos de sincronización
fracción de vecinos premium.
con el resto de agentes, dado que ası́ el modelo se asemeja
más a un modelo de simulación continuo, más cercano a la En estas circunstancias podemos modelar el proceso de
realidad [12]. adopción premium siguiendo la Ecuación 2 [12]. Un agente
A puede hacerse premium en un step t si adoptar devuelve 1,
B. Actualización del estado de los agentes y de su red donde r, s ∈ [0, 1) son números aleatorios generados usando
Los agentes tienen distintas variables de estado para re- una distribución uniforme y fA es la fracción de vecinos
presentar la transición de usuario básico a premium. En el premium de A.
504
( cedimiento de búsqueda local implementa una estrategia tipo

1, si r < p̂ ∨ s < fA q̂, hill climbing [19]. Partiendo de una solución aleatoria, refina
adoptartA (r, s) = (2)
0, e.o.c. la calidad de la solución incrementando o decrementando el
valor de uno de los parámetros de manera iterativa. Nuestra
III. M ETAHEUR ÍSTICAS PARA CALIBRACI ÓN búsqueda local considera la variable incremento, que regula
En esta sección presentamos nuestra propuesta para calibrar la variación aplicada a los parámetros de la solución. En cada
ABM usando métodos automáticos basados en metaheurı́sti- iteración, la búsqueda local se moverá al primer vecino que
cas. La calibración automática es un proceso intensivo que mejore su fitness por un umbral dado.
usa una medida de error para comparar la salida del modelo
B. GA
con datos reales, modificando sus parámetros para encontrar la
configuración que más se ajuste a los datos reales [17], [18]. Diseñamos nuestro algoritmo genético (GA) siguiendo una
Medimos la calidad del modelo ejecutando una simulación y estrategia generacional donde cada nueva generación reem-
comparando su salida con los datos reales. En este trabajo plaza a la anterior [20]. Fijamos el tamaño de población del
hemos considerado metaheurı́sticas para calibración dado que algoritmo en 100 invidividuos y el el número de generaciones
los parámetros del ABM no muestran interacciones lineales y en 200. Nuestra implementación usa selección por torneo
la mejor opción es usar un algoritmo de optimización no-lineal [19], con k siendo el tamaño del torneo. También incluimos
que pueda gestionar un espacio de búsqueda muy amplio [17], elitismo débil, por lo que el mejor padre siempre pasa a
[26], [27]. Aun ası́, elegir la metaheurı́stica más adecuada la siguiente generación. Como estrategia de cruce elegimos
para calibrar ABM no es trivial dado que hay que tener en un cruce multipunto PMX con probabilidad pc para cada
cuenta dos criterios opuestos: la exploración del espacio de individuo. Respecto a la estrategia de mutación, cada individuo
búsqueda (diversificación) y la explotación de las soluciones tendrá una probabilidad pm de reiniciar uno de sus parámetros
más prometedoras (intensificación). (genes), sustituyendo su valor por un número aleatorio usando
En general, las metaheurı́sticas elegidas modificarán el una distribución uniforme en el intervalo [0, 1].
conjunto de parámetros del modelo para ajustarse a los datos C. PSO
reales de las distintas instancias. Calibramos cuatro parámetros
Para nuestra implementación de Particle Swarm Optimi-
reales del modelo anteriormente descrito: los dos parámetros
zation (PSO) [22] consideramos también una población de
que regulan la estacionalidad d, f ∈ [0, 1], el coeficiente de
100 individuos y 200 iteraciones. Cada individuo considera 5
innovación p̂ ∈ [0, 1], y el coeficiente de imitación q̂ ∈ [0, 1].
vecinos que se asignan aleatoriamente durante la inicialización
Las metaheurı́sticas seleccionadas usan la misma función de
del algoritmo. En cada iteración, cada individuo se mueve
fitness, que determina la calidad del modelo con relación a los
(modifica sus valores) considerando su mejor configuración
datos reales de usuarios premium. Para evaluar el ajuste de un
conocida, el mejor de sus vecinos, y el mejor global. Este
modelo utilizamos cada dataset R y lo dividimos en Rtrain
movimiento se calcula utilizando cuatro parámetros que actúan
y Rtest para seguir un enfoque de validación hold-out [27].
como pesos: velocidad (vc ), mejor personal (pc ), mejor vecino
Ambos conjuntos tienen sus variables de entorno correspon-
(ic ), y mejor global (gc ).
dientes Etrain y Etest , que definen las condiciones como el
estado de la red social y el número de usuarios premium. D. DE
Utilizaremos 15 ejecuciones de MC, siendo la estimación de El diseño que hemos elegido para differential evolution (DE)
error ǫ(Rtrain , M (P ∗ , Etrain )) la media del ajuste en estas [21] considera una población de 100 invidividuos y se ejecuta
15 ejecuciones de la simulación. En nuestro caso elegimos L2 durante 200 generaciones. La variante utilizada es DE/rand/2,
o distancia euclı́dea para calcular el error ǫ: que genera el vector donante a partir de la siguiente ecuación:
v
un−1 xi (G + 1) = xr1 (G) + F (xr2 (G) − xr3 (G)), donde xi es el
2
uX vector generado y r1, r2, y r3 son soluciones diferentes. F
L =t |VM (i) − VR (i)|2 ,
es un parámetro del algoritmo que actúa de amplificador de
i=0
la mutación. Esta variante genera nuevos individuos usando el
donde n es el número de puntos del histórico y VM y VR son vector donante con una probabilidad definida por el parámetro
los vectores de salida (nuevos usuarios premium) del modelo CR.
y de la instancia respectivamente. Por último, hemos imple-
mentado las metaheurı́sticas en Java utilizando el framework E. CMA-ES
ECJ [28]. Las secciones siguientes presentan los detalles de Covariance matrix adaptation evolution strategy (CMA-ES)
las metaheurı́sticas elegidas: hill climbing [19], algoritmos [23] es otro algoritmo bio-inspirado que desarrolla la mutación
genéticos [20], differential evolution [21], PSO [22], y CMA- de su población (o recombinación) de acuerdo a una matriz de
ES [23]. covarianza. CMA-ES suele funcionar muy bien con problemas
similares al nuestro, ya que los parámetros son valores reales y
A. HC el tamaño del conjunto a calibrar es pequeño. Hemos elegido
Hemos definido una búsqueda local para comparar su ren- la variante (µ/µI , λ)-CMA-ES, donde en cada iteración se
dimiento con las metaheurı́sticas poblacionales. Nuestro pro- combinan los mejores µ candidatos con λ nuevas soluciones.
505
IV. E XPERIMENTACI ÓN

A. Configuración
La Tabla I muestra los parámetros que hemos usado para
nuestros experimentos. Nuestro proceso de calibración consi-
dera datos reales de Creature Party divididos en cuatro datasets
diferentes. Estos datasets contienen el número de usuarios
premium por dı́a para periodos de tiempo distintos que a su
vez dividimos en training y test. El primer dataset contiene
91 dı́as, con 60 para training y 31 para test. El segundo y el
tercer dataset consideran 46 dı́as, divididos en 31 dı́as para
training y 15 para test. El cuarto y último dataset contiene 45
dı́as, con 30 para training y 15 para test. Figura 1: Evolución del fitness de los algoritmos poblacionales
para el dataset 3.
Tabla I: Valores de los parámetros de las metaheurı́sticas
General GA PSO
Nombre Valor Nombre Valor Nombre Valor
Evaluaciones 20,000 pc 1.0 vc 0.3
Individuos 100 pm 0.2 pc 0.04
Generaciones 200 k 3 ic 0.3
Monte-Carlo 15 gc 0.3
HC DE CMA-ES
Nombre Valor Nombre Valor Nombre Valor
incremento 0.01 F 0.6 λ 8
umbral 0.01 CR 0.3 µ 4
Figura 2: Comparación entre la salida del modelo calibrado y

los datos históricos de training del dataset 2 (31 dı́as).
B. Resultados de calibración
Mostramos los resultados de calibración obtenidos por las
metaheurı́sticas en la Tabla II. Estos resultados muestran el se ajusta a los datos históricos. Por ejemplo en el step 4, el
ajuste de la mejor solución después de 15 ejecuciones con número de usuarios premium fue 204 y la simulación predice
distintas semillas. Este ajuste se presenta como el fitness medio 196. Aunque hay excepciones, como el dı́a 2 donde el número
y la desviación tı́pica de las 15 simulaciones de MC para de usuarios premium fue 511 pero el modelo predice 404.
training y test. Como se puede observar, el fitness de la
mayorı́a de metaheurı́sticas es mejor para los datasets más C. Análisis de sensibilidad
pequeños (2, 3, y 4), lo cual parece coherente dado que su Nuestros experimentos señalan CMA-ES como el mejor
comportamiento deberı́a ser más fácil de ajustar. Por otro lado, método, consiguiendo los mejores resultados en tres conjuntos
los valores de desviación tı́pica son similares. Con respecto al de training y uno de test. En esta sección hacemos un análisis
ajuste de las soluciones, estros resultados muestran que CMA- de sensibilidad a las soluciones generadas por CMA-ES para
ES supera a los otros algoritmos por un pequeño margen. cada dataset. Los scatter plots de las Figuras 3 y 4 muestran
Además de valores de fitness bajos, CMA-ES consigue unos los valores de los coeficientes de Bass y los parámetros de
valores de desviación tı́pica reducidos, por lo que se muestra estacionalidad para los soluciones generadas por CMA-ES
estable con distintas semillas. durante el proceso de calibración. Estas soluciones provienen
Mostramos el rendimiento de los algoritmos poblacionales de una única ejecución de la metaheurı́stica, recogidas desde
durante el proceso de calibración usando el dataset 3 en la el principio de la calibración hasta que el algoritmo termina,
Figura 1. Esta gráfica muestra la evolución del fitness de la filtrando las soluciones que superen 500 de fitness. Este filtro
mejor solución en cada generación, por lo que el progreso permite concentrar el análisis en las mejores soluciones.
de los algoritmos se muestra cada 100 evaluaciones. Estos Podemos observar que los valores de los coeficientes de
resultados muestran que los algoritmos alcanzan valores de Bass de las soluciones para los distintos dataset son similares.
error reducidos rápidamente y sugieren que aumentar el núme- Por ejemplo, para el primer dataset (Figura 3a) las mejores
ro de evaluaciones no mejorarı́a el resultado final de manera soluciones rondan p̂ = 0,03 y q̂ = 0,16. En cambio el
significativa. coeficiente de imitación es ligeramente más bajo en el resto de
En la Figura 2 mostramos una comparación entre los datos datasets (q̂ = 0,1). En el caso del coeficiente de innovación,
históricos y la salida del modelo calibrado para la mejor los dos primeros dataset (Figura 3a y 3b) muestran sus
solución encontrada por CMA-ES para el segmento training mejores valores alrededor de p̂ = 0,03 y los dos siguientes
del dataset 2. Estos resultados muestran que el proceso de ca- (Figura 3c y 3d)) alrededor de p̂ = 0,045. En estos últimos
libración obtiene buenos resultados y que el modelo calibrado observamos también mayor dispersión en sus soluciones con
506
Tabla II: Fitness medio y desviación tı́pica de cada metaheurı́stica para cada dataset
Dataset 1 Dataset 2 Dataset 3 Dataset 4
TRA TEST TRA TEST TRA TEST TRA TEST
HC 365.6 (18.7) 349.2 (21.9) 256.0 (17.2) 211.0 (20.3) 301.1 (19.8) 351.7 (15.7) 336.1 (30.3) 222.1 (20.1)
GA 351.9 (19.6) 333.7 (22.4) 247.6 (24.8) 182.1 (19.1) 286.0 (22.4) 331.4 (20.0) 304.5 (26.0) 283.7 (31.5)
DE 351.8 (18.9) 335.3 (20.4) 245.3 (22.0) 194.8 (20.5) 286.8 (21.6) 348.0 (17,0) 301.6 (17.6) 283.5 (34.2)
PSO 347.2 (15.0) 332.5 (20.8) 246.1 (13.8) 191.7 (19.5) 308.0 (19.7) 261.5 (22.7) 316.5 (31.5) 365.2 (20.4)
CMA-ES 326.9 (18.2) 296.4 (15.6) 248.1 (13.9) 164.8 (17.0) 286.0 (16.9) 318.1 (22.3) 303.3 (24.4) 267.2 (26.4)
(a) Dataset 1 (b) Dataset 2
(c) Dataset 3 (d) Dataset 4
Figura 3: Scatter plots para el análisis de sensibilidad sobre los coeficientes de Bass (p/q).
mejor fitness, lo que podrı́a indicar que estos dataset tienen elegido las soluciones calibradas por CMA-ES, la mejor
mayor tolerancia a distintos valores de estos parámetros. metaheurı́stica según nuestra experimentación, para desarrollar
Globalmente, se puede observar que las soluciones muestran un análisis de sensibilidad sobre sus parámetros. Usando estas
mayor dispersión para el coeficiente de innovación (p̂), lo que soluciones, hemos visualizado los valores de los coeficientes
indica que es un parámetro más sensible. En comparación con del modelo de Bass y los parámetros de estacionalidad.
otras configuraciones del modelo de Bass para otros mercados Los resultados de calibración de las distintas metaheurı́sticas
publicados anteriormente en la literatura de marketing [12], los muestran valores de fitness cercanos. Sin embargo, CMA-ES
modelos calibrados presentan un valor alto para el coeficiente consigue mejores soluciones por lo que lo distinguimos como
de innovación (p̂) y un valor bajo para el coeficiente de el mejor método, lo cual es coherente con publicaciones ante-
imitación (q̂). riores sobre optimización continua utilizando metaheurı́sticas.
Por último, los scatter plots de la Figura 4 muestran los El análisis de sensibilidad aplicado sobre las soluciones
valores de estacionalidad para los soluciones encontradas para calibradas por CMA-ES muestra que sus parámetros para
los distintos datasets. Estas soluciones muestran valores cons- los distintos dataset son similares. Además estos valores son
tantes en los diferentes datasets, con valores que rondan d=0,1 diferentes de otros modelos similares [12], lo que podrı́a
para la probabilidad de jugar entre semana y f =0,2 para la indicar que las aplicaciones freemium como Creature Party
probabilidad de jugar en fin de semana. Estos parámetros tienen un componente de innovación mayor. Por último, dado
también muestran mayor concentración en el parámetro (d), que nuestro análisis no tiene en cuenta las caracterı́sticas
lo que sugiere que el ABM de Creature Party es más sensible especı́ficas del diseño del ABM subyacente, pensamos que
a los cambios en la probabilidad de jugar entre semana que nuestros resultados podrı́an ser generalizables a otros modelos.
en para la probabilidad de jugar en el fin de semana.
AGRADECIMIENTOS
V. C ONCLUSIONES Este trabajo está financiado por el Ministerio de Economı́a
En este artı́culo hemos aplicado distintas metaheurı́sticas y Competitividad bajo el proyecto NEWSOCO (ref. TIN2015-
a la calibración de un modelo ABM usando datos reales. 67661-P), incluyendo Fondos Europeos de Desarrollo Regio-
Después de comparar el rendimiento de los algoritmos, hemos nal (ERDF).
507
(a) Dataset 1 (b) Dataset 2
(c) Dataset 3 (d) Dataset 4
Figura 4: Scatter plots con los valores de los parámetros de estacionalidad: entre semana (d) y fin de semana (f ).
R EFERENCIAS [15] F. Viger and M. Latapy, “Efficient and simple generation of random
simple connected graphs with prescribed degree sequence,” in Lecture
[1] V. Kumar, “Making freemium work: Many start-ups fail to recognize Notes in Computer Science. Computing and Combinatorics. Springer,
the challenges of this popular business model.” Harvard Business 2005, vol. 3595, pp. 440–449.
Review, vol. 92, no. 5, pp. 27–29, May 2014. [Online]. Available: [16] F. M. Bass, “A new product growth model for consumer durables,”
https://hbr.org/2014/05/making-freemium-work Management Science, vol. 36, no. 9, pp. 1057–1079, 1969.
[2] M. Trusov, R. E. Bucklin, and K. Pauwels, “Effects of word-of-mouth [17] R. Oliva, “Model calibration as a testing strategy for system dynamics
versus traditional marketing: Findings from an internet social networking models,” European Journal of Operational Research, vol. 151, no. 3,
site,” Journal of Marketing, vol. 73, no. 5, pp. 90–102, 2009. pp. 552–568, 2003.
[3] B. Libai, R. Bolton, M. S. Bügel, K. De Ruyter, O. Götz, H. Risselada, [18] R. G. Sargent, “Verification and validation of simulation models,” in
and A. T. Stephen, “Customer-to-customer interactions: broadening the Proceedings of the 37th conference on Winter simulation, 2005, pp.
scope of word of mouth research,” Journal of Service Research, vol. 13, 130–143.
no. 3, pp. 267–282, 2010. [19] E.-G. Talbi, Metaheuristics: from design to implementation. John Wiley
[4] O. Hinz, B. Skiera, C. Barrot, and J. U. Becker, “Seeding strategies & Sons, 2009.
for viral marketing: An empirical comparison,” Journal of Marketing, [20] T. Back, D. B. Fogel, and Z. Michalewicz, Handbook of evolutionary
vol. 75, no. 6, pp. 55–71, 2011. computation. Bristol (UK): IOP Publishing Ltd., 1997.
[5] R. Van der Lans, G. Van Bruggen, J. Eliashberg, and B. Wierenga, “A [21] K. Price, R. M. Storn, and J. A. Lampinen, Differential evolution: a
viral branching model for predicting the spread of electronic word of practical approach to global optimization. Springer Science & Business
mouth,” Marketing Science, vol. 29, no. 2, pp. 348–365, 2010. Media, 2006.
[6] D. J. Watts and P. S. Dodds, “Influentials, networks, and public opinion [22] J. Kennedy and R. Eberhart, “Particle swarm optimization,” in Neural
formation,” Journal of Consumer Research, vol. 34, no. 4, pp. 441–458, Networks, 1995. Proceedings., IEEE International Conference on, vol. 4.
2007. IEEE, 1995, pp. 1942–1948.
[7] P. Schmitt, B. Skiera, and C. Van den Bulte, “Referral programs and [23] N. Hansen and A. Ostermeier, “Completely derandomized self-
customer value,” Journal of Marketing, vol. 75, no. 1, pp. 46–59, 2011. adaptation in evolution strategies,” Evolutionary computation, vol. 9,
[8] M. Chica and W. Rand, “Building agent-based decision support systems no. 2, pp. 159–195, 2001.
for word-of-mouth programs: A freemium application,” Journal of [24] P. W. Farris, N. T. Bendle, P. E. Pfeifer, and D. J. Reibstein, Marketing
Marketing Research, vol. 54, no. 5, pp. 752–767, 2017. [Online]. metrics: The definitive guide to measuring marketing performance,
Available: https://doi.org/10.1509/jmr.15.0443 2nd ed. Wharton School Publishing, 2010.
[9] C. M. Macal and M. J. North, “Tutorial on agent-based modeling and [25] R. Milo, N. Kashtan, S. Itzkovitz, M. Newman, and U. Alon, “On the
simulation,” in Proceedings of the 37th conference on Winter simulation. uniform generation of random graphs with prescribed degree sequences,”
ACM, 2005, pp. 2–15. arXiv preprint http://arxiv.org/abs/cond-mat/, 2004.
[10] J. M. Epstein, Generative social science: Studies in agent-based compu- [26] J. H. Miller, “Active nonlinear tests (ANTs) of complex simulation
tational modeling. Princeton University Press, 2006. models,” Management Science, vol. 44, no. 6, pp. 820–830, 1998.
[11] M. A. Janssen and E. Ostrom, “Empirically based, agent-based models,” [27] F. Stonedahl and W. Rand, “When does simulated data match real data?
Ecology and Society, vol. 11, no. 2, p. 37, 2006. Comparing model calibration functions using genetic algorithms,” in
[12] W. Rand and R. T. Rust, “Agent-based modeling in marketing: Guideli- Advances in Computational Social Science, ser. Agent-Based Social
nes for rigor,” International Journal of Research in Marketing, vol. 28, Systems. Springer, Japan, 2014, vol. 11, pp. 297–313.
no. 3, pp. 181–193, 2011. [28] S. Luke, L. Panait, G. Balan, S. Paus, Z. Skolicki, J. Bassett, R. Hubley,
[13] M. Trusov, W. Rand, and Y. V. Joshi, “Improving prelaunch diffusion and A. Chircop, “Ecj: A java-based evolutionary computation research
forecasts: Using synthetic networks as simulated priors,” Journal of system,” Downloadable versions and documentation can be found at the
Marketing Research, vol. 50, no. 6, pp. 675–690, 2013. following url: http://cs. gmu. edu/eclab/projects/ecj, 2006.
[14] M. Haenlein and B. Libai, “Targeting revenue leaders for a new product,”
Journal of Marketing, vol. 77, no. 3, pp. 65–80, 2013.
508
An empirical validation of a new memetic CRO

algorithm for the approximation of time series*
* Note: The full contents of this paper have been published in the volume Lecture Notes in Artificial Intelligence 11160 (LNAI 11160)
Antonio M. Durán-Rosal Pedro A. Gutiérrez

Dept. of Computer Science and Numerical Analysis Dept. of Computer Science and Numerical Analysis
University of Córdoba University of Córdoba
Córdoba, Spain Córdoba, Spain
Sancho Salcedo-Sanz César Hervás-Martı́nez

Department of Signal Processing and Communications Dept. of Computer Science and Numerical Analysis
Universidad de Alcalá University of Córdoba
Madrid, Spain Córdoba, Spain
Abstract—The exponential increase of available temporal data

encourages the development of new automatic techniques to re-
duce the number of points of time series. In this paper, we propose
a novel modification of the coral reefs optimization algorithm
(CRO) to reduce the size of the time series with the minimum
error of approximation. During the evolution, the solutions are
locally optimised and reintroduced in the optimization process.
The hybridization is performed using two well-known state-
of-the-art algorithms, namely Bottom-Up and Top-Down. The
resulting algorithm, called memetic CRO (MCRO), is compared
against standard CRO, its statistically driven version (SCRO)
and their hybrid versions (HCRO and HSCRO, respectively). The
methodology is tested in 15 time series collected from different
sources, including financial problems, oceanography data, and
cardiology signals, among others, showing that the best results
are obtained by MCRO.
Index Terms—Time series size reduction, segmentation, coral
reefs optimization, memetic algorithms
509
Modelling Mandible Articulation for Skull-Face

Overlay in Forensic Identification1
E. Bermejo, C. Campomanes-Álvarez, O. Cordón∗
A. Valsecchi, O. Ibáñez, and S.Damas Research Center on Information
∗
Andalusian Institute on Data Science and Computational and Communication Technologies
Intelligence (DaSCI), University of Granada University of Granada
Email: [email protected], [email protected] Email: [email protected]
I. I NTRODUCTION by relatives, the missing person usually appears in relaxed

situations, most of them smiling or with the mouth slightly
Forensic anthropology is a sub-field of physical anthropol-
open. Generally, cases with grimaces or forced poses are
ogy that involves applying scientific knowledge to the collec-
discarded due to the fact that the mandible is in an exaggerated
tion and analysis of medico-legal information. It includes the
position and these kinds of facial expressions distort the soft
recovery, identification, and description of human skeletal re-
tissue of the face. Additionally, each individual comparison
mains [2]. Currently, several forensic identification techniques
should involve the analysis of one skull against more than one
are available, i.e., DNA samples, fingerprint recognition, or
AM photograph of the same person to significantly increase
dental records. When none of the previous methods can be
the reliability and accuracy of the method [6]. Overall, this
applied, the analysis of skeletal remains becomes the last resort
is a very time-consuming task even using an automatic SFO
of forensic identification. One of the alternative techniques
method.
is craniofacial superimposition (CFS) [3], which involves the
superimposition of a complete skull (or a skull model) with a II. M OTIVATION , P ROPOSAL , AND C ONCLUSIONS
number of ante mortem (AM) images of an individual. CFS
Those photographs where subjects appear with their mouths
is thus a technique used when only skeletal information is
open reduce the confidence of the identification. Therefore,
available for the forensic assessment and other techniques
it is essential to model the articulation of the mandible in
such as DNA or dental record analysis are not possible or
order to improve CFS reliability, considering that we only have
conclusive.
skeletal information available to infer its movement. In our
Traditional CFS techniques are tedious and based on a
contribution, we have modeled and integrated the mandible
‘trial and error’ process requiring several hours of manual
articulation within the SFO optimization algorithm.
processing to obtain a correct superimposition. Therefore,
In particular, we considered a simple model [7] to estimate
there is a strong interest on designing automatic methods
and parameterize the mandible aperture movement using the
to assist the CFS identification procedure [4]. The process
aperture percentage. Moreover, we proposed different design
requires a forensic expert to position the skull in the same
alternatives to integrate the estimation of the mandible aperture
pose as the face in the photograph. This process is known as
within the scheme of the current state-of-the-art SFO opti-
Skull-Face Overlay (SFO).
mization algorithm [8], namely RCGA. Specifically, RCGA
Up to now, all computer-based SFO methods have con- is a real-coded, elitist genetic algorithm that performs the
sidered the mandible as a rigid part of the skull. These registration of the 3D skull with the 2D AM photograph.
methods usually follow one of the following approaches to Our proposal involves three different design alternatives
approximate the mandible aperture [5]: i) Before capturing to balance the exploration-exploitation trade-off during the
the 3D model, the mandible was manually located relative to optimization. We have performed a thorough experimental
the cranium so that the model resembled the facial expression study to analyze the suitability of the proposed articulation
of the photograph under study; and ii) Once the mandible and model to the SFO technique. Additionally, we have designed
the cranium were scanned, the 3D models were positioned a ground-truth database to allow an objective evaluation of the
according to the relative aperture in the photograph using 3D reliability of our proposal.
modeling software.
According to the results of this experimentation (Figure 1),
Such a simplification (anatomically incorrect) causes a the application of a simple mandible aperture model has
negative impact on the accuracy of the automatic SFO method. proven its effectiveness, significantly improving the accu-
As the AM images used to perform CFS are typically provided racy and the versatility of the state-of-the-art automatic SFO
1 This article is a summary of the work published in Information Sciences
method. Such an outstanding performance facilitates the use
[1], to be considered as a part of the CAEPIA’18 Key Works. The motivation, of facial photos where the individual either smiles or opens
the main contributions and some conclusions are briefly summarized. the mouth partially. Such photos have been usually discarded
510
in real identification scenarios. The availability of new AM

evidence is a crucial consequence of this work. Indeed, the use
of multiple facial photos of the same individual is essential to
increase the reliability of the identification based in CFS [9]
In our proposal, the expert is only required to pinpoint
the incisors, and the mandibular and cranial condyles, a
much simpler task to carry out. This task is only performed
once, no matter which number of AM photos the skull is
compared with. Thereby, our articulated SFO approach avoids
entirely the time-consuming and error-prone positioning of the
mandible, besides adding versatility to the procedure as it can
adapt its pose to different mouth openings in the photographs.
ACKNOWLEDGMENT
This publication is supported by Spanish Ministerio de
Economı́a y Competitividad under the NEWSOCO project
(ref. TIN2015-67661-P) and the Andalusian Dept. of Inno-
vación, Ciencia y Empresa under project TIC2011-7745, both
including European Regional Development Funds (ERDF).
Dr. C. Campomanes Álvarez’s work has been supported by
Spanish MECD FPU grant AP-2012-4285. Dr. Ibáñez’s work
has been supported by Spanish MINECO Juan de la Cierva
Fellowship JCI-2012-15359.
R EFERENCES
[1] E. Bermejo, C. Campomanes-Álvarez, A. Valsecchi, O. Ibáñez, S. Damas,
and O. Cordón, “Genetic algorithms for skull-face overlay including
mandible articulation,” Information Sciences, vol. 420, pp. 200 – 217,
2017.
[2] M. Yoshino and S. Seta, “Skull-photo superimposition,” Encyclopedia of
Forensic Sciences, vol. 2, pp. 807–815, 2000.
[3] M. Yoshino, Craniofacial superimposition, in: C. Wilkinson and C. Rynn,
Eds. Craniofacial Identification, University Press, Cambridge, 2012.
[4] S. Damas, O. Cordón, O. Ibáñez, J. Santamarı́a, I. Alemán, M. Botella,
and F. Navarro, “Forensic identification by computer-aided craniofacial
superimposition,” ACM Computing Surveys, vol. 43, no. 4, pp. 1–27,
2011.
[5] M. I. Huete, O. Ibáñez, C. Wilkinson, and T. Kahana, “Past, present,
and future of craniofacial superimposition: Literature and international
surveys,” Legal Medicine, vol. 17, no. 4, pp. 267–278, 2015.
[6] S. Damas, C. Wilkinson, T. Kahana, E. Veselovskaya, A. Abramov,
R. Jankauskas, P. T. Jayaprakash, E. Ruiz, F. Navarro, M. I. Huete,
E. Cunha, F. Cavalli, J. Clement, P. Lestón, F. Molinero, T. Briers,
F. Viegas, K. Imaizumi, D. Humpire, and O. Ibáñez, Study on the
performance of different craniofacial superimposition approaches (II):
Best practices proposal. Forensic Science International, 2015, vol. 257.
[7] J. J. Lemoine, J. J. Xia, C. R. Andersen, J. Gateno, W. Buford, and
M. A. K. Liebschner, “Geometry-Based Algorithm for the Prediction of
Nonpathologic Mandibular Movement,” Journal of Oral and Maxillofa-
cial Surgery, vol. 65, no. 12, pp. 2411–2417, 2007.
[8] B. R. Campomanes-Alvarez, O. Ibanez, C. Campomanes-Alvarez,
S. Damas, and O. Cordón, “Modeling Facial Soft Tissue Thickness
for Automatic Skull-Face Overlay,” IEEE Transactions on Information
Forensics and Security, vol. 10, no. 10, pp. 2057–2070, oct 2015.
[9] D. Austin-Smith and W. R. Maples, “The reliability of skull/photograph
superimposition in individual identification,” Journal of Forensic Sci-
ences, vol. 39, no. 2, pp. 446–55, mar 1994.
Fig. 1. Visual SFO results: A1 (left images) and RCGA (right images) for
different frontal and lateral instances (Smile, 15, 30, and 40).
511
Propuestas de mejora para la evaluación del

arte evolutivo.
Francisco Fernández de Vega1 , Cayetano Cruz1 , Patricia Hernández2
I. R ESUMEN diferentes variaciones de los algoritmos evolutivos

En este trabajo se discute el modo de evaluar para generar lo que los autores consideran arte. De
adecuadamente el arte evolutivo, no tanto desde el hecho, el arte generativo se ha estado utilizando
punto de vista de la función de fitness, que tam- durante el siglo XX para, basado en medios fı́sicos,
bién, sino considerando el resultado final al que se quı́micos, mecánicos o en computadores, generar un
llega. En la aplicación tradicional de los algoritmos nuevo tipo de arte. Ya en los años 60, se organizó
evolutivos a la resolución de problemas el resultado en Londres una llamativa exposición en la que arte
obtenido es fácilmente evaluable y comparable con gráfico, poesı́a, música, etc, era generada mediante
otras metodologı́as, pues basta obtener una medida programas de computador [10].
cuantitativa de la calidad final de la solución. Sin El término arte es algo que depende de la sociedad,
embargo, en los procesos asociados al arte y diseño, y ha variado con frecuencia a lo largo de los siglos.
estas medidas objetivas no son tan sencillas. Este Como caso paradigmático de esta variación, cabe
trabajo, que se plantea como un posicionamiento destacar el rechazo que el salón de arte de Parı́s
sobre la cuestión de cómo evaluar apropiadamente el tuvo hacia los nuevos pintores denominados impre-
arte evolutivo, revisa alguna de las propuestas que sionistas, que decidieron abrir un salón alternativo
se han producido en este ámbito, pasando por la donde mostrar su obra [6]. En sus inicios, el im-
evaluación interactiva, el test de turing para el arte presionismo era rechazado por la crı́tica -compuesta
ası́ como algunas competiciones internacionales en fundamentalmente por los eruditos y artistas más
el dominio de los algoritmos evolutivos, para discutir tradicionales de la época, aunque fue recibiendo
finalmente el papel que otros actores fundamentales, y aceptación del público de forma gradual, y llegó con
frecuentemente olvidados en el mundo del arte, están el tiempo a ser considerado una nueva forma de
teniendo en este arte generativo basado en evolución: expresión artı́stica al mismo nivel que el arte más
el público, la crı́tica, galerı́as de arte, museos, etc. clásico. Al impresionismo le siguieron otras muchas
Una vez discutida la cuestión, y planteada la solución tendencias en el siglo XX, como el expresionismo,
propuesta, se describen algunas experiencias en las cubismo, futurismo, dadaismo, surrealismo, etc. Y es
que algunos, si no todos, de estos actores han sido que las formas artı́sticas trazan lı́neas que navegan
incluidos en el proceso, y los resultados que se han arrastrando esa cadena de colisiones haciendo del arte
obtenido. Entendemos que estas experiencias pueden un lugar activo, positivo, lúcido, versátil y maleable.
servir de ejemplo para otras iniciativas artı́sticas que Del mismo modo, en el mundo de la música seria,
puedan surgir en este ámbito de aplicación de los al- los comienzos del siglo XX en Estados Unidos de
goritmos evolutivos, y a la vez la propuesta sirva para América vieron nacer una nueva forma de expresión
clarificar el papel del arte evolutivo en el contexto musical fruto del mestizaje de culturas y tradiciones
artı́stico en general. provenientes de varios continentes. La música Jazz,
que inicialmente era despreciada como música de
II. I NTRODUCCI ÓN raza (eufemismo para hablar de personas de color),
La aplicación de los algoritmos evolutivos al arte fue conquistando los gustos del público, y poste-
y diseño no es nuevo [11]. Desde la década de los riormente, también la crı́tica musical entendió sus
noventa, son muchos los trabajos que han utilizado fundamentos e importancia, de tal modo que alguno
de los compositores y músicos Jazz de color, son hoy
1 Universidad de Extremadura, 06800 Mérida, España. dı́a considerados como alguno de los más grandes
[email protected], [email protected]
2 Universidad de Sevilla, España artistas y compositores de la historia, incluyendo
[email protected] a Luis Amstrong -trompetista- y Duke Ellington -
512
pianista-, reconocido actualmente este último como modo: La sección III describe las dificultades pa-
uno de los más grandes compositores americanos de ra evaluar adecuadamente el arte evolutivo. En la
la historia [9]. sección IV presentamos nuestro posicionamiento al
También lo contrario ha sucedido con frecuencia: respecto, con ideas sobre como mejorar. La sección
tendencias artı́sticas consideradas desde el inicio co- V presenta algunos resultados obtenidos mediante la
mo arte formal o académico no han sido aceptadas propuesta descrita, y finalmente la sección VI resume
por el público de forma mayoritaria, tal como sucede nuestras conclusiones.
con el serialismo y dodecafonismo de Schoemberg,
que aunque de utilidad innegable asociado a otras III. E STADO DEL ARTE
formas de arte, como el cine, sigue despertando poco Cuando los investigadores decidieron por primera
interés entre el público en general [2], y pocas son vez aplicar los algoritmos evolutivos en procesos de
las compañı́as, si es que hubiera alguna, que puedan creación artı́stica, se encontraron un problema, que
sobrevivir interpretando solamente obras de este tipo es la clave en la evaluación del arte a lo largo de
sin ayudas del sector público. Quizá sea necesaria la historia: ¿Cómo evaluar correctamente la calidad
una reflexión adicional sobre qué tipo de forma de estética de una imagen surgida de la evolución?
arte se adapta mejor a la naturaleza intrı́nseca del ser La solución tradicional ha sido permitir que sean
humano, que es finalmente el destinatario final de la los humanos quienes evalúen la calidad, produciendo
misma, y sobre si el término arte se ha desvirtuado o ası́ un cambio profundo en los algoritmos evolutivos
no en el siglo XX y convertido en cajón de sastre para tradicionales, dando lugar a lo que se conocen como
incluir elementos que quizá debieran categorizarse de Algoritmos Evolutivos Interactivos, con multitud de
otro modo. Como en otros ámbitos sociales, estirar en aplicaciones hoy dı́a [13].
deması́a el significado de un término puedo provocar Ası́, las herramientas que se han desarrollado y
que el mismo pierda su contenido semántico. Pero están disponibles para el arte evolutivo, tal como Pic-
más allá de esta reflexión, conviene aquı́ considerar el Breeder, se basan en el buen criterio de las personas
arte evolutivo (y generativo en términos más amplios) a la hora de elegir lo que se considere estéticamente
en relación al arte humano. más razonable [12].
Podemos resumir diciendo, que en la evolución y Ha habido intentos de encerrar en fórmulas ma-
cambio que el término arte ha tenido a lo largo de los temáticas la calidad estética de una obra plástica, pero
siglos, se han visto implicados no sólo los eruditos, el resultado no ha sido muy afortunado [8]. También
que podrı́amos describir como la crı́tica, sino también se ha intentado evaluar cual es la opinión del público
el público que con su favor impulsa o no a ciertos sobre el arte plástico, cuales son sus preferencias, y
artistas, y los museos que acogen y exponen lo que con un procedimiento basado en encuestas, se llegó
se considera arte. a conclusiones poco satisfactorias [3].
Sin embargo, cuando nos fijamos en los resultados Trabajos como este último ponen el dedo en la
obtenidos mediante procesos evolutivos en el mundo llaga: la participación de un alto número de usuarios
del arte [11] -y centrándonos aquı́ en el arte plástico- diferentes dando su opinión sobre qué es más apre-
no todos los actores anteriores han sido tenidos en ciado en una obra de arte, cuyo ejemplo más notable
cuenta, como veremos a continuación. es Picbreeder, no tiene necesariamente que conducir
El arte contiene una parte de naturaleza transitoria a un resultado adecuado.
y circunstancial propia de un determinado espacio Pero entonces, si la participación de usuarios no
tiempo y en este trabajo se pretende revisar la impor- es suficiente para garantizar la calidad del resultado,
tancia de cada uno de esos actores en el arte evolutivo, ¿qué otros elementos serı́a necesario incluir?
y alguno de los resultados más llamativos obtenidos En algunos trabajos recientes se habla de la posibi-
cuando todos los actores participan de algún modo lidad de generar un test de turing para el arte basado
en el proceso. en computador [1], que podrı́a aplicarse por tanto al
Este artı́culo por tanto pretende mostrar el camino arte evolutivo. Pero precisamente en este modelo hay
hacia una correcta evaluación de trabajos artı́sticos varios elementos no triviales:
generados mediante procedimientos basados en algo- ¿Quiénes deben actuar como jurado?
ritmos evolutivos, y describe experiencias recientes ¿Con qué arte humano comparamos, con el
que tienen en cuenta la propuesta planteada. producido por artistas profesionales, o cualquier
El resto del artı́culo se estructura del siguiente persona en general?
513
El hecho de que un jurado no sepa si una obra IV-A. El Test de Turing para el arte
ha sido generada por ordenador o no, ¿Le otorga
automáticamente un sello de calidad?
Como se describı́a más arriba, la dificultad para
Estas son las tres preguntas básicas a las que nos
medir la calidad estética de las obras, ha llevado a
vamos a enfrentar en la siguiente sección, descri-
proponer la necesidad de un Test de Turing para el
biendo alguna de las propuestas en las que hemos
arte: si un jurado humano no puede distinguir una
trabajado en los últimos años, y los resultados que
obra generada por un computador de una elaborada
hemos conseguido para intentar proponer modelos
por un humano, el trabajo, se dirı́a, supera el Test de
más adecuados para el arte evolutivo.
Turing.
IV. M ETODOLOG ÍA : S OBRE LA FORMA DE Hay tres razones para cuestionar la utilidad de un
EVALUAR EL ARTE EVOLUTIVO test como el anterior. En primer lugar, la indecidibi-
lidad sobre el origen de una obra -humana o creada
Hasta la fecha, las buenas intenciones han do- por computador- no tiene porqué otorgarle de forma
minado el arte evolutivo. En general, un algoritmo automática un sello de calidad. En el arte tradicional,
interactivo -que es el utilizado de forma tradicional la importancia del reconocimiento del artista detrás de
en este contexto- funciona del siguiente modo: todas la obra se debe principalmente a cuestiones históricas,
las operaciones del algoritmos son llevadas a cabo de de consideraciones académicas, favor del público, y,
modo estándar salvo la evaluación del fitness. Ası́, por último, del mercado del arte, que más que calidad,
los usuarios se encargan de ir decidiendo la calidad lo que evalúa es la cotización del artista firmante [14].
del ”producto en evolución”. Pero en este proceso,
el cansancio del usuario afecta al resultado del pro- Pero en realidad hay una segunda razón que per-
ceso, como ya ha sido reconocido con anterioridad mite cuestionar el mencionado test tenga sentido:
[4]. Aunque existen propuestas que tratan de evitar algunas tendencias artı́sticas nacidas en el siglo XX,
este cansancio utilizando dispositivos no intrusivos generan resultados que fácilmente podrı́an confundir-
que analizan el comportamiento del usuario [3], el se con el producto de un programa de ordenador.
problema de quién evalúa la calidad -el usuario en En música, el serialismo y la atonalidad se basa
este caso- sigue presente. en procesos con un componente estocásticos, y que
Una vez que el algoritmo termina, el resultado aunque son llevados a cabo por personas, son sen-
obtenido en la última generación serı́a el producto cillamente emulables por computador (mucho más
generado. Pero en el arte evolutivo, la obra de arte que la música tonal de tradición clásica occidental,
producida, si se pretende que emule en calidad la en la que el alto número de reglas que la define
contraparte humana, deberı́a ser mostrada al público implica la construcción de sistemas basados en reglas,
y evaluada de forma similar al resto de obras de o con aprendizaje sobre casos conocidos, de alta
arte. En realidad no es esto lo que sucede en la complejidad [15]). Igualmente en el arte plástico,
mayorı́a de los casos; tı́picamente, los resultados el uso de herramientas digitales por parte de los
obtenidos mediante algoritmos evolutivos han sido artistas, podrı́a también inducir a error a los jurados,
presentados a la comunidad en sus propios foros, que confundiendo arte humano, en este caso, por arte
incluye revistas dónde los algoritmos son descritos y generado evolutivamente.
congresos especializados, tal como EvoMusart, o más En resumen, el Test de Turing no parece la herra-
generalistas que acogen cualquier resultado notable mienta necesaria para calificar la calidad de un re-
en el área. Pero en pocas ocasiones este proceso sultado generado mediante evolución. Quizá, pudiera
de exposición y muestra es utilizado para obtener ser más reveladora la apreciación de especialistas con
información de lo que el público opina. criterio artı́stico, como los curadores. No obstante,
Este modo de proceder, es bastante lejano a cómo más allá de la capacidad técnica para emular la
en realidad el mundo del arte funciona. Examinare- manera de hacer una obra, está la capacidad para
mos con detalle los tres puntos destacados anterior- elaborar un lenguaje diferenciado y reconocible, ası́
mente, y propondremos en cada caso cómo podrı́amos como el discurso de trasfondo que subyace en la
acercarnos más al circuito artı́stico internacional, para obra y su relación con factores relacionados con las
llegar a que el arte evolutivo pueda ocupar el puesto tendencias y oportunidades de interés particular en
que merece. cada momento histórico.
514
IV-B. Sobre los artistas. Este tipo de competiciones, permiten avanzar en

alguno de los puntos controvertidos destacados en la
En los ejemplos más conocidos de arte evolutivo, sección previa: el establecimiento de un jurado y una
tal como el que pueda producirse con herramientas competición permite que sea un grupo especializado
similares a Picbreeder, mediante un proceso que el que dictamine. En esta lı́nea, podemos referirnos a
podrı́amos llamar crowd-painting, se invita a usuarios alguno de nuestros trabajos previos en este dominio,
particulares, distribuidos a través de internet, para que como XY que fue enviado a la competición en el
de modo colectivo evolucionen imágenes. ¿Es éste año 2013 y resultó ganador (ver figura 1) [7]. Hay
el procedimiento adecuado para generar un producto que destacar que aunque el trabajo se apartaba del
artı́stico de calidad? Creemos que no. Si queremos modelo interactivo tradicional de algoritmo evolutivo,
que el producto final sea de calidad, es necesario y en su lugar utilizaba la propuesta coocida como
incluir en el algoritmo los elementos necesarios - Algoritmo Evolutivo Desconectado [17], el resultado
aunque puede que no suficientes- para conseguirlo. fue favorablemente evaluado por el jurado.
En nuestra opinión, esto requiere la presencia de artis-
tas humanos, de modo que sean artistas experimenta-
dos los que puedan hacer la evaluación estética de los
resultados parciales, y que de este modo el algoritmo
pueda progresar, dado que hasta el momento no se
ha encontrado la forma de evaluar automáticamente
la calidad estética. No basta incluir usuarios en la
interacción, deben ser usuarios especiales, artistas,
los encargados de la evaluación de la calidad en
el proceso evolutivo. Sólo cuando en el futuro los
procesos de aprendizaje máquina consigan modelar Figura 1. XY: ACM Gecco 2013 Evolutionary Art, Design
and Creativity competition winner. Four out of the sixty works
a los artistas adecuadamente, podrán ser sustituidos, produced are displayed.
pero mientras tanto los artistas deben estar en el
centro del proceso de evaluación. No obstante, la competición se desarrolla en un
En algunas de nuestras experiencias recientes, op- congreso especı́fico de algoritmos evolutivos, ACM
tamos por esta lı́nea de trabajo [16]. No obstante, GECCO 2013 en este caso, y el jurado está com-
aunque creemos necesaria la presencia de artistas puesto por investigadores del área, algunos de ellos
en el algoritmo evolutivo, esto no tiene porqué ser siendo también artistas. Pero por lo anterior, tanto el
suficiente. Para certificar la calidad de un trabajo, ámbito de la competición como el tipo de jueces, hace
debe haber una evaluación final que permita discernir que exista una ”desviación o tendencia”que favorece
sobre la calidad del algoritmo ejecutado, del mismo el tipo de trabajos presentados.
modo que después de la ejecución de un algoritmo Entendemos que es necesario dar un paso más
evolutivo estándar, se evalúa la calidad final para para conseguir posicionar el arte evolutivo dónde le
saber si la solución obtenida es factible o, en caso corresponde.
contrario, ejecutar de nuevo el algoritmo para intentar IV-C. Sobre los jurados.
de nuevo obtener una solución válida. La composición del jurado es crucial para calificar
En el mundo del arte tradicional, son las compe- la calidad de un trabajo. En el mundo del arte,
ticiones, museos y galerı́as quienes aplican el filtro los curadores (comisarios, - curator en inglés) de
final, además, por supuesto, del público que es quién las exposiciones son los que deciden los artistas
visita las exposiciones y, finalmente, adquiere las cuyo trabajo merecen la pena. Por otro lado, en las
obras. competiciones artı́sticas, las selección de un jurado
En el dominio de los algoritmos evolutivos, al- adecuado es lo que otorga calidad a la misma. Tanto
gunos congresos de relevancia, han organizado en competiciones como exposiciones se llevan a cabo
ocasiones competiciones internacionales. Cabe des- en museos y galerı́as, que actuando como crı́tica
tacar el Gecco Evolutionary Art, Design and Creati- permiten filtrar y definir en cada momento histórico
vity competition [7], que ha permitido a los artistas lo que merece la pena del panorama artı́stico.
evolutivos enviar sus trabajos para que un jurado Por todo lo dicho anteriormente, entendemos que la
internacional eligiera el ganador de la competición. forma más adecuada de evaluación del arte evolutivo,
515
es que compita con el arte humano en igualdad de Este mismo problema, que se ha repetido con las
condiciones en el contexto concreto del arte tradicio- obras posteriores, está ya siendo objeto de mejora.
nal: competiciones de arte, galerı́as y museos. Recientemente hemos trabajado en un modelo de
Describimos a continuación la experiencia obtenida exposición interactiva, que permite analizar al usuario
con las obras que hemos desarrollado en los últimos en la visita, mediante dispositivos Kinnect. Los resul-
cinco años, y que nos ha permitido afrontar el proceso tados muestran que los datos obtenidos son similares
de selección de calidad descrito anteriormente, en un a los obtenidos mediante encuesta, con la ventaja de
recorrido por ciudades y galerı́as de todo el mundo. ser métodos no intrusivos [3]. No obstante, lo que más
En las experiencias que describimos, se incluyen importa en la propuesta que hacemos, es el modo de
tanto galerı́as de arte, como otras competiciones evaluación por los actores fundamentales del mundo
internacionales alejadas del cı́rculo de los algoritmos del arte.
evolutivos. En una segunda etapa, y considerando que el lugar
natural para un artista y su obra es una galerı́a de arte,
V. E XPERIMENTOS Y R ESULTADOS decidimos apostar por este ámbito expositivo. Ası́, en
2015 y 2017, organizamos exposiciones temporales
Desde el año 2012, utilizando el Algoritmo Evo- de la obra XYZ en la Galerı́a de Arte ”Back Ballery
lutivo Desconectado -que avanza en la dirección Project”, en Vancouver. Conseguimos gestionar la
del algoritmo evolutivo interactivo, permitiendo al exposición e inauguración del evento en la galerı́a
usuario ejecutar todos y cada uno de los pasos del la misma semana que tuvo lugar el congreso IEEE
algoritmo evolutivo [16]- hemos ido recorriendo una CEC en la ciudad. En el congreso se mostraron
serie de etapas que nos han permitido mejorar los algunas reproducciones de la obra, y se redirigió a los
procesos de evaluación de los resultados artı́sticos, asistentes a la galerı́a para la visita. Hay que enfatizar
avanzando en el camino que creemos es más ade- el hecho de que no habı́a ninguna conexión previa
cuado para posicionar el Arte Evolutivo en el mundo entre la galerı́a de arte, dedicada exclusivamente al
del arte plástico, llegando a obtener algunos de los mundo del arte, y el congreso mencionado.
objetivos perseguidos y, como se verá más adelante, De forma parecida, se gestionó otra exposición
tan sólo pendiente de la decisión sobre la ubicación en la Gallerie Louchard de Parı́s, en Octubre de
definitiva de las obras generadas, ya sea en alguna 2017, aunque en este caso, la galerı́a si ofrecı́a a los
colección particular o en algún museo de arte con- organizadores del congreso Artificial Evolution 2017
temporaneo. Tal como se describe anteriormente en un espacio en el que mostrar arte evolutivo enviado
la metodologı́a, hemos tratado de afrontar procesos al congreso.
de evaluación de calidad cada vez más cerca del Lo anterior muestra que las galerı́as de arte pueden
mundo del arte, y más lejos del área de los algoritmos estar interesadas en el arte evolutivo igual que en
evolutivos. cualquier otro tipo de arte contemporáneo, y que la
aceptación de la obra para ser expuesta por parte
V-A. Galerı́as de Arte y su público de galerı́as de arte, como en los ejemplos descritos
Han sido tres las obras colectivas de arte evolutivo anteriormente, son un indicativo, y por tanto un modo
que hemos producido en estos últimos cinco años: de evaluación, de la calidad de las obras.
XY, XYZ y finalmente The horizon project [5]. Desde V-B. Evaluación definitiva: Competición Interna-
el principio se consideró la necesidad de exponer cional de Arte
las obras y obtener realimentación de la opinión del
público. No obstante, y tal como indicábamos en secciones
En cuanto a la primera obra, XY, se decidió previas, la mejor manera de evaluar un trabajo artı́sti-
mostrarla en congresos del área. Las exposiciones en co, independientemente del procedimiento con que se
Cancún, Madrid y Mérida, en congresos como IEEE ha generado, es presentarlo en alguna competición
CEC o MAEB, permitieron obtener información de puramente artı́stica, a nivel internacional. Esto es
público afı́n, y detectamos los problemas asociados lo que se hizo con la tercera obra, The Horizon
con la utilización de encuestas a los usuarios, que Project [5] (ver figura 2). Se decidió presentarlo a la
implican un cansancio similar al de los usuarios que competición Show Your World 2017 1 , celebrada en
participan de modo interactivo con los algoritmos 1 http://www.reartiste.com/juried-exhibition-show-your-world-
evolutivos. 2017/
516
New York, y cuyas obras finalistas serı́an expuestas AGRADECIMIENTOS

en la galerı́a Gallery MC, en Manhattan. La obra fue Agradecemos el apoyo del Ministerio de Eco-
seleccionada por un jurado internacional como obra nomı́a y Competitividad proyecto TIN2017-85727-
finalista, siendo la única obra Española finalista en C4-{2,4}-P, Junta de Extremadura, Consejerı́a de
esta competición, y por supuesto la única generada Comercio y Economı́a, proyecto IB16035 a través del
mediante procesos evolutivos. Fondo Europeo de Desarrollo Regional, “Una manera
Hasta dónde sabemos, esta es la primera vez de hacer Europa”.
que una obra de estas caracterı́sticas es evaluada -
y seleccionada como finalista- en una competición R EFERENCIAS
internacional abierta en el ámbito del mundo del [1] Boden, M.A.: The turing test and artistic creativity. Kyber-
netes 39(3), 409–413 (2010)
arte, con un jurado especialista, y expuesto en una [2] Botstein, L.: Schoenberg and the audience: modernism, mu-
exposición dirigida por un curador profesional. sic, and politics in the twentieth century. Schoenberg and his
World pp. 19–54 (1999)
[3] Fernández, F., Garcı́a, M., Merelo, J., Aguilar, G., Cruz, C.,
Hernández, P.: Analyzing evolutionary art audience interac-
tion by means of a kinect based non-intrusive method. In:
Studies in Computational Intelligence series, vol. 785, pp.
321–347 (2018)
[4] Frade, M., Fernández de Vega, F., Cotta, C.: Evolution of
artificial terrains for video games based on accessibility. In:
European Conference on the Applications of Evolutionary
Computation, pp. 90–99. Springer (2010)
[5] Hernández, P., Fernández de Vega, F., Cruz, C., Albarrán, V.,
Garcı́a, M., Navarro, L., Gallego, T., Garcı́a, I.: The horizon
project: Emotion in lines. Journal Art and Science 1(1), 1–9
(2017)
[6] House, J.: Impressionism: Paint and Politics. Yale University
Press (2004)
[7] Loiacono, D.: Gecco-2013 competitions. ACM SIGEVOlu-
Figura 2. The Horizon Project, available at: tion 6(2), 27–28 (2014)
http://merida.herokuapp.com/ [8] McCormack, J.: Open problems in evolutionary music and
art. In: Workshops on Applications of Evolutionary Compu-
tation, pp. 428–436. Springer (2005)
En resumen, aunque en los problemas de optimi- [9] Peress, M.: Dvorak to Duke Ellington: A Conductor Explores
zación la calidad del resultado es fácil de evaluar America’s Music and Its African American Roots. Oxford
considerando si el resultado obtenido da solución al University Press on Demand (2004)
[10] Reichardt, J.: Cybernetic serendipity: the computer and the
problema planteado, creemos que el camino mostrado arts. Praeger (1969)
para evaluar el arte evolutivo en este trabajo, que in- [11] Romero, J.J.: The art of artificial evolution: A handbook on
cluye al público y la crı́tica, representada por galerı́as evolutionary art and music. Springer Science & Business
Media (2008)
de arte y competiciones internacionales, es el único [12] Secretan, J., Beato, N., D Ambrosio, D.B., Rodriguez, A.,
que puede otorgar un sello de calidad a un resultado Campbell, A., Stanley, K.O.: Picbreeder: evolving pictures
artı́stico. collaboratively online. In: Proceedings of the SIGCHI
Conference on Human Factors in Computing Systems, pp.
1759–1768. ACM (2008)
VI. C ONCLUSIONES [13] Takagi, H.: Interactive evolutionary computation: Fusion of
the capabilities of ec optimization and human evaluation.
Este artı́culo presenta nuestra posición sobre lo Proceedings of the IEEE 89(9), 1275–1296 (2001)
[14] Thompson, D.: The $12 million stuffed shark: The curious
que consideramos más adecuado para la correcta economics of contemporary art. Macmillan (2010)
evaluación de un proyecto de arte evolutivo. [15] Fernández de Vega, F.: Revisiting the 4-part harmonization
Nuestra propuesta, que renuncia al test de turing problem with gas: A critical review and proposals for im-
proving. In: Evolutionary Computation (CEC), 2017 IEEE
por su incapacidad para otorgar un sello de calidad Congress on, pp. 1271–1278. IEEE (2017)
a un trabajo, se basa en involucrar a actores funda- [16] Fernández de Vega, F., Cruz, C., Navarro, L., Hernández, P.,
mentales del mundo del arte: la crı́tica y al público. Gallego, T., Espada, L.: Unplugging evolutionary algorithms:
an experiment on human-algorithmic creativity. Genetic Pro-
El artı́culo muestra como ejemplo el recorrido de gramming and Evolvable Machines 15(4), 379–402 (2014)
un proyecto artı́stico colectivo que comenzó en 2012, [17] Fernández de Vega, F., Navarro, L., Cruz, C., Chavez, F.,
y su proyección en los diferentes foros artı́sticos, ha Espada, L., Hernandez, P., Gallego, T.: Unplugging evolutio-
nary algorithms: on the sources of novelty and creativity. In:
permitido dotar de sentido diferenciado a la obra, más Evolutionary Computation (CEC), 2013 IEEE Congress on,
allá de la distición por ser arte evolutivo. pp. 2856–2863. IEEE (2013)
517
1
An Evolutionary Approach to Metroidvania

Videogame Design
Álvaro Gutiérrez Rodrı́guez, Carlos Cotta, Antonio J. Fernández Leiva
ETSI Informática, Campus de Teatinos, Universidad de Malaga, 29071 Málaga – Spain
Email:{alvarogr,ccottap,afdez}@lcc.uma.es
Abstract—Game design is a fundamental and critical part directed to propose a tool aimed to create a complete game
of the videogame development process, demanding a high cost (leaving art and sound aside) for any genre, creating the
in terms of time and effort from the team of designers. The mechanics, game rules, game elements, NPC behaviors and
availability of tools for assisting in this task is therefore of
the foremost interest. These can not just speed up the process levels. For this, we propose the use of bioinspired algorithms
and reduce costs, but also improve the overall quality of the for learning and optimization. More precisely, we pose the use
results by providing useful suggestions and hints. A conceptual of evolutionary algorithms to generate game contents (game
system to approach the construction of this kind of tools is rules, mechanics, etc.) and machine learning tools such as
presented in this work. By using a learning component, the artificial neural networks to mimic the way the designer thinks.
preferences and expertise of the designers can be modelled and to
some extent simulated. This model is subsequently exploited by After briefly outlining others related works in Section II, this
an optimization component that tries to create adequate game system is described for a general point of view in Section
designs. A proof of concept of the system is provided in the III. As an initial proof of concept, we have picked the case
context of level design in Metroidvania games. It is shown that of Metroidvania games [7]. The deployment of the system on
the system can produce quality solutions and hints to the designer. this context is then detailed in Section IV, and the results of
an empirical examination are provided in Section V. We close
this work with a summary of findings and an outline of future
I. I NTRODUCTION work in Section VI.
The development of a videogame encompasses different
stages/phases and usually involves teams specialized on partic- II. BACKGROUND
ular areas. Among all these phases, the design phase is crucial AI-assisted game design refers to the development of AI-
for the ultimate fate of the game: it is in this stage where it powered tools supporting the game design and development
is decided how the game will be, what the requirements for process [6]. Combining these tools with Procedural Content
subsequent development phases will be, and most importantly, Generation techniques (PCG) is a good approach to aid the
which the source of fun in the game will be. game designer.
Unlike other development stages, design is not so commonly Liapis et al. [4], [8] generate new designs using genetic
assisted by AI tools. This contrasts with the pervasive use algorithms (GAs) as a PCG technique. Designers have a map
of such tools in content generation. For example, Non-Player design on which they are working, and the application derives
Characters (NPCs) are agents controlled by the computer new designs using this former as a seed. The GA uses different
whose behaviour must be believable (i.e., in accordance with criteria to evolve solutions, such as game pace and player
the rol of that character) to keep the player’s inmersion in the balance (see also [9]). The playability of the design is defined
game. Developers also use procedural generation techniques by considering if all resources and bases are reachable from
to generate new content (e.g., maps1 , weapons2 , stories3 , etc.) any other base or resource. The application shows twelve
during gameplay in order to diminish monotony. The use of derivations, six made with the evolution system commented
content generation tools reduces the workload of designers and and other six with novelty search. An important part of the
artists, and produce results that are generally well-received by experiments involved having professional designers use the
the end users. tool. The feedback was positive, indicating the system was
As anticipated before, the field of intelligent tools for capable of providing interesting suggestions.
game design is still nascent, but it does not mean that it ANGELINA is a cooperative coevolutionary system for
has not yet been explored [1]–[6]. Indeed, previous works automating the process of videogame design. There have been
provide interesting and explanatory results, paving the way several different versions of ANGELINA in the past [10]–[12].
for further developments. While some of them focus on Focusing on the last version [5], it can create every content
specific videogame genres and in stablished mechanics, a of a game: mechanics, game rules, programming, sound, art
broader perspective is possible. In this sense, this work is and levels. The creation of a game starts with a semantic
1 http://spelunkyworld.com/index.html derivation of a sentence or word; after this derivation, free
2 https://borderlandsthegame.com/ contents (e.g., models, textures, sounds, etc) in agreement with
3 https://www.shadowofwar.com/es/ the derivation are searched in the web. Later, mechanics, game
518
2
rules and, finally, levels in agreement with those mechanics

and game rules are created. During the process, a game is
represented as a map which defines passable and non-passable
areas in a two-dimensional grid, a layout which describes the
arrangement of player and non-player characters in the map,
and a ruleset which describes the effects of collisions between
game entities, as well as movement types for the NPCs, and
time and score limits for the game [12]. A collection of EAs
run concurrently, each of them aimed to optimize a different
component; in order to have a complete vision and optimize
their individual objectives, they share information on the game
(board state, rules, mechanics) during the evolutionary process
and use the fitness of individual components to increase the Figure 1: System scheme
overall fitness of the finished artifact4 .
During the process, the designer can interact with the system
III. A N AUTOMATED S YSTEM FOR G AME D ESIGN
by providing additional examples or clues to refine the model
The design process is difficult due to the different abstract and hence bias the search process in specific directions.
facets it encompasses. Consider for example the design process In line with the work by Sorenson and Pasquier [13], in
of a character: the designer receives the story of the character which the fitness function calculate the feasibility and fun of
and some features of their personality (e.g., heroic, brave, etc.); the design, we aim to customize this function to each designer.
then, the designer creates several different designs, all of which To this end, the learning component needs to learn to think like
can be functional, well drawn, and using an appropriate color the designer and will validate the different individuals (ideas)
palette. But which of them is the best design? The designer of the EA like the designer would. A system such as this one
could arrange all different designs in a screenshot of the movie can be used to create a complete game of any genre. As an
or videogame to see which one fits better but how is this initial step, in this work we have focused on Metroidvania
decision taken? Designers need to use their experience and games, whose complexity is more amenable for a study under
creativity to choose the fittest design. controlled conditions. This is detailed in next section.
If we now think about level design in a Metroidvania
videogame, the main issue is the same: designers knows what
kind of experience they want to create with certain mechanics, IV. A C ASE S TUDY: M ETROIDVANIA G AME D ESIGN
game rules and level elements specified but, what is the best When a game designer starts the design of a new game, one
combination and order of all the elements? Some designs of the starting points is selecting the genre of the game. Each
could be created, tested and then the most convincing design genre has several predefined mechanics that define it. When
(according to the designer’s creative mind and subjective the designer select the genre, new mechanics are created and
opinion) could be refined. mixed. In our case, we focus on the Metroidvania genre [14]
The examples above tackle different elements of a game due to its diversity of mechanics. This genre is famous for
but they are solved in the same way: through the designer’s mixing the Metroid and Castlevania games series. Games in
expertise. In both cases the different designs are evaluated by this genre feature a large interconnected map through which
the mind of the designer, so we need to recreate this cognitive the player can move, having to obtain objects, weapons or
process. To this end, we propose a framework that orchestrates abilities to unlock the different locked areas. The map is
the use of bioinspired algorithms for learning and optimization composed of different areas, each of which is in turn composed
– see Fig. 1. A typical configuration would involve the of different rooms (including secret rooms). Rooms are where
use of artificial neural networks (ANNs) for learning and the different enemies, objects, new abilities, are placed.
evolutionary algorithms (EAs) for optimization. Typically, a Metroidvania game is a side-scrolling platform
Within this framework, EAs will be used to recreate the game whose creation can be accomplished by adequately
different ideas that a designer can have during the design defining the following elements [7]:
process. This is done by trying to optimize an objective
• Mechanics: all actions that the player or character can
function that mimics the designer’s goals and preferences.
do, changing the state of the game as a consequence.
This function is provided by the learning component of
• Game rules: these indicate the results of an action,
the framework. This component is initially seeded with a
i.e., how an action has modified the state of the game.
collection of learning cases, namely examples that can be
Rules are composed by a set of previous states of
either positive (goals, appealing features of solutions, etc.) or
game elements, a set of actions and a set of new
negative (undesirable features of solutions, traps to be avoided,
states (not necessarily the states of the elements in-
etc.). Using these, a first model of the designer is built and
volved in the action). For example: stateOf(boxA) +
used by the EA to generate potentially admissible solutions.
action(moveBoxAToPositionX) = stateOf(doorA, open).
4 Two games produced by this system were presented in the Ludumdare 28 • Level elements: all objects included in a certain level
GameJam – http://ldjam.com/ . (phase, stage, or screen) of the game. We distinguish
519
3
(a) (b) (c) (d)
Figure 2: (a) Space partition (b) Main path of the level (c) Joining the main path and the secondary one (d) Complete design
of the level.
between two types: interactive and non-interactive. Inter- Input Hidden Ouput
active elements are those whose state can be changed by layer layer layer
an action. Conversely, non-interactive elements are those I1
whose state is not affected by player’s actions. H1
• Objects: every game object that the player collect, chang-
ing the player’s state as a result. Such a modification will I2
be defined by the game rules, and can be a new ability
or updated stats, just to give two examples. I3
.. O1
• Characters: these are agents controlled by the computer

whose goals are defined by the game rules and whose .. . O2
behaviors are defined by game mechanics.

• Levels: This is the scenario in which players use their
mechanics and the different enemies, objects and level Ik|B|
.
Hn
elements created for the game are placed. The game can
have one or several levels but the goal in all of them is
defined by the game rules. Figure 3: ANN structure used to evaluate motifs
We are specifically going to focus on the generation of
levels. To do so, for each level to be created we pick a width
and height, and generate an empty space of these dimensions, respectively. This is the initial input to the system, and will be
discretized into cells whose size doubles the player’s size. used the get the ball rolling in the automated design process.
Each cell is a possible point of the path to complete the level. In order to model the designer’s preferences, the next step is
Once we have this grid of cells, the designer (or the automated extracting the necessary information from the reference sets.
system) creates the path and the optimization algorithm finds For this purpose, the solutions (i.e., game designs) contained in
a combination of mechanics to use in the so-defined path. The these are scanned in order to identify particular motifs, which
cells that are not part of the path are merely “atrezzo” of the are subsequently classified as good or bad, depending on their
level (e.g., solid walls, pipings, skeletons, etc.). See Fig. 2 for presence in good/bad solutions. Notice that this can lead to
an example of a level created by the system. contradictory inputs to the classifier, since a given motif can
The path was calculated by choosing two random points appear in both good or bad solutions. The particular learning
on the left and right sides of the grid and connecting them. algorithm used must therefore be able to discern whether the
Subsequently, a secondary path is created using the same pro- motif is really a significant indicator of goodness/badness or
cedure, picking two randoms points in the grid at Manhattan it is simply an irrelevant piece of information.
distance > 2 of the main path. In the particular context we are considering in this work,
solutions are the description of the main path of the level
A. Learning process (the same process can of course be applied to the secondary
As stated in the previous section, the learning component is path). We assume we have a collection B of possible building
responsible of modelling and simulating the cognitive process blocks for this path, each of them representing the contents of a
of the designer regarding how good a particular level design is. certain grid cell (i.e., a corridor, a staircase, a moving platform,
In this work, we have opted for using a neural network for this etc.). The whole path is therefore a sequence of blocks. Let
purpose, although arguably other machine learning methods m be the length of this sequence. In order to extract motifs,
could be used as well. The role of this component is to serve as we have opted for a very simple strategy which amounts to
a judge capable of assessing the creations of the optimization identifying contiguous subsequences of a certain length k.
component in the same way that the designer would do. To Thus, if we have a solution [b1 , b2 , . . . , bm ], we can extract
this end, we need a reference set composed of good and m − k + 1 motifs from it: hb1 , . . . , bk i, hb2 , . . . , bk+1 i, up to
bad solutions, as dictated by the preferences/knowledge of the hbm−k+1 , . . . , bm i. This is repeated for each solution in either
designer. We shall use in the following the notation Refgood reference set, and each motif is assigned a label good/bad
and Refbad to refer to the collection of good and bad solutions depending on its provenance.
520
4
Once the set of motifs is available, it is fed to an artificial which could be in turn refined online by tagging particular
neural network such as the one depicted in Fig. 3. The input solutions as good or bad and retraining the ANN.
level has k|B| neurons, meaning that each motif is encoded
as the concatenation of k bitstrings, each of them representing V. E XPERIMENTS AND R ESULTS
a block in the motif. To be precise, each of these bitstrings The system described in the previous sections has been put
has as many bits as block types are, and only one bit is set to to test in order to obtain a proof of concept of its functioning.
1 (the bit corresponding to the block in the corresponding The results obtained will be described later on in this section.
position of the motif). As to the output level, it has two Previously, let us detail the configuration of the experiments.
neurons, corresponding to each of two classes considered
(good/bad). After training the ANN, any given motif can
A. Experimental setting
be assessed numerically with a value ranging from −1 to
1 by subtracting the output (which is between 0 and 1) of The game design task considered in this work consists
these two output neurons. We use this procedure in order of constructing the level of a Metroidvania game using a
to handle contradictory information, which can be present as collection B of 7 different blocks. The length of the main
stated before. path is in this case m = 50, thus resulting in a search space
whose size |B|m > 1042 makes a brute force exploration be
out of question. The motifs considered are substrings of length
B. Optimization process k = 3. Hence, the ANN utilized in the learning phase has an
The optimization process has the role of generating tenta- input layer of k|B| = 21 neurons. We have chosen n = 63
tive solutions. As stated before, each solutions indicates the neurons in the intermediate layer (that is, thrice the size of
different mechanics to be used in the main path of the level. the input layer), and have 2 output neurons as described in
We represent them with an integer array of length m. Each Section IV-A. All neurons have a sigmoid activation function,
position in the array represents a cell in the main path, and and the ANN is trained using backpropagation (learning rate
each integer value 0, . . . , |B| − 1 indicates a certain type of δ = 0.2, momentum α = 0.33; run until the error is less than
block. In order to evaluate a given solution, it is scanned and 0.1 or a maximum of 100,000 learning epochs is reached).
the motifs it contains are extracted, much like it was described As to the GA utilized in the optimization component has a
in the previous subsection. Given that we are considering population size of µ = 50 individuals, crossover probability
substrings of length k as motifs, it is convenient to define pc = 0.9, mutation probability pm = 1/m = 0.05, and is run
a function for maxevals= 5000 evaluations (we created different sets of
k
M(k) : B m → N|B| (1) parameters, tested them with the same training set and those
mentioned before obtained the best results).
that computes how many times each motif appears in a certain We have considered three test cases to evaluate the behavior
solution (note that each solution contains m − k + 1 motifs, of the system. Each of these test cases is constructed by
some of them possibly repeated, among |B|k different potential creating an initial payoff table for each of the motifs. Once
motifs). adequate reference sets Refbad and Refgood are defined (by
Now, we resort to the assessment of the ANN in order to providing solutions that aim to maximize or minimize the
evaluate a particular collection of motifs. More precisely, let S resulting sum of payoffs according to the initial table), the
be a solution (a length-m sequence of blocks). Then, M(k) (S) whole system tries to (i) discover the usefulness of each
would be an array with the frequency of each motif in S. We motif (which is quantitatively unknown to the system, and
will use the notation M(k) (S)i1 ...ik to refer to the element can only be inferred via the appearance of these motifs in
in this frequency array corresponding to motif hi1 . . . ik i, i.e., good or bad solutions) and (ii) construct good solutions by
the count number of this specific motif in this solution S. The combining appropriately these motifs (not straightforward in
quality value f (S) of this solution would be then: general, given the fact that all motifs in a solution are in partial
X overlap with each other).
f (S) = TiANN
1 ...ik
M(k) (S)i1 ...ik (2)
The first test case is given by a payoff matrix
i1 ...ik ∈{1,...,|B|} (
1 (x = y) ∨ (x = z) ∨ (y = z)
where TiANN
1 ...ik
is the assessment provided by the ANN for that Txyz = (3)
specific motif hi1 . . . ik i. Thus, the objective function would −1 otherwise
compute the sum of the value attributed by the ANN to each i.e., motifs with 3 different elements are undesirable, whereas
motif (which ranges from 1 for very desirable motifs down motifs with 2 or 3 identical elements are good. This is
to −1 for highly undesirable solutions, with all the range of an easy test case that can nevertheless provide interesting
intermediate values for motifs of more or less uncertain desir- information in terms of the bias of the optimizer towards
ability) present in the solution, weighted by the corresponding particular directions. The second test case is actually a variant
frequency of the motif. of the previous one, and is given by the following payoff table:
The search engine used is an elitist genetic algorithm (GA) 
with binary tournament selection, uniform crossover and ran- 0 x = y = z

dom mutation. The objective of the search would be providing Txyz = 1 x 6= y 6= z (4)

designers different suggestions that mimic their preferences, 
3 otherwise
521
5
Refgood Refbad Evolved Refgood Refbad Refgood Refbad Evolved

Evolved
20 20 20 20 20 20 20 20 20
18 18 18 18 18 18 18 18 18
16 16 16 16 16 16 16 16 16
14 14 14 14 14 14 14 14 14
12 12 12 12 12 12 12 12 12
frequency
frequency
frequency
10 10 10 10 10 10 10 10 10
8 8 8 8 8 8 8 8 8
6 6 6 6 6 6 6 6 6
4 4 4 4 4 4 4 4 4
2 2 2 2 2 2 2 2 2
0 0 0 0 0 0 0 0 0
-40 -20 0 20 40 -40 -20 0 20 40 -40 -20 0 20 40 0 50 100 150 0 50 100 150 0 50 100 150 -20 0 20 40 -20 0 20 40 -20 0 20 40
quality quality quality quality quality quality quality quality quality
(a) (b) (c)
Figure 4: Histogram of objective values according to the underlying payoff table for reference solutions (Refgood and Refbad )
and solutions evolved by the system. (a) Test case #1 (b) Test case #2 (c) Test case #3
In this case, motifs with 3 identical elements are highly Table I: Structural difference between solutions in the test case
undesirable. motifs with 3 different elements are better, yet #1. The number of motifs of each type (based on the number
suboptimal; the best motifs are those with exactly 2 identical b of identical blocks in it) is shown for each data set
elements. Finally, the third test case is defined via random b=2 b=3 b=0
payoffs: Txyz is uniformly drawn at random from the interval Refgood 897 63 0
Refbad 0 0 960
[−1, 1] for each particular motif hx, y, zi. Evolved 533 414 13
In the first two test cases, perfect reference sets are con-
structed by picking at random solutions only comprising good
or bad motifs (in the second test case, suboptimal motifs are good according to the hidden criterion used for defining
just included in bad solutions). In the third case, we have goodness/badness.
resorted to an GA analogous to that used in the optimization Some further insight is obtained if we take a look at the
component aiming to maximize/minimize the objective func- structure of evolved solutions and try to compare these with so-
tion defined by the corresponding payoff table. In all cases, lutions in either reference set. To this end, we compute for each
both Refbad and Refgood comprise 20 solutions each. solution S the associated motif-frequency array M(k) (S).
For each test case, the ANN has been trained using the Subsequently, we can compute the structural distance D(S, S ′ )
motifs extracted from the reference sets and the GA has between two solutions S and S ′ as the Euclidean distance
been run 20 times, keeping the best solution found in each between the corresponding motif-frequency arrays, i.e.,
run. All algorithms have been implemented on the videogame sX
′
2
engine Unity using C# as programming language. The AForge D(S, S ) = M(k) (S)i1 ...ik − M(k) (S ′ )i1 ...ik (5)
library5 has been used to support the ANN. i1 ...ik
Once this is done for each pair of solutions, the resulting

B. Results distance matrix can be used to perform a hierarchical cluster
A first glimpse of the experimental results obtained is analysis. We have done this on the solutions available for each
provided in Fig. 4. Therein, the objective values of both test case, using Ward’s minimum variance method to guide the
reference solutions and evolved solutions is shown for each agglomerative clustering process [15]. As can be seen in Fig.
test case. As indicated in previous subsection, the reference 5, in both test cases #2 and #3, evolved solutions have some
solutions for the first two test cases are perfect, in the sense affinity among them but tend nevertheless to mix with clusters
they only contain desirable or undesirable motifs. Thus, the of solutions in Refgood . Together with the good objective
mass of objective values is concentrated on the left end of quality of these solutions discussed before, this indicates that
the histogram for bad solutions and on the right end for the system did faithfully capture the features of interest in
good solutions. The reference solutions for the third test case solutions and could combine them appropriately. Test case #1
were empirically obtained and hence there is more variety of is also interesting: evolved solutions are objectively good, but
objective values (note that this may to some extent constitute they tend to cluster together, mostly apart from solutions in
a more realistic setting, in which solutions provided by the either reference set. If we perform a quick structural analysis,
designer are not ideal flawless prototypes but can rather have we obtain the results shown in Table I. Note that a few
an inherently noisy structure). In either case, notice how the bad motifs (composed of three different blocks; b = 0)
solutions provided by the EA also tend to cluster towards the have slipped into these solutions, although this is not very
right end of the histogram, indicating that they are objectively significant. It is far more interesting to note that evolved
solutions tend to have much more motifs composed of identical
5 http://www.aforgenet.com/ blocks. This may be an artifact of the learning process, that
522
6
* * * * * * * * * * * * * * * * * *o* * . . . . . . . . . . . . . . . . . . . . ooooooooooooooooooo . . . . . . . . . . . . . . . . . * * * *o* * * * *o* * *ooo*oo* *ooo*ooooo* * * *ooooo . . . * * * * * * * * * *oooooo* * * * *oo* * * * *oooooooooooo . . . . . . . . . . . . . . . . . . . .
(a) (b) (c)
Figure 5: Clustering of solutions in the reference sets and evolved by the system. A dot (’.’) represents solutions in Refbad , a
star (’*’) solutions in Refgood , and a circle (’o’) evolved solutions. (a) Test case #1 (b) Test case #2 (c) Test case #3
might marginally favor some particular motif, or a byproduct [3] A. Liapis, G. N. Yannakakis, and J. Togelius, “Designer modeling for
of the search dynamics of the EA, whereby it may be easier personalized game content creation tools,” in The 9th AAAI Conference
on Artificial Intelligence and Interactive Digital Entertainment. Boston,
for it to create good solutions by exploiting this kind of USA: AI Access Foundation, 2013, pp. 11–16.
motifs. Of course, at this point the loop could be closed by [4] ——, “Sentient sketchbook: Computer-aided game level authoring,” in
having the designer inspect these solutions, possibly providing ACM Conference on Foundations of Digital Games, G. N. Yannakakis,
E. Aarseth, K. Jørgensen, and J. C. Lester, Eds. Chania, Crete: Society
complementary preferences in order to support or discard this for the Advancement of the Science of Digital Games, 2013, pp. 213–
kind of solutions. 220.
[5] M. Cook and S. Colton, “Ludus ex machina: Building a 3d game
designer that competes alongside humans,” in International Conference
VI. C ONCLUSIONS AND F UTURE W ORK on Computational Creativity, S. Colton, D. Ventura, N. Lavrač, and
M. Cook, Eds. Ljubljana, Slovenia: computationalcreativity.net, 2014,
We have presented the concept of an AI-assisted videogame pp. 54–62.
design system, aimed to help designers create games by [6] G. N. Yannakakis and J. Togelius, “A panorama of artificial and com-
putational intelligence in games,” IEEE Transactions on Computational
suggesting new ideas based on a model of their preferences Intelligence and AI in Games, vol. 7, no. 4, pp. 317–335, 2015.
and knowledge. To this end, we propose the orchestrated use [7] K. Pearson, “Guide to making metroidvania styled games – part 1,” Plat-
of machine learning techniques and optimization methods, the formerPower, 2017, https://platformerpower.com/post/160130225259/
guide-to-making-metroidvania-styled-games-part-1 [accessed 28-Jun-
former to capture the designers’ expertise, and the latter to 18].
exploit this expertise in a systematic (and hopefully creative) [8] A. Liapis, G. N. Yannakakis, and J. Togelius, “Designer modeling
way. The experimental proof of concept has shown that not for sentient sketchbook,” in 2014 IEEE Conference on Computational
Intelligence and Games. Dortmund, Germany: IEEE, 2014, pp. 1–8.
only quality solutions analogous to those provided as reference [9] R. Lara-Cabrera, C. Cotta, and A. J. Fernández-Leiva, “On balance and
can be generated, but also different non-anticipated biases can dynamism in procedural content generation with self-adaptive evolution-
appear, providing interesting hints to the designer. ary algorithms,” Natural Computing, vol. 13, no. 2, pp. 157–168, Jun
2014.
As future work, we plan to deploy the system on a more [10] M. Cook and S. Colton, “Multi-faceted evolution of simple arcade
realistic environment to test its capabilities. Needless to say, games,” in 2011 IEEE Conference on Computational Intelligence and
closing the loop and having the designer introduce dynamic Games (CIG’11), S. Cho, S. M. Lucas, and P. Hingston, Eds. Seoul,
South Korea: IEEE, 2011, pp. 289–296.
preferences is another improvement of the foremost interest. [11] M. Cook, S. Colton, and A. Pease, “Aesthetic considerations for auto-
mated platformer design,” in AAAI Conference on Artificial Intelligence
and Interactive Digital Entertainment, M. Riedl and G. Sukthankar, Eds.
ACKNOWLEDGMENTS California, USA: The AAAI Press, 2012, pp. 124–129.
This work is supported by Spanish Ministerio de Economı́a, [12] M. Cook, S. Colton, and J. Gow, “Initial results from co-operative co-
evolution for automated platformer design,” in Applications of Evo-
Industria y Competitividad under projects EphemeCH lutionary Computation – EvoApplications 2012, ser. Lecture Notes
(TIN2014-56494-C4-1-P) and DeepBIO (TIN2017-85727-C4- in Computer Science, C. Di Chio et al., Eds., vol. 7248. Berlin,
1-P), and by Universidad de Málaga, Campus de Excelencia Heidelberg: Springer Verlag, 2012, pp. 194–203.
[13] N. Sorenson and P. Pasquier, “Towards a generic framework for au-
Internacional Andalucı́a Tech. tomated video game level creation,” in Applications of Evolutionary
Computation - EvoApplications 2010, ser. Lecture Notes in Computer
Science, C. Di Chio et al., Eds., vol. 6024. Berlin Heidelberg: Springer
R EFERENCES Verlag, 2010, pp. 131–140.
[1] R. Hunicke, M. Leblanc, and R. Zubek, “MDA : A formal approach to [14] C. Nutt, “The undying allure of the metroidvania,” Gamasu-
game design and game research,” in AAAI Workshop on Challenges in tra, 2015, https://www.gamasutra.com/view/news/236410/The undying
Game AI, vol. 4. San Jose: Press, 2004, pp. 1–5. allure of the Metroidvania.php [accessed 29-Jun-18].
[2] N. Sorenson and P. Pasquier, “The evolution of fun: Automatic level de- [15] J. H. Ward Jr., “Hierarchical grouping to optimize an objective function,”
sign through challenge modeling,” in International Conference on Com- Journal of the American Statistical Association, vol. 58, no. 301, pp.
putational Creativity, D. Ventura, A. Pease, R. P. y Pérez, G. Ritchie, 236–244, 1963.
and T. Veale, Eds. Lisbon, Portugal: Department of Informatics
Engineering, University of Coimbra, 2010, pp. 258–267.
523
Bioinspirados
(XIII MAEB)
MAEB 2.1: SESIÓN E SPECIAL:
SCATTER SEARCH Y
PATH R ELINKING
Organizadores:
A NNA M ARTÍNEZ-GAVARA Y
JESÚS SANCHEZ-O RO CALVO
GRASP with Path Relinking for the Constrained

Incremental Graph Drawing Problem
A. Martı́nez-Gavara A. Napoletano P. Festa
Dept. Estadı́stica i Inv. Operativa Dept. Mathematics and Applications Dept. Mathematics and Applications
Universitat de València University of Napoli Federico II University of Napoli Federico II
València, España Napoli, Italy Napoli, Italy
[email protected] [email protected] [email protected]
T. Pastore R. Martı́
Dept. Mathematics and Applications Dept. Estadśtica i Inv. Operativa
University of Napoli Federico II Universitat de València
Napoli, Italy València, España
Abstract—Graph Drawing is a well-established area in Com- map of the user over successive drawings. In this way, we
puter Science, with applications from scheduling to software consider a new model adding constraints on both the relative
diagrams. The main quality desired for drawings is readability, ( [7]) and the absolute position of the original vertices ( [1]
and edge crossing minimization is a well-recognized method for
a good representation of them. This work focuses in incremental in the context of orthogonal graphs).
graph drawing problems, with the aim to minimize the number In this work, we propose a new mathematical programing
of edge crossings while satisfying some constraints to preserve the formulation and a GRASP (Greedy Randomized Adaptive
absolute position of the vertices in previous drawings. We propose Search Procedure) with PR (Path Relinking) method. We
a mathematical model and a GRASP (Greedy Randomized Adap-
adapt the well-known Local Solver black-box optimizer
tive Search Procedure) with PR (Path Relinking) methodology to
solve this problem. Finally, we compare our methodology with to solve this problem. Finally, we compare our heuristic
CPLEX and heuristic solutions obtained by a well-known black- with CPLEX and Local Solver, we have verified that
box solver, LocalSolver. GRASP+PR is able to obtain a fraction of the optimal so-
Index Terms—heuristics, graph drawing, path relinking lutions.
I. I NTRODUCTION II. M ATHEMATICAL P ROGRAMING M ODEL

Graph Drawing is a relevant topic of research in areas such
A hierarchical graph H = (G, p, L) is defined as a graph
as workflow visualization, database modeling, bioinfomatics
G = (V, E) where V and E represent the sets of vertices
and decision diagrams. The difficulty lies in getting readable
and edges, respectively, p is the number of layers, and L :
informations from systems represented by graphs. See, for
V → {1, 2, . . . , p} is a function that indicates the layer where
example, Kaufmann and Wagner [4] and Di Battista [1]
a vertex v ∈ V resides. Let V t be the set of vertices in layer
for a throughly survey in graph drawing. The edge-crossing
t, and let E t be the set of edges from V t to V t+1 , with nt =
minimization criterion is one of the most common to obtain a
|V t |.
readable drawing. The problem of minimizing the number of
The problem of minimizing edge-crossing is well-known in
crossings is NP-complete.
graph drawing [1] and, in the context of hierarchical graphs,
In this work we consider hierarchical graphs, this is not a
may be formulated as the problem of finding the optimal
limitation since there exists several methodologies to convert
ordering in each layer. A drawing D of a hierarchical graph
any directed acyclic graph (DAG) into a layered graph. The
H is the pair (H, Π) where Π is the set {π 1 , . . . , π p }, with
Hierarchical Directed Acyclical Graph (HDAG) representation
π t establishing the ordering of the vertices in the layer t. We
is done by setting all the vertices in layers, and all the edges
define as C(D) the total number of edge crossings in drawing
pointing in the same direction. The most well-known method
D.
to obtain a good representation of a graph is the Sugiyama’s
From an original hierarchical graph H = (G, p, L) and its
procedure [9], which has become a standard in the field.
drawing D = (H, Π0 ), we can consider the addition of some
We focus on minimizing the number of edge crossings in
vertices V̂ and edges Ê obtaining an incremental graph IH =
incremental graph drawings. The goal is to preserve the mental
(IV, IE, p, L), where IV = V ∪ V̂ and IE = E ∪ Ê, p is
This work has been partially supported by the Spanish Ministerio de the number of layers and mt is the number of vertices in the
Economı́a y Competitividad with grant ref. TIN2015-65460-C02. incremental graph in layer t.
527
The goal in the Incremental Graph Drawing Problem

(IGDP) is to minimize the number of edge crossings of an
incremental drawing ID = (IH, Π), while conserving the
same relative position between the original vertices as in the
original drawing D. The mathematical programing formulation
of IGDP is based on a linear integer formulation for the Multi-
Layer Drawing Problem proposed by Jünger et al. in [3], with
a new set of constraints that preserves the relative position of
the original vertices. As the authors in [3], we define the binary
variables xtik , where xtik take the value 1 if vertex i precedes
vertex k and 0 otherwise, where i, k are vertices that reside
in the same layer t, t = 1, . . . , p. Let π0t (i) be the original
position of the vertex i. The new constraints are:
Fig. 1. Constructive phase for the C-IGDP.
xtij + xtji =1, ∀ i, j ∈ V t : 1 ≤ i < j ≤ mt (1)

in swapping the positions of two incremental vertices. For a
xtij =1, ∀ i, j ∈ V t : π0t (i) < π0t (j). (2)
incremental vertex v, from the first until the last incremental
Finally, we add the requirement that the positions of the vertex in a layer, our procedure searches the best swap move
original vertices has to be set close enough to their positions in with all the other incremental vertices, and performs it if it
the original drawing. The maximum distance slack between the reduces the number of edge crossings. The algorithm scans all
original position of a vertex and the new one, is represented by the swap moves from layer 1 to p until no further improvement
K. The mathematical model for the Constrained Incremental is possible. Since only incremental vertices are involved, all
Graph Drawing Problem (C-IGDP) consists in the IGDP the moves are feasible. Henceforth, we call this local search
model adding the following set of constraints: phase as Swap.
Then, the local search method resorts to a second phase,
max{1, π0t (i) − K} ≤ π t (i) ≤ min{π0t (i) + K, mt }, ∀ i ∈ V,
called Insertion, based on neighborhood N1 (ID). In a given
(3)
layer, the method scans all incremental vertices (starting from
t t
where π0 (i) and π (i) represent the position of the vertex i, the first one) and explores all its feasible insertions in previous
original and the new one where i can be assigned, respectively. positions (a move is feasible if the position of the original
vertices is within the limits of (3)). As in the case of N0 (ID),
III. G REEDY R ANDOMIZED A DAPTIVE S EARCH
the local search performs sweeps from layer 1 to p until no
P ROCEDURE
improvement is possible.
In this work, we propose a GRASP metaheuristic. The Our improvement procedure ends when Swap and Insertion
method iteratively performs two phases, constructive and im- phases are performed and a local optimum is found.
provement. The first phase employs a greedy function g(v)
that measures the minimum number of edge crossings g(v, q) IV. PATH R ELINKING
when vertex v is inserted in position q in its layer, for all
positions q. In this work, we propose a hybridization of GRASP with
Initially, the construction phase starts with the original draw- forward Path Relinking (PR). PR was originally proposed in
ing, and iteratively, a vertex v is selected from the Restricted the context of Tabu Search [2] to integrate search diversi-
Candidate List (RCL) and it is placed in the position in which fication and intensification. Later, Laguna and Martı́ in [6]
the number of crossings is minimum. The RCL consists of all adapted this technique as an intensification phase for GRASP.
unselected vertices (CL) with the number of edge crossings The method generates intermediate solutions in the path to
lower than or equal to a threshold τ : connect high-quality solutions, which could be better or more
diverse than the solutions being connected.
τ = min g(v) + α max g(v) − min g(v) . (4) Let IDi and IDg be the initial and guiding incremental
v∈CL v∈CL v∈CL
drawings, respectively. A path relinking move consists of
That is RCL = {v ∈ CL : g(v) ≤ τ }. The performance of replacing an entire layer from the initial solution IDi with
this method depends on the parameter α which balances a layer from IDg . Fig. 2 illustrates the path between two
greediness and randomness. Note that during the construction solutions IDi and IDg with 3 layers and 6 vertices. The three
phase all the original vertices should maintain the restriction first intermediate solutions ID1 , ID2 and ID3 are generated
max{1, π0 (v) − K} and min{π0 (v) + K, mL(v) }. The pseu- from IDi , exchanging one of its layer with the layers of
docode of construction phase is described in Fig. 1. IDg . The process continues from the best solution found, in
Once a solution ID is obtained, we apply our improvement this case solution ID1 with C(ID1 ) = 2, in case of ties
method which consists in two neighborhoods N0 (ID) and the algorithm choose one of the solutions at random. The
N1 (ID). First, the method explores N0 (ID), which consists algorithm finds two solutions, ID4 and ID5 , that are better
528
These preliminary experimentation is devoted to fine tune

the parameters in our GRASP+PR heuristic. First, the value of
the parameter α in the construction phase which controls the
balance between the diversity and the quality of the solution.
We test three different values of α: 0.25, 0.5, and 0.75, and
we also include a variant, labelled as random that, for each
construction, the value of α is selected by random in the range
[0, 1]. The best performance is achieved with this random
variant. The last parameters to be set are the elite set size
Fig. 2. Illustration of PR.
and the distance parameter in the PR procedure. We set these
values to |ES| = 3 and γ = 0.2. The selection of the values of
the parameters in these preliminary experiments is a trade-off
than IDi and IDg , both with number of edge crossings equal between quality and computing time, for this reason, we do
to 1. not reproduce the tables.
The PR explores the path between all pairs of solutions Table I shows the comparison between GRASP and
in a set, called Elite Set (ES), which is constructed with GRASP+PR with CPLEX and LocalSolver over the entire
m = |ES| solutions generated with our procedure, and has set of 609 instances, classified by size. We execute our
the property of being as good as diverse as possible. Initially, heuristics for 100 iterations, LocalSolver is run with a
the ES contains the m first solutions obtained with our time limit of 20 seconds on the instances with 2 layers,
GRASP. In each iteration, this set is updated with the generated and 60, 150 and 300 seconds on those with 6, 13 and 20
solution ID∗ if ID∗ is better than the best solution in ES or layers, respectively. Finally, we configure CPLEX to run for
sufficiently different from the other elite solutions. Diversity a maximum of 1800 seconds. This table shows for each
is measured as the number of positions that are not occupied procedure, the average number of crossings (C̄), the average
by the same vertices divided by the number of vertices in the percent deviation from the best solution found (% dev), the
graph (with a distance larger than a parameter γ), while the average percentage deviation between the heuristic solution
quality is evaluated by the objective function. The algorithm value and the CPLEX best solution value (% gap), the number
ends when no new solutions are admitted to ES. of best solutions (Bests), the number of optimum solutions
(Opt), and the CPU-time in seconds required to execute the
V. E XPERIMENTAL RESULTS method (T ime).
This section describes the experimental analysis to study the TABLE I

effectiveness and efficiency of the procedures presented above. C OMPARISON ON ENTIRE BENCHMARK SET ACCORDING TO INSTANCE
SIZE
In particular, we consider the following methods: GRASP
(construction phase + local search), and GRASP+PR where Procedures C % gap % dev Bests Opt T ime
we couple GRASP with Path Relinking. We also compare our 2 Layers (32 ≤ n ≤ 96), 171 instances
CPLEX 2408.50 - 0.00 171 171 0.77
heuristics with the solution obtained by running the integer GRASP 2409.19 0.14 0.14 161 161 1.11
linear programing proposed above with LocalSolver, and GRASP+PR 2408.92 0.14 0.14 164 164 1.18
CPLEX. LocalSolver 2785.47 17.01 17.01 12 12 20.11
6 Layers (48 ≤ n ≤ 288), 159 instances
The algorithms are implemented in C++, and the exper- CPLEX 9995.70 - 0.01 157 157 56.24
iments have performed in an Intel Corei7-4020HQ CPU GRASP 9997.43 0.13 0.14 81 81 5.53
@2.60Ghz x 8. The set of instances consists of 240 files with GRASP+PR 9994.32 0.08 0.08 100 98 5.39
LocalSolver 11024.89 16.59 16.6 0 0 62.43
2, 6, 13 and 20 as the number of layers and the graph density 13 Layers (104 ≤ n ≤ 611), 141 instances
varying in the range {0.065, 0.175, 0.3}. This set is generated CPLEX 23469.05 - 0.21 131 128 273.77
in line with previous graph drawing papers [8] and [5], and it GRASP 23319.41 0.13 0.33 29 27 15.22
GRASP+PR 23305.22 0.02 0.22 54 44 15.34
is available on-line in the web-page http://www.optsicom.es. LocalSolver 25530.24 15.95 16.16 0 0 162.06
To avoid over-training, we consider 24 representative in- 20 Layers (120 ≤ n ≤ 960), 138 instances
stances from the set of 240 to fine tune the algorithmic CPLEX 37918.20 - 0.38 118 116 383.73
GRASP 37522.42 0.03 0.39 21 20 25.77
parameters. Note that, an important element is the value of GRASP+PR 37495.44 -0.12 0.24 49 29 28.39
the slack, K, between the original position of the vertices and LocalSolver 40954.07 14.30 14.68 0 0 328.77
the feasible ones. In this work, we consider low values of this
parameter, K = 1, 2 and 3. Then, for each instance in the Table I shows that, as expected, GRASP+PR obtains better
testing set, we have at most three different instances, one for results than GRASP. It is worth mentioning that CPLEX is able
each value of K (if the number of incremental vertices in one to obtain the optimal solution in 572 out of the 609 instances,
layer is less than K, then this value cannot be considered). and, with similar CPU time as our heuristics, it is able to obtain
To sum up, we have 609 instances in our testing set, and 62 all the exact solutions for the small instances. However, in
instances in the training set. large instances, our heuristics are able to obtain similar quality
529
results as CPLEX with lower CPU time. Note that GRASP +

PR is able to obtain a % gap of −0.12 which means that
on average beats CPLEX. LocalSolver obtains the largest
deviations in both % dev and % gap, even if it is executed
for longer CPU times than the competing heuristics.
VI. C ONCLUSIONS
In this work, we propose a new mathematical model to
tackle the Multilayer Incremental Graph Drawing Problem.
We consider new constraints (by means of a paramenter K) to
preserve key characteristics when updating an existing draw-
ing. We develop a GRASP algorithm combined with a Path
Relinking to obtain high quality solutions in the long term. We
compare our heuristic with general solvers as CPLEX, which is
able to obtain optimal solutions in 572 out of the 609 instances,
and LocalSolver. GRASP+PR is competitive with them,
obtaining similar quality solutions as CPLEX in smaller times
on large instances, and outperforming LocalSolver.
R EFERENCES
[1] G. Di Battista, P. Eades, R. Tamassia, and I. G. Tollis. Graph Drawing:
Algorithms for the Visualization of Graphs. Prentice Hall PTR, Upper
Saddle River, NJ, USA, 1st edition, 1998.
[2] F. Glover and M. Laguna. Tabu Search. Kluwer Academic Publishers,
Norwell, MA, USA, 1997.
[3] M. Jünger, E. K. Lee, P. Mutzel, and T. Odenthal. A polyhedral approach
to the multi-layer crossing minimization problem. In International
Symposium on Graph Drawing, pages 13–24. Springer, 1997.
[4] M. Kaufmann and D. Wagner, editors. Drawing Graphs: Methods and
Models. Springer-Verlag, London, UK, UK, 2001.
[5] M. Laguna, R. Martı́ and V. Valls. Arc crossing minimization in
hierarchical digraphs with tabu search. Computers and Operations
Research, 24:1175–1186, 1997.
[6] M. Laguna and R. Martı́. Grasp and path relinking for 2-layer straight
line crossing minimization. INFORMS Journal on Computing, 11:44–
52, 1999.
[7] R. Martı́, A. Martı́nez-Gavara, J. Snchez-Oro, and A. Duarte. Tabu
search for the dynamic bipartite drawing problem. Computers &
Operations Research, 91:1–12, 2018.
[8] J. Sánchez-Oro, A. Martı́nez-Gavara, M. Laguna, A. Duarte, and
A. Martı́. Variable neighborhood scatter search for the incremental
graph drawing problem. Computational Optimization and Applications,
68:775–797, 2017.
[9] K. Sugiyama, S. Tagawa, and M. Toda. Methods for visual understanding
of hierarchical system structures. IEEE Trans. Syst. Man, Cybern.,
11:109–125, 1981.
530
Detección de puntos débiles en redes utilizando

GRASP y Path Relinking
Sergio Pérez-Peló Jesús Sánchez-Oro Abraham Duarte
Dept. of Computer Sciences Dept. of Computer Sciences Dept. of Computer Sciences
Universidad Rey Juan Carlos Universidad Rey Juan Carlos Universidad Rey Juan Carlos
C/Tulipán, S/N, 28933, Móstoles, Spain C/Tulipán, S/N, 28933, Móstoles, Spain C/Tulipán, S/N, 28933, Móstoles, Spain
Email: [email protected] Email: [email protected] Email: [email protected]
Resumen—El avance que se ha producido en la tecnología en segundo estará interesado en reforzar esos nodos importantes
los últimos años ha hecho que sea imprescindible disponer de con medidas de seguridad más robustas. Además, ambas partes
herramientas que permitan monitorizar y controlar las debili- quieren consumir la mínima cantidad de recursos posibles para
dades que aparecen en redes. Debido al carácter dinámico de
las redes, continuamente se conectan y desaparecen dispositivos minimizar los costes derivados del ataque / defensa: por un
de las mismas, siendo necesario reevaluar las debilidades que lado, el atacante está interesado en ocasionar el máximo daño
han aparecido tras cada modificación. La evaluación de estas posible a la red empleando la mínima cantidad de recursos
debilidades tiene como objetivo proporcionar información de posible; por otro lado, el defensor querrá reforzar la red
utilidad al responsable de la red para conocer qué nodos de minimizando los costes de mantenimiento y seguridad. Por
la misma es necesario reforzar. Los continuos cambios crean la
necesidad de disponer de herramientas que evalúen los puntos lo tanto, es interesante para ambas partes identificar cuáles
críticos en tiempos reducidos. En este trabajo se presenta un son los puntos más débiles en la red.
algoritmo metaheurístico basado en la metodología GRASP Definimos una red como un grafo G = (V, E), donde V
(Greedy Randomized Adaptive Search Procedure) para detectar es el conjunto de vértices (|V | = n) y E es el conjunto de
puntos débiles en redes. Además, se propone un método de
aristas (|E| = m). Un vértice v ∈ V representa un nodo de
combinación basado en Path Relinking para mejorar la calidad de
las soluciones generadas. Los resultados experimentales muestran la red, mientras que una arista (v1 , v2 ) ∈ E, con v1 , v2 ∈ V
la calidad de la propuesta comparándola con el mejor algoritmo indica que hay una conexión en la red entre los vértices v1 y
encontrado en el estado del arte. v2 . Definimos un separador de una red como un conjunto de
Index Terms—α-separator problem, GRASP, Path Relinking, vértices S ⊆ V cuya eliminación supone la separación de la
nodos críticos red en dos o más componentes conexas. Formalmente,
I. I NTRODUCCIÓN
En los últimos años la ciberseguridad se ha convertido en V \ S = C1 ∪ C2 . . . ∪ Cp
uno de los campos más relevantes para todo tipo de usuarios: ∀ (u, v) ∈ E ⋆ ∃ Ci : u, v ∈ Ci
desde empresas e instituciones hasta usuarios individuales.
El incremento del número de ataques a diferentes redes, así donde E ⋆ = {(u, v) ∈ E : u, v ∈ / S}.
como de la importancia de la privacidad en Internet, han Este trabajo se centra en encontrar un conjunto de vértices
creado la necesidad de tener redes más seguras, confiables y mínimo S ⋆ que permita separar la red G en componentes
robustas. Un ciberataque a una compañía que conlleve pérdida conexas de tamaño menor que α·n. En términos matemáticos,
de información personal de sus clientes puede resultar en un
importante daño económico y social [1]. Además, los ataques
de Denegación de Servicio (del inglés Denial of Service, DoS) S ⋆ ← arg min |S| : máx |Ci | ≤ α · n
S∈S Ci ∈V \S
y ataques de Denegación de Servicio distribuídos (del inglés
Distributed Denial of Service, DDoS) han ido siendo cada vez Cabe mencionar que el número de componentes conexas
más comunes, debido a que un ataque exitoso puede resultar en resultantes no es relevante para este problema. La restricción
la deshabilitación de un servicio de un proveedor de Internet, actual del problema del separador α (α-SP) es que el número
por ejemplo. Además, si otros servicios dependen a su vez de vértices en cada componente conexa debe ser menor o
del servicio atacado, podría producirse un fallo en cascada, igual que α · n. Este problema es N P-completo para redes
afectando a un mayor número de clientes [2]. de topología general cuando se consideran α ≥ 32 [3]. Se han
Es importante identificar cuáles son los nodos más im- propuesto algunos algoritmos en tiempo polinómico cuando la
portantes en una red. Ésta es una cuestión de interés para topología de la red es un árbol o un ciclo [4]. Sin embargo,
ambas partes de un ciberataque: el atacante y el defensor. El estos algorimos requieren tener un conocimiento previo de la
primero estará interesado en deshabilitar dichos nodos con topología de la red, lo que no es usual en problemas de la
el objetivo de hacer la red más vulnerable, mientras que el vida real.
531
E
E
E B
B
B F
F
F
A
A A D
D D
G
G G C
C C I
I I
H H
H
(a) (b) (c)
Figura 1: 1(a) Ejemplo de un grafo derivado de una red, 1(b) una solución factible con 4 nodos en el separador (B,C,E, y
I), y 1(c) una solución mejor con 2 nodos en el separador (A y B)
Este problema ha sido abordado tanto desde la perspectiva un procedimiento de búsqueda local sencillo, pero es común
exacta como la heurística. En concreto, se han presentado combinar esta metaheurística con procedimientos de búsqueda
algoritmos que resuelven el problema en un tiempo polinómico más complejos, como pueden ser Tabu Search [13] o Variable
para topologías como árboles o ciclos, así como un algorit- Neighborhood Search [14], entre otros, lo que prueba la
mo voraz con una relación de aproximación de α · n + 1 versatilidad de la metodología GRASP.
[4]. Adicionalmente, un algoritmo heurístico para estudiar II-A. Criterio voraz
los separadores y los Sistemas Autónomos de Internet se
propuso en [5]. Dependiendo del valor de α, el problema La fase de construcción necesita definir un criterio voraz
del separador α puede relacionarse con otros problemas bien g(v) que evalúe, para cada vértice v ∈ V , la relevancia de
conocidos. En particular, cuando α = n1 , es equivalente al insertar dicho vértice en la solución. Para el problema que
minimum vertex cover problem, y cuando α = n2 es análogo al estamos tratando, α-SP, el criterio voraz debe indicar cuáles
minimum dissociation set problem. Por lo tanto, el problema de los vértices que aún no han sido incluidos en la solución
del seaparador α es una generalización de estos problemas, son nodos críticos en la red.
que son también N P-completos [6]. En este trabajo se propone la utilización de criterios utiliza-
dos en el área del análisis de redes sociales, de manera que se
II. P ROPUESTA ALGORÍTMICA
tratará de identificar qué vértices serían los más importantes
de la red si ésta se tratara de una red social. En el análisis
Greedy Randomized Adaptive Search Procedure (GRASP), de redes sociales, un vértice es importante si mantiene a un
que en castellano se podría traducir como procedimientos de gran número de usuarios de la red conectados entre sí [15],
búsqueda voraz, aleatorizados y adaptativos, es un procedi- por lo que la analogía con el problema del α-SP es directa:
miento multi-arranque que fue originalmente propuesto en [7] un vértice es importante en la red si su desaparición hace que
pero no se definió formalmente hasta [8]. Los procedimientos los dispositivos conectados a él dejen de estar conectados.
multi-arranque son un conjunto de procedimientos que inten- Existen numerosas métricas para evaluar la importancia de
tan evitar quedar atrapados en óptimos locales reiniciando un usuario en una red social, siendo el cálculo de la mayoría
el procedimiento desde otro punto de inicio del espacio de de ellas muy costoso computacionalmente. Esto es debido a
búsqueda, lo que permite aumentar la diversificación de la que varias de las métricas, como pueden ser Betweenness [16]
estrategia de búsqueda. Esta metaheurística se ha utilizado o PageRank [17] necesitan conocer todos los caminos más
recientemente con éxito en varios problemas de optimización cortos que pasan entre cada par de usuarios de la red. En este
[9]–[11]. trabajo se utilizará la métrica denominada closeness [18], la
Cada iteración en GRASP tiene dos fases bien diferencia- cual considera que un vértice es importante si es alcanzable
das: construcción y mejora. La primera tiene como objetivo (i.e., se puede llegar a él a través de muchos caminos) por
generar una solución inicial de calidad para el problema, un elevado número de vértices de la red. Más formalmente,
mientras que la segunda trata de mejorar la solución inicial dada una red conexa G, el valor del closeness de un vértice se
a través de algún método de optimización local [12]. Tra- calcula como la suma de la longitud de las rutas más cortas
dicionalmente el optimizador de la segunda fase suele ser entre el nodo en cuestión y el resto de nodos en el grafo.
532
Cabe destacar que la evaluación de esta métrica solo necesita objetivo comprobar que todas las componentes conexas de la
conocer el camino más corto entre cada par de vértices, por red tienen un tamaño inferior a α · n si se eliminan los nodos
lo que basta con realizar un recorrido en anchura (si la red incluidos en la solución parcial S.
no es ponderada) o aplicar el algoritmo de Dijkstra (si la red Tras ello, se calculan el mínimo y el máximo valor (pasos
es ponderada). La idea que subyace bajo esta métrica es que, 5 y 6, respectivamente) para la función voraz elegida. En este
cuanto más central es un nodo, más cerca está de todos los caso, se utiliza el valor de closeness descrito en la Sección
demás nodos. II-A. Estos dos valores se utilizan para calcular un umbral µ
El valor del closeness de un nodo v ∈ V , definido como (paso 7) que limitará los vértices que entran a formar parte de
C(v) se evalúa como el cálculo inverso de la suma de las la lista de candidatos restringida RCL (paso 8). El valor del
distancias desde ese nodo v hasta el resto de nodos de la red umbral dependerá de un parámetro β (con 0 ≤ β ≤ 1) que
u ∈ V \ {v}. En términos matemáticos, controla la aleatoridad o voracidad del método. Por un lado, si
β = 0, entonces µ = gmáx y, por tanto, solo se considerarán
1 en la RCL aquellos vértices con el máximo valor de closeness,
C(v) ← P resultando en un método completamente voraz. Por otra parte,
u∈V \S d (v, u)
si β = 1, entonces µ = gmı́n , formando parte de la RCL
donde d (v, u) es la distancia entre los nodos v y u. En todos los vértices de la CL, convirtiéndose así en un método
este trabajo, se considera que la distancia entre dos vértices totalmente aleatorio. De esta forma, cuanto mayor sea el valor
u, v ∈ V será la longitud del camino más corto que conecta del parámetro β, más aleatorio será el método, y viceversa. La
u con v. Cabe destacar que esta métrica solo tiene sentido en Sección III discutirá cómo afecta el valor de este parámetro a
componentes conexas, ya que de otra manera no sería posible la calidad de las soluciones obtenidas.
encontrar un camino entre los vértices u y v.
II-C. Fase de mejora
II-B. Fase de construcción Las soluciones generadas en la fase de construcción se han
El procedimiento de construcción parte de una solución construido mediante un procedimiento aleatorizado (a través
vacía e iterativamente añade vértices a dicha solución hasta del parámetro β), por lo que, en general, es posible aplicar
que ésta es factible. En el caso del α-SP, inicialmente ningún un método de optimización local para mejorar la calidad
vértice ha sido añadido al separador, por lo que es necesario de la solución. Aunque es posible utilizar cualquier tipo de
añadir vértices al mismo hasta cumplir la restricción de que la optimizador en esta fase, el problema tratado requiere de la
red se encuentra dividida en componentes conexas de tamaño obtención de soluciones en períodos cortos de tiempo, por lo
inferior a α · n. El Algoritmo 1 muestra el pseudocódigo del que se han descartado optimizadores complejos, optando por
método de generación de soluciones propuesto. un procedimiento de búsqueda local tradicional.
Los procedimientos de búsqueda local tienen como objetivo
Algorithm 1 Construir (G, β) encontrar el óptimo local de una solución con respecto a una
1: v ← Random(V ) vecindad predefinida. En primer lugar, es necesario definir qué
2: S ← {v} vecindad va a explorar el procedimiento. En este trabajo se
3: CL ← V \ {v} considerará la vecindad 2 × 1, la cuál contiene a todas las
4: while not esFactible(S, G) do soluciones alcanzables desde una solución inicial S mediante
5: gmı́n ← mı́nv∈CL C(v) la eliminación de dos vértices que estaban originalmente en la
6: gmáx ← máxv∈CL C(v) solución y la inserción de un nuevo vértice en la misma. Cabe
7: µ ← gmáx − β · (gmáx − gmı́n ) destacar que cualquier movimiento dentro de esta vecindad
8: RCL ← {v ∈ CL : C(v) ≥ µ} que produzca una solución factible habrá mejorado el valor
9: v ← Random(RCL) de la función objetivo, ya que habrá reducido el conjunto de
10: S ← S ∪ {v} vértices que necesitan ser eliminados de la red en una unidad.
11: CL ← CL \ {v} Más formalmente, la vecindad se define como:
12: end while
13: return S N (v, S) ← {S ′ : S ′ ← S \ {u, v} ∪ {w},
∀ u, v ∈ S ∧ ∀ w ∈ V \ S}
El procedimiento comienza eligiendo al azar el primer
vértice que va a ser incluido en la solución (pasos 1-2). La Existen dos métodos tradicionales para explorar la vecindad
elección aleatoria de este primer elemento permite aumentar definida: First Improvement y Best Improvement. El primero
la diversidad de las soluciones generadas en la fase de cons- recorre todas las soluciones de la vecindad, realizando siempre
trucción. A continuación, se crea la lista de candidatos CL el primer movimiento que conduzca a una solución de mayor
con todos los vértices de la red salvo el elegido inicialmente calidad, comenzando la búsqueda de nuevo desde la nueva
(paso 3). El método de construcción entonces añade un nuevo solución. Sin embargo, Best Improvement primero explora
vértice a la solución hasta que ésta satisfaga las restricciones todas las soluciones existentes en la vecindad, realizando el
del problema (pasos 4-12). La función esFactible tiene como movimiento que lleve a la solución de mayor calidad.
533
En este trabajo se considerará únicamente la variante First

Improvement debido a dos motivos principales. En primer
Swap(S ′ , v, u) ← S ′ \ {v} ∪ {u} : v ∈ S ′ \ Sg , u ∈ Sg \ S ′
lugar, First Improvement requiere de un menor coste compu-
tacional ya que no recorre la vecindad completa para realizar En cada iteración, Path Relinking realiza un movimiento
un movimiento y, como se ha mencionado en otras ocasiones, de swap que genera una nueva solución intermedia en la
en este problema se requiere un tiempo de cómputo reducido. trayectoria. Cabe destacar que este movimiento produce, con
Por otra parte, dada la vecindad 2 × 1 definida, cualquier alta probabilidad, una solución no factible, por lo que será
movimiento que lleve a una solución factible producirá una necesario reparar la solución intermedia generada tras un
solución cuyo valor de la función objetivo se habrá mejorado movimiento Swap(S ′ , v, u). Para ello, tras el movimiento, se
en una unidad, sea cual sea el movimiento que se realice. insertarán de manera aleatoria tantos nodos en la solución
Por tanto, para esta vecindad no es útil comprobar todos los como sean necesarios para que la solución vuelva a ser
posibles movimientos disponibles. factible.
Teniendo en cuenta lo mencionado anteriormente, el pro- Existen numerosas variantes de Path Relinking que difieren
cedimiento de búsqueda local propuesto para el problema del en cómo se construye la trayectoria. Tradicionalmente se
α-SP consiste en recorrer de manera aleatoria la vecindad de consideran dos variantes de Path Relinking: Greedy Path Re-
cada una de las soluciones generadas en la fase de construc- linking (GPR) y Random Path Relinking (RPR). GPR, en cada
ción, parando cuando no se encuentre ninguna solución de iteración, genera una solución intermedia por cada elemento
mayor calidad en la misma, y devolviendo la mejor solución incluido en Sg que no está incluido en la solución intermedia
encontrada en la búsqueda. S ′ , continuando la trayectoria por la mejor solución interme-
dia de entre las generadas. Por otra parte, RPR selecciona
II-D. Path Relinking aleatoriamente un elemento de entre los disponibles en Sg
que no están incluidos en S ′ y genera una única solución
Path Relinking (PR) es un método de combinación de intermedia con un movimiento swap donde se incluya dicho
soluciones propuesto originalmente como una metodología vértice. Mientras que GPR se centra en la intensificación,
para integrar estrategias de intensificación y diversificación en RPR tiene como objetivo la diversificación. De nuevo, la
el contexto de la búsqueda tabú [19]. El comportamiento de PR exploración exhaustiva de la trayectoria de GPR hace que
se basa en explorar las trayectorias que conectan soluciones de no sea un método adecuado para el problema α-SP, debido
alta calidad, con el objetivo de generar soluciones intermedias al elevado coste computacional. En su lugar, se considera la
que, eventualmente, pueden ser mejores que las soluciones variante RPR, menos exigente computacionalmente al explorar
originales utilizadas para construir la trayectoria. Laguna y una única solución en cada etapa de la trayectoria. Para
Martí [20] adaptaron Path Relinking en el contexto de GRASP compensar la falta de intensificación en esta etapa, se aplicará
como un método destinado a aumentar la intensificación. el procedimiento de mejora descrito en la Sección II-C a la
El algoritmo de Path Relinking opera sobre un conjunto de mejor solución encontrada en la trayectoria.
soluciones, llamado Elite Set (ES), que se encuentra ordenado En este trabajo el Elite Set se compone de todas las
siguiendo un criterio descendiente de acuerdo al valor de soluciones generadas en la fase de construcción y mejora. Es
un criterio de calidad predefinido de cada solución. En este importante aclarar que no se permite la entrada de soluciones
trabajo, consideramos como criterio de calidad el valor de ya existentes en el Elite Set, por lo que todas las soluciones
la función objetivo de la solución. En concreto, el Elite Set combinadas serán siempre diferentes entre sí.
se compone de las soluciones de mayor calidad generadas
mediante el algoritmo GRASP. Este diseño generalmente se III. R ESULTADOS COMPUTACIONALES
denomina estático [21], ya que en primer lugar se aplica Esta sección está dedicada a analizar el rendimiento de
GRASP para construir el conjunto de élite y posteriormente los algoritmos propuestos y comparar los resultados obtenidos
se aplica Path Relinking para explorar trayectorias entre todos con el mejor método previo encontrado en el estado del arte.
los pares de soluciones en el ES. Por otra parte, el diseño Los algoritmos se han desarrollado en Java 9 y todos los
dinámico considera la actualización del Elite Set cada vez que experimentos se han llevado a cabo en un Intel Core 2 Duo
se explora una trayectoria. 2,66 GHz con 4 GB de RAM.
Dadas una solución inicial, Si y una solución guía Sg , Path El conjunto de instancias utilizadas en esta experimentación
Relinking crea una trayectoria de soluciones intermedias desde se ha generado utilizando el mismo generador de grafos
Si hasta Sg a través de la inserción en Si de características propuesto en el mejor trabajo previo [22]. Específicamente, los
pertenecientes a Sg que aún no se encuentran en Si . En el grafos se generan utilizando el modelo Erdös Rényi [23], en
contexto de α-SP, se propone la eliminación de un vértice v el que cada nuevo nodo insertado tiene la misma probabilidad
que se encuentra en la solución que se está explorando en la de estar conectado a un nodo ya existente en el grafo. Se
trayectoria S ′ pero no está incluido en la solución guía, a la ha generado un conjunto de 28 instancias de 100 vértices de
vez que se inserta un elemento u que no se encuentra en S ′ diferente densidad (de 200 a 500 aristas).
pero sí en Sg . Formalmente, se define entonces el movimiento La experimentación se encuentra dividida en dos partes dife-
swap de la siguiente manera: rentes: experimentación preliminar y experimentación final. La
534
primera está diseñada para ajustar el único parámetro del que Cuadro II: Comparativa de los resultados obtenidos por el
requiere GRASP, β, que controla la aleatoriedad del método, algoritmo previo (RW) frente a los algoritmos GRASP y Path
mientras que la segunda se dedica a analizar el rendimiento Relinking propuestos en este trabajo.
de la mejor variante de GRASP junto con Path Relinking en F.O. Tiempo (s) Desv. ( %) #Mejores
comparación con el mejor algoritmo anterior encontrado en el
GRASP 31.93 18.53 7.42 % 3
estado del arte. PR 29.43 275.67 0.00 % 28
Todos los experimentos proporcionan las siguientes métri- RW 46.46 721.58 37.81 % 0
cas: F.O., el valor de la función objetivo promedio; Tiempo
(s), el tiempo promedio de cómputo medido en segundos;
Desv.( %), la desviación porcentual promedio con respecto a la de la mitad del tiempo necesitado por el mejor método previo.
mejor solución encontrada en el experimento; y #Mejores, el Cabe destacar que, incluso GRASP de manera aislada, sin
número de veces que un algoritmo alcanza la mejor solución considerar Path Relinking, obtiene mejores resultados en todas
del experimento. las métricas que el método previo.
El experimento preliminar considerará un subconjunto de Para confirmar que existen diferencias estadísticamente sig-
20 instancias para evitar el sobreajuste del algoritmo. Para nificativas entre los métodos propuestos, se ha llevado a cabo
ajustar el valor del parámetro, se ha ejecutado la fase de el test no paramétrico de Wilcoxon. El p-valor menor que
construcción y mejora para generar un total de 100 soluciones 0.00001 demuestra que sí que existen diferencias entre los
por cada instancia, devolviendo la mejor solución encontrada, métodos, resultando el siguiente ranking: PR (1.05), GRASP
con β = {0,25, 0,50, 0,75, RND}, donde el valor RND indica (1.95), y RW (3.00). Además, se ha llevado a cabo el test de
que se obtiene un valor de β aleatorio en cada construcción. Wilcoxon con signos para comparar algoritmos por pares. La
La Tabla I muestra los resultados obtenidos para cada valor. comparativa de PR frente a RW ha resultado en un p-valor
menor que 0.00001, al igual que el análisis entre GRASP y
Cuadro I: Rendimiento de GRASP (100 fases de construcción PR. Analizando estos resultados, podemos concluir que Path
y mejora) con diferentes valores de β Relinking emerge como el mejor algoritmo del estado del arte
para el problema del α-SP.
β F.O. Tiempo (s) Desv. ( %) #Mejores
0.25 29.75 18.37 2.31 11 IV. C ONCLUSIONES
0.50 29.90 18.92 2.91 12
0.75 31.65 18.81 7.09 7
En este trabajo se ha presentado un algoritmo basado
RND 29.80 18.99 3.02 10 en GRASP para la detección de puntos críticos en redes.
Además, las soluciones generadas se combinan utilizando Path
Como se puede observar, el valor de β que obtiene los Relinking para mejorar la calidad de las soluciones obtenidas.
mejores resultados es β = 0,25, que se corresponde con Los resultados obtenidos superan a las mejores soluciones
la variante que proporciona una menor aleatoriedad a la encontradas en el estado del arte, todo ello respaldado por
construcción. Este resultado parece indicar que el criterio de test estadísticos. El algoritmo GRASP es capaz de encontrar
closeness utilizado es muy preciso para identificar los vértices soluciones de calidad en cortos períodos de tiempo (menos
críticos de la red. Por lo tanto, la diversificación se incluirá de 20 segundos en promedio), mientras que Path Relinking
en mayor medida con la inclusión del método de combinación es un procedimiento más costoso computacionalmente pero
Path Relinking. capaz de mejorar significativamente las soluciones encontradas
El experimento final está diseñado para comparar los resul- por GRASP. Ambos métodos obtienen mejores soluciones que
tados obtenidos incluyendo el método de combinación Path el método previo, basado en Random Walks combinado con
Relinking respecto al mejor algoritmo encontrado en el estado modelos de Markov. La solución propuesta emerge como el
del arte, esta vez ejecutado sobre el total de instancias disponi- mejor método en el estado del arte, pudiendo obtener solucio-
bles. El mejor algoritmo previo está basado en Random Walks nes de alta calidad en tiempo real con GRASP y mejorarlas
combinado con Markov Chains. Debido a no haber recibido posteriormente con Path Relinking en aquellas situaciones en
respuesta por parte de los autores previos, los resultados las que el tiempo no sea crítico.
proporcionados son los obtenidos tras reimplementar detalla- AGRADECIMIENTOS
damente el método previo [24]. Los resultados se muestran en
Este trabajo ha sido parcialmente financiado por el Minis-
la tabla II.
terio de Economía y Competitividad, ref. TIN2015-65460-C2-
Como se puede observar, el mejor algoritmo resulta ser Path
2-P.
Relinking, obteniendo el mejor resultado en todas las instancias
del conjunto de datos utilizado. Comparando los resultados R EFERENCIAS
frente a GRASP, podemos concluir que Path Relinking es [1] G. Andersson, P. Donalek, R. Farmer, N. Hatziargyriou, I. Kamwa,
capaz de mejorar los resultados previos, quedando GRASP P. Kundur, N. Martins, J. Paserba, P. Pourbeik, J. Sanchez Gasca,
a una desviación del 7.42 %, a cambio de un mayor coste R. Schulz, A. Stankovic, C. Taylor, and V. Vittal, “Causes of the 2003
major grid blackouts in North America and Europe, and recommended
computacional (18.53 frente a 275.67 segundos). Aún con este means to improve system dynamic performance,” IEEE Transactions on
incremento en el tiempo de cómputo, sigue requiriendo menos Power Systems, vol. 20, no. 4, pp. 1922–1928, 2005.
535
[2] P. Crucitti, V. Latora, and M. Marchiori, “Model for cascading failures

in complex networks,” Phys. Rev. E, vol. 69, p. 045104, 2004.
[3] U. Feige and M. Mahdian, “Finding small balanced separators.” in
STOC, J. M. Kleinberg, Ed. ACM, 2006, pp. 375–384.
[4] M. Mohamed-Sidi, “K-Separator Problem. (Problème de k-Sèparateur).”
Ph.D. dissertation, Telecom & Management SudParis, Èvry, Essonne,
France, 2014.
[5] M. Wachs, C. Grothoff, and R. Thurimella, “Partitioning the Internet.”
in CRiSIS, F. Martinelli, J.-L. Lanet, W. M. Fitzgerald, and S. N. Foley,
Eds. IEEE Computer Society, 2012, pp. 1–8.
[6] M. Garey and D. Johnson, Computers and Intractability - A guide to
the Theory of NP-Completeness. San Fransisco: Freeman, 1979.
[7] T. A. Feo and M. G. C. Resende, “A probabilistic heuristic for a
computationally difficult set covering problem,” Operations Research
Letters, vol. 8, no. 2, pp. 67 – 71, 1989.
[8] T. A. Feo, M. G. C. Resende, and S. H. Smith, “A greedy randomized
adaptive search procedure for maximum independent set.” Operations
Research, vol. 42, no. 5, pp. 860–878, 1994.
[9] A. Duarte, J. Sánchez-Oro, M. G. C. Resende, F. Glover, and R. Martí,
“Greedy randomized adaptive search procedure with exterior path re-
linking for differential dispersion minimization.” Inf. Sci., vol. 296, pp.
46–60, 2015.
[10] J. D. Quintana, J. Sánchez-Oro, and A. Duarte, “Efficient greedy
randomized adaptive search procedure for the generalized regenerator
location problem.” Int. J. Comput. Intell. Syst., vol. 9, no. 6, pp. 1016–
1027, 2016.
[11] J. Sánchez-Oro, M. Laguna, R. Martí, and A. Duarte, “Scatter search for
the bandpass problem,” Journal of Global Optimization, vol. 66, no. 4,
pp. 769–790, 2016.
[12] F. W. Glover and G. A. Kochenberger, Handbook of metaheuristics.
Springer Science & Business Media, 2006, vol. 57.
[13] F. Glover and M. Laguna, “Tabu search,” in Handbook of combinatorial
optimization. Springer, 2013, pp. 3261–3362.
[14] P. Hansen and N. Mladenović, “Variable neighborhood search,” in Search
methodologies. Springer, 2014, pp. 313–337.
[15] J. Scott, Social Network Analysis: A Handbook. Sage Publications,
2000.
[16] U. Brandes, “A faster algorithm for betweenness centrality,” Journal of
mathematical sociology, vol. 25, no. 2, pp. 163–177, 2001.
[17] L. Page, S. Brin, R. Motwani, and T. Winograd, “The pagerank citation
ranking: Bringing order to the web.” Stanford InfoLab, Tech. Rep., 1999.
[18] M. E. Newman, “The mathematics of networks,” The new palgrave
encyclopedia of economics, vol. 2, no. 2008, pp. 1–12, 2008.
[19] F. Glover, Tabu search and adaptive memory programming – advances,
applications, and challenges. Dordrecht, Massachusetts, USA: Kluwer
Academic Publishers, 1996.
[20] M. Laguna and R. Martí, “Grasp and path relinking for 2-layer straight
line crossing minimization.” INFORMS Journal on Computing, vol. 11,
no. 1, pp. 44–52, 1999.
[21] F. Glover, M. Laguna, and R. Martí, “Fundamentals of scatter search and
path relinking,” Control and cybernetics, vol. 29, no. 3, pp. 653–684,
2000.
[22] J. Lee, J. Kwak, H. W. Lee, and N. B. Shroff, “Finding minimum
node separators: A markov chain monte carlo method,” in DRCN
2017 - Design of Reliable Communication Networks; 13th International
Conference, March 2017, pp. 1–8.
[23] P. Erdős and A. Rényi, “On random graphs,” Publications Mathematicae,
vol. 6, p. 290, 1959.
[24] B. Hassibi, M. Hansen, A. Dimakis, H. Alshamary, and W. Xu, “Opti-
mized markov chain monte carlo for signal detection in mimo systems:
An analysis of the stationary distribution and mixing time,” Signal
Processing, IEEE Transactions on, vol. 62, no. 17, pp. 4436–4450, 2014.
536
Where facility centers should be located?

A.D. López-Sánchez J. Sánchez-Oro
Department of Economics, Quantitative Methods and Economic History Department of Computer Science
Pablo de Olavide University Rey Juan Carlos University
Sevilla, Spain Madrid, Spain
A.G. Hernández-Dı́az M. Laguna

Department of Economics, Quantitative Methods and Economic History Leeds School of Business
Pablo de Olavide University University of Colorado
Sevilla, Spain Boulder, Colorado
Abstract—Facility location problems aim to determine the best optimizes all objectives, or, in other words, the value of one
position to place facility centers. This task is not easy since many objective function cannot be improved without deteriorating
objectives may be taken into consideration to choose the best the value of at least another objective function. Those solutions
possibility and the locations can be substantially different. This
paper presents a Scatter Search algorithm with Path Relinking are known as efficient solutions, non-dominated solutions or
to decide where facility centers should be located depending Pareto optimal solutions.
on the objective functions under consideration. The objectives The mo-FLP that optimizes f1 , f2 , and f3 , was recently
considered in this study are to minimize the distance between studied by Karatas and Yakici, see [10]. The authors devel-
demand points and their nearest facilities, to maximize the oped an hybrid algorithm, named ITER-FLOC, that combines
number of demand points covered by a facility center and to
minimize the maximum distance between demand points and branch & bound techniques and iterative goal programming.
their nearest facilities. Then, this problem is addressed as a three- In particular, authors proposed a different formulation for
objective optimization problem and the algorithm proposed is each considered objective. Initially, lower and upper bounds
compared against other competitors obtaining promising results for each objective are evaluated. Then, for each iteration of
according to three different performance metrics. the ITER-FLOC algorithm, the location models are solved,
Index Terms—Scatter Search, Path Relinking, Multi-objective
optimization problems, Facility location problems verifying if the termination criterion has been achieved. If
so, the algorithm ends, returning the Pareto front constructed.
Otherwise, the lower and upper bounds of each objective are
I. I NTRODUCTION
updated. Prior to executing the next iteration, the location
It is not an easy task to locate facility centers since many models are updated with additional constraints.
objectives may be taken into consideration to choose the best They are able to generate the Pareto optimal solutions
possibility. Depending on the objective and the constraints with high level of diversity and cardinality. However, the
imposed by the decision-maker, the facility centers may be drawbacks are the requirement of preference information since
located in different places. Hence, the best location may be goal programming is considered an a priori method and its
substantially different depending on the objective function slowness because it an exact algorithm that needs to be solve
considered for optimization. Specifically, this work is focused multiple times (one for each considered goal). Additionally,
on three common objective functions: f1 , with the aim of the method requires from several input parameters that can
minimizing the average distance between demands and their difficult the scalability of the algorithm for new datasets.
nearest facilities; f2 , focused on covering the maximum num- Here, the mo-FLP is addressed using a Scatter Search algo-
ber of demand points; and f3 , which minimizes the maximum rithm combined with Path Relinking (SSPR). The output of the
distance between demand points and their nearest facilities. algorithm is the approximation of the Pareto front containing
But what happens when the decision-maker wants to optimize efficient solutions. A variety of optimization problems has
all the objectives at the same time? In such a case, the location been solved and the computational results indicate that the
problem becomes a multi-objective facility location problem Scatter Search algorithm is able to find the Pareto set in a
(mo-FLP) in which the objectives are usually in conflict. simple run within short computational time.
That is, there is not a single solution that simultaneously This work is structured as follows. Section II describes the
problem. Section III gives details of the Scatter Search algo-
J. Sánchez-Oro is supported by the Spanish Ministry of “Economı́a y rithm with Path Relinking implemented to solve the problem
Competitividad”, Grant Refs. TIN2015-65460-C2-2-P. A.D. López-Sánchez
and A.G. Hernández-Dı́az acknowledge support from the Spanish Ministry of under consideration. Section IV presents the computational
Science and Innovation through Project ECO2016-76567-C4-1-R. results. Finally, Section V summarizes the paper and discusses
537
P
future work. Initialization
II. L OCATION P ROBLEM D EFINITION

Diversiication Improvement
Generation Method Method
Let I = {1 . . . m} be the set of available locations to host a
facility center and J = {1 . . . n} the set of demand points that
requires to be covered by a facility center. Each demand point
i ∈ I has an associated weight wi that represents the cost of
Improvement Reference Set
satisfying its necessity with a facility center. Additionally, let Method Update Method
dij ≥ 0 be the distance between a candidate location i ∈ I and

Solution Combination
a demand point j ∈ J. The distance is evaluated as the length Method
of the shortest path that connects x with y. A solution S for RefSet
a facility location problem is then represented as the set of p

RefSet1
candidate locations to host a facility center, and the objective Subset Generation
of the problem is to find a solution with the optimum value Method
RefSet2
with respect to one or more objective function.
Stop if no new
This work is focused on optimizing three different objective solutions in the
Reference Set
functions simultaneously, becoming a multi-objective problem.
The first considered objective function, f1 , is focused on Fig. 1. Scatter Search algorithm.
minimizing the average weighted distance between the demand
points and their nearest facility center, which can be found in
the literature as the p-Median Problem (pMP). Given a solution
The method firstly generates an initial population P . These
S, the evaluation of f1 is formally defined as:
solutions are generated using a diversification generation
method (Section III-A). Then, a local optimum for each
1X solution is found by an improvement method (Section III-B).
f1 (S) ← wj · di⋆ j , where i⋆ ← arg min dij
n i∈S It is important to remark that there are not repeated solutions
j∈J
in the initial population P .
The second objective function, f2 , tries to maximize the
Traditional implementations of Scatter Search constructs
number of demand points whose necessity is satisfied by the
the reference set RefSet with the β/2 best solutions of set
selected candidate locations, which is usually referenced as
P in terms of objective function value. This work adapt
the Maximal Coverage Location Problem (MCLP). A demand
this criterion for a multi-objective approach, by dividing the
point is covered by a facility center if the distance between
RefSet in three subsets, RefSet 1 , RefSet 2 , and RefSet 3 , with
them is smaller or equal than a predefined threshold r. More
|RefSet 1 | = |RefSet 2 | = RefSet 3 = β. In particular, RefSet 1
formally,
initially contains the best β/2 solutions with respect to f1 ,
while RefSet 2 and RefSet 3 contains the best β/2 ones with
f2 (S) ← j ∈ J : di⋆ j ≤ r, where i⋆ ← arg min dij
respect to f2 and f3 , respectively. The remaining β/2 solutions
i∈S for each RefSet are selected as the most diverse solutions
among the remaining solutions in P . Diversity between a
The third objective function, f3 , is intended to minimize
solution S and the RefSet under construction is measured as
the maximum distance between the demand points and the
the minimum distance between S and every solution in the
facility centers, which result in the p-Center Problem (pCP).
RefSet, considering the distance between two solutions as the
This objective function is formally defined as:
number of candidate locations that differs in both solutions.
Once the RefSet has been created, Scatter Search selects
f3 (S) ← max di⋆ j , where i⋆ ← arg min dij the subsets of reference solutions that will be combined with
j∈J i∈S
the aim of finding new trial solutions. The most common
Some of the first studies dealing the previous location implementation of the subset generation method consists of
problems were proposed by [2], [8], [9]. combining all pairs of solutions included in the RefSet. Consid-
ering that we maintain three RefSet, this implementation would
III. S CATTER S EARCH ALGORITHM WITH PATH be rather computationally demanding. Instead, we generate
R ELINKING all pairs of solutions (S, S ′ ) such that S and S ′ belong
Scatter Search (SS), first proposed by Glover, see [5], is to different RefSet (i.e., S ∈ RefSeti , S ′ ∈ RefSetj , with
a metaheuristic framework which generates, maintains, and 1 ≤ i, j ≤ 3 ∧ i 6= j).
transforms a reference set of solutions, RefSet. It has been The solution combination method (Section III-C) is de-
successfully applied to a large variety of optimization prob- signed to combine all the subsets generated in the previous
lems [12], [13]. Figure 1 depicts the general scheme for Scatter step in order to generate new solutions that become candidate
Search. for entering in the RefSet. Regarding that the moFLP considers
538
three different objective functions, a local optimum is found that α ∈ [0, 1] is a parameter of the method that controls
with respect to each one of the by using the improvement the randomness of the constructive procedure. On the one
method. Then, each improved solution is evaluated for being hand, if α = 0 then the RCL would contain the candidates
included in its corresponding RefSet. In particular, a solution with the minimum greedy function value, being a totally
enters in the RefSet if it is better than the worst solution already greedy procedure. On the other hand, when α = 1, the RCL
in the RefSet. It is worth mentioning that the size of the RefSet contains all the candidate locations in CL, becoming a random
remains constant throughout the whole process. Therefore, procedure. Then, it is interesting to find a balance between
the new solution must replace another one. Specifically, the diversification and intensification by varying the value of the
new solution replaces the most similar solution already in the α parameter. A new candidate is selected in each iteration
RefSet that presents a quality smaller or equal than it. following this strategy until p candidate locations already host
Scatter Search iterates until a stopping criterion is met. a facility.
The algorithm proposed in this work stops when it has not
B. Improvement Method
been possible to include new solutions in any of the RefSet,
returning the set of efficient solutions found during the search. The diversification generation method is designed to pro-
duce not only high quality solutions, but also diverse ones.
A. Diversification Generation Method The increase in the diversity of the solutions generated usually
The diversification generation method (DGM) is designed implies a decrease in the quality of those solutions. Therefore,
for creating an initial set of solutions P which will become it is interesting to use a local improving method designed
the source for creating the initial RefSet. On the one hand, to find a local optimum with respect to a previously defined
P should contain high quality solutions in order to guide the neighborhood.
search through promising regions of the search space. On the Regarding the algorithmic proposal for the moFLP, the so-
other hand, solutions in P must be diverse enough to provide lutions included in the set of initial solutions P can be further
different solutions for the combination stage, thus diversifying improved using a local optimizer. Scatter Search is a versatile
the search. methodology than allows using different types of optimizers,
We propose three different constructive methods in this from local search methods to complete metaheuristics like
work, DGM 1 , DGM 2 , and DGM 3 each one of them focused Tabu Search or VNS, among others (see [REF AUTOCITA]
on generating promising solutions for f1 , f2 , and f3 , respec- for some successfull application of complete metaheuristics in
tively. With the aim of increasing the diversity of the set the improving phase). For this problem, we propose a local
of solutions constructed, we propose a Greedy Randomized search method designed to improve the quality of the initial
Adaptive Search Procedure (GRASP). GRASP is a multi-start solutions and of those resulting from the combination method.
methodology originally proposed by [4], that is conformed The computational effort required to evaluate the solutions
by two stages: construction and improvement. The former makes the use of complete metaheuristics not suitable for the
consists of a greedy, randomized, and adaptive construction problem under consideration.
of a solution while the latter is designed for finding a local Prior to define the local improvement method, it is necessary
optimum with respect to a predefined neighborhood. to present the neighborhood of solutions considered by the
The diversification generation method proposed in this work method. We define the neighborhood N (S) as all the solutions
follows a traditional GRASP construction scheme. The method that can be reached from an initial solution S by performing
initially creates a candidate list CL with all the candidate loca- a single interchange move, which consists of removing a
tions available to host a facility. Then, each candidate location selected location and replacing it with any non-selected facility
is evaluated with a greedy function that estimates the relevance location. More formally,
of locating a facility in that candidate. For this problem, we
propose a different greedy function for each objective function
N (S) ← {S ′ : S ′ ← S \ {v} ∪ {u} ∀ v ∈ S ∀ u ∈ V \ S}
considered f1 , f2 , f3 . In particular, the greedy function value
for each candidate location is calculated as the corresponding Having defined N (S), the local search method proposed
objective value (f1 , f2 , and f3 , respectively) if the location is visits all neighbor solutions in a random order and replaces
assigned to host a facility. After evaluating all the candidates, the incumbent solution with the first neighbor solution with a
the method calculates a threshold µ as follows: better objective function value. It is worth mentioning that the
local search proposed follows a first improvement approach in
order to reduce the computational effort required to apply it.
µ ← gmin + α · (gmax − gmin )
Specifically, if an interchange move results in an improvement
This threshold is used for constructing the restricted candi- with respect to the objective function being optimized, the
date list RCL, that contains the most promising candidates to move is performed, restarting the search with the new best
host a facility. In particular, the RCL is conformed with all the solution. This strategy reduces the complexity of the search
candidate locations whose greedy function value is smaller or since the opposite strategy, best improvement, requires the
equal than threshold µ. For each iteration, a random element complete exploration of the neighborhood in each iteration
is selected from the RCL to host the next facility. Notice to select the best solution in the neighborhood.
539
In the framework of Scatter Search, the improvement IV. C OMPUTATIONAL R ESULTS

method is applied in two different stages, see Figure 1. First In this section the numerical results are shown in order to
of all, it is used for locally improving the solutions that prove the superiority of the Scatter Search algorithm with Path
are included in the initial population. It is worth mentioning Relinking in comparison to the algorithm proposed by Karatas
that the set P is divided into three subsets (one for each and Yakici in [10].
objective function), so the local search method improves each Since the original instances are not available, we request
solution with respect to the objective function considered for the code from the previous work in order to have a fair
its construction. comparison. Additionally, 20 new instances of sizes were
The local search method is also applied to those solutions generated following the instructions of the previous work. The
resulting from the combination stage. As it is described in instances are divided into three sets depending on their size:
Section III-C, the combination stage does not produce local small, those with 20 candidate locations and 50 demand points;
optimum with respect to any neighborhood, so the resulting medium, with 50 candidate locations and 100 demand points;
solutions can be further improved with a local optimizer. and large, with 200 candidate locations and 400 demand
Specifically, for each solution derived from the combination points. Table I summarizes the following parameters of the
stage, three local optima are found, one for each objective instances generated:
function of the moFLP, respectively. Then, each improved
• m: number of candidate locations to host a facility
solution is evaluated to be included in the RefSet.
• n: number of demand points
• p: number of candidate locations that must be selected
C. Solution Combination Method • r: radius in which a facility is covering a demand point
The solution combination method is responsible for gen- We refer the reader to [10] for a more detailed description
erating new solutions in each iteration of the Scatter Search on the instance structure.
algorithm by combining two or more solutions that are already
in the RefSet. The combination can be performed following TABLE I
different strategies, from genetic operators to the generation PARAMETERS SETTING FOR THE INSTANCES .
of paths between solutions.
In this work we propose using Path Relinking (PR) [6], Parameter Small Medium Large
[7] as a combination method, which has been successfully m 20 50 200
applied in several recent works [1], [3]. Given an initial and a n 50 100 400
p 5 10 15
guiding solution, si and sg , respectively, PR constructs a path r 20 15 10
of solutions that starts in si and finishes in sg . The objective of
PR is iteratively transform the initial solution into the guiding
one. The transformation is achieved by adding attributes of All the algorithms proposed in this work have been imple-
the guiding solution into the initial one while removing those mented using Java 8 and the experiments were performed on
attributes of the initial solution that are not present in the an Intel Core i7 920 (2.67 GHz) with 8 GB RAM. It is worth
guiding one, stopping when si becomes sg . mentioning that the previous algorithm has been also executed
There exist several strategies for combining solutions in the in the same computer in order to have a fair comparison.
context of Path Relinking: Random Path Relinking, Greedy Table II shows average results of both the Scatter Search
Path Relinking, or Greedy Randomized Path Relinking, among with Path Relinking algorithm proposed (SSPR) and the best
others. Most of the greedy variants require the exploration previous method (ITER-FLOC) the 20 instances. Regarding
of all the alternative solutions in each step of the path, the multi-objective nature of the problem under consideration,
in order to select the most promising solution to continue we have considered using the following metrics: coverage, C;
the path. However, these strategies are usually very time hypervolume, HV; epsilon indicator, Eps; and CPU time. Re-
consuming, increasing the required computing time to execute sults in Table II shows the superiority of the SSPR algorithm.
the algorithm. We have selected the Random Path Relinking If we focus on the coverage metric, it can be hold that
variant in order to accelerate the proposed algorithm, thus the proportion of solutions covered by the SSPR algorithm is
increasing the diversification of the search. larger than the proportion of solution covered by the ITER-
Starting from the initial solution si , Random Path Relinking FLOC algorithm. Furthermore, the SSPR scales better thatn
generates a random solution in the neighborhood defined in the ITER-FLOC algorithm, as it can be seen with the increase
Section III-B that inserts a new candidate location which is of the solutions covered by SSPR when increasing the size of
already in the guiding solution, removing one of the candidate the instance, achieving a 100% of coverage when analyzing
locations currently in si that does not belongs to sg . Notice the set of large instances.
that after a certain number of iterations, the initial solution Regarding the hypervolume (larger values are better) and the
would become the guiding one, since in each iteration the epsilon indicator (smaller values are better), we can conclude
initial solution will have an additional candidate location in that SSPR consistently obtains better results thatn the ITER-
common with sg . FLOC algorithm. Again, the larger the instance set, the better
540
the results of SSPR when compared against ITER-FLOC. This R EFERENCES

behavior suggests that SSPR is a more adequate algorithm for [1] V. Campos, R. Martı́, J. Sánchez-Oro, A. Duarte, “GRASP with path
real-life problems with a large number of candidate locations relinking for the orienteering problem”, Journal of the Operational
and demand points. Research Society, vol. 65, pp. 1800–1813, 2014.
[2] R. Church, and C.R. Velle, “The maximal covering location problem,”
Finally, if we consider the computing time, we can see that Papers in Regional Science, vol. 32, pp. 101–118,1974.
ITER-FLOC is equivalent or even faster when considering [3] A. Duarte, J. Sánchez-Oro, M.G.C. Resende, F. Glover, R. Martı́,
small or medium instances, but the performance does not scale “Greedy randomized adaptive search procedure with exterior path re-
linking for differential dispersion minimization”, Information Sciences,
good with the size of the instance. Therefore, when solving the vol. 296, pp. 46–60, 2015.
largest instances the proposed SSPR algorithm is considerably [4] T. Feo, M.G.C. Resende. “A probabilistic heuristic for a computationally
faster than the ITER-FLOC approach. difficult set covering problem”, Operations Research Letters, vol. 8, pp.
67–71, 1989.
[5] F. Glover, “Heuristics for integer programming using surrogate con-
TABLE II straints,” Decision Sciences, vol. 8, pp. 156–166, 1977.
AVERAGE RESULTS . [6] F. Glover“Tabu search and adaptive memory programming – advances,
applications, and challenges,” Kluwer Academic Publishers, 1996.
[7] F. Glover, and M. Laguna, “Tabu Search,” Kluwer Academic Publishers,
C(SSPR,ITER-FLOC) C(ITER-FLOC,SSPR) 1997.
Small 0.61 0.17 [8] S.L. Hakimi, “Optimum Locations of Switching Centers and the Abso-
Medium 0.82 0.00 lute Centers and Medians of a Graph,” Operations Research, vol. 12,
Large 1.00 0.00 pp. 450–459, 1964.
[9] S.L. Hakimi, “Optimum Distribution of Switching Centers in a Com-
HV(SSPR) HV(ITER-FLOC) munication Network and Some Related Graph Theoretic Problems,”
Operations Research, vol. 13, pp. 462–475, 1965.
Small 0.28 0.07 [10] M. Karatas, and E. Yakc, “An iterative solution approach to a multi-
Medium 0.52 0.12 objective facility location problem,” Applied Soft Computing, vol. 62,
Large 0.81 0.20 pp. 272–287, 2018.
Eps(SSPR) Eps(ITER-FLOC) [11] R. Martı́, M. Laguna, and F. Glover. “Principles of scatter search,”
European Journal of Operational Research, vol. 169, pp. 359–372, 2006.
Small 0.44 0.78 [12] J. Sánchez-Oro, M. Laguna, R. Martı́, and A. Duarte. “Scatter Search
Medium 0.14 0.70 for the Bandpass Problem”, Journal of Global Optimization, vol. 66(4),
Large 0.00 0.50 pp. 769–790, 2016
CPU(SSPR) CPU(ITER-FLOC) [13] J. Sánchez-Oro, A. Martı́nez-Gavara, M. Laguna, A. Duarte, and R.
Martı́. “Variable neighborhood scatter search for the incremental graph
Small 6.41 7.25 drawing problem”, Computational Optimization and Applications, vol.
Medium 72.66 19.74 68(3), pp. 775–797, 2017
Large 1920.53 5920.34 [14] J.J. Sylvester, “A Question in the Geometry of Situation,” Quarterly
Journal of Pure and Applied Mathematics, vol. 1, 1857.
V. C ONCLUSIONS
A population-based metaheuristic with a method for com-
bining solutions have been proposed for a multi-objective facil-
ity location problem (mo-FLP) which considers three different
objectives of interest in real-life problems: to minimize the
average distance between demands and their nearest facilities,
to maximize the total number of demand points covered, and
to minimize the maximum distance between demand points
and their nearest facilities.
The computational experiments shows how Scatter Search
with Path Relinking is a suitable algorithm for solving large
scale instances, performing better in both quality and comput-
ing time than the best previous algorithm found in the state
of the art. The experiments have been performed in the same
computer in order to have comparable results, concluding that
SSPR outperforms the best previous method considering all
the metrics presented.
ACKNOWLEDGMENT
J. Sánchez-Oro is supported by the Spanish Ministry of
“Economı́a y Competitividad”, Grant Refs. TIN2015-65460-
C2-2-P and TIN2014-54806-R.
A.D. López-Sánchez and A.G. Hernández-Dı́az acknowl-
edge support from the Spanish Ministry of Science and Inno-
vation through Project ECO2016-76567-C4-1-R.
541
Bioinspirados
(XIII MAEB)
MAEB 2.2:
SCATTER SEARCH Y VNS
Encontrando grafos bipartitos completos mediante

Búsqueda de Vecindad Variable
Juan David Quintana Jesús Sánchez-Oro Abraham Duarte
Dept. Computer Sciences Dept. Computer Sciences Dept. Computer Sciences
Universidad Rey Juan Carlos Universidad Rey Juan Carlos Universidad Rey Juan Carlos
Madrid, España Madrid, España Madrid, España
Resumen—El Problema del Máximo Biclique Balanceado, se representan con una lı́nea continua, mientras que aquellas
o Maximum Balanced Biclique Problem (MBBP), consiste en con un extremo fuera de la solución se representan con
encontrar el biclique de tamaño máximo inducido por un grafo una lı́nea discontinua. Obsérvese que no es posible insertar
bipartito no completo. Se tiene la restricción adicional de que
tanto el tamaño del grafo de partida como el biclique inducido nuevos vértices en la solución, ya que en dicho caso el grafo
tienen el mismo número de vértices en cada una de sus capas, por bipartito inducido resultante no serı́a un biclique balanceado.
lo tanto se dice que son balanceados. Algunas de sus aplicaciones Por ejemplo, no es posible añadir los vértices E o H porque no
se dan en el diseño de circuitos en integración a gran escala son adyacentes a los vértices B y A, respectivamente. Además,
(VLSI) o el diseño de sistemas nanoelectrónicos, entre otras. Se ha no es posible añadir vértices en la capa L1 ya que el biclique
demostrado que este problema de optimización combinatoria es
NP-Duro. En la literatura se han propuesto diversas heurı́sticas inducido no serı́a balanceado (i.e., |L1 | =
6 |R1 |).
para solucionarlo, generalmente basadas en la eliminación de La figura 1(c) muestra una solución B2 (L2 , R2 , E2 ) de
vértices, y más recientemente se ha propuesto un algoritmo mejor calidad, ya que tiene 3 vértices en cada capa. En
evolutivo que tiene los mejores resultados en la literatura. En concreto, L2 = {B, C, D}, y R2 = {F, G, H}. De nuevo, no es
este trabajo se propone el uso de la metodologı́a RVNS para posible añadir más vértices sin violar la restricción de tener
abordar este problema. Esta elección se justifica en la dı́ficultad
para diseñar una búsqueda local efectiva para este problema. un biclique balanceado.
Index Terms—biclique, Reduced VNS, bipartito. Se ha demostrado que este problema es N P-Duro en varios
trabajos previos [1]–[3]. Algunos resultados teóricos proponen
I. I NTRODUCCI ÓN cotas para el tamaño máximo que la solución óptima puede
alcanzar [4], y se demostrado difı́cil de aproximar dentro de
Sea G(L, R, E) un grafo bipartito balanceado en el que L
un determinado factor [5].
y R son dos conjuntos (o capas) de vértices con la misma
Los grafos biclique han demostrado ser de utilidad en
cardinalidad (i.e., |L| = |R| = n) y E es el conjunto de
varias aplicaciones prácticas, la mayorı́a de ellas en el campo
aristas. Al ser un grafo bipartito, L ∩ R = ∅, una arista solo
de la biologı́a: agrupación de datos de microarrays [6]–
puede conectar un vértice v ∈ L con otro u ∈ R, i.e., ∀(v, u) ∈
[8], optimización de la reconstrucción del arbol filogenético
E v ∈ L∧u ∈ R. Además, definimos un biclique B(L′ R′ , E ′ )
[9], entre otras [10]–[12]. En particular, el MBBP tiene
como el grafo inducido por G, en el que L′ ⊂ L, R′ ⊂ R, de
aplicaciones adicionales en diversos campos: diseño eficiente
forma que todo vértice v ∈ L′ está conectado a todo vértice
de circuitos en integración a gran escala (VLSI) [13], o el
u ∈ R′ . Dicho de otra forma, B es un grafo bipartito completo,
diseño de nuevos sistemas nanoelectrónicos [14]–[16], entre
también llamado biclique.
otras.
Dado un grafo bipartito balanceado G(L, R, E), este trabajo
A pesar de las aplicaciones prácticas del MBBP, no se
se centra en resolver el Problema del Máximo Biclique
han propuesto muchos algoritmos eficientes para solucionarlo,
Balanceado, más conocido como Maximum Balanced Biclique
principalmente debido a la dificultad del problema. Sin
Problem (MBBP) en inglés, que consiste en identificar un
embargo, si del MBBP eliminamos la restricción de que la
biclique balanceado B ⋆ (L′ , R′ , E ′ ) con el mayor número de
solución deba ser balanceada, entonces el problema resultante
vértices por capa. En otras palabras, el objetivo del MBBP es
serı́a resoluble en tiempo polinómico [17], pero la mayorı́a
maximizar la cardinalidad de los conjuntos L′ y R′ .
de las soluciones serı́an desbalanceadas, haciendo que los
La Figura 1 presenta un ejemplo de grafo bipartito con 8
resultados no sean adaptables al problema que estamos
vértices, 13 aristas, y dos posibles soluciones para el MBBP.
considerando.
La figura 1(b) muestra una solución B1 (L1 , R1 , E1 ) con
La mayorı́a de los planteamientos previos siguen un enfoque
dos vértices en cada capa. En este caso, L1 = {A, B}, y
destructivo en el que la solución inicial contiene todos los
R1 = {F, G}. Las aristas que pertenecen al biclique inducido
vértices y la heurı́stica elimina iterativamente vértices en
Este trabajo ha sido financiado parcialmente por el Ministerio de Economı́a L′ y R′ hasta que la solución resultante es factible. Estos
y Competitividad, ref. TIN2015-65460-C2-2-P. algoritmos se diferencian entre sı́ principalmente por el criterio
545
A E A E A E
B F B F B F
C G C G C G
D H D H D H
(a) (b) (c)
Figura 1: 1(a) Grafo bipartito con 8 vértices y 13 aristas, 1(b) una solución factible con 2 vértices en cada capa (A y B en L′ ,
F y G en R′ ) , y 1(c) una solución distinta con 3 vértices en cada capa (B, C y D en L′ , F, G, y H en R′ )
utilizado para elegir los vértices a eliminar. En particular, [14] tanto deterministas como estocásticas (e.g., Basic VNS,
selecciona los vértices de mayor grado, mientras que [15] General VNS).
elimina los de mayor número de vértices de mı́nimo grado Como se menciona en trabajos previos [19], [20], diseñar
en la otra capa. Además, algunos algoritmos han intentado una búsqueda local para el MBBP es una tarea difı́cil
combinar ambos criterios [18], [19]. El mejor algoritmo principalmente por la complejidad de mantener una solución
encontrado en la literatura consiste en un algoritmo evolutivo factible (i.e. un biclique balanceado) tras eliminar o añadir
[20] que propone un nuevo operador de mutación ası́ como una vértices en una solución previa. En otras palabras, el MBBP
nueva busqueda local para mejorar la calidad de las soluciones no es idóneo para proponer métodos de búsqueda local que
generadas. permitan encontrar un óptimo local en relación a una solución
El resto de este artı́culo está organizado de la siguiente determinada. Por lo tanto, este trabajo propone un algoritmo
forma: la Sección II describe la propuesta algorı́tmica para Reduced VNS, que se basa en la exploración aleatoria de las
el MBBP; la Sección III presenta los experimentos realizados vecindades establecidas.
para evaluar la calidad de la propuesta algortimica; y la RVNS es una variante de VNS útil para instancias grandes
Sección IV plantea las conclusiones de esta investigación. en las que la búsqueda local es muy costosa en tiempo, o para
aquellos problemas en los que no es fácil diseñar un método
II. R EDUCED VARIABLE N EIGHBORHOOD S EARCH de búsqueda local.
La Búsqueda de Vecindad Variable (VNS por sus siglas Algoritmo 1 RVNS (B, kmáx , tmáx )
en inglés Variable Neighborhood Search) [21] es una 1: repeat
metaheuristica basada en cambios sistemáticos de vecindad. 2: k←1
Al ser una metaheurı́stica, no garantiza la optimalidad de las 3: while k ≤ kmáx do
soluciones obtenidas, pero se centra en obtener soluciones de 4: B ′ ← Shake(B, k)
alta calidad en un tiempo razonable de cómputo. La constante 5: k ← NeighborhoodChange(B, B ′ , k)
evolución de VNS ha dado lugar a diversas variantes, entre 6: end while
la que podemos destacar Basic VNS, Reduced VNS (RVNS), 7: until CPUTime() ≤ tmáx
Variable Neighborhood Descent (VND) , General VNS, Skewed 8: return B
VNS, Variable Neighborhood Decomposition Search, entre
otras. El algoritmo requiere de dos parámetros de entrada: B,
La mayorı́a de las variantes se diferencian en la forma de una solución factible de partida, que se puede generar
explorar las vecindades establecidas. En particular, Variable aleatoriamente o mediante un procedimiento constructivo más
Neighborhood Decomposition Search realiza una exploración elaborado; y kmáx , la vecindad máxima a explorar.
totalmente determinista del espacio de soluciones, mientras Cada iteración de RVNS empieza desde la vecindad inicial
que la exploración realizada por RVNS es totalmente (paso 2). A continuación, el método explora cada una de las
estocástica. Algunas variantes combinan cambios de vecindad vecindades establecidas (pasos 3-6) de la siguiente forma. En
546
primer lugar, el método genera una solución al azar B ′ en la la solución factible (i.e., la solución es un grafo bipartito
vecindad k de la solución actual B con el método Shake (paso completo). Por lo tanto, en este paso inicial, CLL contiene
4). Luego el método NeighborhoodChange (paso 5) se encarga todos los vértices de L exceptuando al vértice seleccionado v.
de seleccionar la siguiente vecindad a explorar. En particular, Por otra parte, CLR contiene todos los vértices adyacentes a
si la nueva solución B ′ es mejor que la solución de partida B, v en R, ya que de otra forma la solución no serı́a un grafo
entonces se actualiza (B ← B ′ ), y reinicia la búsqueda desde bipartito completo. A continuación, el método añade un vértice
la vecindad inicial (k ← 1). En caso contrario, la búsqueda en la capa R′ y luego en L′ iterativamente, mientras que
continúa con la siguiente vecindad (k ← k + 1). Una iteración queden candidatos en ambas capas (paso 16-19).
de RVNS termina cuando se ha alcanzado la vecindad máxima La selección del vértice siguiente se describe en la función
establecida kmáx . Es importante mencionar que la vecindad UpdateLayer que requiere de tres parámetros: la lista de
máxima utilizada en RVNS es generalmente pequeña debido candidatos desde la que se debe elegir el vértice, CL1 , la
a la naturaleza aleatoria del método Shake, ya que un valor lista de candidatos de la otra capa, CL2 , y el parámetro α que
mayor para kmáx producirı́a resultados equivalentes a reiniciar determina el grado de voracidad / aleatoriedad de la selección.
la búsqueda desde una nueva solución inicial. El método Una función voraz g que evalúa la calidad de un vértice
RVNS se ejecuta hasta que se alcanza un tiempo lı́mite de candidato v debe ser definida. En este trabajo, proponemos
cómputo tmáx . como función el número de vértices adyacentes en la lista de
candidatos de la capa opuesta. Formalmente,
II-A. Procedimiento constructivo
La solución inicial para RVNS puede ser generada al
azar o con un procedimiento constructivo más elaborado. g(v, CL) ← {u ∈ CL : (v, u) ∈ E}
Este trabajo propone un procedimiento constructivo basado
en Greedy Randomized Adaptive Search Procedure (GRASP) El primer paso para seleccionar el vértice siguiente consiste
[22]. Esta metodologı́a considera una función voraz que evalúa en obtener los valores mı́nimo (gmı́n ) y máximo (gmáx ) para la
la importancia de insertar cada vértice en la solución a función voraz (paso 2-3). A continuación, se construye (paso
construir. En el Algoritmo 2 se presenta el pseudocódigo del 5) la lista de candidatos restringida (RCL) con aquellos vértices
procedimiento constructivo propuesto. cuyo valor de la función objetivo sea mayor o igual que el
umbral hallado previamente µ (paso 4). Los valores para el
Algoritmo 2 Construct(G = (L, R, E), α) parámetro α están en el rango 0–1, dónde α = 0 implica
1: function U PDATE L AYER(CL1 , CL2 , α) que el método es totalmente aleatorio, y α = 1 transforma
2: gmı́n ← mı́nv∈CL1 g(v) el algoritmo en completamente voraz. El siguiente vértice se
3: gmáx ← máxv∈CL1 g(v) selecciona al azar de RCL (paso 6), y luego se actualiza cada
4: µ ← gmı́n + α · (gmáx − gmı́n ) lista de candidatos. En particular, CL1 se actualiza mediante
5: RCL ← {v ∈ CL1 ; g(v) ≤ µ} quitar el vértice seleccionado de sı́ mismo, mientras CL2 se
6: v ← Random(RCL) actualiza quitando aquellos vértices que no son adyacentes a
7: CL1 ← CL1 \ {v} v, debido a que no pueden ser elegidos en iteraciones futuras
8: CL2 ← CL2 \ {u ∈ CL2 : (v, u) ∈ / E} sin que la solución se vuelva infactible.
9: return v
10: end function II-B. Shake
11: v ← Random(L) El método Shake es una etapa dentro de la metodologı́a VNS
12: L′ ← {v} diseñada para escapar de óptimos locales encontrados durante
13: CLL ← L \ {v} la fase de búsqueda. Consiste en perturbar aleatoriamente una
14: CLR ← {u ∈ R : (v, u) ∈ E} solución con el objetivo de explorar regiones más amplias en
15: while CLL 6= ∅ and CLR 6= ∅ do el espacio de búsqueda. Esta fase de la metodologı́a VNS se
16: vr ← U PDATE L AYER(CLR , CLL , α) centra en diversificar la búsqueda.
17: R′ ← R ∪ {vr } Dada una vecindad k, el método Shake propuesto en
18: vl ← U PDATE L AYER(CLL , CLR , α) este trabajo elimina k elementos al azar de cada capa. La
19: L′ ← L ∪ {vl } solución resultante es factible pero el valor de función objetivo
20: end while siempre es menor, ya que se reduce el número de vértices
21: return B = (L′ , R′ , {(v, u) v ∈ L′ ∧ u ∈ R′ }) seleccionados.
Teniendo en cuenta las restricciones del problema, si un
El método empieza por seleccionar un vértice al azar de la vértice v se añade a la solución, entonces todos los vértices
capa L (paso 11), insertarlo la capa correspondiente L′ de la en la capa opuesta que no sean adyacentes a v no pueden
solución (paso 12). Entonces, se crean dos listas de candidatos ser añadidos en iteraciones futuras, ya que en dicho caso
(CL), una por cada capa del grafo (paso 13-14). Obsérvese que la solución obtenida no serı́a un biclique. Sin embargo,
ambas listas de candidatos solo contienen aquellos vértices quitar algunos vértices con el método Shake puede permitir
de cada capa que pueden ser seleccionados manteniendo eventualmente que nuevos vértices sean añadidos a la solución
547
(i.e., aquellos que no eran adyacentes a ninguno de los vértices probabilidades p = {85 %, 90 %, 95 %} de que una arista
eliminados). exista en el grafo. Se trata de grafos densamente poblados en
Por lo tanto, proponemos una etapa de reconstrucción que los que falta un porcentaje bajo de aristas para que lleguen a
se ejecuta después de cada Shake. En concreto, la fase de ser completos. Este conjunto de datos se utiliza para comparar
reconstrucción intenta añadir nuevos vértices a la solución, el rendimiento de nuestro algoritmo con el estado del arte. A
aquellos que no eran candidatos factibles antes de ejecutar el parte de las instancias utilizadas para presentar sus resultados,
método Shake. los autores de [20] también facilitan otras instancias generadas
La etapa de reconstrucción siempre mejora o, al menos, con los mismos parámetros, no utilizadas en su artı́culo, y
mantiene la calidad de la solución obtenida tras la llamada que en este trabajo se utilizan para ajustar los parámetros del
al método Shake. Obsérvese que la solución reconstruida solo algoritmo.
supera a la inicial si y solo si la etapa de reconstrucción es En estos experimentos presentamos los siguientes datos: el
capaz de insertar más de k vértices en cada capa. tamaño promedio del biclique balanceado más grande obtenido
La naturaleza aleatoria de este procedimiento hace que sea para el conjunto de datos, Tamaño; el tiempo promedio
difı́cil obtener mejoras en la calidad de la solución. Para de ejecución por instancia, Tiempo (s); el porcentaje de
mitigar este efecto se proponen cuatro variantes del método desviación promedio respecto de la mejor solución obtenido
Shake. Estas se diferencian en cómo se realizan las fases de por instancia, %Desv.; y el número de veces que se encuentra
destrucción y reconstrucción de la solución, cada fase puede la mejor solución para cada instancia, #Mejores.
ser respectivamente aleatoria (R) o voraz (G), con lo que
obtenemos cuatro variantes: RR, RG, GR, GG. La Tabla I III-A. Experimentos preliminares
muestra el comportamiento voraz o aleatorio de cada una de Los experimentos presentados a continuación fueron
las variantes propuestas. Por ejemplo, la variante de Shake GR diseñados para elegir la mejor variante para el algoritmo
realiza una destrucción voraz con una reconstrucción aleatoria. propuesto. Se utilizó un grupo reducido de 6 instancias
representativas, una por cada combinación posible de
Variante Destrucción Reconstrucción parámetros, seleccionadas a partir de las excluidas del
RR Aleatoria Aleatoria experimento final para no sobreajustar el algoritmo. Estas
RG Aleatoria Voraz instancias forman parte de las facilitadas por [20] y han sido
GR Voraz Aleatoria
GG Voraz Voraz generadas al azar con los mismos parámetros n (tamaño) y
p (probabilidad) que aquellas utilizadas en la comparación de
Tabla I: Enumeración de las cuatro variantes de Shake resultados. En el primer experimento se comprueba cuál es
propuestas. el mejor valor de α para el procedimiento constructivo, en
el segundo se comparan cuatro variantes del procedimiento
En la fase de reconstrucción se utiliza el mismo método Shake, y finalmente se examina cuál es el valor más
constructivo que genera la solución inicial, pero modificado conveniente para la vecindad máxima a explorar. Todos los
para ser totalmente aleatorio (α = 0) o totalmente voraz experimentos se han ejecutado iterativamente hasta alcanzar
(α = 1). En la fase de destrucción se plantea un algoritmo, el limite de tiempo establecido, un número de segundos igual
con una estructura similar a la del método constructivo, que al tamaño n de la instancia.
elimina vértices de una solución factible. Para que sea una
destrucción voraz es necesario definir una nueva función α Tamaño Tiempo (s) %Desv. #Mejores
heurı́stica g ′ que puntúe los vértices a eliminar. El valor de 0.25 46.33 375.00 11.57 0
esta función heurı́stica para cada vértice v ∈ S se calculará 0.50 48.33 375.00 7.96 0
0.75 52.00 375.00 0.96 2
por el número de vertices en la otra capa con los que no está rnd 52.50 375.00 0.00 6
conectados.
Tabla II: Comparación del algoritmo constructivo con distintos
III. R ESULTADOS EXPERIMENTALES valores del parámetro α.
En esta sección se presentan dos grupos de experimentos:
los experimentos preliminares, realizados para ajustar los En el primer experimento ejecutamos iterativamente
parámetros del algoritmo propuesto; y el experimento final, únicamente el procedimiento constructivo hasta que se alcanza
diseñado para evaluar la calidad de nuestra propuesta el lı́mite de tiempo para cada instancia y se guarda la
algorı́tmica y compararla con el algoritmo previo de la mejor solución alcanzada en dicho tiempo. Se consideran los
literatura. Todos los algoritmos fueron implementados en Java siguientes valores posibles para el parámetro alfa α = {0.25,
y se ejecutaron en un sistema con una CPU Intel i7 (7660U) 0.50, 0.75,random}. En particular, el valor “random” significa
y 8 GB de RAM, en la máquina virtual de Java 8. que en cada iteración se elige un alfa distinto de forma
Se ha utilizado el mismo conjunto de datos presentado en aleatoria. Los resultados en la Tabla II muestran que los
[20], facilitado por dichos autores, que consiste en 30 grafos mejores resultados se obtienen cuando se elige aleatoriamente
bipartitos balanceados con tamaños n = {250, 500}, donde n el parámetro alfa en cada iteración. En este caso, se obtiene un
representa el número de vértices en cada capa; y con diferentes biclique balanceado de tamaño 52.50 en promedio y, además,
548
alcanza la mejor solución hallada en este experimento en todas del tamaño (n) de las instancias. En la Tabla V se puede ver
las 6 instancias. Por consiguiente, tanto en los experimentos que nuestros resultados son muy cercanos al algoritmo previo
sucesivos como en el final, se utilizará este valor de alfa para respecto a la calidad de las soluciones obtenidas, está a menos
el constructivo inicial que forma parte de nuestra propuesta de de un vértice de distancia en promedio, pero tiene un tiempo
RVNS. de ejecución que se aproxima a la mitad del tiempo requerido
por el algoritmo memético.
Shake Tamaño Tiempo (s) %Desv. #Mejores
RR 48.83 375.00 10.21 0 Tamaño Tiempo (s) %Desv. #Mejores
RG 54.33 375.00 0.00 6
GR 49.50 375.00 8.95 0 EA/SM 55.10 2075.11 0.04 29
GG 53.17 375.00 2.37 1 RVNS 54.33 1125.00 1.71 10
Tabla III: Comparación del algoritmo RVNS con las cuatro Tabla V: Comparación del RVNS con el algoritmo evolutivo
variantes del método Shake. Se ha fijado la vecindad máxima EA/SM encontrado en la literatura.
en Kmax = 50 %.
IV. C ONCLUSIONES
El siguiente experimento está diseñado para elegir la mejor
variante del método Shake. Se ha fijado la vecindad máxima En este trabajo se ha propuesto el uso de la metodologı́a
del algoritmo RVNS en Kmax = 50 % y se comparan las RVNS para buscar soluciones eficientes para el MBBP.
cuatro variantes propuestas para el método Shake. En este Se ha constatado que en este problema es difı́cil plantear
experimento se observa en la Tabla III que la variante RG, es una búsqueda local efectiva y debido a ello se ha elegido
decir, destrucción aleatoria con reconstrucción voraz, alcanza una variante de VNS que explora aleatoriamente una
los mejores resultados. Esta obtiene un biclique balanceado vecindad predefinida. Se ha conseguido plantear un algoritmo
con un tamaño de 54.33 vértices en promedio y, además, competitivo en calidad respecto al actual estado del arte que
también obtiene las 6 mejores soluciones de este experimento. utiliza aproximadamente la mitad del tiempo que este, por lo
que todavı́a es un enfoque prometedor que permite explorar en
Kmax Tamaño Tiempo (s) %Desv. #Mejores un futuro otras técnicas complementarias para mejorar estos
10 % 53.17 375.00 2.37 1 resultados.
20 % 53.33 375.00 1.85 2
30 % 53.83 375.00 0.98 3 R EFERENCIAS
40 % 53.83 375.00 0.87 3
50 % 54.33 375.00 0.00 6 [1] M. R. Garey and D. S. Johnson, Computers and Intractability: A Guide
to the Theory of NP-Completeness. New York: Freeman, 1979.
Tabla IV: Comparación del algoritmo RVNS para diferentes [2] D. S. Johnson, “The np-completeness column: An ongoing guide.” J.
valores de la vecindad máxima Kmax . Algorithms, vol. 13, no. 3, pp. 502–524, 1992.
[3] N. Alon, R. A. Duke, H. Lefmann, V. Rödl, and R. Yuster, “The
algorithmic aspects of the regularity lemma,” J. Algorithms, vol. 16,
En el último experimento preliminar queremos evaluar no. 1, pp. 80–109, 1994.
la influencia que tiene el tamaño máximo de la vecindad [4] M. Dawande, P. Keskinocak, J. M. Swaminathan, and S. Tayur, “On
bipartite and multipartite clique problems,” Journal of Algorithms,
kmax sobre el algoritmo propuesto. Se utiliza la mejor vol. 41, no. 2, pp. 388 – 403, 2001.
configuración hallada en los experimentos anteriores, es decir, [5] U. Feige and S. Kogan, “Hardness of approximation of the balanced
una construcción incial con un alfa aleatorio en cada iteración complete bipartite subgraph problem,” Tech. Rep., 2004.
[6] Y. Cheng and G. M. Church, “Biclustering of expression data,” in Proc.
y el método Shake que realiza primero una destrucción of the 8th ISMB. AAAI Press, 2000, pp. 93–103.
aleatoria y luego una reconstrucción voraz (RG); y se ejecuta [7] A. Tanay, R. Sharan, and R. Shamir, “Discovering statistically significant
el algoritmo con diferentes tamaños para la vecindad máxima biclusters in gene expression data.” in ISMB, 2002, pp. 136–144.
[8] H. Wang, W. W. 0010, J. Yang, and P. S. Yu, “Clustering by pattern
Kmax = {10 %, 20 %, 30 %, 40 %, 50 %}. En este experimento similarity in large data sets.” in SIGMOD Conference, M. J. Franklin,
se puede ver que, en general, expandir el tamaño de la B. Moon, and A. Ailamaki, Eds. ACM, 2002, pp. 394–405.
vecindad permite que el algoritmo alcance mejores soluciones, [9] M. J. Sanderson, A. C. Driskell, R. H. Ree, O. Eulenstein, and
S. Langley, “Obtaining maximal concatenated phylogenetic data sets
disminuyendo en consecuencia la desviación. Se toma como from large sequence databases,” Molecular Biology and Evolution,
mejor vecindad Kmax = 50 % con la que se han obtenido los vol. 20, no. 7, pp. 1036–1042, 2003.
mejores resultados de este experimento. [10] E. J. Chesler and M. A. Langston, “Combinatorial genetic regulatory
network analysis tools for high throughput transcriptomic data.” in
Systems Biology and Regulatory Genomics, ser. Lecture Notes in
III-B. Experimento final Computer Science, E. Eskin, T. Ideker, B. J. Raphael, and C. T.
En el experimento final se presenta una comparación con Workman, Eds., vol. 4023. Springer, 2005, pp. 150–165.
[11] E. J. Baker, J. J. Jay, V. M. Philip, Y. Zhang, Z. Li, R. Kirova, M. A.
el algoritmo memético [20] encontrado en la literatura previa. Langston, and E. J. Chesler, “Ontological discovery environment: A
La comparación se realiza utilizando el mismo conjunto de 30 system for integrating gene–phenotype associations,” Genomics, vol. 94,
instancias que se han utilizado en dicho trabajo. El algoritmo no. 6, pp. 377 – 387, 2009.
[12] R. A. Mushlin, A. Kershenbaum, S. T. Gallagher, and T. R. Rebbeck,
RVNS se ejecuta por iteraciones hasta que se llega a un tiempo “A graph-theoretical approach for pattern discovery in epidemiological
lı́mite, en este caso es un tiempo en segundos igual al triple research.” IBM Systems Journal, vol. 46, no. 1, pp. 135–150, 2007.
549
[13] S. S. Ravi and E. L. Lloyd, “The complexity of near-optimal

programmable logic array folding.” SIAM J. Comput., vol. 17, no. 4,
pp. 696–710, 1988.
[14] M. B. Tahoori, “Application-independent defect tolerance of
reconfigurable nanoarchitectures,” JETC, vol. 2, no. 3, pp. 197–
218, 2006.
[15] A. A. Al-Yamani, S. Ramsundar, and D. K. Pradhan, “A defect tolerance
scheme for nanotechnology circuits.” IEEE Trans. on Circuits and
Systems, vol. 54-I, no. 11, pp. 2402–2409, 2007.
[16] M. B. Tahoori, “Low-overhead defect tolerance in crossbar
nanoarchitectures.” JETC, vol. 5, no. 2, 2009.
[17] M. Yannakakis, “Node-deletion problems on bipartite graphs.” SIAM J.
Comput., vol. 10, no. 2, pp. 310–327, 1981.
[18] B. Yuan and B. Li, “A low time complexity defect-tolerance algorithm
for nanoelectronic crossbar,” in International Conference on Information
Science and Technology, 2011, pp. 143–148.
[19] ——, “A fast extraction algorithm for defect-free subcrossbar in
nanoelectronic crossbar,” ACM Journal on Emerging Technologies in
Computing Systems (JETC), vol. 10, no. 3, p. 25, 2014.
[20] B. Yuan, B. Li, H. Chen, and X. Yao, “A new evolutionary algorithm
with structure mutation for the maximum balanced biclique problem,”
IEEE Trans. Cybernetics, vol. 45, no. 5, pp. 1040–1053, 2015.
[21] P. Hansen and N. Mladenović, Variable Neighborhood Search. Boston,
MA: Springer US, 2014, pp. 313–337.
[22] T. A. Feo and M. G. Resende, “Greedy randomized adaptive search
procedures,” Journal of global optimization, vol. 6, no. 2, pp. 109–133,
1995.
550
Búsqueda de Vecindad Variable para el

problema de la agrupación y recogida de
pedidos online en almacenes logísticos
Sergio Gil-Borrás, Abraham Duarte, Antonio Alonso-Ayuso y Eduardo G. Pardo
almacenamiento y la recogida de las mismas cuando se recibe

Resumen—En este trabajo se presenta la adaptación de un un pedido. En este último contexto, es donde se enmarca el
algoritmo de Búsqueda de Vecindad Variable Básica al problema presente trabajo. En concreto, se estudia cómo hacer eficiente
de agrupación y recogida de pedidos online en almacenes la recogida de pedidos online que llegan al almacén. Existen
logísticos. La recogida de pedidos en almacenes se ha convertido, diferentes variantes de este problema, en función de factores
en la actualidad, en una importante tarea operacional como parte
tales como: el número de personas recogiendo los pedidos
de la cadena de suministro. En particular, debido a los costes
derivados de esta actividad se ha tornado necesario tratar de simultáneamente; si los pedidos tienen o no fecha límite de
optimizar el proceso de recogida, de modo que los productos entrega; e incluso en función de la estructura concreta de los
asociados a los pedidos sean entregados de forma eficiente. Existen almacenes considerados (varios bloques de estanterías, número
diferentes políticas de recogida, entre las que destacan: (i) la de pasillos paralelos, existencia de pasillos diagonales, etc.).
recogida de pedidos directa, es decir, cada pedido que llega al
almacén es recogido directamente por un trabajador en orden de El problema que se aborda aquí es el denominado “Online
llegada; y (ii) la recogida por lotes, en la que varios pedidos son Order Batching Problem” (OOBP). Este problema consiste en
agrupados en un mismo lote y asignados a un trabajador, para ser determinar el orden en el que se recogen los pedidos que van
recogidos simultáneamente. En este trabajo se aborda una
llegando al almacén de manera constante, así como la ruta
variante del problema de recogida de pedidos, basada en la política
de agrupación en lotes. En concreto, la variante abordada tiene en necesaria para recogerlos. Para ello, se conforman una serie de
consideración que los pedidos llegan online al almacén, es decir, lotes de recogida, formados por un conjunto de pedidos, con un
que no están todos disponibles al comienzo del turno de recogida, tamaño máximo por lote. En este caso, cada uno de los lotes
sino que van llegando a medida que la jornada de trabajo avanza. será recogido por un único trabajador. El objetivo consiste en
La función objetivo consiste en minimizar el tiempo máximo que minimizar el tiempo máximo que transcurre desde que un
un pedido permanece en el sistema. pedido entra en el almacén hasta que este ha sido procesado
para su envío. Este tiempo es comúnmente denominado
Palabras clave— Búsqueda de Vecindad Variable, Agrupación en “makespan” en la literatura asociada a los procesos industriales.
lotes, Heurísticas, Online Order Batching Problem. El tiempo en el que un pedido está en el almacén es, en realidad,
la suma de dos tiempos. Por un lado, el tiempo de procesado del
I. INTRODUCIÓN lote (compuesto a su vez por lo que tarda en generarse el lote y
E n los últimos años las compras a través de Internet se han

popularizado en la sociedad. Derivado de esto, ha surgido
la necesidad de mejorar los procesos que se producen
por el tiempo de espera hasta que este lote pase a ser recogido).
Y, por otro lado, el tiempo que se tarda en recoger todo el lote
por los pasillos del almacén y llevarse a la zona de entrega. Para
dentro de los almacenes logísticos, para llevar a cabo una rápida este último proceso, la recogida de artículos, se emplean
y eficaz gestión de los pedidos, así como una reducción de algoritmos que establecen una ruta dentro del almacén. En
costes de procesamiento de los mismos. Esto ha motivado el concreto, en este trabajo se han repasado tres de los algoritmos
estudio de diferentes problemas que se producen dentro de este heurísticos más conocidos en la literatura, como son S-Shape
contexto, tan demandado por empresas de distribución. Entre [1], Largest-Gap [2] y Combined [3] [4], que se repasarán
los problemas que surgen, se pueden encontrar, entre otros, detalladamente en la Sección III.
problemas relacionados con la recepción de mercancías, su
En este trabajo se han empleado almacenes con dos pasillos
trasversales, uno superior y otro inferior, y un conjunto variable
Sergio Gil-Borrás, Universidad Politécnica de Madrid. Ctra. Valencia, Km. de pasillos paralelos que los unen, donde se colocan los
7, 28031, Madrid, España, (e-mail: [email protected]). productos en columnas de igual tamaño, a ambos lados de cada
Abraham Duarte, Universidad Rey Juan Carlos. C/Tulipán s/n, 28933,
Madrid, España, (e-mail: [email protected]). pasillo paralelo. El número de pasillos y las dimensiones de la
Antonio Alonso-Ayuso, Universidad Rey Juan Carlos. C/Tulipán s/n, sala, así como de las estanterías, varía según la instancia
28933, Madrid, España, (e-mail: [email protected]). seleccionada. En la Fig. 1 se puede ver un ejemplo de este tipo
Eduardo G. Pardo, Universidad Politécnica de Madrid. Ctra. Valencia, Km. de almacén con dos pasillos transversales y cinco pasillos
7, 28031, Madrid, España, (e-mail: [email protected]).
paralelos. Cada pasillo paralelo tiene nueve posiciones de
recogida a cada uno de los lados, representadas por pequeños
551
cuadrados. El almacén mostrado tiene, por lo tanto, un total de Sebastián Henn en su artículo del 2012, si bien no se realiza una
90 posiciones de recogida. Se considera que en cada posición comparación directa entre ambos trabajos.
de recogida se almacena únicamente un posible producto. No
se consideran, por lo tanto, múltiples alturas en cada posición Sobre otras variantes del problema, íntimamente relacionadas,
de recogida. En el pasillo transversal inferior se sitúa, además, destaca la publicación en estos últimos años del trabajo
el depósito, que será el punto de partida para las rutas de presentado por Rubrico en [11] donde la recogida de los
recogida, así como el punto de entrega de los productos pedidos se hace por múltiples trabajadores (habitualmente
recogidos en cada ruta. Este depósito aparece posicionado en el denominados pickers) en lugar de únicamente por uno, tal y
centro del pasillo, si bien existen instancias en las que el como se realiza en el problema tratado en este documento. En
depósito se encuentra en uno de los extremos del mismo. este caso, Rubrico propone dos variaciones de un “Incremental
static scheduling scheme algorithm”, que los autores
denominan “Steepest descent insertion” y “On multistage
rescheduling”. En este caso, los autores utilizan un conjunto de
instancias generadas por ellos mismos, y se compara con el
“G66 Listing algorithm”, el cual es una extensión del algoritmo
“Graham’s list scheduling algorithm” [12]. También se realiza
una comparación con el denominado “Aspnes’93 algorithm”
[13].
Otra variante interesante del problema, publicada en 2016 [14],

consiste en añadir una restricción de fecha/hora límite de
entrega a cada pedido y, además, la recogida de los pedidos
también se realiza con múltiples pickers. El algoritmo que los
autores proponen es un algoritmo basado en reglas para
preprocesar los pedidos antes de usar el algoritmo de
Fig. 1 – Estructura del almacén agrupamiento de pedidos en lotes. Con esta estrategia, los
autores consiguieron mejorar los resultados. En su caso, los
El resto del artículo está estructurado de la siguiente forma: en algoritmos que usan para compararse son los “Seed algorithms”
la Sección II se repasa el estado del arte del problema abordado. [15] y el “Recalculation saving algorithms” [16]. Las instancias
En la Sección III se describen los algoritmos de enrutamiento utilizadas en este artículo siguen siendo las mismas instancias
más relevantes de la literatura. En la Sección IV se presentan que introdujo Sebastián Henn en [5].
los algoritmos heurísticos de agrupación propuestos, basados en
la metodología de Búsqueda de Vecindad Variable. En la
III. ENRUTAMIENTO
Sección V se muestran algunos resultados preliminares
obtenidos y los conjuntos de instancias empleados. Por último, Los algoritmos de enrutamiento son los encargados de
en la Sección VI se exponen las conclusiones de este trabajo. decidir el camino que seguirá el trabajador por el almacén para
recoger todos los pedidos incluidos en un mismo lote. El
II. ESTADO DEL ARTE camino comenzará en el depósito que está marcado en las
Entre los últimos artículos publicados que se recogen en la siguientes figuras como “D” (del término en inglés depot). El
literatura, relativos a esta familia de problemas de optimización, camino finaliza en el mismo depósito, una vez que se han
destaca el artículo de S. Henn en 2012 [5], donde los autores recogido todos los elementos de un mismo lote. Al igual que
proponen un algoritmo basado en la metaheurística “Iterated otros problemas de enrutamiento, este problema de
Local Search” (ILS) [6] para abordar el problema. Este optimización ha sido ampliamente trabajado con anterioridad,
algoritmo está basado en el principio de búsqueda local y, en existiendo en la literatura algoritmos heurísticos,
este artículo, se compara el algoritmo propuesto con las técnicas metaheurísticos y exactos para esta variante concreta. No
heurísticas clásicas de “First Come, First Served” (FCFS) y el obstante, los algoritmos de enrutamiento elegidos para este
método de “Clarke and Wright” (C&W) [7]. trabajo, y que se repasan a continuación, son algoritmos
heurísticos. Estos algoritmos, aunque generan soluciones con
Más recientemente, en el año 2015, Ricardo Pérez-Rodríguez recorridos ligeramente más largos que los algoritmos exactos o
publicó un artículo [8] resolviendo también esta variante del que los algoritmos metaheurísticos, son más rápidos a la hora
problema. En este artículo, los autores proponen un algoritmo de computar una solución. Además, en términos generales, el
basado en la estimación continua de la distribución recorrido que ofrecen suele ser de alta calidad y más
(denominado OBCEDA por sus siglas en inglés) que a su vez comprensible por parte de los empleados del almacén.
está basado en los bien conocidos Algoritmos de la Estimación
de la Distribución (EDA) [9]. En este trabajo, se compara la
En la Fig. 2 se puede ver una ilustración de la estrategia de
propuesta realizada con un algoritmo genético y con un
enrutamiento denominada S-Shape, también conocida en
algoritmo basado en la metaheurística “Tabu-Search” [10]. En
algunas referencias como estrategia Trasversal. Esta estrategia
este caso también se usan las mismas instancias que usa
consiste en recorrer completamente todos los pasillos paralelos
que contengan ítems que recoger. A excepción del último
552
pasillo con ítems, que dependerá de la posición del recogedor

cuando deba entrar en dicho pasillo. En el caso que se acceda a
él desde el pasillo trasversal inferior, entonces se recorrerá el
pasillo únicamente hasta llegar al último ítem a recoger del
pasillo y luego, el recogedor dará media vuelta para recorrer ese
mismo pasillo de vuelta hasta llegar de nuevo al pasillo
trasversal inferior y, posteriormente, volver al depósito para
entregar las mercancías. No obstante, en el caso de que el picker
se encuentre en el pasillo transversal superior, en el momento
de entrar en el último pasillo, entonces este se recorrerá
completamente, volviendo al pasillo transversal inferior, que
contiene el depósito, para la entrega de mercancías. En la Fig. Fig. 3 – Recorrido basado en Largest Gap1
2, están representados con color compacto negro los puntos de
recogida de los ítems de un mismo lote. En la estrategia Combined, para recorrer cada pasillo paralelo
se evalúa qué recorrido es más corto de hacer para recoger todos
los ítems de un mismo pasillo, si hacer una estrategia S-Shape
o si hacer una estrategia Largest-Gap. De este modo, a medida
que se va avanzando se toma la mejor decisión para cada
pasillo. De manera global, se puede afirmar que los resultados
obtenidos con esta estrategia son mejores que aquellos
obtenidos aplicando las anteriores estrategias expuestas de
manera independiente. En la Fig. 4, se presenta un ejemplo de
un recorrido empleando la estrategia Combined, para la misma
instancia representada en la Fig. 2 y en la Fig. 3.
Fig. 2 – Recorrido basado en S-shape1
Análogamente, en la Fig. 2, se puede ver la estrategia de

enrutamiento denominada Largest-Gap. En esta estrategia solo
se recorrerán completamente el primer y último pasillo paralelo
con ítems. El resto de pasillos paralelos solo se recorrerán, en
el caso que tenga ítems a recoger. Además, el tramo de pasillo
a recorrer será el comprendido entre el pasillo transversal del
que se parta (inferior o superior según el caso) y el denominado
“largest-gap”. Este término se utiliza para referirse al espacio
más grande que hay entre cada par de ítems consecutivos en un Fig. 4 – Recorrido basado en Combined1
mismo pasillo. Una vez alcanzado el largest-gap, el operario
encargado de la recogida debe dar media vuelta sobre sus pasos
IV. AGRUPAMIENTO
y volver al pasillo transversal del que partía. En el caso de que
quedasen ítems por recoger (que se encuentren más allá del Para abordar el problema del agrupamiento de pedidos en lotes,
largest-gap) estos serán recogidos en la ruta de vuelta desde el se propone la combinación de dos algoritmos: un algoritmo
pasillo transversal contrario. Por lo tanto, desde el pasillo constructivo voraz y una metaheurística, como método de
trasversal superior se accederá solo a recoger los ítems que se mejora de la solución inicial formada por el constructivo.
encuentran en la zona situada antes del largest-gap, en la mitad
superior de los pasillos paralelos. De manera similar, desde el El método constructivo ordena los pedidos en función del orden
pasillo trasversal inferior solo se recogerán los ítems que se de llegada y parte de un lote vacío. A continuación, toma el
encuentran entre el pasillo transversal inferior y la última primer pedido según el orden establecido y trata de añadirlo al
posición de un ítem dentro del pasillo paralelo, antes del último lote disponible (en el caso inicial, el lote vacío). Cuando
denominado largest-gap. este lote no tiene espacio suficiente crea un nuevo lote. Este
proceso se repite hasta que todos los pedidos han sido asignados
Por último, en la Fig. 3, se puede ver la estrategia denominada a un lote. En lo sucesivo se denominará a este método
Combined. En esta estrategia se combinan las técnicas de las constructivo como First-Come-First-Serve (FCFS). Se propone
dos estrategias anteriormente explicadas. también una variante de este método consistente en tratar de
añadir el siguiente pedido en el orden establecido a cada uno de
1. La Fig. 2, Fig. 3 y Fig. 4 han sido obtenidas de la página web de la
los lotes previos (no solo en el último) intentando, de ese modo,
Universidad de Rotterdam: https://www.erim.eur.nl/material- completar el espacio vacío en los lotes. A este método se le
handling-forum/research-education/tools/calc-order-picking- denominará en lo sucesivo como First-Come-First-Serve
time/what-to-do/routing-strategies/, el día 13 Julio de 2018. Completo (FCFS-Completo).
553
Además de los métodos constructivos anteriormente descritos,

se propone la utilización de un método basado en la ALGORITMO II
FUNCIÓN PRIMERAMEJORA
metaheurística Búsqueda de Vecindad Variable (VNS) [17].
VNS es un algoritmo metaheurístico que ayuda a resolver Función PrimeraMejora(x)
problemas complejos tanto de optimización combinatoria como 1: repeat
de optimización global. En concreto, partiendo de una solución 2: x' ← x;
inicial, intenta mejorarla visitando distintos vecindarios. 3: i←0;
Mediante la utilización de una búsqueda local explora, en cada 4: repeat
vecindario, las posibles soluciones prometedoras, obteniendo 5: i←i+1
un óptimo local en cada uno de ellos. 6: x←argmin{ f (x), f (xî)}, xî ∈ N(x)
7: until ( f (x) < f (xî) or i = |N(x)|)
Existen diferentes variantes dentro de la metodología VNS. En 8: until ( f (x) ≥ f (x'))
este trabajo, se ha escogido la variante denominada “Búsqueda 9: return x
de Vecindad Variable Básica” (BVNS, del inglés Basic
Variable Neighborhood Search). El algoritmo BVNS se basa El método encargado de realizar una perturbación de la solución
en tres métodos: un método consistente en una búsqueda local (denominado Shake) se utiliza para escapar del óptimo local
para alcanzar un óptimo local en un vecindario dado; un método actual mediante el movimiento a una nueva vecindad. En este
de perturbación de la solución y un método que determina si caso, el método de perturbación se basa en movimientos de
debe o no cambiarse la vecindad a explorar. En Algoritmo I se intercambio de pedidos. Es decir, se toman dos pedidos de dos
presenta el pseudocódigo del método BVNS. lotes distintos, al azar, y se intercambian, siempre y cuando al
ALGORITMO I
realizar el intercambio la solución continúe siendo factible (no
FUNCIÓN BVNS se sobrepase la capacidad de los lotes involucrados). Este
Función BVNS (x, k_max, t_max); mecanismo se aplica tantas veces como indique la variable k.
1: repeat Por último, se incluye un mecanismo para determinar si se debe
2: k ← 1; explorar una vecindad de mayor tamaño, o bien se deben
3: repeat explorar de nuevo vecindades próximas a la que se acaba de
4: x' ←Shake(x, k) /* Perturbación */; explorar. Este mecanismo se implementa en el método
5: x'' ← PrimeraMejora (x') /* Búsqueda local */; CambioVecindad, recogido en el pseudocódigo de Algoritmo
6: x← CambioVecindad (x, x'', k) III.
/* Cambio de vecindad */;
7: until k = k_max ; ALGORITMO III
FUNCIÓN CAMBIOVECINDAD
8: t ←CpuTime()
Función CambioVecindad (x, x', k)
9: until t > t_max ;
1: if f (x') < f(x) then
2: x ← x' /* Realizar un movimiento */
Cada iteración del método BVNS repite la ejecución de los tres
3: k ← 1 /* Volver a vecindad inicial */
métodos anteriormente mencionados, mientras que no se
alcance el valor máximo de k (denotado por el parámetro 4: else
k_max), que determina el máximo número de vecindades a 5: k ← k+1 /* Siguiente vecindad */
explorar. Una vez alcanzado el valor de k_max, se permite
realizar una nueva exploración completa si el tiempo máximo Tal y como se ha indicado anteriormente, los pedidos no están
de ejecución (t_max) no se ha superado. disponibles, en su totalidad, al comienzo de la jornada de
trabajo. Durante la ejecución del algoritmo los pedidos entran
El método de búsqueda local propuesto dentro del algoritmo en el sistema siguiendo una distribución uniforme. El algoritmo
BVNS se presenta en el pseudocódigo de la función BVNS se ejecuta durante un tiempo t_max, considerando, en
PrimeraMejora (ver Algoritmo II). Este método, dada una cada iteración, los pedidos que hayan llegado hasta ese
solución de partida x explora las soluciones en el vecindario de momento. Una vez alcanzado el valor de t_max, el método
x, denotado como N(x), hasta que encuentra una solución de comienza de nuevo, realizando una nueva construcción y
mejor calidad, en cuyo caso, utiliza esta nueva solución como añadiendo los nuevos pedidos que hayan llegado durante el
punto de partida para la siguiente iteración del algoritmo. El tiempo de la última ejecución de BVNS. En cada ejecución del
procedimiento se repite hasta que toda la vecindad ha sido algoritmo se devuelve la mejor solución encontrada. Cuando el
explorada. La vecindad, en el caso de esta búsqueda local, está trabajador encargado de la recogida ha terminado con un último
definida por movimientos de inserción factibles, es decir, se lote, se le asigna, de la última solución disponible, uno de los
toma un pedido de un lote y se trata de insertar en cada uno de lotes aún no recogidos. Para determinar qué lote será el
los otros lotes disponibles, realizando la inserción únicamente siguiente en recogerse se emplea un algoritmo de selección. En
si el pedido cabe en el lote. En concreto, se realizará el primer
concreto, este algoritmo, elegirá el lote que tiene un menor valor
movimiento factible que suponga una mejora en valor de la
del cociente entre el tiempo estimado que tarda en recogerse el
función objetivo de la nueva solución vecina. El procedimiento
se repite hasta que ningún movimiento mejora la solución. lote y el peso del mismo.
554
V. RESULTADOS En la Tabla I y en la Tabla II de resultados, respectivamente, se

En esta sección se describe el conjunto de instancias observa como la diferencia entre los resultados arrojados por
utilizadas para la validación de los algoritmos propuestos y se los algoritmos es muy pequeña. En concreto, se reportan en la
recogen, además, los resultados por instancia, de entre el Tabla I los valores de función objetivo por instancia, obtenidos
conjunto de instancias seleccionadas. por cada método comparado y, en la Tabla II, la desviación
obtenida respecto a la mejor solución del experimento. En este
A. Instancias caso, ILS aparece como el mejor método, siendo capaz de
obtener el mayor número de mejores soluciones y la menor
Las instancias usadas para hacer esta investigación son las
desviación. Los mejores resultados, por cada instancia, están
publicadas por Albareda-Sambola et al. [18], en 2009. Las
instancias constan de 4 tipos de almacenes rectangulares con el resaltados en negrita en las tablas.
depósito colocado en la esquina inferior izquierda o en el centro TABLA I
inferior del almacén. La distribución de los ítems en los COMPARACIÓN CON EL ESTADO DEL ARTE
almacenes de las instancias puede ser de dos tipos: ABC y TIEMPO MÁXIMO DE LOS PEDIDOS EN EL SISTEMA
aleatoria. Las distribuciones de tipo ABC dividen los productos BVNS – FCFS
Instancia ILS BVNS - FCFS
en tres categorías, situando los productos más demandados en Completo
la categoría A, y los menos demandados en las categorías B y A1_100_000 1721232 1666627 1578027
A1_100_030 1215180 2081531 2621530
C respectivamente. Una vez clasificados los productos, aquellos A1_100_060 1515669 1945930 1885316
que caen dentro de la categoría A se sitúan más próximos al A1_100_090 1099946 1409978 1443535
depot, los pertenecientes a la categoría B, se sitúan a A1_150_000 2876411 4215847 3375709
continuación y, por último, se almacenan los productos A1_150_030 1081205 1426639 1645529
A1_150_060 2651687 2855052 3770849
pertenecientes a la categoría C. Además, cada instancia tiene A1_150_090 1232818 1437467 1422996
distinto número de pedidos (50, 100, 150, 200 y 250). Las A1_200_000 5578399 2273878 1479272
instancias empleadas para el problema son una pequeña
selección de 10 instancias de entre todas las publicadas en [18].
Es importante destacar que, en este artículo no se emplean las TABLA II
instancias de tamaño 50 pedidos, ya que no generan la COMPARACIÓN CON EL ESTADO DEL ARTE
DESVIACIÓN RESPECTO A LA MEJOR SOLUCIÓN DEL EXPERIMENTO
congestión suficiente para que sistema tenga sentido. Al no
BVNS – FCFS
producirse congestión, para este tipo de instancias basta con Instancia ILS BVNS - FCFS
Completo
seguir una política de recogida First-Come-First-Serve (FCFS). A1_100_000 9,1% 5,6% 0,0%
Para hacer la experimentación presentada en este documento, A1_100_030 0,0% 71,3% 115,7%
las instancias, con origen en la versión offline del problema, han A1_100_060 0,0% 28,4% 24,4%
tenido que ser adaptadas a instancias aptas para la recepción de A1_100_090 0,0% 28,2% 31,2%
A1_150_000 0,0% 46,6% 17,4%
pedidos online, generando un sistema de entrega de paquetes A1_150_030 0,0% 31,9% 52,2%
que distribuya la llegada de los pedidos. En concreto, el proceso A1_150_060 0,0% 7,7% 42,2%
encargado de entregar los paquetes al sistema sigue una A1_150_090 0,0% 16,6% 15,4%
distribución uniforme y los pedidos son entregados en un A1_200_000 277,1% 53,7% 0,0%
horizonte temporal de 4 horas.
B. Resultados En la Tabla III, se muestran los resultados obtenidos de manera

resumida. En concreto, se presenta el promedio de desviación
Por último, se ha comparado la propuesta algorítmica con los
de las 10 instancias consideradas y la suma del número de veces
resultados obtenidos por el algoritmo del estado del arte
que un algoritmo ha encontrado el mejor valor.
“Iterated Local Search” propuesto por Henn [5] en su artículo
de 2012. La comparación se ha realizado entre dicho algoritmo TABLA III
y dos variantes del BVNS propuesto, donde se combina un COMPARACIÓN CON EL ESTADO DEL ARTE
RESULTADOS AGRUPADOS
BVNS con cada uno de los dos tipos de construcciones
BVNS – FCFS
iniciales. Un FCFS estándar y un FCFS-Completo, donde Instancia ILS BVNS - FCFS
Completo
siempre se intenta completar la capacidad del lote a la llegada Promedio 31,8% 32,2% 33,2%
de cada pedido, con independencia de que dicho lote se hubiera Número de
7 0 2
dado por lleno en la iteración anterior. El BVNS se ejecuta en mejores
iteraciones de 60 segundos, permitiendo a los algoritmos
constructivos, reconstruir la solución con los nuevos pedidos
VI. CONCLUSIONES
llegados al sistema antes de continuar con la búsqueda. Como
selector, para determinar el siguiente lote a ser recogido, se En este trabajo se ha estudiado el problema de agrupación y
emplea el criterio del lote que tiene un menor valor en el recogida de pedidos online en almacenes logísticos. Este
cociente obtenido al dividir el tiempo que tarda en recogerse el problema de optimización, consiste, por un lado, en la
lote entre el peso del mismo. agrupación en lotes de los pedidos que llegan al sistema y, por
otro, en el diseño de rutas eficientes para recoger cada lote. La
variante abordada considera que únicamente se dispone de un
555
trabajador y que los pedidos llegan al almacén de manera [5] S. Henn, «Algorithms for On-line Order Batching in an Order- Picking
online, es decir, no todos los pedidos están disponibles al Warehouse», Computers &OperationsResearch, nº 39, pp. 2549–2563,
2012.
comienzo de la jornada de trabajo, sino que van llegando a
[6] H. R. Lourenco, O. C. Martin y T. Stutzle, «Iterated Local Search:
medida que avanza el proceso de recogida.
framework and applications», Handbook on MetaHeuristics, pp. 363-
397, 2001.
Para abordar el problema se ha repasado el estado del arte de la [7] C. G. y W. J., «Scheduling of vehicles from a central depot to a number
variante online del mismo y se han descrito los métodos de of delivery points», Operations Research, vol. 4, nº 12, pp. 568-581,
routing más comunes en la literatura. A continuación, se ha 1964.
propuesto un algoritmo basado en la metodología de Búsqueda [8] R. Pérez-Rodríguez, A. Hernández-Aguirre y S. Jöns, «A continuous
de Vecindad Variable, en concreto, su versión Básica. Se ha estimation of distribution algorithm for the online order-batching
problem», Int J Adv Manuf Technol, pp. 569–588, 2015.
implementado también el algoritmo más destacado del estado
[9] P. Larrañaga y J. A. Lozano, Estimation of Distribution Algorithms a
del arte. Para validar el algoritmo propuesto se ha adaptado un New Tool for Evolutionary Computation, Boston, MA: Springer, 2002.
subconjunto de las instancias presentes en la literatura para la
[10] F. Glover, «Future paths for integer programming and links to artificial
versión offline del problema, estableciendo una distribución intelligence», Computers and Operations Research, vol. 13, nº 5, pp.
uniforme para la llegada de los pedidos al almacén, y se han 533-549, 1986.
ejecutado ambos algoritmos en la misma máquina. [11] J. Rubrico, T. Higashi, H. Tamura y J. Ota, «Online rescheduling of
multiple picking agents for warehouse management», Robotics and
Pese a ser aún un trabajo en desarrollo, los resultados obtenidos Computer Integrated Manufacturing, nº 27, pp. 62–71, 2011.
son prometedores, siendo el algoritmo propuesto competitivo [12] R. Graham, «Bounds for certain multi-processing anomalies», Bell Syst
Tech, pp. 1563–1581, 1966.
con la mejor variante en el estado del arte de la actualidad. Si
bien, el método del estado del arte, propuesto por Henn en 2012, [13] J. Aspnes, Y. Azar, F. A., S. Plotkin y O. Waarts, «On-line load balancing
with applications to machine scheduling and virtual circuit routing»,
es el mejor, en promedio, de los algoritmos estudiados. Proceedings of the 25th A C Mannual symposium on the theory of
computing, pp. 623–631, 1993.
Como trabajos futuros, en primer lugar, se plantea la posibilidad [14] J. Zhang, X. Wanga y K. Huang, «Integrated on-line scheduling of order
de mejorar el algoritmo constructivo voraz utilizado como batching and delivery under B2C e-commerce», Computers & Industrial
punto de partida inicial. Además, parece recomendable probar Engineering, nº 94, pp. 280–289, 2016.
diferentes vecindades a la propuesta en este trabajo, de modo [15] Y. C. Ho y Y. Y. Tseng, «A study on order-batching methods of order-
picking in a distribution centre with two cross-aisles», International
que se puedan conformar nuevas búsquedas locales para Journal of Production Research, vol. 44, pp. 3391-3417, 2006.
embeber dentro del esquema de Búsqueda de Vecindad
[16] R. De Koster, E. S. Van der Poort y M. Wolters, «Efficient order batching
Variable Básica. De manera similar, varias búsquedas locales methods in warehouses», International Journal of Production Research,
pueden ser utilizadas en un esquema de Búsqueda de Vecindad vol. 37, pp. 1479–1504, 1999.
Variable General. Por otro lado, las estrategias más [17] N. Mladenovic y P. Hansen, «Variable neighborhood search»,
prometedoras propuestas, pueden ser empleadas también para Computers and Operations Research, nº 24, pp. 1097–1100, 1997.
resolver otras variantes del problema tales como: disponer de [18] M. Albareda-Sambola, A. Alonso-Ayuso y E. Molina, «Variable
más de un trabajador para recoger los pedidos en el almacén; o neighborhood search for order batching in a warehouse», Asia-Pacific
Journal of Operational Research, vol. 26, nº5, pp. 655-683, 2009.
establecer una fecha/hora límite de entrega de cada pedido que
se debe cumplir para evitar penalizaciones.
AGRADECIMIENTOS
Esta investigación ha sido parcialmente financiada por el

Ministerio de Economía y Competitividad, Referencias
“TIN2015-65460-C2-2-P y MTM2015-63710-P”.
REFERENCIAS
[1] R. Hall., «Distance approximation for routing manual pickers in a

warehouse», IIE Transactions, nº 25, pp. 77–87, 1993.
[2] C. Petersen, «Routeing and storage policy interaction in order picking
operations», Decision Science institute Proceedings, nº 31, pp. 1614 -
1616, 1995.
[3] R. De Koster, E. Van der Poort y K. Roodbergen, «When to apply
optimal or heuristic routing of orderpickers, in: Advances in Distribution
Logistics», Springer , pp. 375-401, 1998.
[4] K. Roodbergen y C. Petersen, «How to improve order picking efficiency
with routing and storage policie», Progress in Material Handling
Practice, pp. 107–124, 1999.
556
Una metaheurı́stica paralela para grandes problemas

de optimización dinámica entera mixta, con
aplicaciones en la biologı́a computacional
David R Penas David Henriques Patricia González
Departamento de Estadı́stica, Análisis Instituto de Investigaciones Marinas (IIM) Grupo de Arquitectura de
matemático y Optimización, y Consejo Superior de Investigaciones Computadores (GAC)
Instituto de Matemáticas (IMAT) Cientı́ficas (CSIC) Universidade da Coruña (UDC)
Universidade de Santiago de Vigo, España Coruña, España
Compostela (USC), España
[email protected]
Ramón Doallo Julio Saez-Rodriguez Julio R Banga

Grupo de Arquitectura de Joint Research Centre for Computational Instituto de Investigaciones Marinas (IIM)
Computadores (GAC) Biomedicine (JCR-Combine) Consejo Superior de Investigaciones
Universidade da Coruña (UDC) RWTH Aachen University Cientı́ficas (CSIC)
Coruña, España Aquisgrán, Alemania Vigo, España
Abstract—Esto es un resumen de nuestro artı́culo publicado región cercana a la solución global en un tiempo de ejecución
en PLoS ONE [1] para su presentación en la Multiconferencia aceptable. Sin embargo, cuando estos problemas tienen un
CAEPIA’18 Key Works. tamaño o complejidad considerable, el costo computacional
Index Terms—Optimización MIDO-MINLP, programación
paralela, metaheurı́stica cooperativa, Scatter Search. puede llegar a ser muy alto [5], [6].
Por ello, en este trabajo se ha presentado saCeSS2 [7]: una
I. I NTRODUCCI ÓN metaheurı́stica cooperativa y auto-adaptativa con capacidad
para resolver problemas MIDO-MINLP de manera satisfac-
Muchos problemas clave dentro de la bioinformática, la toria en un tiempo de cálculo razonable.
biologı́a computacional o la biologı́a de sistemas [2], se
pueden resolver a través de formulaciones basadas en la opti- II. M ÉTODOS
mización matemática. Un ejemplo es el desarrollo de modelos
matemáticos dinámicos, donde se mapean comportamientos Una de las contribuciones de este trabajo es la actualización
que varı́an en el tiempo de determinados procesos biológicos, de saCeSS [8], la cual es una herramienta distribuida, coop-
como por ejemplo el de rutas metabólicas, o la regulación de erativa y auto-adaptativa del método de búsqueda dispersa,
determinados genes. en concreto del enhanced Scatter Search (eSS) [9], [10]. Ası́,
En este trabajo nos hemos centrado en los conocidos en saCeSS es un optimizador global orientado a trabajar con prob-
bioinformática como problemas de ingenierı́a inversa [3], los lemas NLP que implementa las siguientes funcionalidades:
cuales consisten en reconstruir la estructura de una red celular • Paralelización a grano fino combinando el modelo
a partir de sus datos experimentales. Este proceso puede maestro-esclavo con un modelo en islas: cada esclavo/isla
ser formulado como un problema de optimización dinámica ejecuta de manera aislada una búsqueda con eSS, y
entera mixta (MIDO), debido a las variables dependientes en cuando se encuentra una solución prometedora, se envı́a
el tiempo y al uso de loggic-ODEs [4] para mapear ciertos al maestro, el cual es el encargado de gestionar las
comportamientos en el modelo, y donde además parte de comunicaciones entre las diferentes islas, evitando ası́ un
las variables de decisión son discretas (binarias o enteras). exceso de compartición de resultados que podrı́a degradar
Adicionalmente, este tipo de optimización también pertenece la diversidad del método.
a la programación no linear entera mixta (MINLP), dando • Cooperación de soluciones basado en la calidad de la
lugar a problemas extremadamente difı́ciles de resolver debido solución: el intercambio de información entre islas solo
a que presentan no linealidad, no convexidad, mal acondi- se realiza cuando una isla encuentra una solución lo
cionamiento y multimodalidad. suficientemente buena.
Las metaheurı́sticas son una buena alternativa a tener en • Comunicaciones ası́ncronas: el protocolo de comuni-
cuenta en este contexto, ya que generalmente alcanzan una caciones diseñado es ası́ncrono, para evitar retardos y
557
esperas, haciendo que la búsqueda de soluciones de cada gran superordenador y una plataforma de Cloud pública.
isla nunca se pare. Curiosamente, los resultados muestran cómo la cooperación
• Esquema autoadaptativo: se ha implementado un mecan- de búsquedas paralelas individuales modifica las propiedades
ismo de auto-configuración de los parámetros de la sistémicas del algoritmo secuencial, logrando aceleraciones
metaheurı́stica. Cada isla comenzará el proceso de opti- superlineales en comparación con una búsqueda individual
mización con unas opciones de configuración diferentes. (por ejemplo, aceleraciones de 15 con 10 núcleos) y mejorando
A medida que la búsqueda avance, el maestro permitirá significativamente (por encima del 60%) el rendimiento con
que los esclavos que hayan aportado menos soluciones a respecto a un esquema paralelo no cooperativo. La escalabil-
la búsqueda global adquieran la configuración de aquellos idad del método también es buena (las pruebas se realizaron
que hayan sido más exitosos. usando hasta 300 núcleos). Adicionalmente, se ha obtenido
Por lo tanto, la principal aportación de este trabajo es la que la utilización de saCeSS2 en una infraestructura pública de
presentación de un nuevo método, saCeSS2, que resulta de Cloud tiene un buen rendimiento en configuraciones que usan
las modificaciones del método saCeSS original con el principal 10 núcleos, pero el rendimiento se degrada considerablemente
objetivo de resolver problemas MIDO-MINLP. Esta extensión cuando se trata de utilizar más procesadores.
de funcionalidades ha seguido tres direcciones principales: IV. C ONCLUSIONES
1) Inclusión de un solucionador local especializado en la Los resultados mostrados en este trabajo demuestran que
resolución de problemas de optimización entera mixta: saCeSS2 puede ser útil en los problemas de ingenierı́a inversa
se ha combinado el eSS con un método de programación en modelos dinámicos de complejas rutas biológicas. Además,
cuadrática, llamado Mixed-Integer Sequential Quadratic los éxitos obtenidos mediante esta herramienta pueden ser
Programming (MISQP) [11], en cada isla. fácilmente exportados a otros casos de estudios que también
2) Modificación del mecanismo de auto-adaptación con el generen problemas de optimización MIDO-MINLP a gran
objetivo de evitar estancamiento prematuro de la conver- escala, como por ejemplo la ingenierı́a metabólica, la biologı́a
gencia: en este tipo de problemas de optimización, en- sintética, o la programación de fármacos.
contrar nuevas soluciones candidatas a ser compartidas Por otro lado, desde el punto de vista computacional,
no es fácil, por lo tanto se han relajado las condiciones también se han demostrado que las estrategias de virtualición
de adaptación del método. y computación en Cloud, pueden ser una buena alternativa,
3) Implementación de nuevos mecanismo para mantener aunque presentan unas bien conocidas limitaciones debido
la diversidad durante el proceso de cooperación: se ha principalmente a sobrecargas en la compartición de recursos.
observado que en este tipo de problemas hay que ser
R EFERENCES
muy cautos durante la compartición de soluciones, ya
que una cooperación agresiva daña muy rápidamente [1] D.R. Penas, D. Henrı́ques, P. Gónzalez, R. Doallo, J. Saez-Rodriguez and
J.R. Banga, “A parallel metaheuristic for large mixed-integer dynamic
la diversidad de la isla. Por eso, cuando se realice optimization problems, with applications in computational biology”
un cambio en los parámetros de configuración de una PLoS ONE, 12(8): e0182186, 2017.
isla que no ha contribuido lo suficiente, se produce un [2] J.R. Banga, “Optimization in computational systems biology” BMC
Systems Biology, 2 (1), 47, 2008.
reinicio aleatorio de la mayorı́a de soluciones de su [3] A.F. Villaverde and J.R. Banga, “Reverse engineering and identification
población. in systems biology: strategies, perspectives and challenges” Journal of
The Royal Society Interface, 11(91), 20130505, 2014.
Otra de las contribuciones de este trabajo ha sido la [4] D. Henriques, A.F. Villaverde, M. Rocha, J. Saez-Rodriguez , J.R. Banga
extensión y generalización de la formulación considerada “Data-driven reverse engineering of signaling pathways using ensembles
por Henriques et al [4] al adoptar un enfoque genérico del of dynamic models” PLoS Computational Biology, 13(2), e1005379,
2017.
problema del control óptimo entero mixto, pero sin utilizar [5] P. Mendes and D. Kell “Non-linear optimization of biochemical path-
relajaciones o transformaciones del problema original durante ways: applications to metabolic engineering and parameter estimation”,
su resolución. Bioinformatics, 14 (10), 869–883, 1998.
[6] C.G. Moles, P. Mendes and J.R. Banga, “Parameter estimation in
biochemical pathways: a comparison of global optimization methods”,
III. R ESULTADOS Genome Research, 13 (11), 2467–2474, 2003.
[7] saCeSS2 - global mixed-integer optimization library version 2017A,
Se ha probado el método propuesto en tres casos de estudio https://zenodo.org/record/290219
de ingenierı́a inversa muy complejos relacionados con la [8] D.R. Penas, P. González, J.A. Egea, R. Doallo and J.R. Banga “Param-
señalización celular: (1) un problema que considera una vı́a de eter estimation in large-scale systems biology models: a parallel and
self-adaptive cooperative strategy”, BMC Bioinformatics, 18:52, 2017.
señalización sintética, con 84 variables de decisión continuas [9] J.A. Egea, R. Martı́, J.R. Banga, “An evolutionary method for complex-
y 34 binarias; (2) un modelo dinámico de señalización en process optimization”, Computers & Operations Research, 37(2), 315-
cáncer de hı́gado que utiliza datos de alto rendimiento, con 324, 2010.
[10] J.A. Egea, E. Balsa-Canto, MS. G. Garcı́a, J.R. Banga, “Dynamic
135 variables de decisión continuas y 109 binarias; y (3) un optimization of nonlinear processes with an enhanced scatter search
problema extremadamente difı́cil relacionado con el cáncer de method”, Industrial & Engineering Chemistry Research, 48(9), 4388–
mama, con 690 variables de decisión continuas y 138 binarias. 4401, 2009.
[11] O. Exler, K. Schittkowski, “A trust region sqp algorithm for mixed-
Se reportaron resultados computacionales obtenidos en integer nonlinear programming”, Optimization Letters, 1(3), 269—280,
diferentes infraestructuras, incluyendo un clúster local, un 2007.
558
Bioinspirados
(XIII MAEB)
MAEB 3: H EURÍSTICAS,
H IPERHEURÍSTICAS Y
M ETAHEURÍSTICAS
Genetic programming to evolve priority rules for

on-line scheduling on single machine with variable
capacity
Francisco Gil-Gala, Carlos Mencı́a, Marı́a R. Sierra, Ramiro Varela
Department of Computer Science, University of Oviedo,
Campus of Gijón, Gijón 33204, Spain
{giljavier, menciacarlos, sierramaria, ramiro}@uniovi.es
http:// www.di.uniovi.es/ iscop
Abstract—On-line scheduling is often required in a number this task is the use of hyper-heuristics, as search needs to
of real-life settings. This is the case of distributing charging be conducted in a space of heuristics rather than in a space
times for a large fleet of electric vehicles arriving stochastically of solutions to the scheduling problem. Since priority rules
to a charging station under power constraints. In this paper,
we consider a scheduling problem derived from a situation of are arithmetic expressions that can be naturally represented
this type: one machine scheduling with variable capacity and by trees, we opted to investigate a Genetic Programming (GP)
P
tardiness minimization, denoted (1, Cap(t)|| Ti ). The goal is approach, which is proposed in this paper. Experimental results
to develop new priority rules to improve the results from some indicate that GP is capable of evolving effective priority rules
classical ones as Earliest Due Date (EDD) or Apparent Tardiness P
for the (1, Cap(t)|| Ti ) problem, outperforming ATC and
Cost (ATC). To this end, we developed a Genetic Programming
(GP) approach. We conducted an experimental study showing other classical priority rules. The results also provide insights
that it is possible to evolve new efficient rules that outperform of practical interest that motivate further research.
ATC and EDD using the same problem attributes and operations. The remainder of the paper is organized as follows. Sec-
tion II reviews some GP approaches to evolve priority rules for
Index Terms—Scheduling, One machine scheduling, Priority scheduling problems. In Section III, we describe the EVCSP
Rules, Genetic Programming, Hyperheuristics, Electric Vehicle
Charging Scheduling and show how the solving procedure proposed in [6] decom-
poses an instance ofPthis problem into a number of instances
of the (1, Cap(t)|| Ti ) problem. In PSection IV, we give the
I. I NTRODUCTION
formal definition of the (1, Cap(t)|| Ti ) problem. Section V
One machine scheduling problems have attracted an ever introduces a schedule builder for this problem and describes
increasing body of research over the last decades, due to its main properties. In Section VI, we present some classical
both their usual high computational complexity as well as for priority rules used to solve the problem. Section VII describes
acting as building blocks in the development of solutions to the GP approach propose to evolve new priority rules. In
more complex scheduling problems. This paper focuses on Section VIII, we report the results of the experimental study
a problem in this class in which a number of jobs must be conducted to evaluate the proposed GP approach. Finally, in
scheduled on a single machine, whose capacity varies over Section IX we summarize the main conclusions and outline
time, with the objective of minimizing the total tardiness some ideas for future work.
objective function. This problem was introduced in [6] in the
context of scheduling the charging times of a large fleet II. E VOLVING PRIORITY RULES FOR SCHEDULING
P of PROBLEMS
Electric Vehicles (EVs), and it is denoted (1, Cap(t)|| Ti ).
Solving the Electric Vehicle Charging Scheduling Prob- The terms Dispatching Rule (DR) and Priority Rule (PR)
lem (EVCSP) tackled in [6] amounts P to solving a number are commonly used in the scheduling literature to refer to
of instances of the (1, Cap(t)|| Ti ) problem. Due to the “a simple heuristic that derives a priority index of a job
computational intractability of this problem and the tight real- from its attributes” [1]. Due to their low computational cost,
time requirements of the EVCSP, on-line scheduling repre- PRs are well suited for on-line scheduling: the job with the
sents the most
P (if not the only) suitable approach to the highest priority among those available at a given time is
(1, Cap(t)|| Ti ) problem. In [6], it is solved by means of scheduled next. In this section, we review some existing GP
the Apparent Tardiness Cost (ATC) priority rule, commonly approaches proposed to discovering dispatching or priority
used in the context of scheduling with tardiness objectives. rules for scheduling problems, such as job shop (JSSP), one
The aim of this paper is the automated development of machine or unrelated parallel machines scheduling problems,
new, efficient, priority
P rules specifically adapted to address among others. In some cases, the purpose is just to find a good
the (1, Cap(t)|| Ti ) problem. A natural way to cope with priority rule which is then embodied into a schedule builder.
561
Other works notice that a single rule may not suffice and focus
on finding sets of rules to be applied collaboratively to solve
instances with different characteristics.
Branke, Schols-Reiter and Hildeblant analyze in [1] three
representation models for priority rules for the dynamic JSSP:
expression trees commonly used in GP, Artificial Neural
Networks (ANNs) and weighted linear combination of job
properties. Their results show that expression trees evolved
by GP perform slightly better than the other approaches. Fig. 1. General structure of the charging station. (1) Three-phase electric
In [5], the authors propose evolving sets of rules that are power 400v AC, (2) lines, (3) charging points Type 2/AC IEC 62196-2
with V2G communication interface ISO 15118, (4) masters, (5) server, (6)
used collaboratively to solve problems. They use GP to evolve communication Rs 485, (7) communication TCP/IP, (8) slaves, (9) active
a set of PRs for the static JSSP. They consider single and vehicles, (10) inactive vehicles.
composite dispatching rules as terminal nodes, as for example
SPT or ATC, in addition to some parameters. The rules are
used in combination with various schedule builders, as for events as EVs arrivals and sends activation/deactivation signals
example the well-known Giffler and Thompson algorithm to the charging points in accordance with a schedule.
[4]. These rules are sequenced into heuristics. To produce a Due to the EVs arrivals being not known in advance, the
solution to the problem, each rule in the heuristic is applied EVCSP is dynamic and so schedules must be computed at
in turn to schedule a single operation. different points over time. Furthermore, the physical charac-
In [8], the authors consider composite PRs for the JSSP teristics and the operating mode of the charging station impose
given by linear combinations of 16 problem features, as for some restrictions to the EVCSP that make it hard to solve. In
example total remaining work for a job or total idle time for particular, the contracted power is limited and so there is a
all machines. The weights in the linear function are learned maximum load in each line. Besides, the load in the three
from a set of optimal solutions obtained by a MILP solver. lines must be similar to avoid an excessive imbalance among
Preference and imitation learning were used for this purpose. the three phases. Here, we assume two simplifications of the
In [13], GP is used to learn DRs for the Order Accep- model: (1) the contracted power is constant over time, and
tance and Scheduling problem (OAS) directly from optimal (2) the EVs charge at constant rate in the so called Mode
scheduling decisions. Instead of evolving just a single rule, a 1 in accordance with the regulation UNE-EN 61851-1 [7].
set of rules is evolved that is used in a Forward Construction Therefore, there is a maximum number N of EVs that can be
Heuristic (FCH): at each step the rule that produces the best charging in each line simultaneously.
local improvement is applied. One of the novelties of this Figure 2 shows a feasible schedule for the situation rep-
model is that the fitness of a rule depends on how well the rule resented in Figure 1; dark bars represent the EVs that are
performs at each decision point (i.e., whether or not it takes charging at time Tk and light bars represent EVs that are
the optimal decision) rather than the final objective values of scheduled at a later time. In this example, we consider that
the schedule. the maximum number of active EVs in a line is 4 and that the
In [3], the authors consider on-line scheduling for multiple maximum difference in the number of active EVs in every two
unrelated parallel machines. They also propose evolving new lines is 2. For these reasons, none of the tasks 12 and 13 can
priority rules with GP, incorporating some enhancements as be scheduled at Tk because if some of them were scheduled
dimension awareness to guarantee semantically correct rules at Tk , lines 2 and 3 would be imbalanced after completion of
and some GP variant as gene expression. task 8, as there would be 4 EVs charging in line 2 and only
In [2], PRs are evolved by GP for the Resource Constrained one (number 9) charging in line 3, so exceeding the maximum
Project Scheduling Problem (RCPSP) that outperform many of difference of 2. The schedule built at Tk allows the EVs in
the existing ones for this problem. the system to complete their charging periods without violating
P the constraints of the system. However, if new EVs arrive the
III. W HERE THE (1, Cap(t)|| Ti ) PROBLEM COMES FROM charging station after Tk , a new schedule must be built to
P
As pointed out, the (1, Cap(t)|| Ti ) comes from the EV accommodate them.
Charging Scheduling Problem (EVCSP) considered in [6]. In To solve the EVCSP, in [6] the authors proposed an algo-
turn, the EVCSP is motivated by the charging station designed rithm that considers at each scheduling time Tk the active EVs
in [15] to be installed in a community park where each user in each line (which cannot be rescheduled), the demanding
has its own space. Figure 1 shows the general structure and EVs (which have not yet started to charge), the maximum
the main components of this charging station. Each space has number of active EVs in a line, N , and a profile of maximum
a charging point which is connected to one of the three lines load in each line Nimax (t), i = 1, 2, 3, which is iteratively
of a three phase feeder. The system is controlled by a central adapted to keep the imbalance among the lines under control.
server and a number of masters and slaves. Each slave takes The objective is to schedule all the EVs in the three lines
control of two charging points and each master controls up such that all the constraints are satisfied and the total tardiness,
to eight slaves in the same line. The control system registers i.e., the delay w.r.t. to the times the users want to take their
562
(a) Non left-shifted schedule
Fig. 2. A feasible schedule for the problem in Figure 1. Tasks 1 - 10 are the
active EVs at time Tk in the lines 1, 2 and 3 respectively, while tasks 10 - 13 (b) Left-shifted schedule
correspond to inactive EVs in the lines 2 and 3, which could be rescheduled P
if it were neccesary to accomodate new EVs arriving after Tk . Fig. 4. Two feasible schedules for an instance of the (1, Cap(t)|| Ti )
problem with 7 jobs and a machine with capacity varying between 2 and 5.
capacity of the machine; i.e.,

X(t) ≤ Cap(t). (1)
ii. The processing of jobs on the machine cannot be pre-
empted; i.e.,
Ci = sti + pi , (2)
where Ci is the completion time of job i.
Fig. 3. Definition of the capacity of the machine Cap(t) from the maximum The objective function is the total tardiness, defined as:
profile Njmax (t) and the active EVs at time Tk . X
max(0, Ci − di ) (3)
i=1,...,n
EVs away, is minimized. If two of the obtained schedules are
which should be minimized.
imbalanced at some time point, some of the maximum profiles
Figure 4 shows an example of two feasible schedules for
Ni (t) must be recalculated and a new schedule obtained for
a problem with 7 jobs; the capacity of the machine varies
the line i. The details of this process are given in [6].
between 2 and 5 over time. Due dates are not represented
Therefore, scheduling the EVs in each line, subject to the
for the sake of clarity. As we can observe, in both schedules
maximum load and taking into account the active EVs, may
X(t) ≤ Cap(t) for all t ≥ 0.
be viewed as the problem of scheduling a set of jobs on a
One particular case of this problem is when the capacity of
machine with variable capacity over time. The calculation
the machine is constant over time. This is
Pthe parallel identical
of the capacity of the machine from the active EVs and
machines problem [10], denoted (P || TP i ), which is NP-
the maximum load profile is illustrated in Figure 3. In this
hard. Thus, it follows that the (1, Cap(t)|| Ti ) problem is
example, we consider that at the scheduling time Tk there are
NP-hard as well.
three EVs charging in line j as they were scheduled before
Tk , and that the maximum load of line j, Njmax (t), undergone V. S CHEDULE B UILDER
two adjustments due to lower load in the other two lines. So, Schedule builders constitute an essential component for
the capacity to accommodate new charging EVs, Cap(t), for designing efficient scheduling algorithms. Also known as
t ≥ Tk , is variable as shown in the upper part of the figure. schedule generation schemes, these methods provide a way for
computing and enumerating a subset of the feasible schedules,
IV. P ROBLEM D EFINITION
P thus enabling the definition of a search space to look for
The (1, Cap(t)|| Ti ) problem may be defined as follows. solutions to the problem. We use here the schedule builder
We are given a number of n jobs {1, . . . , n}, all of them proposed in [12], which produces left-shifted schedules, in
available at time t = 0, which have to be scheduled on a which no job can be scheduled earlier without changing the
machine whose capacity varies over time, such that Cap(t) ≥ starting time of some other job. Figure 4 shows two feasible
0, t ≥ 0, is the capacity of the machine in the interval [t, t+1). schedules for a problem instance with 7 jobs, one is not left-
Job i has duration pi and due date di . The goal is to allocate shifted (a), while the other one is left-shifted (b).
starting times sti , 1 ≤ i ≤ n to the jobs on the machine such The schedule builder is depicted in Algorithm 1; it maintains
that the following constraints are satisfied: a set U S with the unscheduled jobs, as well as the consumed
i. At any time t ≥ 0 the number of jobs that are processed capacity X(t) due to the jobs scheduled so far. U S is
in parallel on the machine, X(t), cannot exceed the initialized with all the jobs. In each iteration, the algorithm
563
Algorithm 1 Schedule Builder TABLE I
P
Data: A (1, Cap(t)|| Ti ) problem instance P. S UMMARY OF RESULTS FROM [12]. AVERAGE TOTAL TARDINESS .
Result: A feasible schedule S for P.
U S ← {1, 2, ..., n}; ATC GA
X(t) ← 0; ∀t ≥ 0;
n EDD SPT 0.25 0.5 0.75 1.0 Best Avg Time(s)
while U S 6= ∅ do
γ(α) = min{t′ |∃u ∈ U S; X(t) < Cap(t), t′ ≤ t < t′ + pu }; 15 8.28 14.03 7.35 7.17 7.27 7.50 6.53 6.53 13.13
U S ∗ = {u ∈ U S|X(t) < Cap(t), γ(α) ≤ t < γ(α) + pu }; 30 26.56 55.84 19.36 18.93 18.81 19.09 17.73 17.76 21.49
Non-deterministically pick job u ∈ U S ∗ ; 45 46.52 137.74 36.25 36.20 35.83 36.75 33.31 33.45 30.22
Assign stu = γ(α); 60 131.31 262.54 90.59 89.86 89.03 89.23 86.84 87.19 38.48
Update X(t) ← X(t) + 1; ∀t with stu ≤ t < stu + pu ; Avg 53.17 117.93 38.39 38.04 37.74 38.14 36.10 36.23 25.83
U S ← U S − {u};
end
return The schedule S = (st1 , st2 , ..., stn );
In Equation (4), p̄ is the average processing time of the jobs in
U S and g is a look-ahead parameter to be introduced by the
user. As we can see, the ATC rule combines the information
selects one unscheduled job among the ones that can start at exploited by SPT and EDD as the priority of a job i is in
the earliest time γ(α). inverse ratio with its duration pi and it is decreasing with the
Note that the selection of a job to be scheduled at each slack time to its due date dj − γ(α) − pj .
iteration is non-deterministic. Regardless of this, we can Table I reproduces some results reported in [12] obtained by
guarantee that the application of Algorithm 1 always results in the rules EDD, SPT and ATC with four values of the parameter
a feasible left-shifted schedule; for example, the sequence of g, and by a genetic algorithm proposed therein (GA), over a
choices (1, 3, 4, 5, 6, 7, 2) would lead to building the schedule set of 120 instances distributed in four sets having different
in Figure 4(b). Furthermore, any left-shifted schedule may be number of jobs (15, 30, 45, 60) with 30 instances each. As
obtained considering the appropriate choice in each iteration. we can see, ATC produces much better results than both EDD
In other words, the scheduler searches in the whole space of and SPT, the results of the latter being actually poor, as can
left-shifted schedules, which is dominant; i.e., it contains at be expected due to the fact that this rule does not consider
least one optimal schedule. any information related to the tardiness objective. Besides, the
The schedule builder may be instantiated by using any performance of ATC depends on the value of the parameter g;
priority rule or heuristic, as we will see in the next section. In the best value of g depending on the the size of the instances
[12] it was embedded as a decoder in a genetic algorithm. n. Furthermore, the ATC rule produces worse results than
P the GA, which of course takes much longer time than the
VI. P RIORITY RULES FOR THE (1, Cap(t)|| Ti ) priority rules. These facts lead us to formulate the following
A schedule builder, as the one shown in Algorithm 1, may hypotheses:
be used in combination with some priority rule to make the 1) The ATC rule may be outperformed by new rules having
non-deterministic choice in each iteration: the job having the a different structure or more detailed information of the
highest priority is chosen to be scheduled. This paradigm is problem domain, or just considering other parameters.
called priority scheduling, which is particularly appropriate for 2) Given a benchmark containing instances with a similar
on-line scheduling, where decisions must be made quickly. structure, there may exist priority rules that are well
In the literature there are a number
P of rules that could adapted to this particular benchmark.
be adapted to the (1, Cap(t)|| Ti ) problem. Among the
simplest ones, we may consider Earliest Due Date (EDD) VII. E VOLVING NEW PRIORITY RULES WITH G ENETIC
or Shortest Processing Time (SPT); the first one picks the P ROGRAMMING
operation with the smallest due date, while SPT selects the
From the hypotheses above, our purpose is to devise new
one with the least duration. These two rules are often used for P
dispatching rules for the (1, Cap(t)|| Ti ) problem. To this
objective functions that are non decreasing with the completion
end, we propose using hyper-heuristics, as they provide a
time of the jobs, as for example the makespan, the lateness
natural way of searching over a (sub)space of the heuristics
or even the tardiness. As they are quite simple rules, it often
that solve a given problem. As we are interested in devising
happens that they produce rather moderate results. In contrast,
some arithmetic expression, as that of the ATC rule given in
more sophisticated rules are usually able to produce (much)
Equation (4), Genetic Programming (GP) [11] is a good choice
better results as they take into account more knowledge on
as it provides a way of evolving tree structures.
the problem. This is the case of the Apparent Tardiness Cost
The first step in the design of a GP solution is selecting
(ATC) rule, which was used with success to solve some
the sets of terminal and function nodes of the candidate trees.
scheduling problems with tardiness objectives (e.g. [14], [9]);
Terminal symbols represent the elementary properties that are
with this rule, the priority of each job j ∈ U S is give by
considered relevant to establish jobs’ priorities as, for example,
Equation (4).
processing times, due dates, etc., as well as some constants.
Function symbols are the elementary arithmetic operations and

1 −max(0, dj − γ(α) − pj )
πj = exp (4) some other unary and binary functions.
pj g p̄
564
TABLE III
GP PARAMETERS ’ SETTING .
Cross., Mut., Init. pop. gen. Standard [11]

Cross. and Mutation ratio 0.8 and 0.02 resp.
Population size 500
Number of generations 500
Max. init. chrom. depth 6
Max. chromosome size 32
Elitism 1
Number of runs 30
Fig. 5. Tree representing the ATC rule.

To control the size of chromosomes, we limit the size of the
initial candidate solutions and also after crossover. In this case,
Looking at conventional rules as ATC, EDD or SPT, we if an offspring exceeded the size limit, it is discarded and the
have chosen the functional and terminal sets of symbols parents are mated again choosing different points until some
showed in Table II. The considered grammar generates any valid offspring is reached.
feasible expression in accordance with the arithmetic rules,
without any other restrictions. For this reason, we could have VIII. E XPERIMENTAL S TUDY
inconsistencies as division by 0. To dealing with that, we We have conducted an experimental study aimed at assess-
make use of the EDD rule in the following way: when a rule ing the quality of the rules obtanied by the proposed approach
produces a division by 0 for some job, we assume that this rule (GP). To this aim, we implemented a prototype in Java, and
does not decide anything for that job. Then, we consider the ran a series of experiments on a Linux cluster (Intel Xeon 2.26
job having the largest priority together with all jobs for which GHz. 128 GB RAM).
the rule did not decide and apply to these jobs the EDD rule. The experiments were carried out over a benchmark set
This way, a rule producing many divisions by 0 gets penalized of 2000 instances, generated by means of the procedure
as many decisions are taken by using EDD. Figure 5 shows introduced in [12]. Each instance is characterized by the
the tree representing the ATC rule. number of jobs (n) and the maximum capacity of the machine
We remark that the set of terminal symbols only include (M C). Given fixed n and M C, a random instance is generated
information regarding jobs, but no information about the using uniform distributions as follows (all sampled values are
machine, such as its capacity Cap(t), which is relevant in integers):
this problem. The main reason to not include it is that in 1) Each job i ∈ J = {1, ..., n} is assigned a random
a first stage we plan to analyze the extent to which it is processing time pi ∈ {1, ..., 100}.
possible to improve the conventional rules without considering 2) Once all jobs have a processing time, they Pare assigned
new information. Besides, including new terminal symbols a random due date di ∈ [pi , max(pi + 2, j∈J pj /2)].
augments the size of the search space. 3) The capacity of the machine (Cap(t)) is generated as a
unimodal function, with each constantP interval taking a
TABLE II random duration in the range [1, pj /M C]. Both the
F UNCTIONAL AND TERMINAL SETS USED TO BUILD EXPRESSION TREES .
S YMBOL “-” IS CONSIDERED IN UNARY AND BINARY VERSIONS .
initial and the final capacity of the machine is a random
integer in {1, 2}.
Function - + / * pow max min exp This procedure aims at avoiding the generation of under-
Terminal pi di γ(α) p̄ 0.00 0.01 . . . 0.99 1.0 constrained instances, which can be easily solved. All the
2000 instances considered in this experimental study have been
We used a rather conventional GP as proposed in [11] with generated with n = 60 and M C = 10.
only some small changes. We ran GP considering a training subset of 50 instances
The evaluation of chromosomes is the most time consuming to evaluate each candidate solution and used the remaining
component of the algorithm and P consists in solving a battery 1950 instances for testing. The parameters of GP are given
of instances of the (1, Cap(t)|| Ti ) problem. The fitness in Table III. These parameters were chosen from a large
of each individual being the inverse of the average cost (total set of preliminary experiments. In these experiments we ran
tardiness) of the solutions obtained. Therefore, if the instances GP 30 times and recorded the best priority rule evolved
had a similar structure, for example if their data were generated in each run. Then, we report the average results of the 30
from the same probability distributions, we could expect the rules and the results from the best and worst rules (over
GP to evolve rules well adapted to those instances. the training and test sets). These results are summarized in
The evolutionary schema used in our approach is gener- Table IV, which includes the results from EDD, ATC (with
ational, with a selection phase in which all chromosomes g ∈ {0.25, 0.5, 0.75, 1.0}) and the solutions by the genetic
are organized into pairs and tournament replacement is done algorithm from [12] (GA).
between every two parents and their two offsprings. The The results over the test set show that the best priority rule
strategy is combined with elitism. obtained in the training phase (which in this case is the second
565
TABLE IV a schedule builder guided by priority rules is able to obtain

S UMMARY OF RESULTS . AVERAGE VALUES OF THE TOTAL TARDINESS even better solutions. Therefore, we conjecture that by using
OBTAINED FOR THE TRAINING AND TEST SETS BY THE BEST RULES
EVOLVED IN EACH ONE OF THE 30 RUNS OF GP, ATC, EDD AND GA. more attributes of the problem, in particular some related to
the capacity of the machine, better rules may be evolved.
Priority Rules Train. Test. Besides, it seems clear that no single rule can be the best
Best(in training) 636.0 548.0 one in every problem instance. Therefore, it may be more
Average(30 rules) 640.4 553.1 appropriate to try to evolve sets of rules to cover different
Worst(in training) 678.0 580.0
subsets of instances, or to take decisions at different stages in
ATC(g=0.25) 660.2 565.0
ATC(g=0.50) 650.9 552.8 the schedule construction. These are some promising lines of
ATC(g=0.75) 650.0 557.1 research we plan to explore in the future.
ATC(g=1.00) 659.0 570.2
ATC(avg. 4 g-values) 655.0 561.3 ACKNOWLEDGEMENTS
EDD 833.3 695.7
This research has been supported by the Spanish Govern-
GA 616.1 520.4
ment under research project TIN2016-79190-R.
R EFERENCES
[1] Branke, J., Hildebrandt, T., Scholz-Reiter, B.: Hyper-heuristic evolution
of dispatching rules: A comparison of rule representations. Evolutionary
Computation 23(2), 249–277 (2015)
[2] Chand, S., Huynh, Q., Singh, H., Ray, T., Wagner, M.: On the use of
genetic programming to evolve priority rules for resource constrained
project scheduling problems. Information Sciences 432, 146 – 163
(2018)
[3] Durasevic, M., Jakobovi, D., Kneevi, K.: Adaptive scheduling on unre-
Fig. 6. Tree representing the best rule obtained. lated machines with genetic programming. Applied Soft Computing 48,
419 – 430 (2016)
[4] Giffler, B., Thompson, G.L.: Algorithms for solving production schedul-
ing problems. Operations Research 8, 487–503 (1960)
best performing rule on the test set) performs better than the [5] Hart, E., Sim, K.: A hyper-heuristic ensemble method for static job-shop
four versions of the ATC rule. In addition, the average value of scheduling. Evolutionary Computation 24(4), 609–635 (2016)
[6] Hernández-Arauzo, A., Puente, J., Varela, R., Sedano, J.: Electric vehicle
the 30 evolved rules outperforms the average value of the four charging under power and balance constraints as dynamic scheduling.
ATC rules. We conducted Wilcoxon paired tests confirming Computers & Industrial Engineering 85, 306 – 315 (2015)
statistically significant differences in favor of the new best [7] (IEC), T.I.E.C.: Electric Vehicle Conductive Charging System?Part 1:
General Requirement; IEC 61851-1. London, UK (2001)
and average results obtained by the proposed GP approach. [8] Ingimundardottir, H., Runarsson, T.P.: Discovering dispatching rules
The worst performing rule evolved by GP lags behind the ATC from data using imitation learning: A case study for the job-shop
rules, although it yields better average total tardiness than the problem. Journal of Scheduling First Online: 13 June 2017 (2017)
[9] Kaplan, S., Rabadi, G.: Exact and heuristic algorithms for the aerial
EDD rule, which performs worst overall. The GA produces refueling parallel machine scheduling problem with due date-to-deadline
the best results, at the expense of taking much longer time window and ready times. Computers & Industrial Engineering 62(1),
(note that priority rules take negligible time). 276–285 (2012)
[10] Koulamas, C.: The total tardiness problem: Review and extensions.
A close look at the actual priority rules generated reveal Operations Research 42, 1025–1041 (1994)
some interesting insights. Figure 6 shows the tree represen- [11] Koza, J.R.: Genetic Programming: On the Programming of Computers
by Means of Natural Selection. MIT Press (1992)
tation of the best priority rule obtained in the experiments. [12] Mencı́a, C., Sierra, M.R., Mencı́a, R., Varela, R.: Genetic algorithm for
Interestingly, we can observe that this rule contains some odd scheduling charging times of electric vehicles subject to time dependent
expressions, such as (dj − 0.43) on the left-most part of the power availability. In: Ferrández Vicente, J.M., Álvarez-Sánchez, J.R.,
de la Paz López, F., Toledo Moreo, J., Adeli, H. (eds.) Natural and
tree. This may be due to using a grammar allowing for any Artificial Computation for Biomedicine and Neuroscience. pp. 160–169.
valid arithmetic expression, and motivates further research, Springer International Publishing, Cham (2017)
e.g., using a restricted grammar instead to deal with these [13] Nguyen, S., Zhang, M., Johnston, M.: A sequential genetic programming
method to learn forward construction heuristics for order acceptance and
situations. scheduling. In: Proceedings of the 2014 IEEE Congress on Evolutionary
Computation, CEC 2014 (2014)
IX. C ONCLUSIONS [14] Sang-Oh Shim, S.O., Kim, Y.D.: Scheduling on parallel identical ma-
chines to minimize total tardiness. European Journal of Operational
This paper studies the one machine scheduling
P problem with Research 177(1), 135–146 (2007)
variable capacity, denoted (1, Cap(t)|| Ti ), and shows that [15] Sedano, J., Portal, M., Hernández-Arauzo, A., Villar, J.R., Puente, J.,
Varela, R.: Intelligent system for electric vehicle charging: Design and
Genetic Programming is a suitable approach to generate new operation. DYNA 88(6), 640–647 (2013)
priority rules, improving the best-performing classical ones
for total tardiness minimization such as EDD and ATC. In
order to make a fair comparison, we considered the same
problem attributes and operations as in these rules. At the same
time, we have seen that there is still room for improvement,
as a genetic algorithm running for much longer time than
566
On the Landscape of a Problem of Finding

Satisfactory Metaheuristics
José M. Cecilia, Baldomero Imbernón José-Matı́as Cutillas-Lozano, Domingo Giménez
Bioinformatics and HPC Research Group (BIO-HPC) Department of Computing and Systems
Polytechnic School, Univ. Católica San Antonio of Murcia (UCAM) University of Murcia
Murcia, Spain Murcia, Spain
{jmcecilia,bimbernon}@ucam.edu {josematias.cutillas,domingo}@um.es
Abstract—Fitness landscape analysis is used to determine the to the development of hyperheuristics on top of the meta-
distribution and shape of the fitness function for the space of heuristic schema [7]. These hyperheuristics has high compu-
solutions of optimization problems. It is a hard task which can tational costs due to the repeated application of numerous
help in the design of efficient metaheuristics to approach the
solution of the problem in hand. This paper studies the landscape metaheuristic configurations to the problem in hand. The
of a problem of finding satisfactory metaheuristics. A molecule- base problem may in turn be computationally demanding,
docking problem and a problem of determination of kinetic and so the combination of the high computational cost of
constants in a chemical reaction are used as case studies. We metaheuristics with that of the hyperheuristics working on top
are not working at the level of the case study problems, but at of metaheuristics advises the exploitation of parallelism at both
a higher abstraction level, which makes the landscape analysis
an even harder task. The metaheuristics being analyzed are levels [8]. But even the efficient exploitation of parallelism is
developed with a parameterized schema, with each combination not enough to reduce the search to an acceptable time, and so
of parameters in the schema being an element of the solutions fitness landscape analysis can guide the search for satisfactory
space and a metaheuristic to be applied to the base problem. The metaheuristics. The conclusions drawn here can be applied to
fitness for a metaheuristic is measured by applying it to some the problem of searching for satisfactory metaheuristics for
training instance of that problem. Some highlights are given on
how fitness landscape analysis can be conducted for this type of other optimization problems.
problems. The ideas analyzed with the two case studies can be The rest of the paper is organized as follows. Section II
extended for the development of hyperheuristics searching for briefly describes the two case studies. The general ideas of
satisfactory metaheuristics for other optimization problems. the parameterized metaheuristic schema and the hyperheuristic
Index Terms—fitness landscape analysis, metaheuristics, hy- developed on top of it are presented in Section III. The fitness
perheuristics, molecule-docking, reaction kinetics
landscape analysis is shown in Section IV. Finally, Section
V summarizes the conclusions and gives some directions for
I. I NTRODUCTION
future work.
Metaheuristics are used to approach the solution of complex
optimization problems, but the selection of a satisfactory II. C ASE S TUDY P ROBLEMS
metaheuristic for a particular problem is a difficult task. A. The Molecule-Docking Problem (MDP)
Fitness landscape analysis has been applied to the field of Virtual Screening (VS) methods analyze large libraries of
metaheuristics since the 1980s [1]–[3]. It studies the shape of small molecules (ligands) to search for those structures which
the fitness in the space of solutions, and gives guidelines for are most likely to bind to a protein receptor or enzyme [9].
the design of metaheuristics for the problem in hand. VS is computationally demanding and requires the application
Here we are interested in the landscape of an optimization of approximate optimization and high performance computing
problem built on top of another optimization problem. Two techniques [10], [11].
optimization problems are used at the bottom as case studies: Molecular docking is used to predict non-covalent binding
a molecule-docking problem [4] and determining the kinetic of molecules. Normally, the molecules to be bound are a
constants of a chemical reaction [5]. Several metaheuristics macromolecule (receptor) and a small molecule (ligand). There
can be applied, and a hyperheuristic (a metaheuristic in itself) are several scoring functions that can be used to measure the
searching in the space of metaheuristics is the optimization strength of the bond [12]. The Lennard-Jones potential is used
problem at the top of our hierarchy. here. The sum of the interactions of each atom of an active site
A parameterized schema of metaheuristics is used. It was of the protein with each atom of the ligand is computed. So,
initially used for the application of several metaheuristics the computing cost is quadratic in the sizes of the molecules.
to some optimization problems [6]. The next step led us The ligand can bind at several spots on the receptor
molecule. There are six degrees of freedom for the ligand,
Supported by the Spanish MINECO and European Commission
FEDER funds, under grants TIN2015-66972-C5-3-R and TIN2016-78799-P three for its translation and three for the rotation. The spot,
(AEI/FEDER, UE). translation and rotation which give the lowest value of the
567
scoring function are sought. The values of the movements and the meaning of the metaheuristic parameters in the schema
rotations of the ligand can be approached with metaheuristics, are commented on.
and a search is conducted in the neighborhood of each spot. Initialize: Sets of candidate solutions are randomly
So, independent metaheuristics are applied at each spot and generated. For the MDP, a subset is generated at each spot, but
the reference set for the search is composed of a subset for in the experiments only one spot is considered for low execu-
each spot. tion times. The number of elements is given by the parameter
Initial Number of Elements (IN EIni), which determines if
B. Kinetic Constants of a Chemical Reaction (KCP) the metaheuristic is closer to a local search (IN EIni = 1) or
When chemical reactions occur in heterogeneous phase the to a population based method.
variables that affect the reaction rate are temperature, pressure, Some of the generated elements are improved, and the
composition and mass transfer rate. The kinetics of the disso- intensity of the improvement can be varied to determine the
lution of calcium carbonate is used for the experiments. It is a importance of the local search in the metaheuristic. A percent-
function of the concentration of the various carbonate species age (P EIIni) of the elements is improved by comparing its
in the solution and, therefore, a function of the partial pressure fitness with that of a neighbor configuration, which substitutes
of carbon dioxide and pH. Depending on the value of the pH, the original element if the fitness is improved. The intensity of
there are different ways in which the dissolution occurs: by the improvement is determined by parameter IIEIni, which
reaction with acetic acid, by reaction with carbonic acid, and represents the maximum number of neighborhood analysis
by the hydrolysis reaction [13]. Therefore, the variation of steps.
moles of calcium over time is Another intensification parameter is considered for MDP.
A ligand has a number of flexibility junctions determined by
1 dNCa2+ n2 n
= −k1 an1 H3 O+ − k2 an3 [H2 CO3 ] 4 − k3

its crystallographic structure. In the intensification, N EIF lex
V dt represents the number of configurations obtained by rotation of
(1)
where ki are the combined reaction rate constants, ni are the the junctions to be evaluated for each candidate element. This
reaction orders, and a is the area of the tablet, which is known parameter depends on the characteristics of the ligand, and so
for each increase of time. The integration of the equation for the same value is considered for improvements in the functions
a certain value of time, tj , gives the increase of calcium in of the schema (after initialization and in the improvements
the solution as a function of the concentrations of protons and inside the loop).
carbonic acid. An individual is represented by a real vector of A number of the best elements is selected for the following
size seven. Every time the fitness of an individual is computed, iteration. The implementations for the two problems differ
the whole chemical system is solved with an iterative process, slightly at this point. In the KCP only one parameter is used,
and the fitness is obtained by comparing the values obtained for the Number of Best Elements to include (N BEIni). But
with the simulation with those obtained experimentally. in the MDP a Number of Best Elements (N BEIni) and of
Worst Elements (N W EIni) is established, in order to not
III. PARAMETERIZED M ETAHEURISTICS AND concentrate the search on only the most promising areas. The
H YPERHEURISTICS selection can be made in different ways (random, roulette,
etc). Our implementation selects the N BEIni best elements,
The application of a parameterized schema of metaheuristics
and N W EIni elements are randomly selected from the half
(Algorithm 1) to the two case studies is considered. Schemas
elements with the worst scores.
of this type have been applied to other problems, and the fit-
EndCondition: Typically, the end condition of a meta-
ness landscape analysis techniques here used can be extended
heuristic is a maximum number of iterations (M N IEnd) or
to other hard optimization problems.
a maximum number of iterations without improving the best
Algorithm 1 Parameterized metaheuristic schema solution (M IREnd). Because we are interested in the study of
Initialize(S,ParamIni) //Generate initial set and improve elements
the influence of the parameters on the fitness, the experiments
while (not EndCondition(S,ParamEnd)) do are carried out for fixed times.
SS=Select(S,ParamSel) //Select elements for combination Select: A number of the best (N BESel) and the worst
SS1=Combine(SS,ParamCom) //Combine pairs of elements
SS2=Improve(S,SS1,ParamImp) //Improve and diversify
(N W ESel) elements of the reference set are selected. The
S=Include(S,SS1,SS2,ParamInc) //Update the reference set selection is made in the same way as the elements to be
end while included in the reference set are selected for the MDP after
the improvement in the initialization.
The schema comprises some basic functions which work Combine: A number of combinations is carried out be-
on sets (S, SS, SS1 and SS2) of configurations. Some tween best (N BBCom), worst (N W W Com) and best-worst
metaheuristic parameters (P aramX) are included in each (N BW Com) pairs of elements. The inclusion of worst ele-
basic function, which can be implemented in different ways, ments diversifies the search. In the MDP the combination of
and the number of parameters and their meanings also change. a pair of elements gives a new element obtained as the mean
Landscape analysis is conducted to study the influence of the of the translation and rotation parameters of the two elements.
parameters on the fitness. The sets, the basic functions and In the KCP, the classical crossing by a middle point is used.
568
Improve: Some of the elements obtained by combination scape could help to guide the search of the hyperheuristic
are improved in the same way as in the improvement in for low search times.
the initialization. The percentage of elements to be improved • In general, to reduce the high execution times, the meta-
is P EIImp, and the intensification of the improvement is heuristic parameters for the hyperheuristic will be smaller
determined by IIEImp. than those of the metaheuristics it searches for. The sets
A diversification strategy is applied to avoid falling into in the search are smaller, as are the number of elements to
local minima. The percentage of elements from the reference be improved and the intensification of the improvement.
subsets to be diversified is P EDImp, and the elements • The improvements in the initialization and inside each
obtained by diversification are improved with an intensification iteration are carried out by analyzing elements in the
IIDImp. An element is diversified by randomly generating neighborhood, with the neighbors of an element being
a new value for one of its parameters, which is selected ran- those which are obtained from it by changing one ele-
domly. The elements generated by diversification are improved ment of the metaheuristic parameter vector (increasing
to avoid early death. or decreasing by one).
Include: The N BEInc best elements from all those • The combination of a pair of metaheuristics is carried out
in the reference set and those generated by combination, with the typical method of selecting a crossing point and
diversification and improvement are included in the reference combining the initial part from one ascendant with the
set for the next iteration. The reference set is completed with second part from the other. If an invalid configuration of
F N EIni − N BEInc elements randomly selected from the the metaheuristic parameters is generated, it is discarded.
remaining ones. • The diversification consists of the substitution of the
There are eighteen metaheuristic parameters in the imple- value of a randomly selected metaheuristic parameter by
mentation for the MDP and sixteen for the KCP, and their another value randomly selected from the search range
influence on the fitness was analyzed varying the execution for this parameter.
time and without considering the end condition parameters. There is an optimization problem at the bottom (MDP or
Hyperheuristics are methods for the selection of satisfactory KCP), and the fitness landscape analysis of metaheuristics for
metaheuristics [14]. The schema in Algorithm 1 can be used this problem studies the shape of the fitness function for some
for the development of hyperheuristics. The optimization prob- instances of the problem. At a higher abstraction level, the
lem now consists in selecting the values of the metaheuristic hyperheuristic is now the metaheuristic to be guided with the
parameters which give the best fitness for some training prob- results of the fitness landscape analysis.
lems. The hyperheuristic is therefore another metaheuristic that IV. F ITNESS L ANDSCAPE A NALYSIS
can in turn be developed as a parameterized metaheuristic with
The fitness landscape analysis of the problem of finding sat-
the parameterized schema. The general ideas of this type of
isfactory metaheuristics for an optimization problem is a hard
hyperheuristics when applied for the two case studies are:
task. The fitness of each metaheuristic is measured through
• The possible solutions for the hyperheuristic are vectors its application to various training instances of the problem.
of metaheuristic parameters (metaheuristics). The sizes The optimization problem can have high computational costs,
of the vectors depend on the implementation of the which, together with the number of training problems, means
parameterized schema: 18 or 16 parameters for the MDP high execution times. Furthermore, the results obtained with
and the KCP, with only 16 or 14 if the end condition is one or several training problems should be representative for
a fixed execution time. The hyperheuristic searches in a other problems. For simplification, for the two case studies
predetermined search range for each parameter. For the experiments were carried out for three instances of the problem
experiments with the MDP, IN EIni varies between 20 and for 100 randomly generated metaheuristics, with the
and 200, and a range between 0 and 100 is established for values of the metaheuristic parameters in the ranges previously
the rest of the parameters; and with the KCP, IN EIni indicated.
and F N EIni are between 20 and 200, the intensifica- The characteristics of the pairs for the MDP are given
tion parameters between 0 and 50 and the rest of the in Table I; they correspond to the Angiotensin-converting
parameters between 0 and 100. enzyme (ACE), the Glycogen phosphorylase beta (GPB) and
• The fitness for each metaheuristic is obtained through its the Poly(ADP-ribose) polymerase (PARP), and the table shows
application to some training problems. Only one training the number of atoms of the receptor and the ligand and the
problem can give problem-dependent results, and a large number of junctions of the ligand. The best fitness when
number of training problems means large execution times. applying each metaheuristic to the corresponding receptor-
Fitness landscape analysis can help in determining how ligand pair was stored at intervals of 30 seconds, starting at
a particular problem is representative of the behavior of 30 seconds and finishing at 600 seconds. Three experiments
other problems. for which laboratory data are available are used for the KCP.
• The execution time of a hyperheuristic of this type is very In this case, each metaheuristic is run for 100 seconds, and
high due to the repeated application of metaheuristics to the fitnesses obtained at intervals of 5 seconds are stored. The
the training instances. So, the analysis of the fitness land- results of the experiments are analyzed to study three aspects:
569
TABLE I seems to be the fourth parameter in importance for good

C HARACTERISTICS OF THE RECEPTOR - LIGAND PAIRS USED IN THE fitness, maybe because combining these elements avoids in-
EXPERIMENTS .
tensification in their neighborhood.
pair #atoms receptor #atoms ligand #junctions The relevance of the parameters changes for the KCP. The
ACE 9198 59 13 most relevant parameter is always clearly IDEImp, which
GPB 13261 29 1
PARP 5588 32 3 has an inverse relation with the fitness, so it is advisable
not to work too much on the improvement of elements after
diversification. The other parameters have little influence. The
• The influence of the parameters in the fitness is analyzed, initialization parameters have in general a positive influence
both individually (which parameters influence the fitness and, in particular, the improvement parameters in the initial-
most and if the influence is positive or negative) and ization. The improvement of the elements in the successive
globally (if the distance between metaheuristics is related steps (P EIImp and IIEImp) also has a positive influence.
to the difference of their fitnesses). The hyperheuristics So, the local searches lead to better results for this problem.
could concentrate the search in the parameters which In any case, independently of which parameters have most
prove to be the most influential, and in the ranges where influence on the fitness, the analysis can serve to guide the
the best fitnesses are obtained. hyperheuristic according to the problem it is being applied
• The influence of the execution time on the distribution of to and the particular implementation of the parameterized
the fitness and on the influence of the parameters in the metaheuristic schema for that problem.
fitness. This study can help establish a time limit for the There is a need to reduce the training time of hyperheuris-
application of the metaheuristics to the training problem, tics. Figures 1 and 2 show the relation of the metaheuristic
so reducing training time. parameters with the fitness at several time-steps. After a
• Whether the results obtained for one instance are similar time (around 250 and 50 seconds) the influence is stable.
to the others. If they are similar or if some relation Furthermore, as can be seen in Figure 3, the correlation
between them can be deduced, the number of training coefficient of the fitnesses obtained at one time step with
problems could be low (in the best case only one), so respect to those obtained at the final time is higher than 0.9
reducing training time. after 250 seconds for the MDP and after 60 seconds for the
KCP. With the application of the metaheuristics to a training
The influence of the metaheuristic parameters on the fitness problem we are not searching for optimum solutions for this
can be analyzed to determine the parameters with most influ- particular problem, but for satisfactory metaheuristics for the
ence and the ranges where the search should be concentrated. general problem. So, the training time could be reduced to
The evolution of the correlation coefficient of the metaheuristic approximately half the time used in the experiments.
parameters with respect to the fitness is shown in Figures 1 There are other possibilities to reduce the training time. For
(MDP) and 2 (KCP). A negative value indicates that when example, with the 100 metaheuristics experimented with in
the value of the parameter increases the fitness improves 20 time-steps, if the five metaheuristics with the worst fitness
(decreases). The figures on the left show the coefficient for the are discarded at each step, the total training time is halved.
parameters with the greatest positive influence on the fitness, The difference in the behavior with the different problems and
and those on the right correspond to the other parameters. instances considered can be seen in Figure 4, where the mean
The colors identify the basic functions in the schema: blue for fitness of the five metaheuristics discarded at each time step
initialization, red for selection, black for combination, brown is shown. The similarity in the results for GPB is observed in
for improvement, cyan for inclusion, and green for NEIFlex. its flat shape. For the MDP, the slope of the lines seems to be
In the MDP, the parameter which most positively influences related to the number of flexible junctions (Table I) and the
the fitness is not always the same. For ACE it is N EIF lex, difficulty of approaching the optimum.
which also influences PARP, but with no influence on GPB. It
can be logical if we consider the number of flexible junctions V. C ONCLUSIONS AND F UTURE W ORK
in each case, which is 13 for ACE, 3 for PARP and 1 for This paper presents a first approach to the analysis of
GPB (Table I). So, it seems the search by flexing the ligand is the fitness landscape for the problem of finding satisfactory
more advisable for more flexible junctions. Another influential metaheuristics for hard optimization problems. A molecule-
parameter is N BEInc, with a correlation coefficient of around docking problem and a problem of obtaining the values of
-0.2 in ACE and PARP, and a little higher than -0.1 in kinetic constants are used as case studies, but the same
GPB. It is also normal that considering a large number of methodology can be applied to the search for metaheuristics
promising elements will provide better fitness. The percentage for other problems. The metaheuristics considered are im-
of elements to diversify (P EDImp) is the best parameter for plemented with a parameterized schema, which is used for
GPB and PARP, and the value is slightly higher than -0.2 in the development of a hyperheuristic which searches in the
ACE. So, it seems that diversification is better than exploring space of metaheuristics. The fitness for each metaheuristic
the neighborhood of promising metaheuristics. Surprisingly, is obtained with its application to some training problems.
the combination of non promising elements (N W W Com) The main difficulty in the fitness landscape analysis is the
570
ACE: parameters with the most positive influence GPB: parameters with the most positive influence PARP: parameters with the most positive influence
0.3 0.3
NWEIni NBESel INEIni IIEIni 0.1 INEIni PEIIni
correlation of the parameter with the fitness

NWESel NWWCom 0.2 NBEIni NWEIni NBEIni NWWCom
0.2 IIEImp PEDImp NBWCom NWWCom PEDImp IIDImp
NEIFlex NBEInc PEDImp NBEInc NEIFlex NBEInc
0
0.1 0.1
0 0 −0.1
−0.1 −0.1 −0.2
−0.2 −0.2
−0.3
−0.3 −0.3
−0.4
50 100 150 200 250 300 350 400 450 500 550 600 50 100 150 200 250 300 350 400 450 500 550 600 50 100 150 200 250 300 350 400 450 500 550 600
ACE: parameters with the most negative influence GPB: parameters with the most negative influence PARP: parameters with the most negative influence
INEIni PEIIni 0.2 PEIIni NBESel

0.4 IIEIni NBEIni NWESel NBBCom
0.15

NBBCom NBWCom PEIImp IIEImp
PEIImp IIDImp 0.15 IIDImp NEIFlex
0.3 IIEIni NMEIni
0.1 NBESel NWESel
0.1 NBBCom NBWCom
0.2 PEIImp IIEImp
0.05 0.05
0.1
0 0
0
−0.05 −0.05
−0.1
−0.1
−0.1
−0.2
50 100 150 200 250 300 350 400 450 500 550 600 50 100 150 200 250 300 350 400 450 500 550 600 50 100 150 200 250 300 350 400 450 500 550 600
Fig. 1. Evolution of the correlation coefficient of the metaheuristic parameters with the fitness, for the MDP, for several execution times for the receptor-ligands
ACE (left), GPB (middle) and PARP (right). Top: the eight parameters with the most direct relation with the fitness after 600 seconds; Bottom: the eight
parameters with the most inverse relation.
EXP1: parameters with the most positive influence EXP2: parameters with the most positive influence EXP3: parameters with the most positive influence
INEIni PEIIni INEIni PEIIni

0 IIEIni NBESel 0.05 IIEIni NBBCom
PEIImp IIEImp 0.05 PEIImp IIEImp
NBEInc NBEInc
0
−0.05
−0.05 0
−0.1
−0.1
−0.05
−0.15 −0.15 INEIni PEIIni
IIEIni NBBCom
−0.1
−0.2 NBWCom PEIImp
−0.2 IIEImp
−0.25 −0.15
−0.25
10 20 30 40 50 60 70 80 90 100 10 20 30 40 50 60 70 80 90 100 10 20 30 40 50 60 70 80 90 100
EXP1: parameters with the most negative influence EXP2: parameters with the most negative influence EXP3: parameters with the most negative influence
0.8
0.6 0.7 0.7
0.5 0.6 0.6

FNEIni NBESel FNEIni NBESel
FNEIni NWESel 0.5 NWESel NWWCom 0.5 NWESel NBWCom
0.4 NBBCom NBWCom PEDImp IDEImp NWWCom PEDImp
NWWCom PEDImp NBEInc IDEImp
IDEImp
0.4 0.4
0.3
0.3 0.3
0.2 0.2 0.2
0.1 0.1 0.1

0 0
0
−0.1 −0.1
10 20 30 40 50 60 70 80 90 100 10 20 30 40 50 60 70 80 90 100 10 20 30 40 50 60 70 80 90 100
Fig. 2. Evolution of the correlation coefficient of the metaheuristic parameters with the fitness, for the KCP, for several execution times for the experiments
EXP1 (left), EXP2 (middle) and EXP3 (right). Top: the seven parameters with the most direct relation with the fitness after 100 seconds; Bottom: the seven
parameters with the most inverse relation.
571
randomness of the application of the metaheuristics, which

MDP
1
makes the surface of the fitness function dependent on the
random execution and on the instances used in the training
0.9 ACE
GPB process. The influence of the parameters and of the training
0.8 PARP
time on the fitness has been experimentally analyzed.
correlation coefficient
0.7
The results of our analysis are being used to guide the
0.6 implementation of hyperheuristics on top of the parameterized
0.5 metaheuristic. More experiments with more instances of the
0.4 case study problems are needed, and similar studies for other
0.3 optimization problems at the bottom of the metaheuristics
0.2 hierarchy will be conducted.
50 100 150 200 250 300 350 400 450 500 550 R EFERENCES
KCP
1 [1] W. Hordijk, “A measure of landscapes,” Evol. Comput., vol. 4, pp. 335–
360, Dec. 1996.
0.9 [2] K. Malan and A. P. Engelbrecht, “A survey of techniques for charac-
EXP1
EXP2
terising fitness landscapes and some possible ways forward,” Inf. Sci.,
vol. 241, pp. 148–163, 2013.
correlation coefficient
EXP3
0.8
[3] P. F. Stadle, “Towards a theory of landscapes,” in Complex Systems and
Binary Networks, vol. 461 of Lecture Notes in Physics, ch. 10, pp. 78–
0.7 163, 2007.
[4] E. López-Camacho, M. J. Garcı́a-Godoy, J. Garcı́a-Nieto, A. J. Nebro,
0.6 and J. F. A. Montes, “Solving molecular flexible docking problems
with metaheuristics: A comparative study,” Appl. Soft Comput., vol. 28,
pp. 379–393, 2015.
0.5
[5] J. Cutillas-Lozano and D. Giménez, “Determination of the kinetic con-
10 20 30 40 50 60 70 80 90 stants of a chemical reaction in heterogeneous phase using parameterized
metaheuristics,” in Proceedings of the International Conference on
Fig. 3. Evolution of the correlation coefficient of the fitness at different time- Computational Science, pp. 787–796, 2013.
steps with respect to the fitness. Top: MDP after 600 seconds; Bottom: KCP [6] F. Almeida, D. Giménez, J.-J. López-Espı́n, and M. Pérez-Pérez, “Pa-
after 100 seconds. rameterised schemes of metaheuristics: basic ideas and applications with
Genetic algorithms, Scatter Search and GRASP,” IEEE Transactions on
Systems, Man and Cybernetics, Part A: Systems and Humans, vol. 43,
no. 3, pp. 570–586, 2013.
[7] J. Cutillas-Lozano, D. Giménez, and F. Almeida, “Hyperheuristics based
MDP on parametrized metaheuristic schemes,” in Proceedings of the Genetic
−300
ACE and Evolutionary Computation Conference, pp. 361–368, 2015.
GPB
PARP [8] J. M. Cecilia, J.-M. Cutillas-Lozano, D. Giménez, and B. Imbernón,
−350
“Exploiting multilevel parallelism on a many-core system for the appli-
cation of hyperheuristics to a molecular docking problem,” The Journal
of Supercomputing, Mar 2017.
final mean fitness
−400
[9] U. Rester, “From virtuality to reality-Virtual screening in lead discovery
and lead optimization: a medicinal chemistry perspective,” Current
−450
Opinion in Drug Discovery & Development, vol. 11, no. 4, pp. 559–
568, 2008.
−500
[10] S. Garcia Sanchez, E. Ramirez Aportela, J. I. Garzón, P. Chacón,
A. S. Montemayor, and R. Cabido, “FRODRUG: A virtual screening
−550 GPU accelerated approach for drug discovery,” in 22nd Euromicro
International Conference on Parallel, Distributed, and Network-Based
50 100 150 200 250 300 350 400 450 500 550 600 Processing, pp. 594–600, 2014.
KCP [11] B. Imbernón, J. M. Cecilia, and D. Giménez, “Enhancing metaheuristic-
4
based virtual screening methods on massively parallel and heterogeneous
EXP1
systems,” in Proceedings of the 7th International Workshop on Program-
3.5 EXP2 ming Models and Applications for Multicores and Manycores, pp. 50–58,
EXP3
2016.
3 [12] E. Yuriev, M. Agostino, and P. A. Ramsland, “Challenges and advances
final mean fitness
in computational docking: 2009 in review,” Journal of Molecular Recog-

nition, vol. 24, no. 2, pp. 149–164, 2011.
2.5 [13] L. N. Plummer, T. M. L. Wigley, and D. L. Parkhurst, “The kinetics of
calcite dissolution in CO2 –water systems at 5 to 60o C and 0.0 to 1.0
2 atm CO2 ,” American Journal of Science, vol. 278, pp. 179–216, 1978.
[14] E. K. Burke, M. Hyde, G. Kendall, G. Ochoa, E. Özcan, and J. Wood-
1.5 ward, A Classification of Hyper-heuristic Approaches, pp. 449–468.
Springer, 2010. In Michel Gendreau, Jean-Yves Potvin, editors, Hand-
10 20 30 40 50 60 70 80 90 100 book of Meta-heuristics.
Fig. 4. Mean of the final fitness of the metaheuristics discarded at different

times-steps. Top: MDP, plot each 30 seconds; Bottom: KCP, plot each 5
seconds.
572
Generador de Planificaciones Conjuntas para

Cuadrante de Rotación de los Conductores de
Autobuses
Eva M. Almansa Aránega Samuel Lopéz Liñán
Dept. Ciencia de la Computación e Inteligencia Artificial Dept. Ciencia de la Computación e Inteligencia Artificial
Universidad de Granada Universidad de Granada
Granada, España Granada, España
Francisco José Rodríguez Serrano José Manuel Benítez Sánchez

R&D Coordinator Dept. Ciencia de la Computación e Inteligencia Artificial
SHS Consultores S.L. Universidad de Granada
Sevilla, España Granada, España
Abstract—El Problema de Generación de Cuadrante de turnos y descansos con condiciones similares dentro de un
Rotación de los Conductores de Autobuses (PGCRCA) se refiere periodo determinado y su rotación en el siguiente periodo,
a la planificación del horario de trabajo de los conductores a lo según corresponda, hasta completar el tiempo de planificación.
largo de un determinado periodo de tiempo, como por ejemplo
un año. Es un problema de naturaleza NP-duro donde El tipo de problema a resolver, a su vez presenta una
habitualmente existen un número alto de restricciones a cumplir, versión distinta a todas las recogidas en la literatura, diferentes
dificultando las decisiones en cada paso de la construcción de una planificaciones de forma simultánea. Lo cual requiere de una
solución. Existen distintas propuestas de resolución de versiones propuesta de solución específica.
simplificadas en la literatura. En este trabajo abordamos un
problema real con amplia diversidad de restricciones y un Un turno es una secuencia de tareas a lo largo de un día, el
número mucho mayor del recogido en las publicaciones: cual tiene características que lo distinguen del resto, como la
diferentes planificaciones que comparten recursos. Hemos franja horaria y la hora de inicio y fin. La homogeneidad
desarrollado una heurística que resuelve eficazmente todos los (franja horaria) y la continuidad (hora de inicio y fin) se
casos reales planteados por empresas de distinto tamaño del utilizan para valorar la similitud entre los turnos dentro de un
sector. Eficacia y eficiencia de la heurística han sido evaluadas en periodo. Un periodo es el tiempo que determina el siguiente
un extenso conjunto de casos reales y se ha podido constatar las cambio de turno o descanso, puede ser una semana o más de
buenas propiedades computacionales del algoritmo. una, a lo largo de una planificación. Una planificación se
encuentra en un rango desde un fecha determinada y puede
Keywords—cuadrantes de rotación de conductores de comprender hasta un año. Pueden existir varias planificaciones,
autobuses; rotación acíclica; backtracking lo que conlleva un reparto de los recursos, el cuadrante de los
conductores. Cada planificación es independiente de las demás
I. INTRODUCCIÓN con respecto a las características que la definen, como por
ejemplo, la fecha de inicialización y finalización; el tipo de
Dentro de la gestión de transporte de viajeros en trasporte
turnos; o el tipo de conductores que usa. Los tipos de
público (TP), un problema es la asignación del horario de
conductores difieren entre sí en la disponibilidad y/o en sus
trabajo para cada uno de sus conductores de autobuses. El
condiciones laborables. Lo cual describe una variante acíclica
horario de trabajo presenta un alto coste a la empresa. No sólo
del problema de Generación de Cuadrante de Rotación de los
para obtener una correcta asignación de tareas se debe de tener
Conductores de Autobuses (PGCRCA), resultando más
en cuenta el convenio colectivo, sino además la equidad en el
compleja que la variante cíclica, donde no existen diferencias
horario de cada conductor. De este modo, el reparto de tareas
entre las condiciones de los conductores.
repercute directamente en el coste para la empresa y en la
satisfacción de cada conductor. Por lo tanto, PGCRCA es considerado un problema de
optimización multi-objetivo sobre las condiciones para la
La rotación se encuentra en distintos contextos laborables y
satisfacción del conductor y el coste de la empresa.
es uno de los problemas que menos se ha tratado en la literatura
académica en comparación con el problema Cuadrante de El resto del artículo está organizado de la siguiente forma.
Personal (PCP). Su complejidad reside en la asignación de En la Sección II, se presenta la revisión bibliográfica sobre la
573
metodología del PGCRCA. Sección III introduce el problema rotación cíclica y acíclica. Cíclica se refiere cuando los
PGCRCA. Sección IV presenta la propuesta, el planificador de conductores pertenecen a la misma clase y la rotación es
rotación. Sección V proporciona distintos ejemplos con exactamente igual en la línea de trabajo, variando únicamente
diferentes características para ilustrar la aplicación del método la hora de inicio. Acíclica se refiere a que cada conductor tiene
propuesto. Finalmente, las conclusiones se encuentran en la distintas condiciones por lo que existen distintos tipos de
Sección VI. conductores.
II. ESTADO DEL ARTE III. CUADRANTE ROTACIÓN DE CONDUCTORES DE AUTOBUSES

El problema de tener un alto número de restricciones La generación de cuadrantes de rotación es considerada un
implica un aumento del número de decisiones en la generación problema que forma parte de un área clásica (Sistema de
de una planificación. Por lo que para comprobar todas las planificación de transportes) en el campo de la investigación de
posibilidades sería necesaria una búsqueda recursiva, con el operaciones en el ámbito de los sistemas de transportes.
añadido problema del tiempo de complejidad. En [1] define la Tradicionalmente este problema se ha subdividido en varios
complejidad del clásico Problema de Satisfacción de sub-problemas debido a la complejidad del mismo. En la Fig.
Restricciones (PSC) utilizando una búsqueda recursiva. 1, aparecen descritos éstos y el flujo clásico de resolución de
los mismos [9]). A continuación, describiremos de forma
En el PGCRCA, para conseguir un reparto equitativo en la general cada uno de los problemas:
carga de trabajo total hay que tener en cuenta demasiados
factores. La normativa de los conductores implica no sólo las
reglas de su contrato laboral, sino que también hay que
considerar la rotación de los turnos y descansos. Por esta razón,
podemos encontrar distintas formulaciones con diferentes
modelos matemáticos y con diferentes objetivos. Una de las
primeras definiciones que se pueden encontrar en la literatura,
se encuentra en [2] que define el problema como un Multi-level
Bottleneck Assigment (MBA) y demuestra que es NP-duro.
Como propuesta, describe un algoritmo que resuelve de forma
iterativa un conjunto de sub-problemas para obtener una
solución “óptima asintóticamente”. De este modo, se puede
encontrar en la literatura distintos enfoques para tratar de
Fig. 1. Sub-problemas del sistema de planificación de transportes.
resolver este tipo de problema. Algunas propuestas, tales como
en [3] con dos heurísticas evolutivas; y en [4] con una solución 1) Generación de horarios (Timetabling)[10]: Partiendo
basada en la técnica colonia de hormigas comparada con dos de la información sobre el número de líneas y el número de
técnicas, búsqueda tabú y enfriamiento simulado. Otros servicios y/o frecuencias requeridas se generan los horarios de
enfoques como, [5] divide el problema en dos etapas: primero cada una de las líneas. Estos horarios incluyen los trayectos,
resuelve el problema de modo cíclico, es decir, todos los cada uno de los cuales se describe con hora de salida, hora de
conductores son de igual tipo, con iguales condiciones; y llegada, punto de partida y punto de llegada.
segundo aplica una mejora con un algoritmo genético. 2) Planificación de vehículos (Vehicle scheduling
El [6] contiene las definiciones, anotaciones, y propone una problem) [11]: Sobre la base de los trayectos generados en la
taxonomía del problema de Cuadrante de Rotación (PCR). De fase anterior, el objetivo en esta etapa es optimizar el uso de los
este modo, se puede conocer el alcance y diferencias entre vehículos de forma que se cubran todos los trayectos definidos
todas las variantes posibles dentro del contexto del PCR. Al en la etapa anterior y se minimice el coste de operación. Este
igual que se logra comprender la dificultad de la generación de coste de operación viene definido por factores como el número
una solución factible según qué variante estemos tratando. de autobuses necesarios, los kilómetros recorridos, y los
tiempos de espera de los vehículos entre distintos trayectos.
Los [7] y [8] recogen revisiones bibliográficas de distintas 3) Planificación de conductores (Crew/bus-driver
especificaciones del PCR. Por un lado, el [7] propone resolver scheduling Problem) [12]: Una vez se dispone de una
de forma conjunta el PCP y el PCR, basándose en otros asignación de vehículos a los distintos trayectos es necesario
artículos que integran los dos problemas en uno; y la asignar conductores que cubran de forma óptima las tareas
regulación a la hora de asignar turnos para una mayor diarias, esto es, la conducción desde el depósito de vehículos al
satisfacción de los conductores. El modelo consiste en resolver comienzo de la jornada hasta la vuelta al mismo al final de la
los dos problemas de forma relajada inicialmente y luego en jornada. Cada una de estas tareas se puede dividir en sub-tareas
aplicar unas post-optimizaciones para obtener soluciones que vienen definidas por estaciones o puntos en los que es
alternativas que mejoren los resultados hasta llegar al óptimo o posible realizar un cambio de conductor. Por tanto, el resultado
hasta los criterios de parada que se establezcan. La función final es la generación de un conjunto de sub-tareas y su
objetivo que establecen para buscar la equidad entre los asignación a un conductor. Usualmente esta planificación tiene
conductores, es la suma del valor absoluto de la distancia de un horizonte temporal corto, aproximadamente 24 horas.
cada turno (media de horas mensuales trabajadas) a un objetivo 4) Generación de cuadrantes de rotación (Bus crew
de número de horas mensuales. Por otro lado, el [8] en su rostering problem) [12]. En este caso se genera una
propuesta trata conjuntamente las dos variantes del PCR: planificación de los turnos de trabajo con un horizonte
574
temporal más amplio que para el caso anterior, por ejemplo 1  Mantener continuidad en los tipos de turnos durante la
mes o 1 año, aparte de tener en cuenta ciertas restricciones semana.
como puede ser el número de horas de descanso entre dos  Cuadrantes para una o más planificaciones.
turnos de trabajo, número de días libres, etc. El resultado final  Se deben repartir todos los turnos durante el tiempo que
es una secuencia de asignación de tareas diarias para cada dure cada planificación.
conductor que tenga en cuenta las restricciones fijadas y que
consiga minimizar los costes de operación.
IV. PLANIFICADOR DE ROTACIÓN
El PGCRCA se puede formular en los siguientes términos: Denominamos Planificador de Rotación (PlanRot) a la
los servicios a prestar están organizados en un conjunto de propuesta para resolver el problema PGCRCA que hemos
turnos, repartidos por días según un calendario establecido. El desarrollado. PlanRot combina la aplicación de la técnica
personal está compuesto por un conjunto de conductores, con backtracking con distintas etapas de refinamiento (mejora) en
características posiblemente distintas en cuanto a la generación de una solución factible.
disponibilidad (ajena), y tipo de turnos que puede hacer. El
objetivo es asignar cada turno a un conductor de modo que se La Fig. 2 representa un ejemplo de una solución donde cada
optimicen varios criterios y se cumplan una serie de color del círculo indica una franja horaria distinta. Partimos de
restricciones, como por ejemplo, contemplar dedicaciones en una lista de turnos distribuidos a lo largo de los días de la
días laborables y festivos, y respetar días de descanso. planificación. Para cada turno |T| se realiza una búsqueda de
selección del conductor |C| que presente mejores condiciones.
Para generar una solución se tiene una función multi-
objetivo, con prioridad para cada criterio de optimización. Los La Fig. 3 es un ejemplo de la estructura del espacio de
criterios de optimización permiten generar diferentes búsqueda. Ilustra todas las posibles combinaciones que
soluciones por ser flexibles en cada aplicación. Sin embargo, dependen del orden de los turnos y del orden de selección de
las restricciones de los conductores se tienen que cumplir para los conductores. Toda decisión tomada en la asignación de un
considerar la solución como factible. conductor a un turno repercute en la siguiente asignación. De
este modo, el espacio de búsqueda se ve reducido debido a las
A. Criterios de optimización características de cada turno cubierto, dado que restringe en las
siguientes decisiones, al igual que se obtienen valoraciones
En orden de mayor a menor preferencia:
diferentes en los criterios de optimización.
1) Minimizar el número de conductores en el periodo.
Fig. 2. Ejemplo de representación de la solución. Aquellos conductores (C1,
2) Minimizar el número de conductores en la C2 y C3) que mejor cumplan las condiciones son asignados a cada turno (T1, …,
planificación. T6) de la lista que suceden a lo largo de una planificación (Día1, Día2 y Día3).
3) Maximizar el número de conductores que cumplen las
horas en el periodo.
4) Maximizar el número de conductores que cumplen las
horas en las planificaciones.
5) Maximizar el número de descansos continuos.
6) Maximizar el número de asignaciones de turnos en la
misma franja (mañana, tarde o noche) a lo largo del
periodo, homogeneidad.
7) Maximizar el número de turnos con igual
características en cada periodo, continuidad.
8) Maximizar el número de periodos que cumplan la
rotación. Fig. 3. Ejemplo de estructura del espacio de búsqueda. La selección del
orden los conductores y el orden en la asignación de turnos representa el
B. Restricciones de los conductores para ser asignables espacio de búsqueda.
Las restricciones que se han de cumplir son:
 Estar disponible (motivos de no estar disponible serían:
vacaciones, enfermedad, baja laboral, o bien, ausencia).
 Cumplir los requisitos para ser asignable,
compatibilidad con los turnos y tener un estado
asignable (según indique la agenda).
 Cumplir los descansos en el periodo.
 Descanso de al menos 12 horas entre que finaliza un
turno y comienza el siguiente.
 No sobrepasar las horas de trabajo indicadas en el
periodo.
 Rotación de descansos en días laborables.
 Excepciones de línea.
575
A. Heurística. Criterios de optimización Para realizar la poda se utiliza el valor de la mejor solución
Empíricamente, se ha llegado a la conclusión de que la encontrada que es igual al número de conductores (criterios de
ordenación de los turnos es significativa. Por lo que, se optimización 1) y 2)) más una pequeña penalización (criterios
comienza asignando los turnos por semanas completas, de de optimización del 3) al 8)). Esta penalización, siempre un
lunes a domingo (o en su defecto desde el día de inicio de la número racional entre 0 y 1, evalúa otros objetivos secundarios
planificación hasta el domingo). En cada semana se asignan como el que la solución sea poco homogénea (una solución
primero aquellos que se encuentren en los días con mayor homogénea es cuando los conductores realizan turnos del
número de turnos y en caso de que sea igual, se comienza por mismo tipo, mañana o tarde durante una semana y el tiempo de
los turnos del fin de semana. trabajo de los conductores es lo más parecido posible). Estas
penalizaciones están directamente relacionadas con los criterios
Para la selección de un conductor se tienen en cuenta la de optimización:
valoración a partir de los criterios de optimización descritos en
la Sección III. El orden de prioridad en los criterios de  Mayor desviación típica sobre el total de minutos de
optimización del 1) a 5) es fijo. Los criterios 1) y 2) son los trabajo.
más importantes, por lo que la función objetivo se define con la  No homogeneidad.
función minimizar el número de conductores. Es decir, durante  No continuidad.
la generación de la planificación se evalúan distintas  Descansos no continuos.
asignaciones de conductores a un turno, y se selecciona aquella  Incumplimiento de rotación.
que presente el mínimo número de conductores. En el caso de
que existan soluciones con igual número de conductores se C. Métodos de refinamiento
evalúan los criterios de siguiente orden. Se comprobarán en Los métodos de mejora de las soluciones siguen una
orden desde el 3) al 5) mientras que no resulte una asignación heurística específica basada en parte en el algoritmo
con mejora en algún criterio evaluado, y que por tanto, ya no backtracking. El recorrido en el método más complejo se basa
será necesario evaluar con los siguientes criterios: por ejemplo, en asignar un turno específico que no ha sido posible asignar a
si existe una única asignación que presenta mejora con el ningún conductor. Este método intenta asignar el turno al
criterio 3) ya no se evaluarán los criterios 4) y 5). Por otro lado, conductor con menos turnos, de forma que si no es posible
se permite cambiar la prioridad de los criterios de optimización asignarlo entonces comprueba si quitándole un turno a ese
6), 7) y 8). De este modo, se pueden obtener diferentes conductor sería posible asignarlo. Si así fuese, entonces se
soluciones y posteriormente seleccionar aquella qué mejor se quita un turno y se asigna el turno actual. Luego se repite el
ajuste a los criterios de optimización en orden del 1) al 5). mismo procedimiento con el nuevo turno sin asignar que se ha
quitado. Además de éste se aplican otros 3 métodos concretos
B. Backtracking. Sistema de penalización que tratan de mejorar la solución centrándose en cuestiones
La técnica algorítmica backtracking se ha utilizado para la más específicas.
parte principal del problema. Se trata de una técnica exacta que
localiza una solución óptima en un espacio de búsqueda El algoritmo PlanRot realiza una búsqueda con distintos
cuando se representa en forma de árbol. El mecanismo de orden en los criterios de optimización en los criterios 6), 7) y
exploración que usa es una búsqueda en profundidad (post- 8); esto implica que resulten diversas construcciones. En
orden). Para acelerar el proceso de búsqueda emplea una muchos casos, las soluciones presentan periodos de tiempo con
función de poda que permite descartar subárboles (soluciones una incompleta continuidad, homogeneidad e incluso días sin
parciales y todas las soluciones derivadas de esta) sin tener que asignar. Los días sin asignar aparecen en las semanas en las
explorar todo el subárbol. Así cuando un subárbol es que no se ha completado el número máximo de turnos para
descartado, la exploración vuelve un nivel hacia arriba en el asignar los días de descanso. Este fenómeno está provocado
árbol, buscando la siguiente rama a explorar. La exploración de principalmente por dos motivos: uno, la rotación de los turnos
un nodo dado termina cuando se han explorado todos sus hijos. y descansos; y dos, el tiempo mínimo de descanso entre que
La exploración del árbol completo termina cuando se ha finaliza un turno y comienza el siguiente, sobre todo al rotar de
explorado la raíz. Se garantiza así encontrar la solución óptima. domingo al lunes.
Para que el proceso sea computacionalmente factible la La mejora de la calidad de las soluciones se realiza
definición de la función de poda es crítica. Es fundamental, mediante las siguientes etapas:
encontrar una que pode cuanto más mejor. Sin embargo,
considerando que el problema es de naturaleza NP-duro 1) Reasignación de turnos: Los conductores que presentan
siempre existirán casos que obligarán a una exploración muy mayor número días sin asignar se eliminan de la planificación.
amplia del espacio de soluciones, con un coste computacional De este modo todos sus turnos quedan sin asignar. Teniendo en
muy elevado. cuenta que, el número máximo de turnos a asignar deberá de
Para formular el espacio de búsqueda (árbol de búsqueda), ser igual o menor que el número de días sin asignar del resto de
las n-uplas que forman el espacio de soluciones tienen tantas conductores. Mientras sea posible, se realiza el intercambio
componentes como turnos a cubrir. Los valores que puede entre los turnos y los días sin asignar más compatibles.
tomar cada componente son los posibles conductores. De esta 2) Reasignación de turnos intensiva: A partir de la etapa
forma, se incluyen todas las posibles asignaciones entre turnos previa, se determina el tipo de incompatibilidad en aquellos
y conductores disponibles. En cada nivel del árbol se evalúan turnos que no hayan podidos ser reasignados con el fin de
los posibles conductores candidatos a realizarlo.
576
reasignarlos en algún otro conductor. Estas incompatibilidades Caso Descripción Plan Semanas
Rotación Rotación
turnos descansos
se clasifican en los siguientes casos y se realiza el intercambio Rotación
siempre que exista otro conductor con el día libre y compatible 5 1 2 - 1
descansos
al turno a asignar: 6
Agenda
1 1 - -
conductores
 Un conductor tiene todos los días de trabajo asignados.
7 1 tipo de día 1 4 2 1
 Franja horaria.
8 2 tipos de días 1 4 2 1
 Rotación de descansos.
Comienzo a
3) Reasignación de descansos: Recorre cada semana e 9 mitad de la 1 3 1 -
identifica los conductores con descansos discontinuos. Una semana, 15 días
vez localizados, realiza un nuevo recorrido para intercambiar 2 tipos días, 2
10 tipos 1 4 1 1
entre los conductores identificados los días de descanso. Para conductores
realizar el intercambio, al menos tiene que beneficiar a un 3 franjas
11 1 2 1 -
conductor por conseguir los días de descanso continuos. horarias
4) Reasignación de turnos no homogéneos: Recorre cada 2
12 2 1 - -
planificaciones
día y obtiene los turnos no homogéneos de cada conductor y
13 Larga duración 1 18 1 2
realiza intercambio entre otro conductor con turno no
homogéneo. Se selecciona la mejor combinación de 14 Año completo 1 52 1 2
intercambio entre turnos no homogéneos. 15
3 tipos de
1 2 1 1
conductor
V. RESULTADOS EXPERIMENTALES 16
3
3 2 1 1
planificaciones
Se ha aplicado PlanRot sobre casos reales planteados por 4
17 4 2 1 1
empresas. Estos casos difieren entre sí en el tamaño, como por planificaciones
ejemplo, número de turnos; número de semanas; tipos de 18 30 semanas 1 30 1 2
conductores; o número de planificaciones.
19 40 semanas 1 30 1 2
La TABLA I. muestra la descripción de cada caso:
característica más descriptiva del caso real; el número de 20 50 semanas 1 50 1 1
planificaciones a resolver; el número de semanas del cuadrante; Distintos
el número de rotaciones de turnos por periodo; y las rotaciones 21 periodos (2, 3 y 3 30 1 1
4 semanas)
por semanas en los descansos en días laborables. Los casos de
prueba se encuentran ordenados de menor a mayor
complejidad.
TABLA II. SOLUCIONES
La TABLA II. contiene los resultados de las soluciones
obtenidas comparadas con las soluciones óptimas de cada caso; Nº
Nº óptimo
PlanRot
Tiempo
y el computo de procesamiento en segundos. El número óptimo conductores (seg)
de conductores se ha obtenido analizando las posibles 1 10 10 5.914
combinaciones. Asimismo, el algoritmo PlanRot encuentra en 2 9 9 4.506
todos los casos una solución óptima con el mínimo número de
conductores necesario. En general, los casos de prueba que 3 10 10 9.667
necesitan menos de 10 segundos para obtener una respuesta, 4 10 10 11.874
son aquellos los que sólo utilizan el método heurístico con los
criterios de optimización. El resto presentan mayor tiempo de 5 10 10 8.432
cómputo por ser necesario aplicar el sistema de refinamiento, 6 11 11 7.111
con un máximo de menos de 2 minutos.
7 10 10 9.469
8 9 9 8.533
TABLA I. INFORMACIÓN DE LOS CASOS REALES 9 8 8 9.142
Rotación Rotación 10 8 8 4.285

Caso Descripción Plan Semanas
turnos descansos
11 13 13 6.386
1 Asignación 1 2 - -
2 tipos de días: 12 16 16 5.722
2 1 1 - -
laborable y no 13 10 10 24.787
2 tipos de
3 1 1 - -
conductores 14 18 18 30.895
Comienzo a
4 mitad de la 1 3 - - 15 10 10 5.144
semana, 15 días
577
Nº
Nº óptimo
PlanRot
Tiempo BIBLIOGRAFÍA
conductores (seg)
[1] Marek, Victor W., y Jeffrey B. Remmel. “The complexity of recursive
16 20 20 10.054 constraint satisfaction problems.” Annals of Pure and Applied Logic 161
(2009): 447-457.
17 30 30 7.164
[2] Carraresi, P., y G. Gallo. “A multi-level bottleneck assignment approach
18 10 10 63.492 to the bus riv rs rost rin pro l m ” European Journal of Operational
Research 16 (1984): 163-173.
19 10 10 83.022 [3] Xie, Lin, “Metaheuristics approach for solving multi-objective crew
rostering problem in public transit,” 2013.
21 10 10 101.888
[4] Moz, Margarida, Ana Respcio, y Margarida Vaz Pato, “Bi-objective
evolutionary heuristics for bus driver rostering,” Public Transport
(Springer Nature) 1 (aug 2009): 189-210.
VI. CONCLUSIONES [5] Ma, Jihui, Tao Liu, y W nyi Zhan , “A Genetic Algorithm Approach to
the Balanced Bus Crew Rostering Problem,” Journal of Traffic and
En este trabajo hemos abordado el problema PGCRCA. Se Logistics Engineering Vol 2 (2014).
trata de una variante más compleja de un problema de [6] Ernst, A. T., H. Jiang, M. Krishnamoorthy, y D. Sier, “Staff scheduling
naturaleza NP-duro. La versión estudiada considera distintos and rostering: A review of applications, methods and models,” European
Journal of Operational Research (Elsevier BV) 153 (feb 2004): 3-27.
tipos de conductores y varias planificaciones simultáneamente.
Para resolverlo de forma eficaz hemos propuesto una heurística [7] Valdes, Vera, y Victor Andres, “Integrating Crew Scheduling and
Rostering Problems,” Ph.D. dissertation, alma, 2010.
basada en backtracking que combina distintos métodos de
[8] Xie, Lin, y Leena Suhl, “Cyclic and non-cyclic crew rostering problems
refinamiento. La evaluación experimental permite comprobar in public bus transit.,” {OR} Spectrum (Springer Nature) 37 (apr 2014):
la eficacia y eficiencia de la propuesta sobre un nutrido 99-136.
conjunto de casos reales. [9] Fr lin , R , “Mo ls an T chniqu s for Int ratin V hicl an Cr w
Sch ulin ” Ph D th sis, Tin r n Institut , Erasmus Univ rsity
Rotterdam (1997).
AGRADECIMIENTOS
[10] Ibarra-Rojas, Omar J., y Yasmin A. Rios-Solis. “Synchronization of us
Este trabajo ha sido parcialmente financiado por los tim ta lin ” Transportation Research Part B: Methodological 46
proyectos del Ministerio de Economía y Competitividad (2012): 599-614.
TIN2016–81113–R y de Excelencia de la Junta de Andalucía, [11] Park, Yang-Byun “A hy ri n tic al orithm for th v hicl
P12–TIC–2958. sch ulin pro l m with u tim s an tim a lin s ” International
Journal of Production Economics 73 (2001): 175-188.
[12] Ma, Ji Hui, Tao Liu, y Wei Guan. “Solvin Balanc Bus Cr w
Rost rin Pro l m with G n tic Al orithm ” Sustainable Cities
Development and Environment Protection. Trans Tech Publications,
2013. 2070-2074.
578
Bioinspirados
(XIII MAEB)
MAEB 4: SESIÓN E SPECIAL:

SMART C ITIES
Monitorización y clasificación de estancias en

edificios empleando captación de comunicaciones
inalámbricas de dispositivos inteligentes.
Antonio Fernández Ares Marı́a Isabel Garcı́a Arenas Pedro A. Castillo Valdivieso
Universidad de Granada Universidad de Granada Universidad de Granada
Granada, Spain Granada, Spain Granada, Spain
Resumen—La monitorización de personas y sus movimientos En este artı́culo se propone el empleo de las captación
es un área de interés en las smart cities ya que estas enfrentan de las comunicaciones inalámbricas WiFi emitidas por los
el problema de la superpoblación. Los actuales sistemas de dispositivos inteligentes, como los smartphones, portados habi-
monitorización de personas, basados en cámaras de vigilancia,
son muy intrusivos, atentan a la privacidad y son costosos. En tualmente por las personas. La información capturada permite
este artı́culo se propone el empleo de la captación de las comuni- identificar al dispositivo de forma única y unı́voca, lo que
caciones inalámbricas emitidas por los dispositivos inteligentes permite reconocer al mismo dispositivo en futuras visitas. Las
portados por los ciudadanos como fuente de datos para los capturas sucesivas de un dispositivo en un lugar acotado, per-
estudios de la monitorización de personas empleando inteligencia mite delimitar temporalmente la estancia de dicho dispositivo,
computacional para la extracción de patrones de comportamiento
habituales. Para ello, se presenta un caso de uso aplicado a la y por tanto a su portador.
monitorización del acceso a un edificio público y la obtención Empleando esta fuente de información se puede obtener
de los momentos que garantizan la mayor disponibilidad para la cuantı́a de visitantes ası́ como la duración de cada visita.
emplazar eventos no regulares. Los resultados muestran que la Mediante el empleo de técnicas de inteligencia computacional,
captación de comunicaciones inalámbricas y la aplicación de
se puede extraer conocimiento sobre el comportamiento y
técnicas de aprendizaje máquina permiten estudiar y extraer
conocimiento sobre el los movimientos de las personas. naturaleza de las distintas visitas, permitiendo obtener los
Index Terms—Ciudades Inteligentes, Monitorización de perso- hábitos o patrones distintivos de cada tipo de visitante.
nas, Comunicaciones inalámbricas, WiFi, Smartphones Para estudiar el potencial de la fuente de datos se emplea
el sistema Mobywit para monitorizar una de las entradas de
I. I NTRODUCCI ÓN la ETSIIT1 de la Universidad de Granada. Con los datos ob-
La monitorización de personas ha cobrado una gran impor- tenidos mediante la detección de los dispositivos inteligentes,
tancia en el entorno de las smart cities debido a que muchos de se realizan estudios que permitan cuantificar el número de
los problemas a los que se enfrentan las ciudades están origi- visitantes recibidos en la escuela y mediante el empleo de
nados por el aumento significativo de la población, debido a la algoritmos de agrupación ser capaces de extraer patrones que
superpoblación de las áreas metropolitanas. Proveer de fuentes definan los comportamientos de los distintos visitantes.
de datos a las ciudades del futuro sobre los movimientos de las Los resultados muestran que las estancias reincidentes a lo
personas que viven en ellas permite una mejor gestión de los largo de varios dı́as se pueden agrupar empleando algoritmos
recursos, lo que repercute positivamente en la calidad de los de machine learning o aprendizaje máquina para extraer
servicios ofertados. Este mismo principio puede aplicarse a los patrones habituales de comportamiento, patrones que sirven
edificios de las smart cities, obteniendo información real sobre para comprender mejor la ocupación y saturación del edificio
como interaccionan las personas con dicho edificio y emplear en los distintos momentos del dı́a.
la información recogida para la extracción de información y El resto del artı́culo se estructura como sigue. En la Sección
conocimiento por medio de la inteligencia computacional. II se presenta un breve estado del arte sobre la monitorización
Sin embargo, las tecnologı́as para el conteo y monitoriza- de personas. En la Sección III se presenta la metodologı́a del
ción de personas actuales se encuentran bastante limitadas. sistema ası́ como el escenario empleado. En la Sección IV
Los sistemas que son capaces de reconocer individualmente se recogen los experimentos realizados, incluyendo análisis
a las personas son intrusivos y muy costosos tanto monetaria de las estancias, ası́ como los resultados del agrupamiento
como computacionalmente, pues se basan principalmente en de las estancias. La Sección V debate sobre los resultados
sistemas basados en reconocimiento de imágenes capturadas obtenidos en los experimentos. Finalmente la Sección VI alega
por cámaras. Los sistemas más simples y baratos, como placas
de presión, tornos o haces láser, no son capaces de reconocer 1 Escuela Técnica Superior de Ingenierı́as en Informática y Telecomunica-
visitas sucesivas de un mismo individuo. ciones
581
la viabilidad de la captación de comunicaciones inalámbricas III. M ETODOLOG ÍA

WiFi para el estudio de la naturaleza de las estancias de las Para la captación de las comunicaciones inalámbricas WiFi
personas en edificios y su importancia en el escenario de un se emplea el sistema Mobywit [19], que permite identificar
edificio inteligente dentro de una smart city. cada dispositivo de forma unı́voca mediante un hash de la
dirección MAC de la interfaz de red WiFi. La detección de
II. E STADO DEL ARTE un dispositivo en las inmediaciones del nodo es denominada
Habitualmente la monitorización de personas ha estado paso, al cual se le asigna una ventana temporal con las marcas
asociada a los entornos de marketing y estudios de mercado[1] de tiempo de la primera y última detección consecutiva. En la
sin embargo en los últimos años ha cobrado vital importancia Figura 1 se puede observar un diagrama del nodo Mobywit
en los entornos de las smart city [2]. emplazado. Es esperable que un mismo dispositivo pueda
Las tecnologı́as para el conteo y monitorización de personas pasar a lo largo del dı́a varias veces por las inmediaciones
han evolucionado desde los sistemas de detección de vehı́culos del nodo. Para cada dispositivo y cada dı́a, se calcula en base
[3], resultando en un problema más complejo. Esto se debe a los sucesivos pasos, el instante de tiempo de entrada y salida
principalmente a que las personas no tienen elementos distin- al centro, siendo el primer y último paso detectado por el nodo.
tivos únicos fácilmente reconocibles por procesamiento OCR2
de imágenes, al contrario que los coches con sus matrı́culas
[4] y porque sus desplazamientos no se encuentran acotados
por carriles y direcciones prefijados [5] como en los vehı́culos.
Distintas tecnologı́as han sido empleadas para la contabi-
lización de personas, como los rayos infrarrojos [6] o las
cámaras térmicas [7], [8]. Las imágenes captadas por cámaras
de vı́deo han sido igualmente empleadas [9], [10], siendo
algunos sistemas incluso capaces de reconocer a la persona con
tasas de acierto aceptables [11]. Sin embargo, estos sistemas
tiene numerosos impedimentos como su alto coste [12] y la
vulneración de libertades individuales y privacidad [13].
El empleo de los dispositivos inteligentes para la detección
de personas es un área de investigación en auge, debido a que
su proliferación en los ciudadanos es significativa. Se estima
que en España el 83 % de la población posee un smartphone3 .
La detección de estos dispositivos por medio de sus co- Figura 1. Emplazamiento del Nodo Mobywit en la Escuela. En la parte
municaciones Bluetooth ha sido empleada con éxito para la derecha de la fotografı́a, fuera de plano, se encuentra la puerta principal.La
monitorización de personas tanto en pequeños edificios [14], puerta en plano de la derecha
grandes [15] o ante eventos culturales multitudinarios [16].
Esto posible debido a que el protocolo Bluetooth dispone de El escenario de estudio es la Escuela Superior de Ingenierı́as
mecanismos nativos para la detección de dispositivos cercanos, en Informática y Telecomunicaciones de la Universidad de
al estar diseñado para las comunicaciones device-to-device4 . Granada. Un nodo Mobywit fue emplazado en la entrada
Las comunicaciones WiFi, en cambio, carecen de mecanis- principal del edificio7 . Dicha escuela tiene matriculados 2119
mos nativos para la detección de dispositivos, al estar basadas alumnos y en ella trabajan unas 250 personas8 . Las clases tiene
en comunicaciones por infraestructura. Sin embargo, es posible una hora de duración, y comienzan a las 8:30.
detectar las dispositivos que emplean WiFi capturando los Durante un periodo de un mes comprendido entre el 3
paquetes que emiten [17]. Este tipo de estudios está menos de Marzo y el 3 de Abril de 2018, incluyendo tanto pe-
extendido, pero ha sido empleado como pruebas de concepto riodos lectivos como no lectivos, el nodo Mobywit cap-
en escenarios como el Sonar 20155 o la Sagrada Familia6 . turó 1 884 219,13M B de tramas WiFi. A partir del procesa-
Desde el ámbito académico, la captación de comunicaciones miento en tiempo real, el nodo estableció los pasos de cada
WiFi para la monitorización de personas ha sido empleada con dispositivo por las inmediaciones del nodo.
éxito para medir masas de personas [18], tanto en exteriores En base a la información en pasos obtenida por el pro-
[19] como interiores [20]. cesamiento de dichas tramas, se propone realizar estudios y
aplicar técnicas de aprendizaje máquina para obtener informa-
2 Optical Character Recognition o Reconocimiento óptico de caracteres ción sobre los hábitos y patrones de comportamiento de los
3 Según el último informe anual sobre la sociedad de la información visitantes.
en España elaborado por telefónica http://www.fundaciontelefonica.com/arte
cultura/publicaciones-listado/pagina-item-publicaciones/itempubli/483/ 7 Aunque una puerta secundaria, al ser totalmente exterior, no pudo ser
4 Comunicaciones entre dispositivos sin necesidad de estaciones base.
monitorizada al no poder emplazarse el nodo.
5 Por el BSC en el proyecto “We know what you did last Sonar” http: 8 Según la memoria académica del curso 2017/2018 https:
//www.bsc.es/viz/whatyoudid/now.html //secretariageneral.ugr.es/pages/memorias/academica/20162017/docencia/
6 D-lab https://d-lab.tech/project-1/ centros/ doc/24/!/download
582
IV. E XPERIMENTOS 4 registra la duración de todas las visitas en las que se ha

registrado tanto la entrada como la salida.
Los pasos obtenidos se resumen y contabilizan en base a un
intervalo de muestreo. La Figura 2 muestra el resultado de este 1200
resumen para tamaños de muestreo de un dı́a y una hora. De
Personas Detectadas
esta forma, se puede observar como el periodo vacacional de 900
Semana Santa la afluencia de gente se reduce drásticamente, 600

de igual manera que durante los fines de semana.
300
3000 0
Periodo no lectivo
2000 0 1 2 3 4 5 6 7 8 9 10 11 12
1000 Horas totales en la ETSIIT

0
2018-03-05 2018-03-12 2018-03-19 2018-03-26 2018-04-02
Figura 4. Duración de las visitas registradas. La mayorı́a de los visitantes
están entre una y dos horas en la escuela.
400
300
200
Conociendo tanto la hora de entrada como la hora de
100
salida de cada vistante, se ejecuta el algoritmos de agrupa-
0
miento FarthestFirst [21]. Para facilitar la interpretación de
2018-03-05 2018-03-12 2018-03-19 2018-03-26 2018-04-02 los resultados del algoritmos de agrupamiento lidiando con
fechas y horas, las horas de entrada y salida se resumen en
Figura 2. Conjunto de datos obtenidos durante un mes de monitoriación. 5 categorı́as divisorias obtenidas como boundaires o fronteras
La gráfica superior presenta el número de personas detectadas cada dı́a. La
inferior presenta la misma información pero por cada hora. del agrupador. Estas divisiones se recogen en la Tabla I.
Tabla I
Esta misma información puede ser mostrada para cada dı́a. I NTERPRETACI ÓN DE LOS DIVISORES DE HORAS DEL AGRUPADOR .
La Figura 3 el número de personas detectadas para distintos Madrugada ∈ (0, 1, 2, 3, 4, 5, 6]
intervalos de muestreo de un dı́a. Se observa como los cambios Mañana ∈ (7, 8, 9, 10, 11]
de clase afectan al número de personas detectadas. Mediodı́a ∈ (12, 13, 14, 15]
Tarde ∈ (16, 17, 18, 19, 20]
Noche ∈ (21, 22, 23]
2018/03/22
12:15
12:15
14:15
14:15
17:30 El algoritmo de agrupamiento establece cinco clases de
150
(15 minutos)
14:30
14:30 visitantes (notadas mediante , ◦ , △ , ⋄ y ⊠ ), más
100
una clase auxiliar para las visitas no clasificables o sin un

50
patrón común extraı́do notado mediante + . Adicionalmente,

0
07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 00:00
Fecha en este artı́culo se notará con el sı́mbolo × aquellas visitas
registradas mediante un único paso cercano al sensor. En la
75 100 125
Tabla II se recogen la asignación de cada divisor de hora a

(5 minutos)
cada clase calculada mediante del algoritmo de agrupamiento.

50
25
Tabla II
0
07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 00:00
Fecha C LASES RESULTANTES DEL AGRUPAMIENTO DE CATEGOR ÍAS
0.50 0.75 1.00 1.25 1.50
13:29
13:29 13:30
13:30 13:31
13:31 13:32 14:15
14:15 14:16
14:16
(1 minuto)
13:32
Clase Entrada Salida
g1 Mañana Mediodı́a
o g2 Mediodı́a Mediodı́a
07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 00:00
Fecha
△ g3 Tarde Tarde
⋄ g4 Mediodı́a Tarde
Dispositivos simultáneos detectados ⊠ g5 Mañana Tarde
+ - * *
Figura 3. Vista detallada de un dı́a monitorizado, empleando tres tamaños de
muestreo: 15 minutos, 5 minutos y 1 minuto. Se han remarcado los valores Para la visita de cada dı́a de cada persona distinta, se
que han sido considerados anómalos o extremos en las series. Para la ventana dispone de la hora de entrada, la hora de salida y la categorı́a
de 1 minuto, se emplea únicamente el grado de color como magnitud.
que le ha asignada mediante el algoritmo de agrupamiento. En
la Figura 8 se puede ver como se relacionan las tres variables
Se espera que cada visitante al edificio registre al menos una entre ellas. Las regiones con patrones comunes de entrada y
entrada y una salida del mismo, siendo registradas ambas en salida han sido asignadas a la misma clase por el algoritmo
el caso de realizarlas por la puerta monitorizada. Esto permite de agrupamiento. Debido al libre albedrı́o de las personas,
calcular para cada dı́a el tiempo medio de visitas. La Figura hay visitas que no corresponden a un patrón compartido.
583
Dichas visitas son notadas mediante + y descartadas por el detectados varios dı́as distintos o de forma reincidente. Esta
agrupador, en lugar de intentar a ajustarlas de forma artificial regularidad individual, supone a su vez un patrón en si mismo.
a algún patrón o clase ya existente.
Nº personas detectadas
2018-03-22 400
23:00
300
22:00
21:00 200
20:00
100
19:00
18:00
0
17:00
Hora de entrada en la ETSIIT
Clase 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 31 32
16:00 - Días reincidentes
¿?
15:00
g1
14:00
g2 Figura 7. Representación del numero de visitantes reincidentes.
13:00 g3
12:00 g4
g5
11:00
Dada la capacidad del sistema Mobywit para ser capaz de
10:00
09:00
reconocer de forma reincidente al mismo dispositivo y por
08:00 tanto a la misma persona, se pueden extraer patrones en los
07:00
hábitos de una misma persona a lo largo de varios dı́as. La
06:00
05:00
Figura 8 muestra para un subconjunto de personas reincidentes
05:00 06:00 07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00
más de 10 veces, la clase asignada a cada una de sus diferentes
Hora de salida en la ETSIIT visitas en diferentes dı́as. En dicha gráfica se puede como
las personas se ajustan en su mayorı́a a un patrón común de
Figura 5. Relación entre la hora de entrada, la hora de salida y la clase
asignada por el agrupador para todas las visitas de un dı́a determinado.
comportamiento a lo largo del tiempo.
FFCBD4...
FEE12C...
El algoritmo de agrupamiento se aplica a todas las visitas de FE9888...
FB54CB...
F71E7D...
todos los dispositivos detectados a lo largo de todo el periodo. F71CEC...
F42BDE...
EFC54D...
La figura 6 recoge la relación entre la hora de entrada, la hora EEEA13...
E62A0F...
E54F14...
de salida y la categorı́a asignada a la visita para todos los dı́as E529D2...
E2EED1...
E1ADA1...
D7B33C...
que han sido monitorizados por el nodo. D7929B...
D71C27...
D09DEE...
Identificador HASH de la persona detectada
CDC5D6...
CDC1BC...
C67BA7...
C6555C...
2018-03-03 2018-03-04 2018-03-05 2018-03-06 2018-03-07 2018-03-08 2018-03-09 B745FB...
B6DE89...
B4762E...
20 B0EA85...
AED2F7...
15 A41887...
9DC73F...
10 9B52A9...
8F446D...
8E87DD...
8D190C...
2018-03-10 2018-03-11 2018-03-12 2018-03-13 2018-03-14 2018-03-15 2018-03-16 8B0F2A...
881A21...
865325...
20 83A3B7...
820943...
15 7D49B8...
797003...
Hora de entrada en la ETSIIT
10 7694C1...
7351BE...
6E7CE2...
6C3246...
2018-03-17 2018-03-18 2018-03-19 2018-03-20 2018-03-21 2018-03-22 2018-03-23 68648D...
5F841F...
589C2E...
20 5578AF...
524BF5...
15 4CE3CF...
45678F...
10 452E70...
402055...
39FEBA...
33B767...
2018-03-24 2018-03-25 2018-03-26 2018-03-27 2018-03-28 2018-03-29 2018-03-30 2D263B...
2BFDBA...
2B2362...
20 274B0D...
2694EB...
15 259D4D...
1AB029...
10 18B727...
1873E5...
14E578...
10 15 20 10 15 20 10 15 20 10A05E...
2018-03-31 2018-04-01 2018-04-02 2018-04-03 101504...
0FBDB2...
0F3D5E...
20 0DD68C...
- g2 g5 08CD5C...
15 03C6B8...
Clase ¿? g3 03223D...
10
g1 g4 mar 05 mar 12 mar 19 mar 26 abr 02
10 15 20 10 15 20 10 15 20 10 15 20
Fecha
Hora de salida en la ETSIIT
- g1 g3 g5
Figura 6. Relación entre la hora de entrada, la hora de salida y la clase Clase
¿? g2 g4
asignada por el agrupador para todos las visitas del conjunto de datos.
Es esperable que los visitantes acudan de forma regular a Figura 8. Representación de la clase asignada en diferentes visitas para un
subconjunto de visitantes los reincidentes más de diez veces. Se observa como
la escuela, ya sea porque estudien o trabajen en ella. En la las visitas sucesivas de la mayorı́a de los visitantes son de la misma clase.
Figura 7 se puede ver el número de visitantes que han sido
584
No todas las visitas de una misma persona tiene porque ser Todas las clases g1 g2 g3 g4 g5
7:30 7:30
clasificadas con la misma categorı́a, sin embargo si puede ser 8:30

39% 29% 39% 42% 33%
8:30
56% 47% 46% 53% 46% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 16% 9% 26% 20% 20%
definida una categorı́a predominante para cada persona de la 9:30

72% 61% 70% 72% 64%
9:30
92% 72% 84% 81% 83% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 49% 49% 50% 52% 52%
cual se extraiga un patrón de comportamiento habitual, aunque 10:30

82% 77% 86% 91% 83%
10:30
93% 86% 100% 100% 94% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 68% 68% 66% 74% 83%
97% 91% 95% 100% 89% 100% 100% 95% 98% 98% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 92% 84% 90% 100% 93%
debido a circunstancias externas ese patrón no sea perfecto. 11:30
100% 100% 100% 99% 100%

11:30
86% 93% 84% 88% 100% 32% 23% 37% 16% 56% 0% 0% 0% 0% 0% 21% 24% 19% 9% 11% 100% 100% 100% 100% 100%
En la Tabla III se presenta la clase predominante de todos los 12:30
91% 97% 100% 94% 95%

12:30
64% 79% 76% 67% 81% 79% 53% 62% 50% 100% 0% 0% 0% 0% 0% 21% 31% 31% 26% 17% 100% 100% 100% 100% 100%
13:30 13:30
visitantes (n ≥ 1) como aquellos reincidentes al menos 10 14:30

80% 83% 88% 92% 74%
14:30
28% 37% 41% 44% 35% 100% 100% 100% 100% 67% 0% 0% 0% 0% 0% 58% 43% 63% 66% 56% 100% 100% 100% 100% 100%
veces (n ≥ 10).
Franja horaria
Franja horaria
68% 68% 68% 67% 58% 1% 7% 2% 4% 4% 50% 38% 63% 41% 22% 0% 0% 0% 0% 0% 89% 73% 87% 100% 78% 100% 100% 100% 100% 100%
15:30 15:30
67% 67% 66% 62% 59% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 31% 58% 62% 54% 14% 100% 100% 100% 100% 100% 92% 91% 94% 92% 97%
16:30 16:30
59% 66% 64% 60% 49% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 67% 90% 100% 100% 57% 89% 100% 88% 85% 61% 72% 82% 88% 80% 83%
Tabla III 17:30
51% 55% 46% 44% 46%

17:30
0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 100% 100% 88% 98% 100% 75% 77% 75% 42% 56% 55% 62% 58% 57% 68%
P ORCENTAJE DE PERSONAS PARA CADA CLASE PREDOMINANTE . 18:30
35% 38% 36% 28% 31%

18:30
0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 67% 59% 75% 41% 100% 46% 66% 56% 26% 39% 37% 35% 44% 37% 37%
19:30 19:30
Clase Predominancia 20:30

9% 14% 8% 11% 9%
20:30
0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 7% 17% 12% 0% 14% 13% 16% 25% 9% 17% 4% 5% 6% 8% 7%
Nombre n≥1 n ≥ 10 21:30

1% 2% 0% 4% 1%
21:30
0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0%
g1 28,5 % 43,8 % 22:30

1% 1% 0% 3% 0%
22:30
0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0%
o g2 17,9 % 4,1 % 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0%
△ g3 18,1 % 4,1 % lun mar mié jue vie lun mar mié jue vie lun mar mié jue vie lun mar mié jue vie lun mar mié jue vie lun mar mié jue vie
⋄ g4 11,3 % 10,9 % Día de la Semana Día de la Semana
Ocupación
⊠ g5 8,1 % 31,5 % 0% 25% 50% 75%100%
+ - 15,8 % 5,4
Figura 10. Disponibilidad de horarios para la realización de eventos en base
Estos patrones de comportamiento pueden ser estudiados a la asistencia a la escuela, tanto genérica como en base los distintos grupos
de usuarios detectados. La ocupación se ha normalizado para cada dı́a a una
a lo largo del tiempo para ver la influencia de factores escala entre el 0 y el 100 % del máximo diario.
periódicos, como los dı́as de la semana, los periodos de
exámenes o los cuatrimestres en los que se divide el curso.
Por ejemplo la figura 9 presenta los horarios habituales para V. R ESULTADOS
cada persona detectada a lo largo de las distintas semana.
Se observa que la clase asignada a las personas que
7:30
8:30
entran por la mañana y salen al medio dı́a es la que ha
9:30
10:30
11:30
12:30
13:30
sido asignada a un mayor porcentaje de gente, indicando
14:30
15:30
16:30
17:30
18:30
que la mayorı́a de las personas que visitan la escuela lo
19:30
20:30
21:30
7:30
8:30
hacen solo en horario de mañana. Además este patrón se
9:30
10:30
11:30
12:30
muestra tanto en aquellas visitas puntuales, y se acentúa
13:30
14:30
15:30
16:30
17:30
en las visitas reincidentes. Para los reincidentes, la segunda
18:30
19:30
20:30
21:30
7:30
clase con mayor porcentaje ( ⊠ ) es aquella asignada a los
8:30
9:30
10:30
11:30
visitantes que llegan por la mañana y se marchan por la tarde,
Hora
12:30
13:30
14:30
15:30
16:30
17:30
constituyendo aproximadamente un tercio de los visitantes
18:30
19:30
20:30
21:30
reincidentes. Un 5 % de las visitas, se produce únicamente al
7:30
8:30
9:30
10:30
11:30
mediodı́a ( ◦ ) posiblemente por gente que únicamente emplea
12:30
13:30
14:30
15:30
16:30
los servicios de comedores del edificio. Los visitantes que
17:30
18:30
19:30
20:30
21:30
llegan al mediodı́a y se van por la tarde ( ⋄ ) suponen un
mar
mar
10 % de las visitas. Por último, sólo un 5 % de los visitantes

mié
mié
lun
jue
lun
jue
vie
vie
7:30
8:30
9:30
10:30
11:30
12:30
13:30
14:30
15:30
realizan su visita únicamente durante horario de tarde ( △ ).
16:30
17:30
18:30
19:30
20:30
En cuanto a la disponibilidad de horario, en términos
21:30
generales la mayor disponibilidad se presenta los jueves a

mar
mar
mar
mar
mar
mar
mar
mar
mar
mar
mar
mar
mar
mié
mié
mié
mié
mié
mié
mié
mié
mié
mié
mié
mié
mié
lun
jue
lun
jue
lun
jue
lun
jue
lun
jue
lun
jue
lun
jue
lun
jue
lun
jue
lun
jue
lun
jue
lun
jue
lun
jue
vie
vie
vie
vie
vie
vie
vie
vie
vie
vie
vie
vie
vie
Día de la semana
partir de las 18:30. Para los distintos turnos, la asistencia por la
Figura 9. Horarios semanales de las 73 personas detectadas reincidentes más mañana presentará mayor disponibilidad los martes de hasta
representativas. El color indica la clase en la que la que cada estancia ha sido las 11:30, en los turnos de tarde los jueves a partir 18:30.
clasificada. Cada visita se superpone con una capa de transparencia del 25 %.
La codificación de colores es la empleada en la Tabla III. Estos rangos de horas y dı́as son por tanto el momento idóneo
para emplazar cualquier evento que no interrumpa la docencia
habitual, obtenida en base a los patrones de comportamiento
Esta información puede ser útil para decidir a que ho-
habituales de los alumnos reincidentes. O en caso de querer
ra emplazar eventos maximizando la disponibilidad de los
atraer a toda la audiencia posible, elegir dos periodos de
alumnos, escogiendo aquellas horas en las que habitualmente
tiempo que permitan la afluencia de ambos tipos de visitantes
estén habitualmente a punto de irse de la facultad. Empleando
disjuntos, repitiendo el evento en los dos intervalos de tiempo
la información del agrupador, se puede elegir intervalos de
obtenidos.
tiempos libres que beneficien a un tipo de visitante concreto,
como se muestra en la Figura 10.
585
VI. C ONCLUSIONES [7] J. W. Davis and V. Sharma, “Robust background-subtraction for person
detection in thermal imagery.” in CVPR Workshops, 2004, p. 128.
Si bien la información obtenida no es más que una muestra [8] K. Hashimoto, K. Morinaka, N. Yoshiike, C. Kawaguchi, and S. Mat-
de la viabilidad de la captación de comunicaciones inalámbri- sueda, “People count system using multi-sensing application,” in Solid
State Sensors and Actuators, 1997. TRANSDUCERS ’97 Chicago., 1997
cas WiFi para la monitorización y extración de patrones de International Conference on, vol. 2, Jun 1997, pp. 1291–1294 vol.2.
comportamientos de las estancias de las personas en edificios, [9] H. Celik, A. Hanjalic, and E. Hendriks, “Towards a robust solution
puede resultar una herramienta muy útil para la gestión eficien- to people counting,” in Image Processing, 2006 IEEE International
Conference on, Oct 2006, pp. 2401–2404.
te de los recursos de dicho edificio. Ası́ como para estudiar el [10] A. Schofield, P. Mehta, and T. Stonham, “A system for counting people
impacto de nuevas medidas en los patrones de comportamiento in video images using neural networks to identify the background
de los visitantes. scene,” Pattern Recognition, vol. 29, no. 8, pp. 1421 – 1428,
1996. [Online]. Available: http://www.sciencedirect.com/science/article/
A modo de ejemplo, en este artı́culo se han determinado pii/0031320395001638
los periodos de mayor disponibilidad de los alumnos para [11] C.-H. Kuo and R. Nevatia, “How does person identity recognition help
la posible asistencia a actividades no regladas, como charlas multi-person tracking?” in Computer Vision and Pattern Recognition
(CVPR), 2011 IEEE Conference on. IEEE, 2011, pp. 1217–1224.
o conferencias, en base a los patrones de comportamiento [12] W. Zhao, R. Chellappa, P. J. Phillips, and A. Rosenfeld, “Face recog-
extraı́dos de las visitas reincidentes. nition: A literature survey,” ACM computing surveys (CSUR), vol. 35,
La potencialidad de la aplicación de técnicas de inteligencia no. 4, pp. 399–458, 2003.
[13] M. L. Gras, “The legal regulation of cctv in europe,” Surveillance &
computacional y análisis de patrones a los datos obtenidos Society, vol. 2, no. 2/3, 2002.
mediante la captación de comunicaciones inalámbricas permite [14] T. Nicolai and H. Kenn, “About the relationship between people and
dotar de fuentes de información baratas, fiables y anónimas discoverable bluetooth devices in urban environments,” in Proceedings
of the 4th international conference on mobile technology, applications,
a las ciudades inteligentes. Fuentes de datos que permitirán and systems and the 1st international symposium on Computer human
optimizar los recursos ajustándolos a los patrones de compor- interaction in mobile technology. ACM, 2007, pp. 72–78.
tamiento aprendidos de las personas que los emplean. [15] J. Weppner and P. Lukowicz, “Bluetooth based collaborative crowd
density estimation with mobile phones,” in Pervasive Computing and
La aplicabilidad del sistema Mobywit en multitud de es- Communications (PerCom), 2013 IEEE International Conference on,
cenarios de escenarios, supone también una futura lı́nea de March 2013, pp. 193–200.
trabajo. El sistema puede ser empleado en cualquier punto [16] A. Morrison, M. Bell, and M. Chalmers, “Visualisation of spectator
activity at stadium events,” in Information Visualisation, 2009 13th
geográfico donde se concentren masas de personas, y extraer International Conference. IEEE, 2009, pp. 219–226.
información sobre el comportamiento de las mismas. Por [17] Y. Chon, S. Kim, S. Lee, D. Kim, Y. Kim, and H. Cha, “Sensing
ejemplo, ofreciendo tiempos de espera hasta ser atendidos en wifi packets in the air: practicality and implications in urban mobility
monitoring,” in Proceedings of the 2014 ACM International Joint
tareas administrativas, monitorizando los recintos habilitados Conference on Pervasive and Ubiquitous Computing. ACM, 2014,
para fumadores o el impacto de la calidad del menú del dı́a pp. 189–200.
en la afluencia de gente en los servicios de comedores. [18] W. Xi, J. Zhao, X.-Y. Li, K. Zhao, S. Tang, X. Liu, and Z. Jiang,
“Electronic frog eye: Counting crowd using wifi,” in INFOCOM, 2014
Proceedings IEEE, April 2014, pp. 361–369.
AGRADECIMIENTOS [19] A. Fernández-Ares, M. Garcia-Arenas, P. A. Castillo, and J. J. Merelo,
“Impact of protests in the number of smart devices in streets: A new
Este trabajo ha sido financiado parcialmente por los proyec- approach to analyze protesters behavior,” in International Conference
tos MOMOFES SPIP2017-02116 (Direción General de Tráfi- on Smart Cities. Springer, 2017, pp. 75–85.
co de España), EphemeCH TIN2014-56494-C4-3-P, DeepBio [20] A. Fernández-Ares, A. Mora, M. Arenas, P. Garcı́a-Sanchez, G. Romero,
V. Rivas, P. Castillo, and J. Merelo, “Studying real traffic and mobility
TIN2017-85727-C4-2-P y TEC2015-68752. Especial agrade- scenarios for a smart city using a new monitoring and tracking system,”
cimiento al cuerpo directivo de la ETSIIT por la concesión Future Generation Computer Systems, vol. 76, pp. 163–179, 2017.
del permiso para la implantación del nodo Mobywit. [21] Hochbaum and Shmoys, “A best possible heuristic for the k-center
problem,” Mathematics of Operations Research, vol. 10, no. 2, pp. 180–
R EFERENCIAS 184, 1985.
[1] W. J. Stanton, “Fundamentals of marketing,” 1967.

[2] G. Pan, G. Qi, W. Zhang, S. Li, Z. Wu, and L. T. Yang, “Trace analysis
and mining for smart cities: issues, methods, and applications,” IEEE
Communications Magazine, vol. 51, no. 6, pp. 120–126, 2013.
[3] R. Schneider, R. Patten, and J. Toole, “Case study analysis of pedestrian
and bicycle data collection in us communities,” Transportation Research
Record: Journal of the Transportation Research Board, no. 1939, pp.
77–90, 2005.
[4] R. Parisi, E. Di Claudio, G. Lucarelli, and G. Orlandi, “Car plate
recognition by neural networks and image processing,” in Circuits and
Systems, 1998. ISCAS’98. Proceedings of the 1998 IEEE International
Symposium on, vol. 3. IEEE, 1998, pp. 195–198.
[5] M. C. Gonzalez, C. A. Hidalgo, and A.-L. Barabasi, “Understanding
individual human mobility patterns,” Nature, vol. 453, no. 7196, pp.
779–782, 2008.
[6] K. Hashimoto, C. Kawaguchi, S. Matsueda, K. Morinaka, and
N. Yoshiike, “People-counting system using multisensing application,”
Sensors and Actuators A: Physical, vol. 66, no. 1-3, pp. 50–55,
1998. [Online]. Available: http://www.sciencedirect.com/science/article/
pii/S0924424797017159
586
Reduction of the Size of Datasets by using

Evolutionary Feature Selection: the Case of Noise
in a Modern City*
Javier Luque, Jamal Toutouh, Enrique Alba

Departamento de Lenguajes y Ciencias de la Computación
Universidad de Málaga
Málaga, Spain
[email protected],{jamal,eat}@lcc.uma.es
Abstract—Smart city initiatives have emerged to mitigate the

negative effects of a very fast growth of urban areas. Most of the
population in our cities are exposed to high levels of noise that
generate discomfort and different health problems. These issues
may be mitigated by applying different smart cities solutions,
some of them require high accurate noise information to provide
the best quality of serve possible. In this study, we have designed
a machine learning approach based on genetic algorithms to
analyze noise data captured in the university campus. This
method reduces the amount of data required to classify the
noise by addressing a feature selection optimization problem. The
experimental results have shown that our approach improved the
accuracy in 20% (achieving an accuracy of 87% with a reduction
of up to 85% on the original dataset).
Index Terms—Smart city, Genetic algorithm, Feature selection,
Noise
587
Studying Solutions of the p-Median Problem for the

Location of Public Bike Stations*
Christian Cintrano Francisco Chicano Thomas Stützle Enrique Alba

E.T.S. Ingenierı́a Informática E.T.S. Ingenierı́a Informática Universite Libre de Bruxelles E.T.S. Ingenierı́a Informática
University of Málaga University of Málaga Brussels, Belgium University of Málaga
Málaga, Spain Málaga, Spain [email protected] Málaga, Spain
Abstract—The use of bicycles as a means of transport is

becoming more and more popular today, especially in urban
areas, to avoid the disadvantages of individual car traffic. In fact,
city managers react to this trend and actively promote the use
of bicycles by providing a network of bicycles for public use and
stations where they can be stored. Establishing such a network
involves the task of finding best locations for stations, which is,
however, not a trivial task. In this work, we examine models to
determine the best location of bike stations so that citizens will
travel the shortest distance possible to one of them. Based on
real data from the city of Malaga, we formulate our problem as
a p-median problem and solve it with a variable neighborhood
search algorithm that was automatically configured with irace.
We compare the locations proposed by the algorithm with the
real ones used currently by the city council. We also study where
new locations should be placed if the network grows.
Index Terms—Bike station location, p-Median problem, Vari-
able neighborhood search
588
Bioinspirados
(XIII MAEB)
A LGORITMOS
M ULTIO BJETIVO
Organizadores:
E NRIQUE A LBA Y M ARIANO LUQUE
An Improvement Study of the Decomposition-based

Algorithm Global WASF-GA for Evolutionary
Multiobjective Optimization*
Sandra Gonzalez-Gallardo, Rubén Saborido, Ana B. Ruiz, Mariano Luque

Department of Applied Economics (Mathematics)
University of Málaga
Málaga, Spain
{sandragg, rsain, abruiz, mluque}@uma.es
Abstract—The convergence and the diversity of the

decomposition-based evolutionary algorithm Global WASF-GA
(GWASF-GA) relies on a set of weight vectors that determine
the search directions for new non-dominated solutions in the
objective space. Although using weight vectors whose search
directions are widely distributed may lead to a well-diversified
approximation of the Pareto front (PF), this may not be enough to
obtain a good approximation for complicated PFs (discontinuous,
non-convex, etc.). Thus, we propose to dynamically adjust the
weight vectors once GWASF-GA has been run for a certain
number of generations. This adjustment is aimed at re-calculating
some of the weight vectors, so that search directions pointing to
overcrowded regions of the PF are redirected toward parts with
a lack of solutions that may be hard to be approximated. We test
different parameters settings of the dynamic adjustment in opti-
mization problems with three, five, and six objectives, concluding
that GWASF-GA performs better when adjusting the weight
vectors dynamically than without applying the adjustment.
Index Terms—Evolutionary multiobjective optimization,
Decomposition-based algorithm, GWASF-GA, Weight vector
591
Pruning Dominated Policies in Multiobjective

Pareto Q-learning*
Lawrence Mandow, José-Luis Pérez-de-la-Cruz

Departamento de Lenguajes y Ciencias de la Computación
Málaga, Spain
{lawrence, perez}@lcc.uma.es
Abstract—The solution for a Multi-Objetive Reinforcement

Learning problem is a set of Pareto optimal policies. MPQ-
learning is a recent algorithm that approximates the whole set of
all Pareto-optimal deterministic policies by directly generalizing
Q-learning to the multiobjective setting. In this paper we present
a modification of MPQ-learning that avoids useless cyclical
policies and thus improves the number of training steps required
for convergence.
Index Terms—
592
Estudio de escalabilidad de implementaciones

multiobjetivo en problemas con muchos objetivos
Aurora Ramı́rez, Rafael Barbudo, José Raúl Romero, Sebastián Ventura
Dpto. Informática y Análisis Numérico, Universidad de Córdoba
{aramirez, rbarbudo, jrromero, sventura}@uco.es
Resumen—Los problemas de optimización de varios objetivos estudios que demuestran el bajo rendimiento de algoritmos
aparecen con frecuencia en aplicaciones reales, lo que ha llevado clásicos a la hora de resolver este tipo de problemas, ası́ como
a la adaptación de la mayorı́a de las metaheurı́sticas existentes. el incremento en el coste computacional [6]. Estos hechos
El creciente interés en los problemas que presentan muchos
objetivos también ha propiciado la aparición de nuevos métodos han propiciado el desarrollo de métodos especializados [7],
especializados. Para conseguir una mayor adopción de estas ası́ como la realización de estudios comparativos [8].
técnicas por parte de usuarios no familiarizados con el uso de A pesar de que algunas librerı́as software están incorporan-
metaheurı́sticas, es necesario que los nuevos desarrollos sean do algunos de los algoritmos para optimización de muchos
incluidos en librerı́as software que faciliten su configuración y objetivos que van adquiriendo mayor relevancia, lo cierto
adaptación. No obstante, la librerı́a escogida puede repercutir
en el rendimiento computacional, pues cada una sigue unos es que aún no existe un gran número de implementaciones
principios de diseño diferentes. Este trabajo analiza algunas de disponibles. Este hecho no solo dificulta su uso con fines
las implementaciones multiobjetivo disponibles en seis librerı́as comparativos, sino que limita su aplicación por parte de
con el propósito de estudiar su comportamiento frente a confi- usuarios con menos experiencia en el campo de las me-
guraciones de creciente complejidad y que incluyen problemas taheurı́sticas. Por otro lado, caracterı́sticas como el lenguaje
de hasta 50 objetivos. La experimentación realizada confirma
que distintas implementaciones de un mismo algoritmo pueden de programación y el diseño estructural de estas librerı́as
presentar diferencias considerables en cuanto al tiempo de podrı́a suponer ciertas diferencias en el uso de los recursos
ejecución y la memoria consumida. computacionales, como el tiempo de ejecución y la memoria,
Index Terms—Optimización de muchos objetivos, me- que también deben considerarse ante la creciente complejidad
taheurı́sticas, librerı́as software tanto de los problemas como de los algoritmos.
I. I NTRODUCCI ÓN En este contexto, este trabajo presenta un estudio preliminar
del rendimiento de algoritmos multiobjetivo implementados en
Los problemas multiobjetivo han sido objeto frecuente de diferentes librerı́as software. Tras realizar un análisis de las
estudio en el campo de las metaheurı́sticas, pues son habitual- implementaciones disponibles, se han elegido seis librerı́as
mente aplicables en escenarios reales [1]. Este tipo de proble- Java: ECJ, EvA, JCLEC-MO, jMetal, MOEA Framework y
mas requiere la definición de un conjunto de variables cuyo Opt4J. El objetivo de la comparación es por tanto analizar el
valor ha de determinarse, un conjunto de restricciones a cum- rendimiento desde una perspectiva puramente computacional,
plir y, al menos, dos objetivos independientes a optimizar [2]. realizando mediciones del tiempo de ejecución y la memoria
La existencia de varios objetivos, a menudo contrapuestos, RAM consumida. Para ello se han seleccionado varios algo-
implica que la solución a un problema multiobjetivo no es ritmos y problemas de entre los disponibles en las librerı́as.
única, sino que debe encontrarse un conjunto de soluciones Además, se ha estudiado la escalabilidad de las distintas im-
donde cada una alcanza un compromiso distinto entre los plementaciones de NSGA-II respecto al número de individuos,
objetivos. El estudio de enfoques bioinspirados para resolver generaciones y objetivos. Los resultados muestran que existen
problemas multiobjetivo ha dado lugar a algoritmos ya clásicos pequeñas diferencias entre las implementaciones cuando se
como NSGA-II y SPEA2, de los que es posible encontrar consideran parámetros estándar, y que éstas se incrementan a
implementaciones en distintos lenguajes de programación [3]. medida que se consideran valores más extremos.
Recientemente, la investigación en este campo se ha cen- El resto del artı́culo se estructura como sigue. La sección II
trado en abordar la resolución de problemas con un número describe los algoritmos y problemas más utilizados en opti-
elevado de objetivos. Según la literatura, los denominados mización multiobjetivo, mientras que la sección III recopila
“problemas de muchos objetivos” (en inglés, many-objective las principales librerı́as software que los implementan. La
optimisation problems) son aquellos que presentan cuatro o sección IV detalla la metodologı́a diseñada para el estudio
más objetivos [4]. Su resolución presenta nuevos retos, tales comparativo, cuyos resultados son analizados en la sección V.
como el crecimiento exponencial del número de soluciones Finalmente, la sección VI presenta las conclusiones.
no dominadas o la ineficacia de operadores genéticos y técni-
cas de preservación de la diversidad [5]. De hecho, existen II. O PTIMIZACI ÓN CON M ÚLTIPLES OBJETIVOS
Trabajo financiado por los ministerios de Economı́a (TIN2017-83445-P) y Esta sección introduce los principales tipos de algoritmos
de Educación (FPU13/01466), y fondos FEDER. multiobjetivo existentes, destacando aquellos especializados en
593
la optimización de muchos objetivos. Después se describen uno [11], y DTLZ, un conjunto de nueve problemas cuyo
algunos de los problemas comúnmente utilizados para evaluar número de objetivos es adaptable [12].
el rendimiento de estos algoritmos.
III. I MPLEMENTACIONES DISPONIBLES EN LIBRER ÍAS
II-A. Familias de algoritmos bioinspirados La popularidad de las técnicas metaheurı́sticas ha llevado
a la creación de librerı́as y frameworks software que dan
Desde la publicación de VEGA, considerado el primer soporte a la investigación y facilitan su aplicación práctica [3].
algoritmo evolutivo multiobjetivo [2], la aparición de nuevos Este tipo de herramientas no solo contemplan la configuración
algoritmos o mejoras sobre los ya propuestos ha sido cons- y ejecución de los algoritmos y sus componentes, sino que
tante [9]. En los inicios del área, los algoritmos iban siendo también permiten adaptarlos a nuevos problemas.
clasificados en generaciones [10]. Ası́, la conocida como La Tabla I muestra un listado de algunas librerı́as que
primera generación se basa fuertemente en el concepto de incluyen soporte para la optimización multiobjetivo, indicando
dominancia y el uso de estrategias de nichos. La incorporación la última versión y su año de lanzamiento, el lenguaje de
de mecanismos de elitismo es la principal caracterı́stica de la programación y los algoritmos que proporcionan1 . Como
segunda generación, a la que pertenecen SPEA2 y NSGA-II. puede observarse, entre ellas hay herramientas de propósito
En el ámbito de la optimización de muchos objetivos, los general muy conocidas, como HeuristicLab y ECJ. A pesar
algoritmos se clasifican atendiendo al enfoque que siguen para de su madurez, el número de implementaciones multiobje-
abordar los retos mencionados anteriormente [7]. En primer tivo que ofrecen se limita a los algoritmos evolutivos más
lugar, los algoritmos basados en descomposición definen un populares. Otras librerı́as Java son Opt4J y EvA, las cuales
conjunto de pesos para establecer diferentes direcciones de disponen de mayor número y variedad de algoritmos. Más
búsqueda. MOEA/D es el algoritmo más conocido dentro de recientemente, han ido apareciendo librerı́as en Python, como
esta familia. Por otro lado, los algoritmos basados en indicado- DEAP (especializada en algoritmos distribuidos) y PyGMO
res utilizan una medida de rendimiento, como el hipervolumen, (especializada en algoritmos paralelos), si bien el número de
para guiar la búsqueda. IBEA fue el primer algoritmo de algoritmos multiobjetivo en ambas es aún reducido.
esta familia, donde también destacan HypE o SMS-EMOA. ParadisEO-MOEO y JCLEC-MO se asemejan en cuanto a
Otro conjunto de algoritmos se caracterizan por la adopción su estructura, pues ambas librerı́as disponen de un módulo
de criterios de dominancia relajados, como la ǫ-dominancia especı́fico para optimización multiobjetivo. Por un lado, Para-
utilizada tanto en algoritmos evolutivos (ǫ-MOEA) como de disEO ha sido posiblemente la librerı́a más popular de entre las
optimización de partı́culas (OMOPSO). El uso de un conjunto desarrolladas en C++, si bien lleva tiempo sin ser actualizada.
de puntos de referencia es una técnica habitual para garantizar Por otro lado, JCLEC-MO ofrece un mayor conjunto de
la diversidad en espacios de objetivos multidimensionales. En algoritmos, incluyendo algunos especialmente indicados para
este grupo se encuentran algoritmos como NSGA-III y RVEA, problemas de muchos objetivos.
entre otros. Finalmente, los métodos basados en preferencias, Finalmente, también es posible encontrar librerı́as especia-
como WASF-GA o PICEA-g, permiten restringir la búsqueda lizadas en optimización multiobjetivo. La primera de ellas fue
a una zona de interés para el usuario. Los detalles de estos PISA, si bien se trata de un proyecto ya abandonado. jMetal y
algoritmos pueden encontrarse en artı́culos de referencia co- MOEA Framework, ambas desarrolladas en Java, destacan por
mo [7], [9]. sus continuas actualizaciones y su amplio catálogo de algorit-
mos. Dos proyectos muy recientes y activos son PlatEMO y
II-B. Problemas para el estudio del rendimiento Platypus, desarrollados en Matlab y Python, respectivamente.
A la hora de comparar el rendimiento de distintos algo- IV. M ETODOLOG ÍA EXPERIMENTAL
ritmos, es frecuente utilizar problemas tipo o benchmarks.
Por ejemplo, problemas tan conocidos como el de la mochila Para el estudio comparativo de implementaciones multiob-
(Knapsack Problem, KP) o el viajante de comercio (Travelling jetivo se han seleccionado las seis librerı́as Java detalladas en
Salesman Problem, TSP) han sido extendidos respecto a sus la Tabla I. La elección de un único lenguaje de programación
formulaciones originales para un único objetivo. Otro bench- facilita la comparación pues evita posibles diferencias debidas
mark a destacar es LOTZ (Leading Ones, Trailing Zeros), al proceso de compilación. Además, estas librerı́as cuentan
un problema simple de codificación binaria con dos objetivos con, al menos, dos algoritmos en común, lo cual reduce la
contrapuestos: maximizar el número de unos al comienzo del posibilidad de alterar el rendimiento debido a la diferencia
genotipo y maximizar el número de ceros al final. de implementación entre desarrollos propios y nativos. Tan
Para codificación real existen varias familias de problemas solo ha sido necesario implementar algunos problemas para
cuyos frentes de Pareto óptimo presentan diferentes propieda- disponer de un conjunto lo suficientemente variado, ası́ como
des (discontinuidad en el frente, proximidad de óptimos loca- operadores genéticos estándar.
les, etc.). Además, algunas permiten establecer el número de Tras analizar las herramientas, se han planteado dos ex-
objetivos que se desea optimizar, por lo que son especialmente perimentos. El primero tiene como objetivo estudiar distintas
útiles para estudiar la escalabilidad. Entre ellas cabe destacar 1 Las posibles variantes de dichos algoritmos no son mostradas por motivos
ZDT, un conjunto de seis problemas con dos objetivos cada de espacio. El lector es remitido a la documentación de cada herramienta.
594
Tabla I
L IBRER ÍAS Y ALGORITMOS DISPONIBLES PARA OPTIMIZACI ÓN MULTIOBJETIVO
Librerı́a Versión Año Lenguaje Principales algoritmos

DEAP 1.2.2 2017 Python CMAES-MO, NSGA-II, SPEA2
ECJ 26 2018 Java NSGA-II, NSGA-III, SPEA2
EvA 2.2 2015 Java CMAES-MO, MOGA, NSGA, NSGA-II, PESA, PESA2, SPEA, SPEA2
HeuristicLab 3.3.15 2018 C# CMAES-MO, NSGA-II
ǫ-MOEA, GrEA, HypE, IBEA, MOCHC, MOEA/D, OMOPSO, NSGA-II,
JCLEC-MO 1.0 2018 Java
NSGA-III, PAES, PAR, RVEA, SMS-EMOA, SMPSO, SPEA2
AbYSS, CellDE, dMOPSO, GDE3, GWASF-GA, IBEA, MOCell, MOCHC,
jMetal 5.4 2017 Java MOEA/D, MOEADD, MOMBI, MOMBI-II, NSGA-II, NSGA-III, OMOPSO,
PAES, PESA2, SMS-EMOA, SMPSO, SPEA2, WASF-GA
CMAES-MO, DBEA, ǫ-MOEA, GDE3, IBEA, MOEA/D, MSOPS, NSGA-II, NSGA-III,
MOEA Framework 2.12 2017 Java
OMOPSO, PAES, PESA2, RVEA, SMPSO, SMS-EMOA, SPEA2, VEGA
Opt4J 3.1.4 2015 Java NSGA-II, OMOPSO, SMS-EMOA, SPEA2
PaGMO/PyGMO 2.8 2018 C++/Python MOEA/D, NSGA-II
ParadisEO-MOEO 2.0.1 2012 C++ MOGA, IBEA, NSGA, NSGA-II, SPEA2
AGE-II, dMOPSO, ǫ-MOEA, GDE3, GrEA, HypE, I-DBEA, IBEA, LMEA,
PlatEMO 1.5 2017 Matlab MOEA/D, MOMBI-II, MOPSO, MSOPS-II, NSGA-II, NSGA-III, PICEA-g,
PSEA-II, RPEA, RVEA, SMPSO, SMS-EMOA, SPEA2, Two Arch2
Platypus 1.0.2 2018 Python ǫ-MOEA, GDE3, IBEA, MOEA/D, NSGA-II, NSGA-III, OMOPSO, SMPSO, SPEA2.
PISA - 2009 C ǫ-MOEA, FEMO, HypE, IBEA, MSOPS, NSGA-II, SEMO2, SHV, SPAM, SPEA2
combinaciones de algoritmos y problemas, donde estos últimos está presente en todas las librerı́as y no presenta parámetros
varı́an en cuanto al tipo de codificación y al número de adicionales. Puesto que se desea variar el número de objetivos,
objetivos. La Tabla II muestra la configuración propuesta, se ha seleccionado DTLZ1 como problema a resolver. Los
donde el número entre paréntesis representa el número de operadores genéticos y sus probabilidades se configuran de
problema dentro de la familia correspondiente. Para las tres acuerdo a los valores mostrados en la Tabla III.
librerı́as que disponen de un número menor de algoritmos se
ha seleccionado un número mayor de problemas. En cuanto Tabla III
C ONFIGURACI ÓN DE PAR ÁMETROS
a las tres últimas librerı́as, se han seleccionado algoritmos
representativos de distintas familias. En el caso de MOEA/D, Parámetro Valor
únicamente se han considerado problemas de optimización Parámetros comunes
Tamaño de la población 100
real debido a que es el tipo de problema asumido en jMetal. Número de generaciones 100
Igualmente, la generación automática de los pesos se limita Probabilidad de cruce 0,9
a problemas biobjetivo. Por ser un algoritmo de partı́culas, Probabilidad de mutación 0,1 (1/longitud genotipo)
Operador de cruce 1-Point (binario), SBX (real)
OMOPSO también queda restringido a problemas de optimi- Operador de mutación Bit flip (binario), Polynomial (real)
zación real. La Tabla III recoge los valores de los parámetros, SPEA2
tanto generales como especı́ficos de cada algoritmo. Tamaño de la población (P ) 50
Tamaño del archivo (A) 50
Selector de padres Torneo
√ binario
Tabla II Parámetro k 2
P +A
A LGORITMOS Y PROBLEMAS SELECCIONADOS MOEA/D
Tamaño de vecindad (τ ) 10
Problema Máx. Núm. Reemplazos (nr) 2
Algoritmo
2 obj. 4 obj. 6 obj. Modo de evaluación Tchebycheff
ECJ, EvA, Opt4J Generación de pesos Uniforme
NSGA-II LOTZ, ZDT (1, 4) KP DTLZ (1, 2, 4) IBEA
SPEA2 LOTZ, ZDT (1, 4) KP DTLZ (1, 2, 4) Selector de padres Torneo binario
JCLEC-MO, jMetal, MOEA Framework Indicator para evaluación Hipervolumen
IBEA LOTZ KP DTLZ (1, 2) Parámetro κ 0,05
MOEA/D ZDT (1, 4) DTLZ (1, 2) Parámetro ρ 2
OMOPSO ZDT (1, 4) DTLZ (1, 2) OMOPSO
NSGA-II LOTZ KP DTLZ (1, 2) Tamaño del archivo 100
Parámetro ǫ 0,0075
El segundo experimento pretende analizar la escalabilidad

de las implementaciones en base a tres factores: el tamaño de En ambos experimentos se ha utilizado Syrupy2 como
la población (100, 500, 1000), el número de generaciones (100, herramienta profiler para medir el tiempo de ejecución y el
500, 1000) y el número de objetivos (2, 5, 10, 25, 50). Estas consumo de memoria a intervalos regulares. Dichos intervalos
configuraciones serán identificadas como Px-Gy-Oz, donde P se han establecido en base a ejecuciones previas con el fin de
representa el tamaño de la población, G, las generaciones y
O, los objetivos. El algoritmo escogido es NSGA-II, ya que 2 https://github.com/jeetsukumaran/Syrupy
595
obtener un mı́nimo de 30 muestras para cada configuración. La Tabla IV

experimentación se ha realizado en una máquina con Debian T IEMPO DE EJECUCI ÓN EN SEGUNDOS PARA EL PRIMER GRUPO DE
LIBRER ÍAS ( EXPERIMENTO 1)
8, ocho núcleos Intel Core i7-2600, CPU a 3,4 GHz y 16 GB
de memoria RAM. En el caso del primer experimento, cada Configuración ECJ EvA Opt4J
NSGA-II – LOTZ(2) 0, 245 ± 0, 014 1, 443 ± 0, 037 0, 773 ± 0, 050
configuración ha sido ejecutada cinco veces en un único núcleo NSGA-II – ZDT1(2) 0, 299 ± 0, 015 1, 827 ± 0, 019 0, 785 ± 0, 056
para evitar posibles interferencias. Además, se ha alternado el NSGA-II – ZDT4(2) 0, 295 ± 0, 017 1, 537 ± 0, 014 0, 765 ± 0, 068
NSGA-II – ZDT6(2) 0, 284 ± 0, 034 1, 466 ± 0, 023 0, 758 ± 0, 058
orden de ejecución de cada librerı́a para mantener condiciones NSGA-II – KP(4) 4, 879 ± 0, 022 1, 587 ± 0, 041 1, 142 ± 0, 076
similares respecto al arranque de la JVM. En el segundo NSGA-II – DTLZ1(6) 0, 344 ± 0, 021 1, 658 ± 0, 043 0, 896 ± 0, 067
NSGA-II – DTLZ2(6) 0, 336 ± 0, 022 1, 803 ± 0, 040 0, 900 ± 0, 043
experimento, cada configuración ha sido lanzada seis veces NSGA-II – DTLZ4(6) 0, 351 ± 0, 034 1, 834 ± 0, 039 0, 922 ± 0, 110
utilizando dos núcleos para que el experimento no tuviese una SPEA2 – LOTZ(2) 0, 444 ± 0, 017 1, 445 ± 0, 022 0, 609 ± 0, 038
SPEA2 – ZDT1(2) 0, 368 ± 0, 028 2, 684 ± 0, 032 0, 999 ± 0, 087
duración excesiva. No obstante, las configuraciones también SPEA2 – ZDT4(2) 0, 291 ± 0, 022 1, 380 ± 0, 029 1, 020 ± 0, 060
se planificaron de forma que no siempre las mismas librerı́as SPEA2 – ZDT6(2) 0, 300 ± 0, 021 1, 385 ± 0, 047 0, 735 ± 0, 032
SPEA2 – KP(4) 3, 219 ± 0, 033 1, 736 ± 0, 105 1, 173 ± 0, 065
estuviesen ejecutando en paralelo a fin de reducir el sesgo SPEA2 – DTLZ1(6) 0, 959 ± 0, 050 1, 646 ± 0, 107 1, 633 ± 0, 236
lo más posible. Tras obtener el tiempo medio de ejecución SPEA2 – DTLZ2(6) 1, 442 ± 0, 023 2, 702 ± 0, 038 1, 583 ± 0, 070
SPEA2 – DTLZ4(6) 1, 435 ± 0, 088 2, 897 ± 0, 059 1, 699 ± 0, 103
de cada configuración, se ha aplicado el test de Friedman Friedman (ranking) 1,250 2,875 1,875
para analizar si existen diferencias significativas entre aquellas Holm (α/i) - 0,025 0,050
librerı́as para las que se ejecutaron los mismos algoritmos y
problemas. Es decir, para el primer experimento se analizan
Tabla V
dos grupos por separado, uno formado por ECJ, EvA y Opt4J, T IEMPO DE EJECUCI ÓN EN SEGUNDOS PARA EL SEGUNDO GRUPO DE
y otro formado por JCLEC-MO, jMetal y MOEA Framework. LIBRER ÍAS ( EXPERIMENTO 1)
En caso de encontrar diferencias significativas, se aplica el
Configuración JCLEC-MO jMetal MOEA Fram.
post-procedimiento de Holm. Además, se ha ejecutado el test NSGA-II – LOTZ(2) 0, 410 ± 0, 009 0, 624 ± 0, 023 0, 328 ± 0, 018
Cliff’s Delta para analizar el tamaño del efecto, esto es, la NSGA-II – KP(4) 0, 519 ± 0, 027 0, 558 ± 0, 042 0, 374 ± 0, 016
NSGA-II – DTLZ1(6) 0, 537 ± 0, 028 0, 540 ± 0, 066 0, 444 ± 0, 011
magnitud de la diferencia observada. NSGA-II – DTLZ2(6) 0, 587 ± 0, 064 0, 595 ± 0, 055 0, 389 ± 0, 008
IBEA – LOTZ(2) 4,754 ± 0, 037 1, 288 ± 0, 039 0, 844 ± 0, 019
V. R ESULTADOS Y DISCUSI ÓN IBEA – KP(4) 3, 012 ± 0, 036 1, 678 ± 0, 142 1, 036 ± 0, 029
IBEA – DTLZ1(6) 1, 829 ± 0, 030 2, 556 ± 0, 034 1, 254 ± 0, 011
En esta sección se presentan los resultados obtenidos para IBEA – DTLZ2(6) 1, 843 ± 0, 018 2, 538 ± 0, 032 1, 285 ± 0, 007
MOEA/D – ZDT1(2) 0, 429 ± 0, 018 0, 337 ± 0, 020 0, 458 ± 0, 008
cada uno de los experimentos planteados. Por motivos de MOEA/D – ZDT4(2) 0, 413 ± 0, 030 0, 277 ± 0, 010 0, 414 ± 0, 010
espacio, solo los resultados más relevantes son discutidos. MOEA/D – DTLZ1(2) 0, 380 ± 0, 022 0, 260 ± 0, 013 0, 434 ± 0, 023
MOEA/D – DTLZ2(2) 0, 492 ± 0, 035 0, 236 ± 0, 004 0, 412 ± 0, 016
OMOPSO – ZDT1(2) 0, 556 ± 0, 034 0, 412 ± 0, 050 1, 269 ± 0, 040
V-A. Comparación de algoritmos y problemas OMOPSO – ZDT4(2) 0, 530 ± 0, 043 0, 284 ± 0, 010 1, 117 ± 0, 032
OMOPSO – DTLZ1(2) 0, 663 ± 0, 009 0, 484 ± 0, 042 1, 510 ± 0, 016
Las Tablas IV y V muestran los tiempos medios de OMOPSO – DTLZ2(2) 0, 715 ± 0, 035 1, 466 ± 0, 086 2, 139 ± 0, 072
ejecución y la desviación estándar para los dos grupos de Friedman (ranking) 2,125 1,938 1,938
librerı́as. La ejecución más rápida (0,24 s) se corresponde

con la resolución de DTLZ2 con MOEA/D en jMetal. Por
el contrario, el problema de la mochila con NSGA-II en ECJ requiriendo varios segundos de ejecución. La diferencia con
es la combinación que más tiempo ha necesitado (4,88 s). respecto al resto de algoritmos es más evidente en JCLEC-
En el primer grupo de librerı́as (Tabla IV), ECJ es la que MO y jMetal, especialmente cuando se resuelven problemas
requiere menos tiempo, empleando más de un segundo en solo combinatorios. Para este conjunto de librerı́as, el test de
cuatro configuraciones. EvA es la librerı́a que reporta tiempos Friedman no encuentra diferencias significativas. De hecho, el
de ejecución más altos, siempre por encima de un segundo, test Cliff’s Delta siempre cataloga las diferencias entre cada
mientras que Opt4J mantiene tiempos más estables, entre 0,5 pareja de librerı́as como insignificante (negligible), salvo entre
y 1,5 s. Para confirmar si estas diferencias son significativas, jMetal y JCLEC-MO, que es pequeña (small).
se ha aplicado el test de Friedman, donde la hipótesis nula Dado que todas estas configuraciones son simples y se eje-
establece que todas las librerı́as tienen un rendimiento similar. cutan en pocos segundos, tan solo se pueden realizar algunas
El valor del estadı́stico de Iman and Daveport, z, es 30,71, apreciaciones respecto a la memoria RAM consumida. Las
mientras que el valor crı́tico de acuerdo a una distribución F seis librerı́as Java analizadas consumen un mı́nimo de 12.000
con 2 y 30 grados de libertad es igual a 5,39 (α = 0, 01). KB en cada ejecución. EvA y Opt4J son las dos librerı́as que
Dado que z es mayor que el valor crı́tico, la hipótesis nula muestran un comportamiento más estable, con un máximo
puede ser rechazada. El test de Holm devuelve un p − value de 56.459 KB y 126.084 KB de media, respectivamente.
igual a 0,05, lo que confirma que ECJ es significativamente Entre el resto, el uso máximo de memoria es más disperso
superior a EvA, pero equivalente a Opt4J. En cuanto al efecto llegando a presentar “picos” de más de 100.000 KB en JCLEC-
del tamaño, el test Cliff’s Delta indica que la diferencia en MO (76.130 KB de media), jMetal (88.326 KB) y MOEA
tiempo entre las tres librerı́as es siempre amplia (large). Framerwork (89.005 KB), y más de 500.000 KB en ECJ
En el segundo grupo de librerı́as (JCLEC-MO, jMetal (149.265 KB) cuando se resuelve el problema de la mochila.
y MOEA Framework), IBEA es el algoritmo más costoso, Valorando los resultados del primer experimento en global,
596
todas las librerı́as presentan unos requisitos de tiempo y distintas combinaciones de objetivos y generaciones, fijando
memoria asumibles ante un escenario de uso normal. Aún el tamaño de población en 1000 (el valor más alto probado).
ası́, y a pesar de que las configuraciones probadas son po- Para facilitar la comparación entre librerı́as, se ha mantenido
co exigentes, se perciben ciertas diferencias. En concreto, la misma escala respecto al tiempo. A excepción de EvA, las
no todas las librerı́as responden igual ante la ejecución de librerı́as presentan una tendencia similar y no suelen requerir
un mismo algoritmo en problemas de distinta naturaleza más de 30 minutos por ejecución.
(combinatorios frente a optimización real). En este sentido, Con respecto al consumo de memoria, el alto número de
los problemas combinatorios son más costosos, aún cuando combinaciones probadas permite obtener mayores diferencias.
el número de objetivos es inferior al considerado para los A modo de resumen, la Tabla VII recoge el valor mı́nimo
problemas DTLZ. Esto puede deberse a que la evaluación y máximo de memoria registrado para cada librerı́a. Como
requiere la interpretación del genotipo, frente al uso directo puede verse, no existen grandes diferencias en cuanto a los
de las variables reales. Por otro lado, la formulación concreta valores mı́nimos, pero sı́ en los máximos alcanzados. También
de los diferentes problemas ZDT no parece tener una gran se muestra el porcentaje de veces que cada librerı́a obtiene el
influencia en el tiempo, mientras que sı́ se observan algunas mı́nimo y máximo global para las 60 combinaciones probadas.
diferencias respecto a los problemas DTLZ (véase por ejemplo En este caso, ECJ y Opt4J son las librerı́as que menor y mayor
OMOPSO en jMetal y MOEA Framework, o SPEA2 en ECJ memoria consumen, respectivamente.
y EvA). Respecto a los algoritmos, NSGA-II suele ser el más Este test de escalabilidad confirma que las implementacio-
rápido en la mayorı́a de librerı́as. La única excepción parece nes Java actuales pueden sufrir una degradación considerable
ser la implementación de MOEA/D en JCLEC-MO y jMetal, en su rendimiento si se las somete a configuraciones extremas.
si bien hay que considerar que este algoritmo solo ha sido Aunque quizás no sean los valores más habituales en la
probado con problemas biobjetivo de codificación real. práctica, también debe considerarse que NSGA-II no es de
los algoritmos más costosos y que el problema es sintético.
V-B. Test de escalabilidad En una aplicación real, donde fuese necesario ejecutar algo-
El segundo experimento, donde se ejecutan configuraciones ritmos especı́ficos para problemas de muchos objetivos cuya
con hasta 50 objetivos, permite detectar mayores diferencias evaluación fuese costosa, la elección de una implementación
entre las librerı́as. La Tabla VI muestra los tiempos mı́nimos u otra podrı́a ser determinante. Entre las librerı́as analizadas,
y máximos medios, con su desviación estándar, para cada EvA y Opt4J presentan mayores problemas para controlar el
tamaño de población. También se incluye el ranking obtenido tiempo y la memoria, respectivamente. Por el contrario, ECJ
con el test de Friedman. Cabe señalar que los tiempos mı́nimos y MOEA Framework presentan el mejor rendimiento consi-
y máximos corresponden, por lo general, con las configuracio- derando ambos factores a la vez, ya que tanto jMetal como
nes P100-G100-O2 y P1000-G5000-050. Las excepciones son JCLEC-MO experimentan mayores oscilaciones de memoria.
algunos tiempos mı́nimos en Opt4J, JCLEC-MO y jMetal, que
se consiguen para cinco objetivos. No obstante, los valores son VI. C ONCLUSIONES
muy similares a los obtenidos para dos objetivos, por lo que Este trabajo ha presentado una comparativa experimental
pueden deberse a pequeñas fluctuaciones en la carga de la de implementaciones de algoritmos multiobjetivo disponibles
máquina. En base a estos resultados, ECJ es la librerı́a que en seis librerı́as Java con el fin de analizar sus requisitos de
mejor responde ante configuraciones más exigentes, seguida tiempo y memoria. Los distintos algoritmos han sido ejecu-
de MOEA Framework, si bien el test de Holm no indica la tados considerando configuraciones que difieren en el tipo de
existencia de diferencias significativas entre ambas. Les siguen problema, el número de objetivos, el número de generaciones
jMetal y JCLEC-MO, si bien cabe señalar que JCLEC-MO y el tamaño de la población. Los dos experimentos realizados
responde algo mejor que jMetal ante el aumento del número indican que estos parámetros afectan en mayor o menor me-
de objetivos. Lo mismo ocurre si se comparan las dos librerı́as dida a todas las librerı́as. Para un uso estándar, las diferencias
más lentas según este estudio, pues aunque Opt4j y EvA son poco apreciables y están condicionadas a la complejidad
reportan tiempos mı́nimos similares, Opt4J escala mejor. del algoritmo o del problema a resolver. Sin embargo, si se
Por otro lado, los datos extraı́dos muestran que el incre- necesitan valores elevados para los parámetros anteriores, es
mento en el tiempo de ejecución no depende únicamente del conveniente analizar la forma en que cada librerı́a implementa
número de generaciones. Por ejemplo, configuraciones con el algoritmo, pues las diferencias pueden ser notables. En este
1000 generaciones y dos objetivos pueden requerir menos sentido, este estudio puede extenderse para abarcar un mayor
tiempo de cómputo que configuraciones con 500 generaciones número de librerı́as, algoritmos y problemas. Asimismo, serı́a
y 50 objetivos. Aunque hay algunas excepciones, sı́ se aprecia interesante analizar la capacidad de las distintas librerı́as para
un incremento lineal cuando dos de los parámetros son fijados paralelizar la evaluación de soluciones.
y el otro aumenta progresivamente. Los dos parámetros más
R EFERENCIAS
determinantes son el número de generaciones y el número
de objetivos, especialmente cuando se consideran valores [1] T. Stewart, O. Bandte, H. Braun, N. Chakraborti, M. Ehrgott, M. Göbelt,
Y. Jin, H. Nakayama, S. Poles, and D. Di Stefano, “Real-World Appli-
superiores a 500 y 10, respectivamente. A modo de ejemplo, cations of Multiobjective Optimization,” in Multiobjective Optimization,
la Figura 1 muestra el tiempo medio de ejecución para las vol. 5252 of LNCS, pp. 285–327, springer Berlin Heidelberg, 2008.
597
Tabla VI
T IEMPOS M ÍNIMOS Y M ÁXIMOS EN SEGUNDOS ( EXPERIMENTO 2)
P = 100 P = 500 P = 1000

Librerı́a Ranking
Min. Máx. Min. Máx. Min. Máx.
ECJ 0, 34 ± 0, 04 14, 37 ± 0, 92 0, 79 ± 0, 05 170, 61 ± 2, 44 2, 73 ± 0, 09 589, 33 ± 3, 58 1,00
EvA 1, 79 ± 0, 02 226, 77 ± 2, 25 5, 74 ± 0, 62 3830, 01 ± 94, 69 16, 38 ± 0, 49 16030, 96 ± 512, 88 6,00
JCLEC-MO 0, 64 ± 0, 07 30, 55 ± 0, 58 3, 25 ± 0, 10 475, 77 ± 4, 83 11, 86 ± 0, 07 1611, 35 ± 91, 90 4,11
jMetal 0, 58 ± 0, 06 30, 74 ± 1, 21 2, 64 ± 0, 07 576, 81 ± 3, 86 9, 01 ± 0, 17 2237, 61 ± 30, 34 3,35
MOEA Framework 0, 37 ± 0, 01 19, 26 ± 0, 21 1, 43 ± 0, 08 339, 96 ± 1, 59 4, 27 ± 0, 14 1284, 00 ± 7, 17 2,02
Opt4J 0, 93 ± 0, 08 39, 18 ± 0, 68 4, 12 ± 0, 09 533, 96 ± 6, 95 13, 98 ± 0, 31 1743, 74 ± 12, 82 4,52
(a) ECJ (b) EvA (c) JCLEC-MO
(d) jMetal (e) MOEA Framework (f) Opt4J
Figura 1. Variación en el tiempo de ejecución de NSGA-II para una población de 1000 individuos (experimento 2)
Tabla VII [5] A. López Jaimes and C. A. Coello Coello, Springer Handbook of
R ESUMEN DEL CONSUMO DE MEMORIA ( EXPERIMENTO 2) Computational Intelligence, ch. Many-Objective Problems: Challenges
and Methods, pp. 1033–1046. Springer Berlin Heidelberg, 2015.
Valores (KB) Porcentajes [6] V. Khare, X. Yao, and K. Deb, “Performance Scaling of Multi-objective
Librerı́a Evolutionary Algorithms,” in Proc. 2nd Int. Conf. Evolutionary Multi-
Min. Máx. Min. Máx.
ECJ 123960 2064160 26,67 0,00 Criterion Optimization, pp. 376–390, 2003.
EvA 111080 1676000 15,00 0,00 [7] B. Li, J. Li, K. Tang, and X. Yao, “Many-Objective Evolutionary
JCLEC-MO 123840 6450680 13,33 0,00 Algorithms: A Survey,” ACM Comput. Surv., vol. 48, no. 1, pp. 13:1–35,
jMetal 124080 14485480 23,33 23,33 2015.
MOEA Framework 123760 2589000 15,00 0,00 [8] J. Maltese, B. M. Ombuki-Berman, and A. P. Engelbrecht, “A Scalability
Opt4J 124480 3909920 6,67 76,67 Study of Many-Objective Optimization Algorithms,” IEEE T Evolut.
Comput., vol. 22, no. 1, pp. 79–96, 2018.
[9] A. Zhou, B.-Y. Qu, H. Li, S.-Z. Zhao, P. N. Suganthan, and Q. Zhang,
“Multiobjective evolutionary algorithms: A survey of the state of the
art,” Swarm Evolut. Comput., vol. 1, no. 1, pp. 32–49, 2011.
[2] C. A. Coello Coello, G. B. Lamont, and D. A. Van Veldhuizen, Evo- [10] C. A. Coello Coello, “Evolutionary Multiobjective Optimization: Current
lutionary Algorithms for Solving Multi-Objective Problems. Springer, and Future Challenges,” in Advances in Soft Computing, pp. 243–256,
2nd ed., 2007. Springer London, 2003.
[3] J. A. Parejo, A. Ruiz-Cortés, S. Lozano, and P. Fernández, “Metaheuris- [11] E. Zitzler, K. Deb, and L. Thiele, “Comparison of Multiobjective
tic optimization frameworks: a survey and benchmarking,” Soft Comput., Evolutionary Algorithms: Empirical Results,” Evolut. Comput., vol. 8,
vol. 16, no. 3, pp. 527–561, 2012. no. 2, pp. 173–195, 2000.
[4] S. Chand and M. Wagner, “Evolutionary many-objective optimization: A [12] K. Deb, L. Thiele, M. Laumanns, and E. Zitzler, Scalable Test Pro-
quick-start guide,” Surv. Oper. Res. Manag. Sci., vol. 20, no. 2, pp. 35– blems for Evolutionary Multiobjective Optimization, ch. Evolutionary
42, 2015. Multiobjective Optimization, pp. 105–145. Springer London, 2005.
598
Algoritmo Evolutivo con División del Espacio de

los Objetivos en base a la Solución Nadir: Un
Estudio Comparativo sobre el Problema de la
Mochila 0/1 Bi-Objetivo
1st Máximo Méndez 2nd Daniel Alejandro Rossit
Instituto Universitario de Sistemas Inteligentes (SIANI) Departamento de Ingenierı́a
Universidad de Las Palmas de Gran Canaria (ULPGC) CONICET, Universidad Nacional del Sur (UNS)
España Argentina
3rd Mariano Frutos 4th Begoña González

Departamento de Ingenierı́a Instituto Universitario de Sistemas Inteligentes (SIANI)
CONICET, Universidad Nacional del Sur (UNS) Universidad de Las Palmas de Gran Canaria (ULPGC)
Argentina España
Resumen—Este trabajo presenta un algoritmo evolutivo mul- que les proporciona gran destreza para encontrar múltiples
tiobjetivo (AEMO) el cual divide el espacio de los objetivos, en soluciones no-dominadas en espacios de soluciones de diversa
varias regiones utilizando la solución Nadir calculada en cada naturaleza. NSGA-II [2] y MOEA/D [12] son dos AEMOs
generación del algoritmo. Para la clasificación de las soluciones
de las distintas regiones en frentes no-dominados, se utilizan muy reconocidos en la comunidad cientı́fica multiobjetivo. El
diferentes estrategias de optimización de las funciones objetivo. primero, utiliza una clasificación de rangos por dominancia
La idea es intensificar la diversidad del frente de soluciones no- como mecanismo de convergencia, mientras que crowding-
dominadas alcanzado. El algoritmo propuesto (NSGA-II/OSD) distance es el mecanismo usado para diversificar las solu-
se implementa sobre el algoritmo NSGA-II y se ensaya sobre ciones. El segundo, funciona descomponiendo el POM en
el Problema de la Mochila 0/1 Bi-Objetivo (MOKP-0/1) bien
conocido en la comunidad multiobjetivo. Con dos objetivos, este un número de subproblemas escalares o mono-objetivos que
problema es de difı́cil resolución para un AEMO dado el elevado son resueltos todos a la misma vez mediante la evolución
número de soluciones superpuestas (overlapping solutions) que de una población de soluciones. Algunos trabajos recientes
se generan durante su evolución. El método propuesto ofrece describen dificultades en cuanto a la especificación del punto
muy buen desempeño cuando es comparado con los algoritmos de referencia en MOEA/D [6], [7], [9], [11]. Trabajos con
NSGA-II y MOEA/D muy reconocidos ambos en la literatura
especializada. AEMOs que incluyan un sub-división del espacio de los
Index Terms—Optimización, Algoritmos Evolutivos Multiob- objetivos como la propuesta en este trabajo son muy escasos,
jetivo, Dominancia de Pareto, MOKP0/1, NSGA-II, MOEA/D. sólo hemos encontrado [8], [10].
El problema de la mochila multiobjetivo en variables bina-
rias (MOKP/0-1) es un problema combinatorio bien conocido
I. I NTRODUCCI ÓN y ampliamente manejado en la comunidad multi-objetivo. Un
Un problema de optimización multiobjetivo (POM) es aquel considerable número de métodos exactos y metaheurı́sticos,
que corresponde a una cierta realidad industrial, económica o ver por ejemplo [3], [5], [12], intentan resolver este problema.
de otra ı́ndole y sobre el que un decisor desea optimizar varios En [4], se señala que se genera un elevado número de
objetivos usualmente en conflicto entre sı́. Cuando se resuelve soluciones superpuestas (overlapping solutions) cuando los
un POM de complejidad difı́cil, métodos metaheurı́sticos AEMOs se aplican a problemas combinatorios con muchas
son muy apropiados. Estos métodos no grantizan obtener el variables de decisión y baja dimensionalidad. La aparición de
frente exacto de soluciones no-dominadas, pero sı́ un conjunto soluciones superpuestas cuando el Problema de la Mochila 0/1
aproximado. Bi-Objetivo se resuelve con un AEMO, tiene un significativo
La segunda generación de algoritmos evolutivos multiob- impacto negativo sobre la diversidad del frente final de solu-
jetvo (AEMOs), ha demostrado obtener excelentes resultados ciones no-dominadas alcanzado.
resolviendo POM [1]. De naturaleza estocástica, los AEMOs Se propone un hı́brido de NSGA-II, que subdivide el espacio
están basados en el concepto de población de soluciones lo de los objetivos en varias regiones utilizando la solución Nadir
599
calculada en cada generación del algoritmo. Las distintas donde z ∗ = (z1∗ , ..., zn∗ ) es el punto de referencia (PR)
subdivisiones utilizan diferentes estrategias de optimización especificado en este trabajo de la siguiente forma:
de las funciones objetivo. La idea que subyace es intensificar
la diversidad de soluciones del frente alcanzado, permitiendo zi∗ = α ∗ min{fi (x)|x ∈ X} paracada i = 1, ..., n (3)
que soluciones dominadas por los extremos del frente no- y donde α ≥ 1.
dominado alcanzado en cada generación del algoritmo puedan
entrar en la población N no-dominada del algoritmo. II-B. MOEA/D con especificación de Ishibuchi del punto de
El resto del trabajo se organiza de la siguiente manera. referencia
En la sección II se presentan algunos conceptos básicos para
Ishibuchi et al. proponen en [6] usar en (2) la siguiente
entender mejor este trabajo. En la sección III se describe el
especificación para el PR:
método propuesto. Los resultados experimentales se detallan
en la sección IV. Por último, en la sección V se presentan las z R = zi∗ − αt (zimax − zi∗ ) (4)
conclusiones.
donde zi∗ = (z1∗ , ..., zn∗ ) corresponde al mı́nimo valor en la
II. C ONCEPTOS B ÁSICOS función objetivo i, zimax = (z1max , ..., znmax ) corresponde al
En términos de minimización, un POM puede ser definido máximo valor de la función objetivo i en la generación en
de la siguiente forma: curso y αt es un parámetro que decrece en cada generación
del algoritmo. De (4) es obvio que cuando αt = 0 los valores
M in. F (x) = f1 (x), f2 (x), ..., fn (x) z R y z ∗ tienen los mismos valores.
s.a. Para hacer que el valor z R se aproxime gradualmente al
(1)
gk (x) ≤ 0 k ∈ (1, 2, ..., p) valor del punto de referencia z ∗ durante la ejecución del
hl (x) = 0 l ∈ (1, 2, ..., q) algoritmo, el valor αt es modificado en cada generación según:
donde F (x) es el vector de objetivos a minimizar y n ≥ 2 el αt = α (tmax − t)/(tmax − 1) (5)
número de objetivos. Las ecuaciones gk (x) ≤ 0 y hl (x) = 0
representan respectivamente p restricciones de desigualdad y donde α es un valor inicial de αt , tmax es el número máximo
q restricciones de igualdad. Los valores de x que satisfacen de generaciones del algoritmo y t es la generación actual.
el conjunto de las (p + q) restricciones, definen el espacio Nótese que el valor final de αt en la última generación es
realizable S. El vector x = (x1 , x2 , ..., xm ) ∈ S es un vector cero, i.e., z R tiende a z ∗ durante la ejecución del algoritmo.
solución de m variables de decisión.
El conjunto de las imágenes de cada solución realizable en III. M ÉTODO PROPUESTO
el espacio de la decisión, conforma el conjunto de soluciones El algoritmo propuesto en este trabajo consiste en una
realizables en el espacio de los objetivos Z = f (S) definido versión modificada de NSGA-II, en los siguientes términos:
como Z = {z1 = f1 (x), ..., zn = fn (x), ∀x ∈ S} y donde 1. En cada generación t del algoritmo: una población Rt =
z = (z1 , ..., zn ) ∈ Rn representa una solución realizable en el Pt + Qt es construida con Pt la población de padres
espacio de los objetivos. de tamaño N y Qt la población de hijos (tamaño N)
Una solución z t = (z1t , z2t , ..., znt ) ∈ Z domina una solución generados de las operaciones de cruzamiento y mutación
z = (z1u , z2u , ..., znu ) ∈ Z y se le conoce como Pareto-óptima
u
a partir de la población N construida en la generación
si se verifican las siguientes condiciones: t-1.
1. zjt ≤ zju ∀j ∈ (1, 2, ..., n) 2. A partir de la población Rt la solución Nadir es identi-
2. ∃j ∈ (1, 2, ..., n) tal que zjt < zju ficada mediante algún método.
Al conjunto de soluciones Pareto-óptimas en el espacio de 3. En base a la solución Nadir el espacio de los objetivos
soluciones se le llama conjunto óptimo de Pareto y a su imagen se divide en tres regiones independientes R1 , R2 y R3
en el espacio de objetivos frente óptimo de Pareto. tal como se indica en la Fig. 1 izquierda.
4. Las soluciones de cada región R1 , R2 y R3 son clasifica-
II-A. MOEA/D con especificación de Zhang del punto de das (complejidad computacional O(n2N)) en diferentes
referencia frentes no-dominados (F1 , F2 ,...,Fn ). Para la clasifica-
Básicamente, MOEA/D trabaja descomponiendo un POM ción de las soluciones, se usan diferentes criterios de
en un número finito de sub-problemas escalares y resolviéndo- optimización de las funciones objetivo f1 y f2 .
los simultáneamente mediante la evolución de una población a) Región R1: Las dos funciones objetivo f1 y f2 son
de soluciones. Algunos enfoques para convertir un POM en un siempre maximizadas (ver Fig. 1 derecha).
sub-problema escalar se pueden consultar en [12]. El enfoque b) Región R2: La función f1 es siempre maximizada.
de Tchebycheff se expresa como sigue: La función f2 es maximizada si se cumple la
condición t≥nt, en caso contrario f2 es minimizada
M in. g te (x|λ, z ∗ ) = máx {λi fi (x) − zi∗ } (ver Fig. 1 derecha). El valor t es la generación
1≤i≤n (2)
s.a. x∈X actual y nt un parámetro (número de generaciones
600
que se maximiza o minimiza la función objetivo) datos del problema y frente óptimo pueden descargarse de:
que se define como: http://www.tik.ee.ethz.ch/ sop/download/supplementary/
testProblemSuite/.
nt = α tmax 0 ≤ α ≤ 1 (6)
En todos los experimentos se utilizó codificación binaria,
c) Región R3: La función f2 es siempre maximizada. cruce uniforme de probabilidad 0.8 y probabilidad de mutación
La función f1 es maximizada si se cumple la (bit a bit) de 1/500. Un número de 400000 evaluaciones de
condición t≥nt, en caso contrario f1 es minimizada la función objetivo se usó como condición de parada. Tres
(ver Fig. 1 derecha). tamaños de la población N=50, N=100 y N=200 soluciones
Finalizado el paso 4, toda la población Rt queda clasi- fueron utilizadas en los tres algoritmos NSGA-II/OSD, NSGA-
ficada en frentes de no-dominación (F1 , F2 ,...,Fn ). II y MOEA/D. Los valores examinados para el parámetro α
5. Para completar la población Pt+1 hasta alcanzar un definido en (6) de balance convergencia/diversidad de NSGA-
tamaño N, como en NSGA-II, las soluciones con menor II/OSD fueron α= 0.0, 0.1, 0.2, 0.3 0.4, 0.5, 0.6, 0.7, 0.8, 0.9
rango primero, y mayor crowding-distance segundo, son y 1.0. Con MOEA/D, los valores ensayados de α en el cálculo
escogidas. del punto de referencia z ∗ según la especificación de Zhang
definida en (3) fueron α= 1.0, 1.05, 1.1, 1.15, 1.2, 1.25, 1.3; en
la versión de Ishibuchi para el cálculo del punto de referencia
z R definido en (4) y (5), los valores se fijaron en α= 0.0, 0.05,
0.1, 0.5, 1.0, 1.1, 2.0, 3.0, 4.0, 5.0 y 10.0.
Para la comparación de los resultados obtenidos por los
algoritmos, se emplearon la S-metric o hipervolumen H (punto
de referencia usado el 0,0) sugerida en [13] y visualizaciones
de los frentes de soluciones de Pareto alcanzados de valor H
más próximo al valor medio final calculado en 30 ejecuciones
independientes.
Figura 1. División propuesta del espacio de los objetivos en base a la solución IV-C. Análisis previo: NSGA-II/OSD y efectos de variar el
Nadir (izquierda). Criterios de optimización de las funciones objetivo para parámetro α
cada región R1 , R2 y R3 (derecha).
En esta subsección se analizan las influencias en la conver-
gencia y diversidad del frente de soluciones alcanzado, cuando
IV. E XPERIMENTOS Y COMPARACIONES se varı́a el parámetro α en la ecuación (6) en el algoritmo
IV-A. Problema de la Mochila Multiobjetivo MOKP/0-1 propuesto NSGA-II/OSD. En la Fig. 2 (izquierda), se muestran
El problema de la mochila multiobjetivo en variables bi- los valores del hipervolumen medio al modificar los valores
narias (MOKP/0-1) consiste en una serie de objetos o ı́tems del parámetro α. Se puede observar que los mejores valores de
con un peso, un beneficio asociado a cada uno de ellos y un H se obtienen para valores intermedios del parámetro α. Para
lı́mite de capacidad para cada mochila. Ası́, la tarea radica mejor interpretar estos resultados, la Fig. 2 (centro) muestra
en encontrar el subconjunto de objetos que maximicen los los efectos sobre la distribución de soluciones de los frentes
beneficios totales de cada mochila y que puedan ser colocados de Pareto obtenidos cuando N=200. Los frentes de Pareto de
en dichas mochilas sin exceder sus lı́mites de capacidad. El menor diversidad (mayor convergencia) y mayor diversidad
problema es de complejidad NP-difı́cil y puede ser usado para (menor convergencia) se obtienen cuando α=0.0 y α=1.0
modelar cualquier aplicación real que se ajuste al modelo respectivamente. El frente con el mejor valor del hipervolumen
descrito en (7). se alcanza cuando α=0.5, ver la Fig. 2 (derecha).
El MOKP/0-1 puede ser definido formalmente como sigue:
IV-D. Resultados comparativos: NSGA-II/OSD vs NSGA-II
 m
∑ En esta subsección se compara el algoritmo NSG-II/OSD
 max. fi (x) = bij xj i = 1, ..., n propuesto en este trabajo con el algoritmo NSGA-II de Deb


j=1
m
∑ (7) et al. [2]. La Fig. 3 muestra los frentes de soluciones de Pareto
 s.a. wij xj ≤ ci xj ϵ{0, 1} obtenidos por ambos algoritmos. Se observa que el frente


j=1 de soluciones alcanzado con el método propuesto (α=0.5)
donde: m=número de objetos, xj =variable de decisión, tiene bastante más diversidad que el alcanzado por NSGA-
n=número de sacos, bij =beneficio objeto j según saco i, II, aunque en términos de convergencia parece que NSGA-
wij =peso objeto j según saco i y ci = capacidad saco i. II obtiene mejor valor. La Fig. 4 (izquierda) muestra que en
términos de la métrica H, el frente de soluciones logrado
IV-B. Configuración de parámetros y métricas por NSGA-II/OSD es mejor que el obtenido por NSGA-II;
En este trabajo, las implementaciones de NSGA-II y también la Fig. 4 (derecha) señala para NSGA-II/OSD un
MOEA/D se han realizado según [2] y [12]. Ambos algoritmos menor valor de la desviación estándard del hipervolumen. En
son aplicados sobre el 500-MOKP/0-1 con dos objetivos, los la Fig. 5 (izquierda) se aprecia que durante la evolución de
601
Figura 2. Valores H al variar el parámetro α en el algoritmo propuesto NSGA-II/OSD (izquierda). Gráficas de soluciones no-dominadas con el valor H más
próximo al valor medio final en 30 ejecuciones (centro). Evolución del hipervolumen medio de los frentes mostrados en la gráfica central (derecha).
los algoritmos, el porcentaje de soluciones diferentes en la

población N de soluciones es siempre mejor para el algoritmo
propuesto, lo que justifica la mayor diversidad del frente de NSGA−II/OSD vs NSGA−II NSGA−II/OSD vs NSGA−II
4.2 0.07
soluciones logrado por NSGA-II/OSD. También, el número de NSGA−II/OSD α=0.5 N200

4 0.06 NSGA−II N200
reparaciones por ensayo realizadas a los cromosomas de las
soluciones de la población para que sean factibles, es menor
Hipervolumen medio
3.8 0.05
Desviación media
con el método propuesto tal como se aprecia en la Fig. 5 3.6 0.04
(derecha).
3.4 0.03
4
x 10 NSGA−II/OSD vs NSGA−II 3.2 0.02
2.1
2.05
3 0.01
NSGA−II/OSD α=0.5 N200
2
NSGA−II N200
1.95 2.8 0
0 500 1000 1500 2000 0 500 1000 1500 2000
1.9 Generación Generación
1.85
f2
1.8 Figura 4. NSGA-II/OSD versus NSGA-II: Evolución de los valores de los

1.75 hipervolumenes medio (iquierda) y desviaciones del hipervolumen (derecha).
1.7
1.65 True POF

1.6
NSGA−II N200
1.55
1.5 1.6 1.7 1.8 1.9 2 2.1
f1 4
x 10
NSGA−II/OSD vs NSGA−II x 10 NSGA−II/OSD

5 vs NSGA−II
100 2.4
Figura 3. NSGA-II/OSD versus NSGA-II: gráficas de soluciones no-
dominadas con el valor H más próximo al valor medio final en 30 ejecuciones. 90 2.2
% Soluciones diferentes en N
80 2
Número Reparaciones
70 1.8
IV-E. Análisis previo: MOEA/D e importancia de la especi- 60 1.6
ficación del punto de referencia PR 50 1.4
Dos especificaciones del punto de referencia -la de Zhang 40 1.2
y la de Ishibuchi descritas en los apartados II-A y II-B- se 30 1
comparan en esta subsección. La Fig. 6 (izquierda) muestra 20 0.8
NSGA−II/OSD α=0.5 N200 NSGA−II/OSD α=0.5 N200

los valores del hipervolumen medio H al variar el valor α en la 10
NSGA−II N200
0.6
NSGAII N200
especificación de Zhang del punto de referencia en MOEA/D 0
0 500 1000 1500 2000
0.4
1 5 10 15 20 25 30
Generación Ensayo
según la ecuación (3). El valor H crece hasta un valor máximo
(cuando α =1.2) para luego volver a decrecer. También se
Figura 5. NSGA-II/OSD versus NSGA-II: Evolución de los porcentajes
pueden observar, en la Fig. 7 (izquierda), los efectos sobre medios de soluciones diferentes en las poblaciones N (izquierda) y de los
la diversidad de los frentes de soluciones alcanzados cuando números de reparaciones de los cromosomas por ensayo (derecha).
α=1.0 (mı́nima diversidad) y α=1.2 (máxima diversidad y
máximo valor de H).
602
MOEA/D MOEA/D MOEA/DZhang vs MOEA/DIshibuchi
4.1 4.1 100
90
Zhangte α=1.2 N200
te
Ishibuchi α=0.0 N200
80
4 4
Ishibuchite α=5.0 N200
Hipervolumen medio
Hipervolumen medio
70 te
60 Ishibuchite α=15.0 N200
3.9 3.9
50
40
Zhangte N200 Ishibuchite N200

3.8 3.8 30
te te
Zhang N100 Ishibuchi N100 20
Zhangte N50 Ishibuchite N50 10

3.7 3.7
1 1.05 1.1 1.15 1.2 1.25 1.3 0 0.05 0.1 0.5 1 1.1 2 3 4 510
Valor Parámetro α Valor Parámetro α 0
0 500 1000 1500 2000
Generación
Figura 6. Valores H al variar el parámetro α en la especificación de Zhang

del PR en MOEA/D (izquierda). Valores H al variar el parámetro α en la Figura 9. Evolución de los prcentajes medios de soluciones diferentes en las
especificación de Ishibuchi del PR en MOEA/D (derecha). poblaciones N.
x 10
4 MOEA/D x 10
4 MOEA/D
2.1 2.1
2.05 2.05
y de la desviación de H (Fig. 8 derecha) a lo largo de
2 2 la evolución del algoritmo. No obstante, hay que señalar
1.95 1.95 que el frente de soluciones logrado por MOEA/D con la
1.9 1.9
1.85 1.85
especificación de Ishibuchi es más pobre (ver Fig. 7 derecha)
f2
f2
1.8 1.8 en número de soluciones diferentes en la población N que el

1.75 1.75 logrado usando la especificación de Zhang. En la Fig. 9 se
1.7 1.7
1.65
True POF
te 1.65
True POF
te
muestra que utilizando la especificación de Zhang, MOEA/D
Zhang α=1.2 N200 Ishibuchi α=5.0 N200
1.6
Zhangte α=1.0 N200 1.6
Ishibuchite α=0.0 N200
consigue siempre en toda la evolución del algoritmo un mayor
1.55
1.5 1.6 1.7 1.8 1.9 2 2.1
1.55
1.5 1.6 1.7 1.8 1.9 2 2.1
número de soluciones diferentes en la población N; por otro
f1 4 f1 4
x 10 x 10 lado, en dicha gráfica también se observa que incrementando
Figura 7. Gráficas de soluciones no-dominadas con el valor H más próximo
el valor α usando la especificación de Ishibuchi en MOEA/D,
al valor medio final en 30 ejecuciones: especificación de Zhang del PR hay un decremento del número de soluciones diferentes en N.
(izquierda), especificación de Ishibuchi del PR (derecha).
IV-F. Resultados comparativos: NSGA-II/OSD vs MOEA/D
Utilizando ahora en MOEA/D la especificación de Ishibu- te te

NSGA−II/OSD vs MOEA/DZhang NSGA−II/OSD vs MOEA/DZhang
chi del punto de referencia según las ecuaciones (4) y (5), 4.2 0.14
también al variar el valor α se obtienen diferentes valores del 4 0.12 te
Zhang α=1.2 N200
hipervolumen H. La Fig. 6 (derecha) señala que el valor H
Hipervolumen medio
3.8 0.1
crece hasta un valor máximo (cuando α≥3) a partir del cual
Desviación media
permanece estable. 3.6 0.08
3.4 0.06
Zhang Ishibuchi Zhang Ishibuchi
MOEA/D vs MOEA/D MOEA/D vs MOEA/D
4.2 0.14 3.2 0.04
Zhangte α=1.2 N200
4 0.12 te NSGA−II/OSD α=0.5 N200
Ishibuchi α=5.0 N200 3 0.02
te
Zhang α=1.2 N200
Hipervolumen medio
3.8 0.1
2.8 0
0 500 1000 1500 2000 0 500 1000 1500 2000
Generación Generación
Desviación
3.6 0.08
3.4 0.06
Figura 10. NSGA-II/OSD versus MOEA/D: Evolución de los valores de los
3.2 0.04
hipervolumenes medio (iquierda) y desviaciones del hipervolumen (derecha).
3 Zhangte α=1.2 N200 0.02

En esta subsección comparamos el algoritmo NSGA-II/OSD
te
2.8
0 500 1000 1500 2000
0
0 500 1000 1500 2000
propuesto en este trabajo y el algoritmo MOEA/D con espe-
Generación Generación cificación de Zhang del PR, utilizando en ambos algoritmos
aquel valor α que proporcionó el mejor valor del hipervolumen
Figura 8. Evolución de los hipervolumenes medio (iquierda) y desviaciones medio H tras 30 ejecuciones independientes y que según los
del hipervolumen (derecha) usando las especificaciones de Zhang e Ishibuchi
del PR en MOEA/D. experimentos descritos en anteriores apartados fue α=1.2 para
ambos algoritmos. En la Fig. 10 (izquierda) se observa que
Una comparación de MOEA/D usando las especificaciones durante la primera mitad de la evolución de los algoritmos,
de Zhang con el valor α=1.2 e Ishibuchi con valores α≥3, MOEA/D tiene un mejor valor de H luego, los valores H
muestra valores parecidos de la métrica H (Fig. 8 izquierda) obtenidos por ambos algoritmos se igualan justo a partir de
603
que las estrategias usadas con NSGA-II/OSD en las regiones α ∈ [0, 1] muy fácil de usar, que permite balancear la
R2 y R3 (Fig. 1) son a maximizar ambos objetivos. Idéntica diversidad/convergencia del frente de soluciones no-dominadas
conclusión se obtiene con las desviaciones del hipervolumen alcanzado por el algoritmo; para el valor α=1.2 el algoritmo
en la Fig. 10 (derecha). logra su mejor valor de hipervolumen medio.
De otra parte, en la Fig. 11 se observa que el frente de El algoritmo propuesto obtiene muy buen desempeño y
soluciones alcanzado con el método propuesto obtiene más mejores resultados cuando es comparado con NSGA-II. Cuan-
diversidad que el alcanzado por MOEA/D con especificación do NSGA-II/OSD es comparado con MOEA/D con la es-
de Zhang del PR, aunque en términos de convergencia es pecificación del punto de referencia de Zhang según (3),
MOEA/D quien parece tener mejor valor. Estas diferencias en términos de la métrica del hipervolumen medio, ambos
se pueden explicar porque NSGA-II/OSD presenta siempre algoritmos obtienen valores similares. No obstante, NSGA-
un mejor porcentaje de soluciones diferentes en la poblacion II/OSD logra una mayor diversificación de soluciones en el
N durante la evolución del algoritmo tal como se ve en la frente no-dominado final alcanzado, mientras MOEA/D parece
Fig. 12 (izquierda). Finalmente, la Fig. 12 (derecha) muestra alcanzar mejor convergencia.
que NSGA-II/OSD realiza un menor número de reparaciones
de cromosomas para factibilizar las soluciones. AGRADECIMIENTOS
Agradecemos el soporte económico del Departamento de
4
x 10 NSGA−II/OSD vs MOEA/D
te
Zhang Informática y Sistemas de la Universidad de Las Palmas de
2.1
Gran Canaria.
2.05
2 R EFERENCIAS
1.95
[1] Carlos A. Coello Coello, Gary B. Lamont, David A. Van Veldhuizen.
1.9
Evolutionary algorithms for solving multi-objective problems. Springer-
1.85 Verlag Berlin, Heidelberg, 2006.
f2
1.8 [2] K. Deb, A. Pratap, S. Agrawal, T. Meyarivan. A Fast and Elitist

1.75 Multiobjective Genetic Algorithm : NSGA-II. IEEE Transactions on
1.7
Evolutionary Computation, Vol. 6, n2, pages 182-197, 2002.
True POF [3] X. Gandibleux, A. Freville. Tabu search based procedure for solving
1.65
NSGA−II/OSD α=0.5 N200 the 0-1 multiobjective knapsack problem: the two objectives case. J. of
1.6 te
Zhang α=1.2 N200 Heuristics, 6(3): 361-383, 2000.
1.55
1.5 1.6 1.7 1.8 1.9 2 2.1
[4] Hisao Ishibuchi, Kaname Narukawa, Yusuke Nojima. Handling of Over-
f1 x 10
4 lapping Objective Vectors in Evolutionary Multiobjective Optimization.
International Journal of Computational Intelligence Research 1(2005):
1-18, 2005
Figura 11. NSGA-II/OSD versus MOEA/D: gráficas de soluciones no-
[5] Hisao Ishibuchi, Naoya Akedo, Yusuke Nojima. Behavior of multiob-
dominadas con el valor H más próximo al valor medio final en 30 ejecuciones.
jective evolutionary algorithms on many-objective knapsack problems.
IEEE Transactions on Evolutionary Computation 19(2), 2015.
[6] Hisao Ishibuchi, Ken Doi, Yusuke Nojima. Reference Point Specification
te te
NSGA−II/OSD vs MOEA/D
Zhang
x 10NSGA−II/OSD
5 vs MOEA/D
Zhang in MOEA/D for Multi-Objective and Many-Objective Problems. 2016
100 2.4
IEEE International Conference on Systems, Man, and Cybernetics
90 2.2 (SMC), 2016.
[7] R. Saborido, A.B. Ruiz, M. Luque. Global WASF-GA: An Evolutionary
80 2
Número Reparaciones
70 1.8 Algorithm in Multiobjective Optimization to approximate the whole

60 1.6
Pareto Optimal Front. Evolutionary Computation 25(2): 309-349, 2017.
50 1.4
[8] Mingzhao Wang, Yuping Wang, Xiaoli Wang. A Space Division Mul-
tiobjective Evolutionary Algorithm Based on Adaptive Multiple Fitness
40 1.2
Functions. International Journal of Pattern Recognition and Artificial
30 1
Intelligence 30(3), 2016.
20 0.8 [9] Rui Wang, Jian Xiong, Hisao Ishibuchi, Guohua Wu, Tao Zhang. On
NSGA−II/OSD α=0.5 N200 NSGA−II/OSD α=0.5 N200
10 te 0.6 te the effect of reference point in MOEA/D for multi-objectiveoptimization.
Zhang α=1.2 N200 Zhang α=1.2 N200
0 0.4 Applied Soft Computing 58(2017): 25-34, 2017.
0 500 1000 1500 2000 1 5 10 15 20 25 30
Generación Ensayo [10] Yuping Wang, Chuangyin Dang. Improving Multiobjective Evolutionary
Algorithm by Adaptive Fitness and Space Division. In: Wang L., Chen
K., Ong Y.S. (eds) Advances in Natural Computation. ICNC 2005.
Figura 12. NSGA-II/OSD versus MOEA/D: Evolución de los porcentajes LNCS, vol 3612. Springer, Berlin, Heidelberg, 2005.
medios de soluciones diferentes en las poblaciones N (izquierda) y de los [11] Zhenkun Wang, Qingfu Zhang, Hui Li, Hisao Ishibuchi, Licheng Jiao.
números de reparaciones de los cromosomas por ensayo (derecha). On the use of two reference points in decomposition based multiob-
jective evolutionary algorithms. Swarm and Evolutionary Computation
34(2017): 89-102, 2017.
V. C ONCLUSIONES [12] Q. Zhang and H. Li. MOEA/D: A multi-objective evolutionary algorithm
En este trabajo se propone un algoritmo evolutivo multi- based on decomposition. IEEE Trans. Evol. Comput., 11(6): 712-731,
2007.
objetivo (NSGA-II/OSD) que hibridiza NSGA-II. El algorit- [13] E. Zitzler, L. Thiele, Multiobjective optimization using evolutionary
mo subdivide el espacio de los objetivos en varias regiones algorithms - A comparative case study, In A.E. Eiben et al. (Eds.):
utilizando la solución Nadir calculada en cada generación Parallel Problem Solving from Nature, LNCS, Volume 1498, pages 292-
301, Springer, Heidelberg, 1998.
del algoritmo. Las distintas subdivisiones utilizan diferentes
estrategias de optimización de las funciones objetivo. El algo-
ritmo NSGA-II/OSD propuesto permite definir un parámetro
604
Algoritmo Evolutivo Multi-Objetivo para la Toma

de Decisiones Interactiva en Optimización Dinámica
Cristóbal Barba-González José M. Garcı́a-Nieto Ana B. Ruiz
Lenguajes y Ciencias de la Computación Lenguajes y Ciencias de la Computación Economı́a Aplicada (Matemáticas)
Universidad de Málaga Universidad de Málaga Universidad de Málaga
Málaga, España Málaga, España Málaga, España
Antonio J. Nebro Mariano Luque José F. Aldana-Montes

Lenguajes y Ciencias de la Computación Economı́a Aplicada (Matemáticas) Lenguajes y Ciencias de la Computación
Universidad de Málaga Universidad de Málaga Universidad de Málaga
Málaga, España Málaga, España Málaga, España
Resumen—Debido al creciente interés en el análisis de datos en multi-objetivo deben poder detectar cuándo cambia el proble-
streaming en entornos Big Data para la toma de decisiones, cada ma y aplicar una estrategia para adaptarse a los cambios.
vez es más común la aparición de problemas de optimización Sin embargo, analizar soluciones preferidas en el frente de
dinámica que involucran dos o más objetivos en conflicto. Sin
embargo, los enfoques que combinan optimización dinámica Pareto aproximado y compararlas al mismo tiempo puede ser
multi-objetivo con la articulación de preferencias para la toma una tarea difı́cil en el proceso de toma de decisiones, espe-
de decisiones son todavı́a escasos. En este artı́culo, proponemos cialmente en presencia de muchos objetivos. De hecho, puede
un nuevo algoritmo de optimización dinámica multi-objetivo ser computacionalmente costoso generar una gran cantidad de
llamado InDM2, que permite incorporar preferencias del experto soluciones que aproximen todo el frente de Pareto, particu-
(humano) de cara a la toma de decisiones para guiar el proceso
de búsqueda. Con InDM2, el decisor no solo puede expresar larmente cuando se tratan problemas reales de la industria.
sus preferencias mediante uno o más puntos de referencia (que Incluso, puede suponer un esfuerzo innecesario si el decisor
definen la región de interés deseada), sino que estos puntos está únicamente interesado en un subconjunto de soluciones
también se pueden modificar de manera interactiva. La propuesta ubicadas en un región particular.
incorpora métodos para mostrar gráficamente las diferentes Una forma de aliviar estos problemas es incorporar infor-
aproximaciones de la región de interés obtenidas durante el pro-
ceso de optimización. El decisor puede ası́ inspeccionar y cambiar, mación sobre las preferencias del decisor en la metaheurı́stica
en tiempo de optimización, la región de interés de acuerdo con la multi-objetivo, para enfocar progresivamente el proceso de
información mostrada. Las principales caracterı́sticas de InDM2 búsqueda sobre aquel subconjunto de soluciones que corres-
son descritas y se analiza su funcionamiento mediante casos de ponden a estas preferencias, conocido como la región de
uso académicos. interés. Por lo tanto, en lugar de aproximar todo el frente
Index Terms—Optimización Multi-Objectivo Dinámica, Toma
de Decisiones, Selección de Preferencias, Algoritmos Interactivos
de Pareto, la idea es aproximar sólo la región de interés.
Mientras que el manejo de preferencias ha sido ampliamente
estudiado en su aplicación para MOPs estáticos en el campo
I. I NTRODUCCI ÓN de la toma de decisiones multi-criteria (Multiple Criteria De-
cision Making - MCDM) [7]–[9], apenas se ha explorado en la
En la actualidad, aunque la mayorı́a de los esfuerzos se optimización dinámica de múltiples objetivos. En ese sentido,
centran en abordar problemas de optimización multi-objetivo en un contexto donde el frente de Pareto puede cambiar con
(MOP) estáticos, existe un creciente interés en aquellos esce- el tiempo, la especificación de preferencias que determinan
narios en los que el problema cambia de alguna manera con la región de interés puede ser difı́cil debido al hecho de
el tiempo, es decir, MOP dinámicos o DMOPs [1]. que el problema en sı́ cambia constantemente. Por lo tanto,
Recientemente, han ido apareciendo varias propuestas de una metaheurı́stica de optimización dinámica multi-objetivo
metaheurı́sticas para la resolución de DMOPs [2]–[5]. Al tratar que incorpore preferencias, deberı́a prestar atención especial
con un DMOP, siempre que existan cambios en el entorno que a estas dos caracterı́sticas simultáneamente: (1) visualización,
afecten a las soluciones del problema (es decir, en la población para proporcionar al decisor una imagen gráfica de las aproxi-
o en el conjunto de soluciones en el frente de Pareto), el maciones de la región o regiones de interés de los frentes de
algoritmo de optimización debe reaccionar para adaptar la Pareto que se encuentran durante el proceso de optimización;
búsqueda a las nuevas caracterı́sticas del problema [6]. Esto y (2) interactividad, para permitir que el decisor pueda indicar
significa que las metaheurı́sticas de optimización dinámica nueva información si quiere redefinir sus preferencias (es decir,
605
indicar una nueva región de interés) en base a su experiencia creto, se utilizan las metaheurı́sticas interactivas WASF-
previa y al conocimiento que progresivamente adquiere sobre GA y R-NSGA-II como optimizador base para los dos
el problema al interactuar con el proceso de optimización. ejemplos sobre el problema FDA2.
Con esta motivación, proponemos en este artı́culo InDM2 El resto del artı́culo se organiza de la siguente forma. La
(Interactive Dynamic Multi-Objective Decision Making), una Sección II está dedicada a describir conceptos previos nece-
nueva propuesta algorı́tmica que cumple con estos requisitos. sarios para la explicación de la propuesta. En la Sección III,
InDM2 está diseñado para actuar como framework algorı́tmico se describen la estructura y los principales componentes de
bajo el que se puede incorporar cualquier metaheurı́stica de InDM2. La Sección IV explica los experimentos realizados a
optimización multi-objetivo basada en puntos de referencia, modo de caso de uso. Finalmente, la Sección V recoge las
para la articulación de preferencias, delegando ası́ en él el principales conclusiones y trabajo futuro.
proceso de resolución del DMOP. Un punto de referencia
está formado por valores de aspiración que el decisor desea II. C ONCEPTOS P REVIOS
alcanzar para cada una de las funciones objetivo.
Una forma común de expresar preferencias consiste en
En particular, hemos considerado una versión dinámica de
indicar valores deseables para las funciones objetivo, que
dos algoritmos evolutivos basados en puntos de referencia:
constituyen las componentes de lo que se conoce como punto
WASF-GA [10] y R-NSGA-II [11]. El proposito de WASF-
de referencia. Este concepto se introdujo en [12] para MOP
GA es aproximar la región de interés determinada por el punto
estáticos, aunque se puede adaptar fácilmente a DMOP.
de referencia mediante el uso de una función escalarizada de
Para un DMOP con k funciones objetivo, en un ins-
logro [12] y un conjunto de vectores de pesos. Para ello, se
tante de timpo t, un punto de referencia viene dado por
clasifican los individuos en fronteras en base a los valores
qt = (qt,1 , . . . , qt,k )T , donde qt,i es un nivel de aspiración
que alcanzan para dicha función. El algoritmo R-NSGA-II
para la función objetivo fi (·, t) proporcionada por el decisor
considera como información preferencial uno o varios puntos
(i = 1, . . . , k). Por lo general, se dice que qt es alcanzable
de referencia y modifica la distancia crowding y el operador
si existe, al menos, una solución factible del problema t
niching de NSGA-II [13] para enfatizar las soluciones cercanas
cuyo vector objetivo iguala o domina qt . De lo contrario, se
al/los punto(s) de referencia dado(s) por el decisor.
dice que el punto de referencia es inalcanzable, es decir, no
InDM2 incorpora un mecanismo que permite al decisor (si
todos los niveles de aspiración se pueden alcanzar o dominar
ası́ lo desea) actualizar interactivamente el punto de referencia
simultáneamente.
al resolver un DMOP. Además, ofrece un mecanismo para
Para un punto de referencia qt , se puede minimizar la fun-
visualizar “sobre la marcha” las aproximaciones de la región
ción escalarizada de logro propuesta en [12] sobre el conjunto
de interés que se generan a lo largo del proceso de solución.
factible, para encontrar la solución óptima de Pareto que mejor
Además, InDM2 se ha implementado con jMetalSP [14], por
satisfaga las expectativas del decisor en el instante t. Dado un
lo que todas las caracterı́sticas de esta librerı́a algorı́tmica están
vector de pesos en el instante t, µt = (µt,1 , . . . , µt,k )T con
incorporadas en la propuesta, incluida la posibilidad de utilizar
µt,i > 0 (i = 1, . . . , k), y un valor real pequeño ρ ≥ 0, la
tecnologı́as Big Data, como Apache Spark. Esto permite, por
función de logro propuesta en [12] viene dada por:
ejemplo, procesar en streaming los datos almacenados en
HDFS (el sistema de archivos Hadoop [15]), además de usar s(qt , f (x, t), µt ) = máx { µt,i (fi (x, t) − qt,i ) }+
toda la potencia de los clústeres Spark. i=1,...,k
Ası́, las principales contribuciones de este artı́culo son: k

X
Se presenta InDM2, un novedoso algoritmo que combina +ρ µt,i (fi (x, t) − qt,i ).
optimización dinámica multi-objetivo, toma de decisio- i=1
nes multi-criterio e interactividad. Una caracterı́stica cla-
III. P ROPUESTA A LGOR ÍTMICA : I N DM2
ve en InDM2 es el mecanismo para visualizar, en tiempo
de optimización, las aproximaciones de la región de El componente principal de InDM2 es una metaheurı́stica
interés que se generan, junto con la posibilidad de indicar multi-objetivo dinámica basada en preferencias, que actúa
puntos de referencia para guiar estas aproximaciones. como motor de optimización. Una descripción más detallada
La propuesta se ha implementado dentro del framework de la implementación se puede encontrar en [16]. Para este
jMetalSP, por lo que se puede utilizar para optimización trabajo, se han implementado nuevas versiones dinámicas de
en contextos Big Data, aprovechando las caracterı́sticas los algoritmos WASF-GA y R-NSGA-II de la siguente manera.
del procesamiento de datos en streaming distribuido La arquitectura orientada a objetos de jMetalSP permi-
de Apache Spark. Esta implementación está disponible te reutilizar la plantilla de algoritmos evolutivos proporcio-
como código abierto en repositorio GitHub de jMetalSP1 . nada por jMetal2 . Esta plantilla tiene un método run()
Se presentan dos casos de estudio para ilustrar el fun- que codifica el pseudo-código de un algoritmo evolutivo
cionamiento de InDM2 en la resolución de problemas genérico. Las implementaciones de las versiones dinámicas
dinámicos del benchmark FDA para DMOPs [6]. En con- de WASF-GA y R-NSGA-II siguen esta plantilla, por lo
1 https://github.com/jMetal/jMetalSP 2 https://jmetal.github.io/jMetal/
606
que el desarrollo de InDM2 sobre WASF-GA y R-NSGA- Eliminar las peores N ′ soluciones de acuerdo a la dis-
II requiere simplemente la redefinición de dos métodos. En tancia crowding.
primer lugar, se debe adaptar el comportamiento del método Eliminar las peores N ′ soluciones de acuerdo a su
isStoppingConditionReached(), ya que en lugar de contribución en hypervolumen con respecto a la última
simplemente terminar el algoritmo, este método debe hacer aproximación de la región de interés.
que la aproximación de la región de interés esté disponible El pseudo-código del InDM2 se muestra en el Algoritmo 1.
para los métodos consumidores de datos de InDM2. De esta Después de la fase de inicialización (lı́neas 1-14), el algoritmo
forma, el algoritmo de optimización subyacente (basado en inicia el ciclo infinito (lı́nea 15) que lleva a cabo múltiples
WASF-GA o R-NSGA-II) pueda comenzar de nuevo teniendo rondas consecutivas de optimización dinámica y consumo de
en cuenta esta información. En segundo lugar, al final de datos resultado (visualización). Cada ronda de optimización
cada iteración, el método updateProgress() incrementa (lı́neas 16-25) implica un número máximo de iteraciones
un contador de evaluación. (Gmax ) en las que se ejecuta el algoritmo evolutivo basado
Para permitir que el decisor pueda actualizar el(los) punto(s) en preferencias (es decir, WASF-GA o R-NSGA-II, lı́nea 17),
de referencia “sobre la marcha”, InDM2 lee el(los) nuevo(s) y se invocan los procedimientos de reinicio cada vez que se
punto(s) de referencia desde teclado (aunque podrı́an usar- detecta un cambio en el punto de referencia (lı́nea 18) o en
se otros métodos más sofisticados). Este evento se detecta el estado del problema (lı́nea 20). Al final de cada iteración,
mediante el método updateProgress(). Para ayudar al la aproximación de la región de interés encontrada se envı́a a
decisor a dar un nuevo punto de referencia de acuerdo con sus los consumidores de datos (lı́nea 25) y el ciclo comienza de
preferencias y teniendo en cuenta los resultados obtenidos, se nuevo.
ha incluido un consumidor de datos gráfico. Por lo tanto, las
aproximaciones de la región de interés generadas por InDM2 Algorithm 1 Pseudo-código InDM2
se muestran cuando se producen, por lo que el decisor puede 1: N ; // Tamaño de población
visualizarlas y cambiar los puntos de referencia como desee. 2: N ′ ; // Número de soluciones a reemplazar
Por defecto, InDM2 siempre está funcionando. Esto sig- 3: Gmax ; // Número máximo de generaciones
nifica que, si el DMOP no cambia durante un perı́odo de 4: c, m ; // Operadores genéticos (cruze y mutación)
5: t ← 0 ; // Contador de generación
tiempo, el algoritmo lo resolverá una y otra vez, utilizando 6: At ; // Estado del problema de optimización
exactamente la misma configuración del problema. Como 7: qt ; // Punto(s) de referencia inicial(es)
consecuencia, si el algoritmo converge la mayorı́a de las 8: P ; // Algoritmo de optimización basado en preferencias
veces, la misma aproximación de la región de interés (o una 9: ϕq ; // Estrategia de reinicio ante cambios del punto de referencia
muy similar, dado que estamos usando enfoques estocásticos) 10: ϕp ; // Estrategia de reinicio ante cambios del problema
11: M ← {WASF-GA, R-NSGA-II} ; // Optimizadores base
se mostrará constantemente. Esto puede ser confuso para el 12: Pt ← initializeP opulation(N ) ;
decisor, ya no percibirá cambios evidentes por un perı́odo 13: evaluate(Pt , At ) ;
de tiempo. Para evitar esta situación, el consumidor de datos 14: Et ← initializeP aretoSet(Pt ) ;
gráficos solo muestra una nueva aproximación en caso de que 15: while true do
ésta haya cambiado significativamente, en comparación con la 16: while t < Gmax do
17: (Pt+1 , Et+1 ) ← compute(M, qt , c, m, Pt , At ) ;
anterior mostrada. Para verificar esto, se calcula internamente 18: if qt+1 6= qt then
el indicador distancia generacional invertida (IIGD ) [17] desde 19: ′
Pt+1 ← restart(Pt+1 , ϕq , qt+1 , N ′ ) ;
la aproximación de la región de interés actual, hasta la anterior. 20: else if At+1 6= At then
′
La nueva aproximación se mostrará únicamente si el valor de 21: Pt+1 ← restart(Pt+1 , ϕp , At+1 , N ′ ) ;
este indicador es inferior a un umbral τ . 22: end if
23: t←t+1 ;
Todos los DMOP disponibles en jMetalSP tienen un método 24: end while
para averiguar si el problema ha cambiado o no. Por lo tanto, 25: C : (Et+1 , τ ) ; // Notifica aproximación a consumidores
InDM2 solo tiene que llamar a este método al final de cada 26: t←0;
iteración (es decir, en el método updateProgress()), para 27: end while
saber si el parámetro del problema ha cambiado.
Una vez que se ha detectado un cambio en el problema
y/o punto(s) de referencia, un aspecto clave en InDM2 es la IV. E XPERIMENTOS
estrategia de reinicio. Hemos adoptado un enfoque flexible El objetivo de este estudio no es tanto la realización de
que consiste en definir el reinicio de acuerdo con otras dos comparativas exhaustivas de rendimiento algorı́tmico, sino el
subestrategias: una para eliminar soluciones de la población de ilustrar cómo funciona InDM2 en la práctica, cuando
y otra para llenar la población con nuevas soluciones. Para interactúa con un decisor, para ası́ mostrar los beneficios
llenar la población, dado un valor N ′ > 0, la estrategia potenciales de la propuesta desde el punto de vista de la toma
seguida es crear al azar N ′ nuevas soluciones. Para eliminar de decisiones.
las soluciones, se pueden configurar las siguentes estrategias: En este sentido, se ha probado InDM2 con el problema
Eliminar las primeras N ′ soluciones. FD2, introduciendo manualmente las preferencias (es decir,
Eliminar N ′ soluciones aleatorias. los puntos de referencia) durante el tiempo de ejecución. La
607
Tabla I: Configuración de InDM2.
InDM2W
Parámetros
Tamaño de población 50 Front 1
Probabilidad de cruze 0.9 Front 15
0.8
Objective 2
Front 24
Probabilidad de mutación 1/L (L = número de variables) Front 33
Número máximo de evaluaciones 25,000 Front 43
Reinicio por punto de referencia Eliminar 100 % de las soluciones Front 53
63
0.4
Front 63
72
Generar 100 % de soluciones aleatoriamente Front 72
Reinicio por cambio de problema Eliminar 50 % de soluciones (hypervolumen)
Generar 50 % de soluciones aleatoriamente
Reference Point[0.0,0.0]
0.0
Comsumidores de datos
Visualizador gráfico Muestra frentes y puntos de referencia
Front writer Carga los frentes generados en ficheros 0.0 0.2 0.4 0.6 0.8 1.0
Streaming runtime Objective 1
Mecanismo Java threads
InDM2W
idea es observar cómo InDM2 puede adaptar el proceso de Reference Point[1.0,1.0]
0.8
optimización a los cambios (tanto en la configuración del
Objective 2
problema como en las preferencias), mostrando ası́ el efecto de Front 1
estos cambios en las aproximaciones de los frentes de Pareto Front 15
0.4
Front 24
Front 33
obtenidas. Nos referimos a las dos configuraciones de InDM2 Front 43
Front 63
para los optimizadores base WASF-GA y R-NSGA-II como Front 72
0.0
Front 82
InDM2W y InDM2R , respectivamente. 0.0 0.2 0.4 0.6 0.8 1.0

El problema FD2 es un DMOPs de representación continua Objective 1
perteneciente al benchmark FDA [6]. Cada problema de esta
familia tiene dependencia con j kel tiempo t, que se define Figura 1: Aproximaciones de región de interés encontradas
mediante la ecuación t = n1t σσT , en la que σ es un contador por InDM2W para el problema FD2, utilizando los puntos de
de generaciones, σT es el número de generaciones en las que referencia (0.0, 0.0) (arriba) y (1.0, 1.0) (abajo).
t permanece fijo y nt es la cantidad de pasos distintos en t.
Para un número real a, ⌊a⌋ denota el entero más grande no
mayor a a. En [6], los autores recomiendan establecer σT = 5 mostrar los frentes de Pareto aproximados que se generan y
y nt = 10. otra para guardar estas aproximaciones en archivos. En este
La formulación de FDA2 se puede encontrar en [6], por lo estudio, solo se considera una fuente de datos, es decir, no
que siguiendo lo recomendado en este trabajo, se han utilizado hay ninguna ventaja de utilizar Apache Spark, por lo que
soluciones de 31 variables con xI = x1 , |xII | = |xIII | = 15. hemos configurado el tiempo de ejecución en hebras de manera
Este problema se ha seleccionado debido a que las aproxima- predeterminada.
ciones de frentes de Pareto y sus conjuntos de Pareto cambian El problema de optimización dinámica FDA2 se define
en el tiempo (tipo II [6]). Por lo tanto, los cambios dinámicos con dos objetivos y frentes de Pareto que cambian de forma
en las aproximaciones causadas por cambios en el punto de convexa a cóncava y vice-versa, con conjuntos de Pareto que
referencia se pueden visualizar fácilmente. también cambian con el tiempo.
La Tabla I muestra la configuración de parámetros utilizada Para tener una idea de los posibles valores de aspiración
para InDM2. La condición de parada utilizada para informar (deseables) que cada objetivo puede tener durante el proceso
de los resultados a los procesos consumidores es alcanzar un de búsqueda, se ha ejecutado inicialmente InDM2W utili-
máximo de 25,000 evaluaciones. Los operadores de variación zando dos puntos de referencia: el punto ideal (0.0, 0.0)
son SBX como operador de cruce y el de mutación polinómica. (inalcanzable) y el punto nadir (1.0, 1.0) (alcanzable). Las
El operador de selección es torneo binario. Para la estrategia aproximaciones producidas por InDM2W para las regiones
de reinicio al detectar un cambio en el problema, en primer de interés de ambos puntos de referencia se muestran en la
lugar, se elimina el 50 % de las soluciones de acuerdo con la Figura 1. En esta figura, las leyendas “Fronti ” marcan las
contribución de hipervolumen; en segundo lugar, se llena la aproximaciones de la región de interés que se muestran. Cada
población con nuevas soluciones creadas aleatoriamente. La una de estas leyendas indica implı́citamente en qué iteración
estrategia de reinicio cuando se proporciona un nuevo punto i se detectó una mejora significativa en la aproximación
de referencia es similar, pero en este caso se eliminan todas generada, en comparación con la anterior mostrada (como se
las soluciones de la población (100 %). explicó en la Sección III, una nueva aproximación se muestra
Para generar los eventos temporales que conducirán a gráficamente solo en caso de que se haya detectado una mejora
cambios en el problema FDA2, hemos utilizado una fuente significativa con respecto al indicador IIGD ).
simple de transmisión de datos que cuenta cada segundo, En la Figura 1, podemos observar que cuando la región
lo que implica que, con un valor predeterminado de σT , de interés aproximada es convexa, la distribución de las
el problema se actualiza con una frecuencia de 5 segundos. soluciones en las aproximaciones encontradas es ligeramente
Además, hemos utilizado dos consumidores de datos, uno para más densa en las regiones centrales que en las extremas,
608
InDM2W InDM2R
Front 1 Front 1
0.8
0.8
Objective 2
Objective 2
Front 9 Front 2
Front 15 Front 4
0.4
0.4
Reference Point[0.0,0.0] Reference Point[0.0,0.0]
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
Objective 1 Objective 1
InDM2W InDM2R
Front 1 Front 1
0.8
0.8
Front 9 Front 2
Objective 2
Objective 2
Front 15 Front 4
Front 22
Front 5
Front 25
0.4
0.4
Front 31 Front 6
Front 8
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
InDM2W InDM2R
1.0
1.0
Front 1 Front 1
Front 9 Front 2
0.8
0.8
Objective 2
Objective 2
Front 15 Front 4
Front 22 Front 5
0.6
0.6
Front 25 Front 6
Front 31 Front 8
Front 39 Front 9
0.4
0.4
Front 11
Front 48
Reference Point[0.6,0.4] Front 57
Front 12
0.2
0.2
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
InDM2W InDM2R
Reference Point[0.7,0.9] Reference Point[0.7,0.9]
0.8
0.8
Front 1 Front 1
Objective 2
Objective 2
Front 9 Front 2
Front 15 Front 4
Front 22 Front 5
Front 25 Front 6
Front 31 Front 8
0.4
0.4
Front 39 Front 9
Front 48 Front 11
Front 57 Front 12
Front 61 Front 16
Front 66 Front 17
0.0
0.0
Front 75 Front 18
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
Figura 2: Aproximaciones de la región de interés encontradas por InDM2W (izquierda) e InDM2R (derecha) para el problema
FDA2, utilizando diferentes puntos de referencia.
extendiéndose de manera uniforme cuando la región apro- realista en el que el decisor modifica sobre la marcha el
ximada tiende a ser más lineal. Esto viene determinado por punto de referencia para indicar la región deseada, varias
la distribución de las direcciones de proyección (es decir, veces durante el proceso de optimización. La Figura 2 muestra
vectores de peso) utilizadas internamente en WASF-GA, lo que las aproximaciones generadas para los puntos de referencia
influye en la distribución de las soluciones encontradas. Para indicados a lo largo del proceso de optimización de InDM2,
ambos puntos de referencia, InDM2W ha podido aproximar para los dos algorithmos base: InDM2W y InDM2R .
la región de interés (que, como se puede ver, es el frente de En el proceso interactivo de optimización seguido por
Pareto completo en ambos casos) al adaptar el proceso de InDM2W , suponiendo que los rangos del frente de Pareto para
búsqueda a los cambios en el problema. problema FDA2 son desconocidos, el decisor seleccionó ini-
A continuación, se realizaron pruebas con InDM2W e cialmente (0.0, 0.0) como primer punto de referencia. Después
InDM2R para FDA2, pero en este caso, se simuló un escenario de observar las tres primeras aproximaciones devueltas por
609
InDM2W en las iteraciones 5, 9 y 15 (véase la gráfica superior consecuencia del uso de Spark es la ventaja de trabajar con
izquierda en la Figura 2), el decisor decidió dar un nuevo punto tecnologı́as Big Data, lo que nos permite desplegar InDM2 en
de referencia para reducir la región de interés aproximada clusters Hadoop y acceder a datos en HDFS.
y establecerlo en (0.2, 0.2). Podemos observar las nuevas Como trabajo futuro, se pretende estudiar el rendimiento
aproximaciones generadas en el segundo gráfico a la izquierda de InDM2 en problemas complejos del mundo real, usando
en la Figura 2. En este gráfico, las primeras aproximaciones preferencias y cambiándolas interactivamente por un decisor
generadas para el punto de referencia inicial (0.0, 0.0) se experto en el dominio de aplicación.
muestran con lı́neas continuas, para poder distinguirlas de las
AGRADECIMIENTOS
nuevas aproximaciones encontradas para el nuevo punto de
referencia (0.2, 0.2), que se muestran con lı́neas punteadas. Este trabajo ha sido financiado por los proyectos TIN2017-86049-
R, TIN2014-58304-R, ECO2017-88883-R (MECD) y P12-TIC-1519
Más tarde, el decisor volvió a ajustar la región de interés (PAIDI). J. M. Garcı́a-Nieto y A. B. Ruiz disfrutan una beca Post-
cambiando el punto de referencia dos veces, indicando (0.6, Doctoral “Captación de Talento para la Investigación”, Universidad
0.4) como tercer punto de referencia y (0.7, 0.9) como el de Málaga. C. Barba-González dispone de un beca pre-doctoral BES-
cuarto. Respectivamente, los resultados obtenidos para estos 2015-072209.
dos nuevos puntos de referencia se muestran en las gráficas R EFERENCIAS
tercera y cuarta a la izquierda en la misma figura.
[1] C. Raquel and X. Yao, “Dynamic multi-objective optimization: A
Respecto a los frentes obtenidos por InDM2R en las gráficas survey of the state-of-the-art,” in Evolutionary Computation for Dynamic
de la derecha en la Figura 2, se puede observar cómo la Optimization Problems (2013), S. Yang and X. Yao, Eds. Springer,
aproximación de las regiones de interés producidas por esta va- 2013, pp. 85–106.
[2] S. Jiang and S. Yang, “A steady-state and generational evolutionary
riante tienen peor diversidad que las generadas por InDM2W . algorithm for dynamic multiobjective optimization,” IEEE Transactions
Nótese que las soluciones generadas por InDM2W siempre on Evolutionary Computation, vol. 21, no. 1, pp. 65–82, 2017.
pertenecen a la región de interés delimitada por los puntos [3] X. Chen, D. Zhang, and X. Zeng, “A stable matching-based selection and
memory enhanced MOEA/D for evolutionary dynamic multiobjective
de referencia, mientras que algunas de las encontradas por optimization,” in Int. Conf. on Tools with AI, 2015, pp. 478–485.
InDM2R también aproximan zonas fuera de esta región. Esto [4] Y. Jin, C. Yang, J. Ding, and T. Chai, “Reference point based prediction
es consecuencia de las capacidades de búsqueda (convergencia for evolutionary dynamic multiobjective optimization,” in Proc. of the
IEEE Cong. on Evol. Comp, 2016, pp. 3769–3776.
y diversidad con respecto a la región de interés) de WASF- [5] A. Muruganantham, K. C. Tan, and P. Vadakkepat, “Evolutionary
GA y R-NSGA-II, lo que evidencia el impacto que puede tener dynamic multiobjective optimization via kalman filter prediction,” IEEE
el algoritmo evolutivo basado en preferencias utilizado como Transactions on Cybernetics, vol. 46, no. 12, pp. 2862–2873, 2016.
[6] M. Farina, K. Deb, and P. Amato, “Dynamic multiobjective optimization
base en InDM2. problems: test cases, approximations, and applications,” IEEE Transac-
Según la Figura 2, podemos ver que tres de los puntos de tions on Evolutionary Computation, vol. 8, no. 5, pp. 425–442, 2004.
referencia dados en el proceso interactivo de optimización son [7] K. Miettinen, Nonlinear Multiobjective Optimization. Boston: Kluwer
Academic Publishers, 1999.
inalcanzables: (0.0, 0.0), (0.2, 0.2) y (0.6, 0.4); y uno de ellos [8] A. Jaszkiewicz and J. Branke, “Interactive multiobjective evolutionary
es alcanzable (0.7, 0.9). Cabe señalar que, en la práctica, la algorithms,” in Multiobjective Optimization, Interactive and Evolutio-
alcanzabilidad de los puntos de referencia no puede conocerse nary Approaches, ser. LNCS, J. Branke, K. Deb, K. Miettinen, and
R. Slowinski, Eds., vol. 5252. Springer, 2008, pp. 179–193.
de antemano, y solo se puede saber si son alcanzables o no [9] M. Helbig, K. Deb, and A. Engelbrecht, “Key challenges and future
cuando el algoritmo genera soluciones y se verifica su relación directions of dynamic multi-objective optimisation,” in Proc. of the IEEE
de dominancia con respecto al punto de referencia utilizado. Cong. on Evol. Comp., 2016, pp. 1256–1261.
[10] A. B. Ruiz, R. Saborido, and M. Luque, “A preference-based evo-
lutionary algorithm for multiobjective optimization: The weighting
V. C ONCLUSIONES achievement scalarizing function genetic algorithm,” Journal of Global
En este trabajo se ha descrito InDM2, un nuevo framework Optimization, vol. 62, no. 1, pp. 101–129, 2015.
[11] K. Deb, J. Sundar, B. Ubay, and S. Chaudhuri, “Reference point based
algorı́tmico de optimización dinámica que permite incorporar multi-objective optimization using evolutionary algorithm,” Int. Jour. of
cualquier metaheurı́stica multi-objetivo basada en puntos de Comp. Intel. Res., vol. 2, no. 6, pp. 273–286, 2006.
referencia para la articulación de preferencias. Se ha mostrado [12] A. P. Wierzbicki, “The use of reference objectives in multiobjective
optimization,” in Multiple Criteria Decision Making, Theory and Appli-
su funcionamiento mediante la resolución de un problema de cations, G. Fandel and T. Gal, Eds. Springer, 1980, pp. 468–486.
optimización dinámica multi-objetivo de benchmarking (FD2). [13] K. Deb, A. Pratap, S. Agarwal, and T. Meyarivan, “A fast and elitist
A partir de una serie de visualizaciones, se ha demostrado multiobjective genetic algorithm: NSGA-II,” IEEE TEVC, vol. 6, no. 2,
pp. 182–197, 2002.
cómo InDM2 es capaz de generar aproximaciones ajustadas a [14] C. Barba-Gonzalez, J. M. Garcia-Nieto, A. J. Nebro, J. A. Cordero,
las preferencias del decisor en tiempo real, tanto si cambia la J. J. Durillo, I. Navas-Delgado, and J. F. Aldana-Montes, “jMetalSP: A
configuración del problema como si se indican nuevos puntos framework for dynamic multi-objective big data optimization,” Applied
Soft Computing,, vol. to appear, 2017.
de referencia (es decir, cambia la región de interés). [15] T. White, Hadoop: The Definitive Guide. O’Reilly Media, Inc., 2009.
Una caracterı́stica importante de InDM2 viene heredada de [16] A. J. Nebro, A. B. Ruiz, C. Barba-González, J. Garcı́a-Nieto, M. Luque,
su implementación en el framework de jMetalSP, por lo que and J. F. Aldana-Montes, “InDM2: Interactive dynamic multi-objective
decision making using evolutionary algorithms,” Swarm and Evolutio-
dispone de procesamiento en streaming mediante Spark de nary Computation, vol. 40, pp. 184 – 195, 2018.
manera transparente. Esto nos permite incorporar multiples [17] H. Ishibuchi, H. Masuda, Y. Tanigaki, and Y. Nojima, Modified Dis-
fuentes de datos mediante el uso de proveedores, como soc- tance Calculation in Generational Distance and Inverted Generational
Distance. Springer International Publishing, 2015, pp. 110–125.
kets, archivos en un directorio, Kafka, Flume o Kinesis. Otra
610
Bioinspirados
(XIII MAEB)
M ETAHEURÍSTICAS EN
PRODUCCIÓN, L OGÍSTICA Y
D IRECCIÓN DE O PERACIONES
Organizador:
JOAQUÍN BAUTISTA-VALHONDO
A GRASP algorithm to optimize Operational Costs

and Regularity of Production in mixed-model
sequencing problems with forced interruption of
operations*
Joaquı́n Bautista-Valhondo Rocı́o Alfaro-Pozo

Universidad Politécnica de Catalunya EAE Business School
Barcelona, Spain Barcelona, Spain
Abstract—We present a GRASP algorithm to solve a problem

that involves the sequencing of mixed products in an assembly
line. The objective of the problem is to obtain a manufacturing
sequence of models that generates a minimum operational cost
with a forced interruption of operations and that is regular in
production. The implemented GRASP is compared with other
procedures using instances of a case study of the Nissan engine
manufacturing plant in Barcelona.
Index Terms—GRASP, Bounded Dynamic Programming,
Work overload, Operational Cost, Mixed-model Sequencing
Problems
613
Metaheurı́sticas constructivas para Car Sequencing

Problem con Flotas de vehı́culos especiales
Ignacio Moya∗ , Joaquı́n Bautista† , Manuel Chica∗ , Sergio Damas∗ , Oscar Cordón∗
∗ Instituto
Andaluz Interuniversitario DaSCI (Data Science and Computational Intelligence), Universidad de Granada, España
† Nissan Chair, Universidad Politécnica de Catalunya, España
Emails: [email protected], [email protected], [email protected], [email protected], [email protected]
Resumen—Car sequencing problem (CSP) es un problema trade la producción. Una alternativa para tratar esta incertidumbre
dicional de satisfacción de restricciones que refleja los problemas es definir distintos escenarios de producción que sean realistas.
que surgen cuando una serie de vehı́culos se introducen en una La extensión Robust CSP (r-CSP) [2] sigue este enfoque,
cadena de producción. Sin embargo no considera vehı́culos no
regulares o fuera de catálogo, pese a que en plantas reales donde la demanda se define en distintos planes de producción y
pueden llegar a representar entre el 10 % y el 20 % de la el impacto de la variabilidad se mide observando los conflictos
producción. Estos vehı́culos se distinguen de los regulares por que ocurren cuando se cambia de un plan a otro. En este
ser bajo pedido, estar orientados al servicio público, y/o requerir artı́culo estudiamos la resolución de r-CSP utilizando como
componentes poco frecuentes. La extensión Robust CSP (r-CSP) referencia el trabajo anterior para el CSP tradicional, que
sı́ que considera estos vehı́culos, modelando la incertidumbre que
introducen los vehı́culos no regulares como escenarios de produc- comúnmente se resuelve usando metaheurı́sticas. Distintas
ción. Para resolver r-CSP proponemos emplear metaheurı́sticas metaheurı́sticas se han aplicado con éxito al CSP, de las cuales
constructivas que ya han sido efectivas en el CSP tradicional: nosotros destacamos las metaheurı́sticas constructivas GRASP
GRASP y VNS. Evaluamos el rendimiento de estos algoritmos [3] y VNS [4], [5].
en r-CSP extendiendo las instancias disponibles en la literatura El resto del texto sigue la siguiente estructura. La Sección
añadiendo la semántica de flotas de vehı́culos especiales. Nuestros
experimentos reflejan que GRASP muestra mejor rendimiento II revisa la bibliografı́a relevante relacionada con la resolución
en las instancias más sencillas, mientras que VNS se muestra del CSP tradicional. Después presentamos brevemente la for-
superior en las más complejas. malización del r-CSP en la Sección III. La Sección IV describe
Index Terms—Metaheurı́sticas, Lı́neas de montaje, Secuencia- las metaheurı́sticas empleadas en nuestros experimentos. En
ción, Car Sequencing Problem, Flotas de vehı́culos la Sección V presentamos la configuración y los resultados de
nuestros experimentos para el r-CSP. Por último, en la Sección
I. I NTRODUCCI ÓN VI presentamos nuestras conclusiones.
Car Sequencing Problem (CSP) fue introducido por Parello II. T RABAJO RELACIONADO
et al. [1] a consecuencia de la transición de la industria hacia Existen diferentes alternativas para resolver el CSP tra-
la personalización masiva. Es un problema de satisfacción dicional. Encontramos varios métodos exactos basados en
de restricciones que representa las dificultades que surgen programación con restricciones [6], [7], integer programming
al introducir vehı́culos con opciones diferentes en una mis- [8], algoritmos de ramificación y poda [9], o beam search
ma lı́nea de montaje, trasformando restricciones de tiempo, [10], [11]. También encontramos muchos ejemplos de resolu-
espacio, o técnicas en opciones binarias de modo que todo ción usando metaheurı́sticas [5], [12], [13], [14], [15]. Todos
vehı́culo requiera de un conjunto arbitrario de estas opciones. estos métodos se suelen comparar usando el framework de
Estas opciones se modelan indicando las paradas que pueden referencia CSPLib [16].
aparecer en una lı́nea de montaje si muchos vehı́culos seguidos De entre los distintos trabajos que utilizan metaheurı́sticas,
requieren una determinada opción, por lo que cada opción se podemos destacar los métodos basados en búsqueda local,
representa usando un ratio de carga. Este ratio se representa VNS y GRASP. De entre los trabajos que emplean búsqueda
como pi /qi , donde p es el número de vehı́culos que pueden local, el trabajo de Puchta y Gottlieb [17] es especialmente
requerir la opción i en una secuencia de longitud q sin causar relevante dado que introduce nuevos operadores que han sido
paradas en la lı́nea. El objetivo del CSP es encontrar una empleados posteriormente en otros trabajos [3], [5], [12], [13].
secuencia completa de vehı́culos que no sobrecargue ninguna Uno de estos operadores, llamado operador de inversión o
opción en ninguna de sus subsecuencias. Lin2Opt se ha convertido en un operador recurrente. Los
Sin embargo el CSP no considera vehı́culos no regulares métodos de búsqueda local normalmente incluyen heurı́sticas
o fuera de catálogo [2]. Estos vehı́culos se distinguen de voraces para construir la solución inicial, de las cuales en-
los regulares por ser bajo pedido, estar orientados al servicio contramos que la propuesta por Gottlieb et al. [12] es la más
público, y/o requerir componentes poco frecuentes. El impacto empleada [5], [13], [14], [18], [19].
de estos vehı́culos en la cadena genera incertidumbre y afecta a En el caso de VNS y GRASP, las contribuciones más
la producción, ya que pueden alcanzar entre el 10 % y el 20 % relevantes se aplican a extensiones del CSP tradicional. En
614
el caso de VNS, destacamos el trabajo propuesto de Ri- y zj,t,ε . Finalmente, la restricción (11) fija un valor nulo para
beiro et al. [4]. Su versión de VNS combinada con ILS las variables Yj,0,ε (∀j ∈ J, ∀ε ∈ E) en el ciclo virtual t = 0.
terminó en segunda posición en el ROADEF’2005 [20], donde
el problema a resolver era una extensión del CSP tradicional X X
que incluye nuevas restricciones relacionadas con la pintura. xi,t + x′i,t,ε = 1, ∀t ∈ [1, T ], ∀ε ∈ E (1)
Hemos incluido algunas de las caracterı́sticas de su trabajo i∈IX i∈IX′
en nuestro diseño de VNS, como el uso del operador de X

inserción (explicado en la Sección IV-C) como operador en la xi,t = di ∀i ∈ IX (2)
perturbación de la solución. En el caso del GRASP podemos t∈[1,T ]
encontrar trabajos donde se utiliza para resolver extensiones
del CSP tradicional [3], por lo que incluimos estos diseños en
X
x′i,t,ε = di,ε , ∀i ∈ IX′ , ∀ε ∈ E (3)
nuestro estudio. t∈[1,T ]
III. D ESCRIPCI ÓN DEL MODELO X

Xi,t − xi,τ = 0, ∀i ∈ IX , ∀t ∈ [1, T ] (4)
En esta sección describimos las particularidades del CSP τ ∈[1,t]
con flotas de vehı́culos especiales (r-CSP). Este modelo sigue
las siguientes hipótesis de trabajo: X
1. Hay dos conjuntos separados de familias de vehı́culos: X′i,t,ε − x′i,τ,ε = 0,
los regulares IX y los especiales IX′ . τ ∈[1,t] (5)
2. Existe una demanda de vehı́culos regulares DX fija para ∀i ∈ IX′ , ∀t ∈ [1, T ], ∀ε ∈ E
cada plan de producción ε ∈ E.
3. Existe una demanda de vehı́culos especiales DX′ fija para X X
cada plan de producción ε ∈ E. Yj,t,ε − nj,i Xi,t − nj,i X′i,t,ε = 0,
4. La demanda total de vehı́culos T (T ≡ D ≡ DX + DX′ ), i∈IX i∈IX′ (6)
se respeta en todos los planes de producción ε ∈ E. ∀j ∈ J, ∀t ∈ [1, T ], ∀ε ∈ E
5. La demanda para cada vehı́culo regular di , i ∈ IX es la
misma para cada plan de producción ε ∈ E. Esto es,
Yj,t,ε − Yj,t−qj ,ε ≤ pj + T · zj,t,ε ,
di,ε = di , ∀ε ∈ E. (7)
6. La demanda de cada vehı́culo especial i ∈ IX′ puede ∀j ∈ J, ∀t ∈ [qj , T ], ∀ε ∈ E
cambiar para dos planes de producción distintos {ε, ε′} ⊆
E. xi,t ∈ {0, 1}, ∀i ∈ IX , ∀t ∈ [1, T ] (8)
7. Los cambios en la cadena de producción deberı́an ser tan
pocos como sea posible, por lo que las secuencias de
producción πε (T ) y πε′ (T ) deberı́an ser lo más similares x′i,t,ε ∈ {0, 1}, ∀i ∈ IX′ , ∀t ∈ [1, T ], ∀ε ∈ E (9)
posible para cada par de planes {ε, ε′} ⊆ E. Esto es:
πε (T ) ≈ πε′ (T ), ∀{ε, ε′} ⊆ E.
8. Cada vehı́culo regular mantendrá la misma posición en zj,t,ε ∈ {0, 1}, ∀j ∈ J, ∀t ∈ [qj , T ], ∀ε ∈ E (10)
todas las secuencias πε (T ), ∀ε ∈ E.
A continuación incluimos la definición formal de r-CSP
en el ámbito de programación lineal entera mixta. También Yj,0,ε = 0, ∀j ∈ J, ∀ε ∈ E (11)
incluimos un conjunto de restricciones que cualquier secuencia
válida debe cumplir. Las restricción (1) impone que solo un r-CSP define multisecuencias ~π (E, T ) compuestas de se-
vehı́culo (regular o especial) puede asignarse en cada ciclo cuencias individuales πε (T ) = (π1,ε , ..., πT,ε ) para cada plan
de producción t ∈ [1, T ] para todos los planes de producción de producción ε ∈ E, como se muestra en la ecuación
ε ∈ E. Las restricciones (2) y (3) fuerzan a que se satisfaga (12). Los vehı́culos regulares i ∈ I se relacionan con los
la demanda de vehı́culos regulares (IX ) y especiales (IX′ ) elementos πt,ε (∀t ∈ [1, T ], ∀ε ∈ E) de la multisecuencia
en cada plan de producción. La restricción (4) determina ~π (E, T ) por las variables binarias xi,t (∀i ∈ IX , ∀t ∈ [1, T ])
la producción acumulada de la clase de vehı́culos regulares y x′i,t,ε (∀i ∈ IX′ , ∀t ∈ [1, T ], ∀ε ∈ E), como se define
i ∈ IX hasta el ciclo de fabricación t. La restricción (5) es en las ecuaciones (13) y (14). Debemos remarcar que todo
análoga a la anterior, referida a los vehı́culos especiales. La vehı́culo regular (i ∈ IX ) mantiene su posición en la secuencia
restricciones (6) y (7) imponen que el número de veces que se para cada plan de producción, pero las posiciones ocupadas
requiere la opción j ∈ J de manera consecutiva en cualquier por vehı́culos especiales dependen del plan de producción
ciclo de producción t ∈ [1, T ] para todo plan de producción ε ∈ E. De este modo podemos decir que toda secuencia πε (T )
ε ∈ E no supere su ratio p/q. Las restricciones (8), (9), y tiene un componente común (los vehı́culos regulares) y un
(10) definen respectivamente las variables binarias xi,t , xi,t,ε , componente exclusivo (sus vehı́culos especiales).
615
B. VNS
   

 π1 (T )  
 (π1,1 , ..., πt,1 , ..., πT,1 )   Nuestra implementación de Variable Neighborhood Search
π2 (T )  (π1,2 , ..., πt,2 , ..., πT,2 )  (VNS) [24] construye su solución inicial siguiendo una es-

    

 
 
 

... ... trategia voraz basada en la heurı́stica de Gottlieb et al. [12].
   
πε (T ) = =

 πε (T )  
 (π1,ε , ..., πt,ε , ..., πT,ε )   A diferencia del diseño usado por GRASP, en este caso el
... ... proceso es determinista y siempre se elige el vehı́culo que

 
 
 


 
 
 

π|E| (T ) (π1,|E| , ..., πt,|E| , ..., πT,|E| ) incluya el menor número de violaciones posible con el mejor
   
(12) valor de la heurı́stica.
Con respecto al diseño de la fase de perturbación de la
xi,t = 1 ⇒ πt,ε = i, ∀i ∈ IX , ∀t ∈ [1, T ], ∀ε ∈ E (13) solución, usamos un operador distinto al que después se utiliza
para la fase de refinado. En concreto elegimos utilizar un
operador de inserción, que se aplica k veces durante la fase
de perturbación donde k es igual a la iteración actual del
x′i,t = 1 ⇒ πt,ε = i, ∀i ∈ IX′ , ∀t ∈ [1, T ], ∀ε ∈ E (14)
algoritmo. Por ejemplo, con k = 3 aplicamos tres veces el
Siguiendo esta formulación definimos la función objetivo operador de manera secuencial. Este operador se describe en
para r-CSP. Esta función, que mostramos en la ecuación (15), detalle junto con el resto de operadores de búsqueda local en
minimiza el número de violaciones de restricciones para las la Sección IV-C.
opciones j ∈ J usando sus ratios de carga pj /qj para todos los
C. Búsqueda local
planes de producción ε ∈ E. Usando este enfoque tratamos
r-CSP como un problema de satisfacción de restricciones y Elegimos nuestros operadores para la búsqueda local
conectamos con la formulación original de Parello et al. [1]. basándonos en trabajo previo [12], [17] y el resultado de
nuestros experimentos. Estos operadores son: Swap, Inserción,
X X X y Inversión. Para mostrar como estos operadores modifican
min Z = zj,t,ε una secuencia dada usaremos como referencia la cadena π
j∈J t∈[qj ,T ] ε∈E descrita en la Ecuación 16. El operador de Swap intercambia
X X X dos posiciones aleatorias en una secuencia. En la Ecuación 17
⇔ max Z′ = (1 − zj,t,ε ) (15)
se puede ver el resultado de aplicar el operador de Swap a la
j∈J t∈[qj ,T ] ε∈E
cadena π, intercambiando los elementos de los ı́ndices 3 y 7.
IV. M ÉTODOS El operador de Inserción selecciona un ı́ndice aleatoriamente
Como ya hemos anticipado, existen distintos casos de éxito y lo mueve a otra posición aleatoria de la cadena, desplazando
de la aplicación de metaheurı́sticas al CSP tradicional [4], las posiciones intermedias de manera que mantengan su orden
[12], [13], [17], [21]. En muchas de estos casos se aplican en la secuencia. En la Ecuación 18 el operador de Inserción
metaheurı́sticas constructivas [22], por lo que proponemos mueve el elemento en la posición 5 a la posición 9. El operador
resolver r-CSP también con estos métodos. En concreto, hemos de Inversión invierte una subcadena definida por dos ı́ndices
elegido GRASP y VNS. seleccionados aleatoriamente. En la Ecuación 19 se muestra
cómo el operador de Inversión invierte una subcadena de π
A. GRASP entre las posiciones 4 y 6.
Nuestro diseño de Greedy Randomized Adaptive Search
Procedure (GRASP) [23] está basado en la heurı́stica propues- π = 5, 3, 4, 2, 3, 4, 1, 5, 2, 0 (16)
ta por Gottlieb et al. [12]. De este modo, la lista de candidatos
para la fase constructiva se compone en tres etapas. En el
πSwap = 5, 3, 1, 2, 3, 4, 4, 5, 2, 0 (17)
primer paso, se descartan los vehı́culos que vioları́an alguna
restricción de carga p/q, salvo que no existan vehı́culos que
no violen alguna restricción, que en ese caso deberán incluir el πInsert = 5, 3, 4, 2, 4, 1, 5, 2, 3, 0 (18)
mı́nimo de nuevas violaciones posible. En el segundo paso, si
existe más de un elemento en la lista (muy posible sobretodo
πInvert = 5, 3, 4, 4, 3, 2, 1, 5, 2, 0 (19)
en los primeros pasos), esos elementos se ordenan según su
valor heurı́stico usando la heurı́stica de Gottlieb et al. [12]. De Independientemente del operador, nuestra búsqueda local
este modo se favorece incluir primero los vehı́culos que inclu- siempre se mueve al primer vecino que mejore la solución
yen opciones más restrictivas. Finalmente la lista de candidatos (primer-mejor). De este modo, en cada paso de la búsqueda
se trunca dependiendo del parámetro α ∈ (0, 1], dejando en local se genera y evalúa un vecino aleatorio de la solución
la lista los elementos con mejor valor heurı́stico. La selección actual, aceptándolo si mejora a la anterior y deshaciendo el
final en este paso de la fase constructiva será un elemento cambio si no. Nuestra búsqueda local aplica dos operadores
aleatorio de la lista de candidatos resultante. Exponemos la de manera secuencial: primero explora el espacio de búsqueda
fase de refinado posterior usando búsqueda local en la Sección usando Swap hasta que la búsqueda termina; después se repite
IV-C. el proceso utilizando el operador de Inversión.
616
V. E XPERIMENTACI ÓN minar a esta función objetivo regular(πε ). Calcular el fitness

para |E| > 1 implica generar y calcular cada combinación de
A. Configuración
planes de producción y vehı́culos no regulares contando las
Comparamos el rendimiento de las metaheurı́sticas seleccio- nuevas violaciones (∀ε ∈ E). Dado que generar cada posible
nadas usando las instancias publicadas en CSPLib [16], que combinación para todas las secuencias implicarı́a tiempos de
es el benchmark generalmente utilizado por la comunidad del ejecución muy costosos, en su lugar optamos por una solución
CSP [12], [13], [14]. Este benchmark contiene instancias con intermedia: simular este valor siguiendo un enfoque similar a
diferentes grados de complejidad que se podrı́an dividir en las simheurı́sticas [25]. De este modo aproximamos el valor
tres categorı́as: las factibles, las clásicas y las avanzadas. Las generando aleatoriamente |M | secuencias posibles para cada
instancias factibles son un conjunto de 70 instancias de 200 plan de producción partiendo de la secuencia encontrada usan-
vehı́culos con 5 opciones y entre 17 y 30 clases. Podemos do el plan de referencia πε y calculamos la media del mı́nimo
argumentar que estas instancias son las más básicas dado de violaciones para cada plan ε ∈ E. La función f leets(πε ),
que están diseñadas para ser factibles. Estas instancias están definida en la Ecuación 20, es por tanto una aproximación para
divididas en grupos de 10 según el porcentaje de requerimiento calcular la función objetivo de r-CSP (definida en la Ecuación
de sus opciones. Las instancias menos exigentes de esta 15 de la Sección III). Nuestra función de fitness final para
categorı́a tienen un 60 % y los distintos grupos de instancias resolver r-CSP combina el número de violaciones sobre el
aumentan su complejidad gradualmente hasta un 90 %. Las plan de referencia con la aproximación de las violaciones de
instancias clásicas [16] son un grupo de 9 instancias con 100 las flotas de vehı́culos especiales usando el parámetro θ. Este
vehı́culos con 5 opciones y entre 18 y 24 clases. Este grupo de parámetro θ se incluye para potenciar la relevancia del plan
instancias es más complejo porque sólo 4 de ellas son factibles, de referencia con respecto al resto de planes de producción.
dado que su porcentaje de requerimiento de sus opciones Ajustamos los parámetros θ y |M | durante la experimentación
está cercano al 100 %. Finalmente las instancias avanzadas, y finalmente se fijan a θ = 0,6 y |M | = 30. En la Ecuación 21
propuestas por [8], son 30 secuencias de 200, 300, y 400 mostramos la función objetivo final que utilizamos en nuestros
vehı́culos. Estas instancias tienen configuraciones de opciones experimentos (f itness(πε )).
y clases similares a las instancias clásicas. Igual que en el
caso de las instancias clásicas, las instancias avanzadas están min
P P P
zj,t,ε
j∈J t∈[qj ,T ] ε∈E
diseñadas para tener un porcentaje de requerimiento muy alto f leets(πε ) = ,
y para la mayorı́a de ellas no se conoce una solución factible |M | (20)
[15]. ∀m ∈ M
Como estas instancias no consideran demanda parcial in-
cierta, extendemos su semántica generando apéndices que f itness(πε ) =
incluyan flotas de vehı́culos especiales para las instancias ya
existentes. De esta manera maximizamos la compatibilidad θ ∗ regular(πε ) + (1 − θ) ∗ f leets(πε ) (21)
con los trabajos anteriores. El enfoque que seguimos es el Tanto GRASP como VNS ejecutan durante su búsqueda
siguiente: para cada instancia existente, consideramos como local un máximo de 10,000 pasos, y contemplan 400 iteracio-
no regulares el 20 % de sus clases de vehı́culos. La suma de la nes respectivamente. De este modo, nuestra experimentación
demanda original de los vehı́culos que pasan a tratarse como fija un criterio de parada de 4,000,000 evaluaciones para las
no regulares será la demanda de vehı́culos especiales en el metaheurı́sticas, que se ejecutan 30 veces utilizando diferentes
plan de producción de referencia. En concreto, las clases de semillas. Además, fijamos el parámetro α = 0, 15 para las
vehı́culos no regulares serán las últimas clases definidas en ejecuciones de GRASP. En cuanto a la implementación, hemos
la instancia original. Por ejemplo, tomando secuencia original implementado cada metaheurı́stica en Java y hemos empleado
con 10 clases, las clases de vehı́culos 1 a 8 seguirán siendo JAMES [26] para la búsqueda local.
vehı́culos regulares y las clases 9 y 10 serán consideradas no
regulares. De este modo, la demanda de vehı́culos que con- B. Comparación algorı́tmica para el r-CSP
sideran flotas de vehı́culos especiales depende de la demanda En esta sección discutimos el rendimiento de las me-
para las clases 9 y 10. Para terminar, se generan aleatoriamente taheurı́sticas sobre las instancias modificadas para incluir flotas
10 planes de producción utilizando una distribución uniforme. de vehı́culos especiales. Por razones de espacio los resultados
Continuando el ejemplo anterior, si la demanda original de sobre estas instancias se muestran divididos en las Tablas I
las clases 9 y 10 era de 20 vehı́culos cada una, la suma de (instancias básicas desde 60-01 hasta 85-10) y II (instancias
ambas será la demanda del plan de referencia y se generan 10 básicas entre 90-01 y 90-10, instancias clásicas p*, e instancias
combinaciones aleatorias de 40 vehı́culos en total. avanzadas pb 200-*, pb 300-*, y pb 400-*).
En cuanto a los cálculos de fitness, en el caso del CSP En la Tabla I vemos que prácticamente todos los valores
tradicional los valores de fitness representan el número de resaltados son de GRASP, tanto en mı́nimo valor como en
violaciones de restricciones p/q en una secuencia. Este es un valor promedio de f itness. La superioridad de GRASP en
caso especial de la función objetivo definida en la Ecuación 15 estas instancias podrı́a deberse a la baja carga de sus opciones.
con un único plan de producción (i.e. |E| = 1). Podemos deno- Además con la configuración de parámetros elegida puede que
617
Tabla I
VALORES M ÍNIMOS Y PROMEDIO DE LAS 30 EJECUCIONES DE CADA
METAHEUR ÍSTICA APLICADA A LAS INSTANCIAS ENTRE 60-01 Y 85-10.
GRASP VNS
Instancias
Min Med Min Med Tabla II
60-01 3.08 3.63 4.64 5.97 VALORES M ÍNIMOS Y PROMEDIO DE LAS 30 EJECUCIONES DE CADA
60-02 59.48 60.50 62.92 63.73 METAHEUR ÍSTICA APLICADA A LAS INSTANCIAS 90-*, CL ÁSICAS , 200-*,
60-03 4.32 4.66 6.00 6.82 300-*, Y 400-*.
60-04 30.56 31.23 31.28 32.87
60-05 1.48 2.40 3.44 4.62 GRASP VNS
Instancias
60-06 2.24 3.01 2.68 3.56 Min Med Min Med
60-07 1.72 2.18 2.92 3.74 90-01 12.76 14.27 13.60 14.35
60-08 3.52 4.22 6.56 7.71 90-02 26.28 27.37 26.44 30.13
60-09 2.96 3.44 3.88 5.03 90-03 18.52 21.91 21.36 23.05
60-10 2.92 3.71 9.24 10.81 90-04 13.40 14.35 14.28 15.35
65-01 6.28 7.04 7.24 7.82 90-05 42.40 44.85 40.52 42.15
65-02 59.96 60.72 62.68 62.68 90-06 61.80 63.43 66.56 69.52
65-03 5.60 6.24 9.68 11.02 90-07 26.48 28.57 25.92 27.22
65-04 26.60 27.57 27.32 29.10 90-08 65.60 67.01 67.20 68.80
65-05 4.96 5.53 5.52 7.42 90-09 44.20 45.46 45.48 46.80
65-06 5.20 5.99 8.76 10.13 90-10 38.04 38.97 39.08 40.22
65-07 5.08 5.68 7.60 9.05 p10 93 15.88 17.53 10.72 11.87
65-08 5.24 5.99 8.04 9.07 p16 81 10.28 11.07 5.52 6.65
65-09 2.32 2.75 3.60 4.59 p19 71 9.52 10.94 7.08 7.59
65-10 4.00 4.99 7.16 9.43 p21 90 4.28 5.75 3.20 3.88
70-01 7.24 8.56 11.20 11.91 p26 82 12.80 13.53 10.16 10.98
70-02 58.56 60.03 61.04 62.07 p36 92 12.68 13.36 10.32 10.93
70-03 10.88 11.53 12.76 13.60 p41 66 6.40 7.29 6.08 7.03
70-04 10.48 11.33 11.04 11.94 p4 72 10.08 11.17 6.20 7.35
70-05 12.28 12.81 14.88 15.96 p6 76 7.28 7.83 7.16 7.58
70-06 3.28 3.94 6.56 7.38 pb 200 01 53.40 54.83 46.76 48.84
70-07 8.92 9.86 12.12 13.88 pb 200 02 20.68 22.87 14.68 15.73
70-08 8.32 8.99 9.44 10.46 pb 200 03 43.32 46.02 38.40 39.86
70-09 6.48 7.52 7.36 10.01 pb 200 04 25.64 27.65 19.72 21.25
70-10 7.84 8.82 11.16 13.88 pb 200 05 23.44 24.75 20.92 22.07
75-01 10.80 11.28 11.84 13.22 pb 200 06 24.52 25.70 20.96 22.09
75-02 106.32 108.29 109.92 113.16 pb 200 07 13.76 15.57 7.84 8.23
75-03 15.88 16.42 17.40 18.74 pb 200 08 30.28 32.29 27.24 29.33
75-04 17.64 19.02 18.60 20.34 pb 200 09 20.44 22.35 17.72 18.32
75-05 8.92 9.83 10.80 11.92 pb 200 10 34.76 37.17 34.32 35.44
75-06 9.52 10.08 12.40 13.84 pb 300 01 71.36 73.56 57.88 60.97
75-07 14.04 14.86 14.96 16.77 pb 300 02 44.16 47.69 30.00 32.87
75-08 17.96 19.12 20.52 21.65 pb 300 03 49.76 52.42 52.76 54.17
75-09 6.64 7.95 9.12 10.52 pb 300 04 55.08 57.41 44.52 47.26
75-10 11.72 12.97 16.52 18.39 pb 300 05 71.52 74.93 70.40 74.24
80-01 6.40 7.11 7.80 8.41 pb 300 06 44.16 47.46 41.12 44.09
80-02 110.92 112.89 113.12 115.61 pb 300 07 62.00 64.68 45.52 51.22
80-03 13.24 13.82 15.64 16.67 pb 300 08 38.40 41.16 27.28 29.87
80-04 34.72 35.68 34.88 36.65 pb 300 09 46.56 48.17 41.60 43.82
80-05 19.16 20.09 23.28 24.79 pb 300 10 113.16 116.20 106.48 110.25
80-06 9.44 10.40 12.76 14.29 pb 400 01 84.84 89.38 79.12 82.13
80-07 15.40 16.36 19.20 20.86 pb 400 02 70.64 74.18 65.20 67.85
80-08 13.60 14.68 14.48 15.82 pb 400 03 56.12 57.66 47.12 49.85
80-09 86.40 87.62 89.40 92.24 pb 400 04 106.04 108.47 95.44 97.38
80-10 12.28 13.79 15.64 16.53 pb 400 05 61.36 65.55 47.76 52.32
85-01 6.20 7.02 7.76 8.63 pb 400 06 87.16 89.49 72.32 75.24
85-02 29.76 30.53 32.56 34.16 pb 400 07 83.72 88.40 73.84 78.20
85-03 36.76 37.64 38.40 41.20 pb 400 08 45.80 48.24 40.60 43.71
85-04 23.48 24.02 26.12 27.24 pb 400 09 145.52 150.82 131.64 137.13
85-05 50.20 51.20 52.08 53.26 pb 400 10 126.72 132.31 120.28 124.20
85-06 61.84 62.65 61.16 62.94
85-07 11.60 12.15 13.80 14.51
85-08 19.72 20.56 21.00 22.00
85-09 55.04 56.34 55.00 56.93
85-10 22.20 23.73 25.72 27.85
618
GRASP tenga algo más de diversidad que VNS, al cual la [6] M. Bergen, P. Van Beek, and T. Carchrae, “Constraint-based vehicle
heurı́stica voraz de su fase constructiva puede estar guiando a assembly line sequencing,” Advances in Artificial Intelligence, pp. 88–
99, 2001.
un óptimo local donde el plan de referencia es factible. Esta [7] M. Siala, E. Hebrard, and M.-J. Huguet, “A study of constraint
explicación es consistente con los resultados de la Tabla II, programming heuristics for the car-sequencing problem,” Engineering
donde GRASP reduce mucho su rendimiento en favor de VNS. Applications of Artificial Intelligence, vol. 38, pp. 34–44, 2015.
[8] M. Gravel, C. Gagne, and W. L. Price, “Review and comparison of three
En este caso VNS consigue prácticamente la mayorı́a de los methods for the solution of the car sequencing problem,” Journal of the
mejores resultados desde p10 93 en adelante. Dado que estas Operational Research Society, vol. 56, no. 11, pp. 1287–1295, 2005.
instancias tienen un requerimiento de sus opciones mayor, se [9] M. Fliedner and N. Boysen, “Solving the car sequencing problem via
branch & bound,” European Journal of Operational Research, vol. 191,
incrementa la importancia de encontrar una secuencia factible no. 3, pp. 1023–1042, 2008.
para el plan de referencia. Además GRASP sólo consigue uno [10] J. Bautista, J. Pereira, and B. Adenso-Dı́az, “A beam search approach
de los mejores resultados en instancias que tengan más de for the optimization version of the car sequencing problem,” Annals of
Operations Research, vol. 159, no. 1, pp. 233–244, 2008.
200 vehı́culos, lo que podrı́a indicar que la escalabilidad del [11] U. Golle, F. Rothlauf, and N. Boysen, “Iterative beam search for car
problema afecta a su rendimiento. sequencing,” Annals of Operations Research, vol. 226, no. 1, pp. 239–
254, 2015.
VI. C ONCLUSIONES [12] J. Gottlieb, M. Puchta, and C. Solnon, “A study of greedy, local search,
and ant colony optimization approaches for car sequencing problems,” in
En este artı́culo hemos propuesto cómo solucionar r-CSP Applications of evolutionary computing. Springer, 2003, pp. 246–257.
[13] S. Morin, C. Gagné, and M. Gravel, “Ant colony optimization with a
usando metaheurı́sticas constructivas, especı́ficamente GRASP specialized pheromone trail for the car-sequencing problem,” European
y VNS. Para ello hemos presentado nuestra propuesta para Journal of Operational Research, vol. 197, no. 3, pp. 1185–1191, 2009.
generar instancias de r-CSP a partir de las instancias de CSP [14] A. Zinflou, C. Gagné, and M. Gravel, “Crossover operators for the car
sequencing problem,” in Evolutionary Computation in Combinatorial
tradicionales, que hemos tomado del benchmark de referencia Optimization. Springer, 2007, pp. 229–239.
CSPLib. Los resultados al aplicar las metaheurı́sticas usando [15] ——, “Genetic algorithm with hybrid integer linear programming cros-
las instancias extendidas para r-CSP muestran que GRASP es sover operators for the car-sequencing problem,” INFOR: Information
Systems and Operational Research, vol. 48, no. 1, pp. 23–37, 2010.
más competitivo en las instancias para las cuales es más senci- [16] I. P. Gent and T. Walsh, “CSPLib: a benchmark library for constraints,”
llo encontrar una secuencia factible para el plan de referencia. in Principles and Practice of Constraint Programming–CP’99. Sprin-
En cambio pierde efectividad gradualmente al incrementar la ger, 1999, pp. 480–481.
[17] M. Puchta and J. Gottlieb, “Solving car sequencing problems by local
dificultad de las instancias y finalmente es sobrepasado por optimization,” in Applications of Evolutionary Computing. Springer,
VNS. 2002, pp. 132–142.
Nuestro trabajo futuro se centrará en incluir nuevas me- [18] B. Estellon, F. Gardi, and K. Nouioua, “Two local search approaches
for solving real-life car sequencing problems,” European Journal of
taheurı́sticas constructivas como Ant Colony Optimization Operational Research, vol. 191, no. 3, pp. 928–944, 2008.
[27], que podrı́an además combinarse con nuestros procedi- [19] C. Solnon, “Combining two pheromone structures for solving the car
mientos de búsqueda local ya presentados. Futuras extensio- sequencing problem with Ant Colony Optimization,” European Journal
of Operational Research, vol. 191, no. 3, pp. 1043–1055, 2008.
nes de nuestro trabajo también considerarán la definición de [20] C. Solnon, V. D. Cung, A. Nguyen, and C. Artigues, “The car sequencing
métricas de robustez más avanzadas que evalúen la calidad problem: Overview of state-of-the-art methods and industrial case-
de las soluciones más allá de la violación de restricciones del study of the ROADEF’2005 challenge problem,” European Journal of
Operational Research, vol. 191, no. 3, pp. 912–927, 2008.
CSP tradicional. [21] M. Prandtstetter and G. R. Raidl, “An integer linear programming ap-
proach and a hybrid variable neighborhood search for the car sequencing
AGRADECIMIENTOS problem,” European Journal of Operational Research, vol. 191, no. 3,
pp. 1004–1022, 2008.
Este trabajo está financiado por el Ministerio de Economı́a y [22] E.-G. Talbi, Metaheuristics: from design to implementation. John Wiley
Competitividad bajo los proyectos NEWSOCO (ref. TIN2015- & Sons, 2009.
[23] T. A. Feo and M. G. Resende, “Greedy randomized adaptive search
67661-P) y FHI-SELM2 (ref. TIN2014-57497-P), incluyendo procedures,” Journal of global optimization, vol. 6, no. 2, pp. 109–133,
Fondos Europeos de Desarrollo Regional (ERDF). 1995.
[24] N. Mladenović and P. Hansen, “Variable neighborhood search,” Compu-
R EFERENCIAS ters & Operations Research, vol. 24, no. 11, pp. 1097–1100, 1997.
[25] A. A. Juan, J. Faulin, S. E. Grasman, M. Rabe, and G. Figueira,
[1] B. D. Parrello, W. C. Kabat, and L. Wos, “Job-shop scheduling using “A review of simheuristics: Extending metaheuristics to deal with
automated reasoning: A case study of the car-sequencing problem,” stochastic combinatorial optimization problems,” Operations Research
Journal of Automated reasoning, vol. 2, no. 1, pp. 1–42, 1986. Perspectives, vol. 2, pp. 62–72, 2015.
[2] J. Bautista Valhondo, “Modelos y métricas para la versión robusta del [26] H. De Beukelaer, G. F. Davenport, G. De Meyer, and V. Fack, “JAMES:
car sequencing problem con flotas de vehı́culos especiales,” Dirección An object-oriented Java framework for discrete optimization using local
y organización, vol. 60, no. 2016, pp. 57–65, 2016. search metaheuristics,” Software: Practice and Experience, vol. 47,
[3] J. Bautista, J. Pereira, and B. Adenso-Dı́az, “A GRASP approach for no. 6, pp. 921–938, 2017.
the extended car sequencing problem,” Journal of Scheduling, vol. 11, [27] M. Dorigo and T. Stützle, “Ant colony optimization: overview and recent
no. 1, pp. 3–16, 2008. advances,” Handbook of metaheuristics, 2010.
[4] C. C. Ribeiro, D. Aloise, T. F. Noronha, C. Rocha, and S. Urrutia,
“An efficient implementation of a VNS/ILS heuristic for a real-life car
sequencing problem,” European Journal of Operational Research, vol.
191, no. 3, pp. 596–611, 2008.
[5] U. Golle, “Fitness landscape analysis and design of metaheuristics for
car sequencing,” On the Car Sequencing Problem: Analysis and Solution
Methods, p. 100, 2011.
619
Secuenciación en líneas de fabricación no

sincronizadas con ensamblajes
Modelado matemático y resolución heurística
Carlos Andrés Julien Maheut

Departamento de Organización de Empresas Departamento de Organización de Empresas
Universitat Politècnica de València Universitat Politècnica de València
Valencia Valencia
Abstract—En este trabajo se presenta el problema de producidas por otras máquinas. De esta manera, no es posible
establecer la secuencia en una línea de montaje no sincronizada en empezar una operación de un trabajo en una máquina, si no han
donde cada estación de trabajo se abastece por otra máquina. llegado a la misma todos los componentes necesarios para
Entre cada estación de trabajo o máquina existen almacenes de ejecutarla. Este tipo de configuraciones posibilita el estudio de
capacidad limitada que pueden provocar bloqueos en las muchas más variantes de sistemas productivos industriales que
instalaciones precedentes si llegan a saturar su capacidad. Se los que se estudian con el taller de flujo puesto que incide en el
modela el problema como un taller de flujo con ensamblajes y problema de la coordinación a nivel de programa de producción
almacenes intermedios con el objetivo de minimizar Cmax y se de la fabricación de los componentes necesarios para obtener un
realiza un estudio sobre el rendimiento de diferentes heurísticas,
producto concreto.
presentándose una adaptación de la metaheurística VNS al
problema. En la mayoría de la investigación realizada sobre estas
configuraciones se asume que existe una capacidad de
Keywords—líneas de fabricación; taller de flujo; almacén almacenamiento infinito entre las máquinas del taller. Sin
limitado; heurística; Variable Neighbourghood Search embargo, en los sistemas productivos reales siempre hay una
limitación de capacidad debido a la necesidad física que los
I. INTRODUCCIÓN trabajos esperen antes de ser procesados en una máquina si ésta
Desde el trabajo seminal de [1] se ha desarrollado una se encuentra ocupada procesando el trabajo previo de la
vastísima literatura relativa a la Programación de Producción en secuencia. Esta limitación es más relevante cuanto mayor es el
sistemas de fabricación y, en concreto, al estudio de modelos y volumen o tamaño de las piezas o lotes procesados entre las
algoritmos para resolver el problema de la secuencia en máquinas. En general, la limitación que se considera en la
diferentes configuraciones. Una de las configuraciones más literatura de secuenciación se establece en base al número
estudiadas es el taller de flujo o “flowshop” en el que todos los máximo de trabajos que pueden almacenarse en cada instante
trabajos tienen la misma ruta de operaciones en las M máquinas entre dos máquinas (asumiendo de esta manera que todos los
donde se procesan y el objetivo es determinar el orden de paso trabajos tienen un volumen parecido o se transportan en
de un conjunto de N trabajos por las máquinas que optimice contenedores estandarizados). Según se recoge en [7] existe un
cierta medida de eficiencia de la secuencia [2]. número creciente de trabajos en los que ya se considera
explícitamente la limitación de capacidad entre etapas del
Dentro del conjunto de soluciones posibles a cualquier proceso de fabricación.
instancia de este tipo de problema, muchos trabajos se han
centrado en el subconjunto formado por aquellas con la Un prometedor campo de investigación es el de la
propiedad denominada “de permutación”, esto es, su secuencia programación de unidades en líneas mixtas de fabricación y/o
de paso es idéntica en todas las máquinas [3], [4]. Esto es debido montaje no sincronizadas con limitación de capacidad. En esta
a que la solución óptima para ciertos casos de optimización es configuración, un trabajo solamente puede ser liberado de una
una secuencia de permutación y que, en muchos problemas estación de la línea a la siguiente estación si existe capacidad de
reales, la disciplina FIFO es la que se aplica con más frecuencia almacenamiento suficiente entre ambas estaciones. Este tipo de
en el transporte de los trabajos entre las máquinas debido a las sistemas productivos, se pueden modelar como talleres de flujo
políticas de transporte de los trabajos entre las máquinas. con almacenes intermedios según se ha propuesto por [8].
Más recientemente, otro tipo de configuración denominada El objetivo de este trabajo es profundizar en este tipo de
taller con ensamblajes “assembly shop” [5], [6], ha empezado a configuraciones en las que, además de una línea de fabricación
llamar la atención de los investigadores. En este tipo de y/o montaje principal, existen una serie de líneas o estaciones de
problemas se considera que existe al menos una máquina o etapa abastecimiento conectadas. Un ejemplo real de este tipo de
que funciona como ensambladora de las partes y componentes sistemas productivos se muestra en la Fig. 1.
620
Fig. 1. Ejemplo de sistema productivo real con ensamblajes
p es el subíndice asociado a la posición ocupada por cada

trabajo (p=1,..,N)
II. PLANTEAMIENTO Y MODELADO DEL PROBLEMA j es el subíndice asociado a las estaciones de trabajo de la
línea principal (j=1,..,M)
A. Descripción del problema
Mj identifica cada estación de trabajo de la línea principal
La configuración objeto de estudio está formada por una
(j=1,..,M). Además, se consideran M máquinas de
línea principal compuesta por M máquinas o estaciones. A cada
abastecimiento que suministran MxN componentes en total
una de estas máquinas le llegan componentes procedentes de una
debido a que solo hay una máquina abasteciendo a cada estación
máquina de fabricación de componentes. Existen almacenes
de trabajo. Cada una de estas máquinas se denotarán por MCj
intermedios entre cada máquina o estación, tanto de la línea
j=1,…,M
principal las máquinas de fabricación de componentes. Para
poder llevar a cabo la operación correspondiente en cada pci,j es el tiempo de proceso del componente necesario para
estación de la línea principal es necesario disponer el producto el producto i en la máquina de abastecimiento MCj.
suministrado por la estación anterior y el componente
suministrado por la máquina de fabricación. En este trabajo se pi es el tiempo de proceso del producto i en cada estación Mj
va a suponer solamente secuencias basadas en permutaciones, de la línea principal.
esto es, la secuencia es la misma en todas las estaciones de la Entre cada par de estaciones de trabajo j-1 y j de la línea
línea principal y en cada máquina de fabricación de principal existe un almacén intermedio Bj. Del mismo modo,
componentes. entre una estación de trabajo Mj y una máquina de
abastecimiento de componentes MCj existe un almacén
B. Notación matemática intermedio BCj.
Para identificar los diferentes elementos del problema se De esta forma se considera que bcj es la capacidad de
usará la siguiente notación basada en la configuración mostrada almacenamiento (en unidades) del almacén que existe entre la
en la Fig.2: máquina de abastecimiento MCj y la estación de ensamblaje Mj
N trabajos o componentes. y que bj es la capacidad de almacenamiento (en unidades) del
almacén que existe entre las estaciones de ensamblaje Mj-1 y
M estaciones en la línea principal. Mj.
i es el subíndice asociado a los trabajos o componentes SCp,j ≥ 0 es la fecha de inicio del componente que ocupa la
(i=1,..,N) posición p de la secuencia en cada máquina j de abastecimiento.
621
MC1 MC2 MCM-1 MCM
BC1 BC2 BCM-1 BCM
M1 B2 M2 … BM-1 MM-1 BM MM
Fig. 2. Configuración estudiada
Sp,j ≥ 0es la fecha de inicio del producto que ocupa la ��,1 ≥ ��−�2 −1,2 � > ��+1 + 1 (12)
posición p de la secuencia en cada estación j de la línea principal.
�
xi,p es una variable binaria que vale 1 si el producto i ocupa � = 2, … , �;
la posición p de la secuencia y 0 en caso contrario. ��,� ≥ ��−1,� + � ��,�−1 ∙ ��,� (13)
�=1
� = 2, … , � − 1
�
C. Modelo matemático � = 2, … , �;
El modelo matemático de la configuración estudiada se basa ��,� ≥ ��,�−1 + � ��,� ∙ ��,�−1 (14)
en las definiciones anteriores y es el siguiente: �=1
� = 2, … , � − 1
�
Min Cmax (1) � = 2, … , �;
��,� ≥ ��,� + � ��,� ∙ ��,� (15)
� = 2, … , � − 1
s.a. �=1
� �≥�
� ��,� = 1 � = 1, … , � (2) ��,� ≥ ��−��+1−1,�+1 ≥ 2 + ��+1 + 1; (16)
�=1
� � = 2, … , � − 1
� ��,� = 1 �
� = 1, … , � (3)
�=1 ��,� ≥ ��−1,� + � ��,�−1 ∙ ��,� � = 2, … , � (17)
�=1
��1,� = 0 � = 1, … , � (4) �
�1,1 ≥ ��1,1 + ∑�
�=1 ��,1 ∙ ��,1 (5) ��,� ≥ ��,�−1 + � ��,� ∙ ��,�−1 � = 2, … , � (18)
�=1
�
(6) �
�1,� ≥ ��1,� + � ��,1 ∙ ��,� � = 2, … , � ��,� ≥ ��,� + � ��,� ∙ ��,� � = 2, … , � (19)
�=1
�=1
�
(7) �
�1,� ≥ �1,�−1 + � ��,1 ∙ ��,�−1 � = 2, … , � �� = ��,� + � ��,� ∙ ��,� (20)
�=1
�=1
�
� = 2, … , �; La expresión (1) corresponde a la función objetivo a
��,� ≥ ��−1,� + � ��,�−1 ∙ ��,� (8) optimizar que en este trabajo es la fecha de fin del último trabajo
� = 1, … , �
�=1 secuenciado o makespan. (2) y (3) son restricciones de
� > �� + 1; asignación biunívoca que obligan a que en cada posición de la
��,� ≥ ��−�� −1,� (9) secuencia haya solo un trabajo y que cada trabajo se asigne
� = 1, … , � solamente a una posición. La restricción (4) define que el
� instante de inicio en las máquinas de abastecimiento del primer
componente es cero. (5) indica que el producto en primera
��,1 ≥ ��−1,1 + � ��,�−1 ∙ ��,1 � = 2, … , � (10) posición empieza en la primera estación de la línea cuando acaba
�=1 la fabricación del componente en la primera máquina de
� abastecimiento.
��,1 ≥ ��,1 + � ��,� ∙ ��,1 � = 2, … , � (11) Las restricciones (6) y (7) afectan a la fecha de inicio del
�=1 producto que va en primera posición de la secuencia en todas las
estaciones de trabajo en función de la máquina que fabrica su
622
componente y de la estación anterior de la línea donde se 1) Heurística NEH

procesa. La primera regla que se ha elegido es la conocida como regla
Las ecuaciones (8) y (9) permiten calcular las fechas de NEH [9], puesto que ha dado muy buenos resultados en diversas
inicio en las máquinas de abastecimiento de los componentes variantes de flowshop [3]. Específicamente, en [10] se corrobora
necesarios para ensamblar el resto de productos de la secuencia. su bondad para configuraciones flowshop con capacidad de
En concreto, (8) se aplica a aquellos productos cuya posición en almacenamiento limitada.
la secuencia es tal que no se ven afectados por el tamaño de los En lo que se refiere a su funcionamiento, la regla NEH se
almacenes que hay entre las máquinas de abastecimiento y las basa en la ordenación de los trabajos en función de un criterio
máquinas de ensamblaje. En este caso, las fechas de inicio solo determinado (en el artículo original se usa la regla de mayor
se ven condicionadas por la fecha de fin del componente tiempo de proceso). En el presente trabajo, la regla de
perteneciente al producto de la posición previa de la secuencia, ordenación de los trabajos considera tanto los tiempos en las
ya que antes de las máquinas MCj no hay otra máquina. Sin estaciones de ensamblaje como los de las máquinas de
embargo, en (9) además de este hecho se debe tener en cuenta fabricación de componentes. Así se han tenido en cuenta los
que más allá de la posición bcj+1, los componentes solo pueden siguientes criterios de ordenación:
empezar cuando empiecen los que están bcj posiciones antes.
• MAX_T/MIN_T: Valor máximo (o mínimo) para cada
Las ecuaciones (10) y (11) son similares a las dos anteriores, trabajo entre todos los tiempos (tanto de la línea principal
pero en este caso, afectan a las fechas de inicio en la primera como las de las máquinas de fabricación de
máquina de la línea principal de los productos que están después componentes).
de la posición 1. En ellas se tiene en cuenta las fechas de inicio
de los trabajos que no se ven afectados por la capacidad del • SUM_T: Para cada trabajo, la suma de todos los tiempos
almacén que se encuentra entre las máquinas M1 y M2 de la (tanto de la línea principal como las de las máquinas de
línea principal (y solo dependen de la fecha de fin en la máquina fabricación de componentes).
de abastecimiento del componente necesario para montar el
trabajo, y la fecha de fin del trabajo anterior en la M1. • MAX_T_P/MIN_T_P: Valor máximo (o mínimo) para
cada trabajo entre todos los tiempos de la línea principal.
En (12) se tiene en cuenta un término adicional que depende
de la fecha en la que el trabajo que está en b2 posiciones antes, • SUM_T_P/SUM_T_C: Para cada trabajo, la suma de
abandona el almacén b2. todos los tiempos en las estaciones de ensamblaje de
fabricación de components (o en las máquinas de
Las expresiones (13) (14) (15) y (16) se aplican de la segunda fabricación de components).
máquina de la línea principal de ensamblaje en adelante. Es por
ello que incorporan términos adicionales en sus expresiones para • MAX_T_C/MIN_T_C: Valor máximo (o mínimo) para
identificar las relaciones de las fechas de inicio de los trabajos cada trabajo entre todos los tiempos de proceso en las
en la máquina, con las fechas de fin del trabajo en la máquina máquinas de fabricación de componentes.
anterior de la línea principal, las fechas de fin del componente
necesario en la máquina de abastecimiento correspondiente, la 2) Heurística PF
fecha de fin del trabajo anterior en la máquina, y en el caso de la En [11] se propuso la regla conocida como PF o Profile
expresión (16) las relaciones en el almacén de capacidad Fitting dentro de un caso de fabricación cíclica en un flowshop
limitada entre la máquina y la máquina siguiente. con almacenes (asimilable a una línea no sincronizada de
Dado que la última máquina M de la línea principal no tiene fabricación con mezcla de modelos). Al ser una regla que tiene
almacén posterior, son necesarias las expresiones (17) (18) y en cuenta los bloqueos y esperas de las máquinas se ha
(19) para calcular los tiempos de inicio en esa máquina. considerado en este trabajo puesto que se le supone un buen
Finalmente, (20) permite calcular la fecha de fin del último rendimiento en sistemas con ensamblajes donde hay muchas
trabajo de la secuencia. posiciones que originan esperas.
El procedimiento comienza eligiendo como primer trabajo
III. HEURÍSTICAS Y METAHEURÍSTICA PLANTEADAS de la secuencia aquel que tiene la mayor suma de tiempos de
proceso. En nuestro caso optaremos por elegir el mayor de las
Pese a la existencia del modelo matemático descrito en el
sumas de tiempos de proceso en todas las máquinas (tanto de
apartado anterior, en el apartado siguiente se muestra la
componentes como principales). Una vez elegido el primer
dificultad de abordar instancias de tamaño medio o grande. Por
trabajo i*, se calcula para el resto de trabajos candidatos ic el
ello, se han propuesto varias heurísticas y úna metaheurística
basada en Búsqueda por Entorno Variable (VNS) para resolver valor ∑� �=1 D[ic]j − D[i∗]j − p[ic]j , donde D[i]j=max(C[i]j, S[i-
el problema. A continuación, se hace una descripción de las b(j+1)]j+1). El sumatorio se extiende a todas las máquinas (tanto las
características principales de estos métodos. de la línea principal como las de abastecimiento) y se elige aquel
trabajo ic en el que se obtenga la suma menor. Este trabajo ahora
se convierte en i* y se repite el proceso hasta que se completa la
A. Heurísticas
secuencia.
Se han evaluado tres reglas heurísticas adaptadas al
problema que nos ocupa.
623
3) Heurística MM El criterio de parada se ha fijado en un número de iteraciones

La última regla que se usará en esta comparación es la determinado, aunque se ha monitorizado el tiempo de cálculo de
definida en [12] para configuraciones flowshop con bloqueo. En cara al estudio experimental que se detalla en el siguiente
primer lugar, se elige en primera posición de la secuencia aquel apartado.
trabajo que tenga menor tiempo de proceso en la primera
máquina de la línea principal. A continuación, se coloca en IV. ESTUDIO EXPERIMENTAL
última posición aquel trabajo que tenga el tiempo de proceso El estudio experimental se ha desarrollado sobre tres grupos
menor en la última máquina de la línea principal. A continuación de instancias: pequeñas, medianas y grandes. Todas ellas se han
del trabajo en primera posición (i*) se coloca un trabajo (ic) con generado a partir del conocido conjunto de instancias de [15]
el menor valor de la siguiente expresión: adaptándolas para el caso que nos ocupa.
� ∙ ∑�−1 �
�=1 �� ,� − ��∗,�+1 � − (1 − �) ∙ ∑�=1 �� ,� (21) Con las instancias pequeñas (9 trabajos y cinco estaciones de
Donde M son las máquinas de la línea principal. Una vez trabajo) se ha realizado una enumeración completa de todas las
colocado el trabajo elegido, este pasa ahora a ser i* y se repite el soluciones y se han representado en la Fig. 4 para poder tener
proceso hasta que no hay más trabajos por colocar. En este una visión del aspecto que puede tener el espacio de soluciones.
trabajo se han propuesto adicionalmente dos variantes, la
primera es usar, en vez de los valores de tiempos de proceso en
la línea principal, el mayor entre los tiempos de proceso del
trabajo i en la máquina que ensambla componentes para la N=9,M=5
máquina j y la máquina j de la línea principal. La segunda es
utilizar la suma de ambos tiempos de procesado en las dos b=0 b=1 b>1
máquinas (la de fabricación de componentes y la de la línea
principal). 40000
FRECUENCIA ACUMULADA
30000
B. Búsqueda por entorno variable (VNS)
20000
La metaheurística VNS o búsqueda por entorno variable fue
planteada por primera vez en [13] y se trata de un procedimiento 10000
de búsqueda local que usa sucesivamente diversos tipos de 0
movimiento (con sus entornos asociados Nk) para explorar 820 1020 1220
eficientemente el espacio de soluciones. La estrategia de CMAX
búsqueda se basa en realizar cambios sistemáticos de entorno
dentro de la búsqueda local y aumentar el tamaño del entorno
cuando la búsqueda no avanza mediante una gran perturbación Fig. 3. Estudio de enumeración completa
denominada “agitación”. Pueden plantearse diversos tipos de
movimientos de agitación del mismo modo que se manejan Se ha observado experimentalmente una clara diferencia
diferentes entornos para la búsqueda local [14]. cuando el tamaño de los almacenes es nulo respecto a lo que
Como elemento novedoso, en este trabajo planteamos una sucede para tamaños de almacenes mayores. Siendo inexistente
variante de VNS a la que se añade un mecanismo de reinicio la influencia que tiene el tamaño de los almacenes intermedios
basado en frecuencias. Inicialmente se parte de una solución para valores superiores a 1.
inicial obtenida mediante la regla NEH, sin embargo, en el En el caso de las instancias medianas (instancias de 20 y 50
momento en que se han realizado todos los movimientos según trabajos, y 5 y 10 estaciones de trabajo) se ha realizado un
las diferentes combinaciones de movimientos de agitación y estudio experimental para evaluar hasta qué tamaño es posible
búsqueda local, se reinicia una nueva solución mediante un resolver de manera óptima el problema. En la Tabla 1 se muestra
procedimiento constructivo. Este procedimiento genera una el resultado de resolver 80 instancias diferentes con tamaños de
secuencia basada en las posiciones relativas de los trabajos que almacén de 0 a 3.
se obtienen en aquellas soluciones que, en una iteración
determinan, han mejorado la mejor solución encontrada. Según la tabla, se puede concluir que el tamaño de los
almacenes influye sobre la posibilidad de resolver óptimamente
En este trabajo, y usando una representación del problema una instancia. Del mismo modo, el número de trabajos a
basada en una permutación de los trabajos, se han utilizado los secuenciar y el de máquinas también tienen influencia, siendo el
siguientes movimientos de agitación: realizar varias inserciones, primero más influyente que el segundo, puesto que, al aumentar
realizar varios swaps entre dos posiciones aleatoriamente el número de trabajo, provoca que, para un gran número de
elegidas, elegir varios trabajos en posiciones consecutivas y instancias, no se puedan ni siquiera calcular una relajación del
reescribirlos en orden inverso, y elegir varios trabajos en modelo que permita la aplicación de las técnicas de ramificación
posiciones no consecutivas y reescribirlos en orden inverso. implementadas en el optimizador
En cuanto a los movimientos de búsqueda local, se han
usado: inserción de un trabajo entre otros, intercambio de TABLA 1.
posiciones de dos trabajos consecutivos e intercambio de
posiciones de dos trabajos no consecutivos.
624
N M b % Resuelto %GAP 0,05< No almacén decrece conforme aumenta el tamaño de almacén,

óptimamente <0,05 %GAP solución siendo casi despreciable a partir de tamaños superiores a 4.
<0,3
20 5 0 0% 20% 80% 0%
1 20% 80% 0% 0% V. CONCLUSIONES
En este trabajo se ha abordado el estudio de una
2 100% 0% 0% 0% configuración tipo flowshop con máquinas auxiliares de
3 80% 20% 0% 0% abastecimiento que presenta limitación de capacidad entre las
10 0 0% 100% 0% 0% diferentes máquinas del sistema. Este tipo de configuraciones
1 0% 20% 80% 0% son de gran interés porque permite representar tanto líneas de
fabricación no sincronizadas como otros sistemas complejos en
2 0% 60% 40% 0%
los que existen máquinas destinadas a la fabricación de
3 0% 60% 40% 0% componentes. Se ha propuesto un modelo matemático que
50 5 0 0% 0% 40% 60% permite obtener soluciones óptimas para instancias de hasta 20
1 0% 0% 20 80% trabajos. Además, se ha observado que los tamaños de los
2 0% 20% 80% 0% almacenes intermedios influyen sobre el problema, tanto en la
3 20% 60% 0% 20% topología del espacio de soluciones como en la capacidad de
10 0 0% 0% 80% 10% alcanzar buenas soluciones (o incluso óptimas) en un tiempo
1 0% 0% 40% 60% limitado.
2 0% 0% 40% 60%
3 0% 0% 60% 40% REFERENCIAS
Finalmente, se ha usado un conjunto de instancias grandes
(200 y 500 trabajos, 5, 10 y 20 estaciones de trabajo y tamaños [1] S.M. Johnson, “Optimal Two- and Three-Stage Production Schedules
de almacén de 0 a 4) para evaluar el rendimiento de las with Setup Times Included”. Naval Research Logistics Quarterly, vol. 1,
heurísticas y la metaheurística VNS descrita. Se ha realizado un pp. 61– 68, 1954
estudio de ajuste de parámetros en aquellas heurísticas que lo [2] T. C. E. Cheng, J. Gupta y G. Wang, “A review of flowshop scheduling
requieren de cara a definir el mejor criterio de ordenación en el research with setup times”. Production and operations management, vol.
9, pp. 262-282, 2000.
caso de la regla NEH o el valor de α más adecuado en el caso
[3] R. Ruiz y C. Maroto, “A comprehensive review and evaluation of
de la regla MM. En la Fig. 4 se puede observar el gráfico de permutation flowshop heuristics”. European Journal of Operational
medias de las reglas (donde 1 es la regla MM, 2 la PF y 3 la Research, vol. 165, pp. 479-494, 2005
NEH) en el que se observa la clara superioridad de la regla NEH. [4] Q. Pan y R. Ruiz, “A comprehensive review and evaluation of
permutation flowshop heuristics to minimize flowtime”. Computers &
Operations Research, vol. 40, pp. 117-128, 2013.
[5] C. Y. Lee, T.C.E. Cheng y B.M.T. Lin, “Minimizing the makespan in the
Medias y 95,0% de Tukey HSD
3-machine assembly-type flowshop scheduling problem”. Management
0,2
Science, vol. 39, pp. 616-625, 1993
[6] C. N. Potts, S. V. Sevast'janov, V.A. Strusevich, L. N. Van Wassenhove,
0,16
y C. M. Zwaneveld, “The Two-Stage Assembly Scheduling Problem:
0,12
Complexity and Approximation”. Operations Research, vol 43, pp. 346-
355, 1995.
APD
0,08
[7] C. Andrés y J. Maheut, “Secuenciación con almacenes limitados. Una
0,04
revisión de la literatura”. Dirección y Organización, vol. 66, 2018.
[8] J. Bautista-Valhondo y R. Alfaro-Pozo, “Mixed integer linear
0
1 2 3
programming models for Flow Shop Scheduling with a demand plan of
Regla job types”. Central European Journal of Operations Research, 2018.
https://doi.org/10.1007/s10100-018-0553-8
[9] M. Nawaz, E. E. Enscore e I. Ham, “A heuristic algorithm for the m-
Fig. 4. Gráfico de medias machine, n-job flowshop problem”. Omega, vol. 11, pp.91-95, 1983.
[10] R. Leinsten, “Flowshop sequencing problems with limited buffer
En el caso de VNS, su comportamiento es superior a la regla storage”. Int. Journal of Prod. Research, vol. 28, pp. 2085-2100, 1990.
NEH, puesto que permite mejorar sus resultados en el 97,91% [11] S. T. McCormick, M. I. Pinedo, S. Shenker, y B. Wolf, “Sequencing in an
de las experiencias planteadas. En concreto, comparando las assembly line with blocking to minimize cycle time”. Operations
mismas instancias con diferentes tamaños de almacén, se ha Research, vol. 37, pp. 925-936, 1989.
observado que, el % en que VNS mejora a NEH aumenta según [12] D. Ronconi, “A note on constructive heuristics for the flowshop problem
aumenta el tamaño de almacén (de una mejora del 0,52% with blocking”. Int. J.ournal of Prod. Economics, vol. 87, pp. 39-48, 2004
respecto a la solución obtenida mediante NEH para los [13] N. Mladenović, P. Hansen, “Variable neighborhood search”. Computers
problemas con tamaño de almacén igual a cero hasta un 6,3% & Operations Research, vol. 24, pp. 1097-1100, 1997.
para problemas con tamaño de almacén igual a 4). Esto, indica [14] J. A. M. Pérez, N. Mladenović, B. M. Batista e I. J. G del Amo, “Variable
que VNS es más efectiva respecto a NEH cuanto mayor es la Neighbourhood Search”, in Metaheuristic Procedures for Training
Neutral Networks. Op. Res. /Comp. Sc. Interfaces Series, vol 36. E. Alba
capacidad de los almacenes intermedios. y R. Martí, Eds, Boston: Springer, 2006
Además, y basándonos ya en los resultados obtenidos por [15] E. Taillard, “Benchmarks for basic scheduling problems”. European
VNS, el estudio muestra que la influencia del tamaño del Journal of Operational Research, vol. 64, pp. 278-285, 1993.
625
Equilibrado robusto de una línea de motores mixtos

con atributos temporales, espaciales y ergonómicos
Joaquín Bautista 1, Manuel Chica 2, Oscar Cordón 2, Sergio Damas 2
1
IOC-ETSEIB-Nissan Chair, Universidad Politécnica de Catalunya, España
2
Instituto Andaluz Interuniversitario DaSCI (Data Science and Computational Intelligence), Universidad de Granada, España
Emails: [email protected], [email protected], [email protected], [email protected]
Resumen— Partiendo de los modelos TSALBP-ergo (Time operarios), un esfuerzo físico (según la categoría del riesgo
and Space Assembly Line Balancing Problem with Ergonomic ergonómico), y un espacio para el producto y sus componentes,
Risk), proponemos 9 métricas para medir la robustez de un la instrumentación y los recursos humanos. La definición de las
equilibrado de línea según sus atributos temporales, espaciales y tareas es el resultado de concebir la fabricación de un producto
contingentes. La versión robusta de TSALBP-ergo considera complejo como la superposición de las mismas, dando lugar a
diversos planes de demanda e incluye funciones que miden los un problema denominado equilibrado de líneas de montaje
excesos de cargas temporales, espaciales y de riesgo ergonómico (ALB: Assembly Line Balancing) [1], [2]. Las soluciones se
en las estaciones de la línea de montaje. Las métricas propuestas
basan en distribuir eficientemente las tareas entre estaciones,
son útiles como funciones objetivo en problemas de optimización
cumpliendo un conjunto de restricciones.
o se pueden emplear como indicadores del nivel de robustez de
una línea. La nueva versión r-TSALBP-ergo pone a disposición
El problema de equilibrado de líneas en su versión simple
del decisor nuevas soluciones de equilibrado más eficientes y denominado SALBP [3] (Simple Assembly Line Balancing
robustas ante una demanda incierta. Problem ), consiste en repartir óptimamente las tareas entre las
estaciones, respetando las restricciones de precedencia entre
Keywords—Líneas de ensamblado; Demanda incierta; Riesgo ellas, siguiendo dos criterios de optimización: (i) minimizar el
Ergonómico; Optimización robusta. número de estaciones de trabajo, dado un tiempo de ciclo de
fabricación (SALBP-1), y (ii) maximizar la tasa de producción
I. INTRODUCCIÓN de la línea, dado un número fijo de estaciones de trabajo
El diseño de una línea de montaje presenta tres vertientes (SALBP-2).
como mínimo: (i) establecer el número de estaciones y decidir TSALBP [4] (Time and Space Assembly Line Balancing
qué operaciones se realizarán en cada puesto de trabajo en Problem) es una extensión natural de SALBP más próxima a
función de la demanda, (ii) ofrecer una distribución en planta situaciones industriales realistas. En efecto, TSALBP incorpora
que contemple tanto el espacio requerido por el producto y sus adicionalmente atributos espaciales relacionados tanto con el
componentes como los espacios adicionales para el desempeño espacio disponible para distribuir en planta las estaciones de
correcto del trabajo de los operarios, y (iii) evitar que el reparto trabajo como con el espacio requerido para ejecutar las tareas y
de cargas de trabajo entre estaciones genere lesiones físicas a para albergar los componentes de montaje del producto.
los trabajadores a medio-largo plazo. TSALBP presenta 8 variantes que resultan de considerar las
Dentro del sector de Automoción de los países de la OCDE, combinaciones de 3 criterios de optimización: � (número de
las líneas de montaje de modelos mixtos están capacitadas para estaciones), � (tiempo de ciclo) y � (área lineal disponible de
ensamblar distintos tipos de producto, como es el caso de las las estaciones).
plantas de motores que usan la misma instalación para fabricar Por su parte, TSALBP-ergo [5] (Time and Space Assembly
distintas versiones de motores para vehículos SUVs, furgonetas Line Balancing Problem with Ergonomic Risk) es una familia
y camiones. de problemas que incorpora a TSALBP el concepto de Riesgo
El ensamblado de estos tipos de producto está constituido Ergonómico tanto en la función objetivo como en restricciones
por tareas semejantes que presentan características comunes; adicionales en las estaciones de trabajo de la línea de montaje.
no obstante, cada tipo de producto requiere piezas específicas, Obviamente, TSALBP-ergo presenta 16 variantes al considerar
distintas formas de aplicar el trabajo, distintas herramientas y las combinaciones de 4 criterios de optimización: los 3 criterios
distintas habilidades y esfuerzo de los operarios. Obviamente, de TSALBP más � (riesgo ergonómico).
esta distinción se da tanto entre tipos de producto de la misma En este contexto, la flexibilidad en la fabricación es una
familia (v.g.- dos versiones de la familia SUVs) como entre propiedad importante de cara a que las grandes compañías
productos de distintas familias (v.g. SUVs o camiones). En puedan responder a cambios de su entorno económico. Entre
estos casos, el ensamblado de un motor requiere unas 400 dichos cambios está el de la variación de la demanda de sus
tareas que pueden agregarse en unas 150 operaciones básicas productos. Esta variación puede ser tanto global, afectando al
ya sea por conveniencia o condicionantes de tipo tecnológico. tiempo de ciclo de la línea, como parcial, afectando al mix de
Brevemente, una línea de montaje es un sistema productivo producción y a los atributos de las tareas (tiempos de proceso,
constituido por un conjunto de estaciones de trabajo a las que áreas requeridas y riesgos ergonómicos).
se asigna de manera exclusiva una serie de tareas. Cada tarea La variación del mix de producción, representada a través
requiere un tiempo de proceso (función de la actividad de los de planes de producción diarios, obliga a reequilibrar la línea.
626
Esta alteración conduce normalmente a la reconfiguración de ejecutar cómodamente la operación, las dimensiones de los
algunos o todos los puestos de trabajo, llegando a veces a ser contenedores de piezas relacionadas con la operación, así como
necesaria nueva obra civil. el espacio ocupado por herramientas y robots para llevar a cabo
Para evitar cambios notables en la distribución en planta de el montaje. Finalmente, son atributos contingentes de una tarea:
la línea, se puede recurrir a la implantación de soluciones que el factor y la categoría de riesgo que supone al operario realizar
sean lo más robustas posibles ante la variación de la demanda una tarea, y el tiempo de exposición del operario a dicha tarea.
[6]-[8]. Cuando la línea fabrica un único tipo de producto, los datos
En este trabajo proponemos métricas para TSALBP-ergo, que precisamos para resolver un problema de equilibrado son:
como extensión a [7], que permiten incorporar a los modelos el 1. El conjunto de operaciones (�: � = 1, . . , |�|) con sus
concepto de solución robusta [9] mediante restricciones y atributos elementales: tiempo de proceso �� : � ∈ �, área
funciones objetivo. Para ello, las restricciones y las funciones lineal requerida �� : � ∈ �, categoría de riesgo �� : � ∈ �,
objetivo contienen toda la información de un conjunto de
referencia de planes de demanda (también llamados escenarios) y riesgo ergonómico �� : � ∈ �.
que alteran los valores de los atributos temporales, espaciales y 2. El conjunto de estaciones de trabajo (�: � = 1, . . , |�|)
de contingencia de las tareas. Esto nos conduce a la definición 3. Las restricciones de precedencia, incompatibilidad
de funciones de robustez temporal, espacial y de riesgo que entre tareas y las restricciones que afectan a los
miden las sobrecargas de tiempo, espacio y riesgo ergonómico atributos de la línea: número de estaciones (�), tiempo
en las estaciones, así como el grado de factibilidad del conjunto de ciclo (�), área disponible en cada estación (�) y
de planes de demanda. riesgo ergonómico permisible (�).
El resto del texto sigue la siguiente estructura. La Sección Cuando la línea es de modelos mixtos, los atributos
II describe sucintamente la robustez en problemas ALB. En la elementales dependen de las tareas y productos, por tanto,
Sección III describimos las condiciones de TSALBP-ergo ante teniendo en cuenta el conjunto de tipos de producto (�: � =
una demanda incierta. En la Sección IV formalizamos y 1, . . , |�|), los atributos temporales, espaciales y contingentes
modelamos el problema objeto de estudio. En la Sección V adoptan respectivamente las formas siguientes: �� , �� , �� ∶ � ∈
presentamos algunos ejemplos ilustrativos. Por último, en la � ⋏ � ∈ �.
Sección VI recogemos nuestras conclusiones. Para simplificar, aquí supondremos �� = �� (� ∈ � ⋏ � ∈
II. ROBUSTEZ EN LOS PROBLEMAS DE EQUILIBRADO DE LÍNEAS �), es decir: el riesgo �� depende del tiempo de proceso �� y de
la categoría de riesgo �� de la tarea � ∈ � (considerando solo un
Una forma de hallar soluciones robustas en ALBP consiste
factor de riesgo del conjunto de factores � (� = 1, . . , |�|))
en buscar configuraciones que se ajusten a todos los escenarios
Lógicamente, una línea de modelos mixtos debe atender a
posibles o, en su defecto, que ofrezcan un desempeño eficiente
diversos planes de demanda de productos que simbolizamos
en todos ellos [10], [7], [11]. En [12] se presenta un modelo
mediante el conjunto de escenarios Ε. No obstante, es común
robusto para ALB y un programa dinámico que minimiza el
realizar el equilibrado de la línea en función de un plan de
tiempo de ciclo de la línea considerando el peor escenario entre
demanda � ∈ Ε, que definimos mediante el vector de demanda
los posibles. En [13], se consideran diversos escenarios que
��⃗
�� = ��1� , … , �|�|� � o a través del vector mix de producción
caracterizan la demanda inestable en una línea de modelos
mixtos. ��⃗
�� = ��1� , … , �|�|� � - donde �� es el número de unidades del
Otra forma de considerar la incertidumbre y la robustez en tipo de producto � ∈ � contenidas en el plan de demanda � ∈ Ε,
ALB es suponer que los tiempos de proceso de las tareas no y �� es la proporción del modelo � ∈ � en el plan � ∈ Ε. Aquí
son deterministas sino que están contenidos en intervalos de se cumple: ��⃗
�� = ��⃗
�� /�� con �� = ∑∀� �� .
valores y se obtienen a partir de una función de distribución Normalmente, el equilibrado de la línea se efectúa con los
conocida. En esta vía se encuentra el trabajo [14], enfocado al valores promediados de los atributos de las tareas en función de
SALBP-E, en el que se acotan los tiempos de proceso por un mix de producción. Por tanto, dado un mix de producción
intervalos y se busca un compromiso entre la minimización de ��⃗
la función objetivo y los valores de un ratio de estabilidad. En �� (� ∈ Ε), los tiempos de proceso, las áreas lineales y los
[15] se presentan dos modelos robustos de ALB que consideran riesgos ergonómicos de las tareas se determinan como en (1),
la incertidumbre con intervalos de valores de los tiempos de (2) y (3), respectivamente:
proceso de las operaciones. ∣�∣
��ɛ = � �� ɛ , ∀� ∈ � ⋏ ∀� ∈ Ε (1)
III. TSALBP-ERGO SUJETO A UNA DEMANDA INCIERTA �=1
∣�∣
En nuestro ideario, las tareas en TSALBP-ergo poseen una ��ɛ = � �� ɛ , ∀� ∈ � ⋏ ∀� ∈ Ε (2)
serie de atributos elementales. Dichos atributos, por su distinta �=1
∣�∣
naturaleza, los agrupamos aquí en 3 categorías o clases: (i) (3)
temporales, (ii) espaciales y (iii) contingentes. Estos atributos ��ɛ = � �� ɛ , ∀� ∈ � ⋏ ∀� ∈ Ε
�=1
elementales están vinculados a cada operación básica de forma
Así, dado un mix de producción de referencia ��⃗
��0 (�0 ∈
individual.
Son atributos temporales de una tarea: el tiempo de proceso Ε), se dice que la línea de modelos mixtos está equilibrada
medido a actividad normal y el factor de actividad que se cuando todas las tareas del conjunto � han sido repartidas
establece para equilibrar la línea. Por su parte, son atributos coherentemente entre las estaciones de trabajo del conjunto �.
espaciales de una tarea: el área requerida por los operarios para Esto supone que a todo puesto de trabajo � ∈ � se asigna en
627
exclusiva un grupo de tareas que se denomina carga de trabajo �� Variable binaria que vale 1 si la tarea � ∈ � se asigna
�� , respetando, en el reparto, todas las restricciones que afectan a la estación � ∈ �, y vale 0 en caso contrario.
a las estaciones. Por tanto, se cumple: �
��ɛ Variable binaria que vale 1 si el tiempo de la carga
(4) de la estación � ∈ �, correspondiente al plan de
� �� = � ⋏ (�� ⋂�� ′ = ∅ , ∀� ≠ � ′ )
�∈� demanda � ∈ Ε y a la configuración de referencia �0
de la línea, es mayor que el tiempo de ciclo – i.e.
� ��0 ≤ � , ∀� ∈ � (5)
�∈��
�� (�� ) > � – y vale 0 en caso contrario.
�
��ɛ Variable binaria que vale 1 si el área lineal de la
� ��0 ≤ � , ∀� ∈ � (6) carga de la estación � ∈ �, para el plan de demanda
�∈��
� ∈ Ε y la configuración de referencia �0 de la línea,
� ��0 ≤ � , ∀� ∈ � (7) es mayor que el área lineal disponible – i.e.
�∈��
�� (�� ) > � – y vale 0 en caso contrario.
La condición (4) representa la partición completa del �
��ɛ Variable binaria que vale 1 si el riesgo ergonómico
conjunto de tareas � entre las estaciones del conjunto �, y las de la carga de la estación � ∈ �, para el plan de
restricciones (5), (6) y (7) corresponden respectivamente a los demanda � ∈ Ε y la configuración �0 de la línea, es
límites que establecen el tiempo de ciclo �, el área lineal mayor que el riesgo ergonómico permisible – i.e.
disponible � y el riesgo ergonómico permisible �, sobre los �� (�� ) > � – y vale 0 en caso contrario.
valores de los atributos que resultan tras la asignación de tareas
�� Variable entera que representa el número de veces
a las estaciones de trabajo (∀� ∈ �). �
que �� (�� ) > � (∀� ∈ Ε, ∀� ∈ �): � � = ∑∀�∀� ��ɛ
IV. INCORPORANDO ROBUSTEZ AL TSALBP-ERGO �� Variable entera que representa el número de veces
�
Llamamos r-TSALB-ergo a la versión robusta de TSALB- que �� (�� ) > � (∀� ∈ Ε, ∀� ∈ �): � � = ∑∀�∀� ��ɛ
ergo. Aquí estableceremos las restricciones del nuevo modelo �� Variable entera que representa el número de veces
�
para un número fijo de estaciones de trabajo, y propondremos que �� (�� ) > � (∀� ∈ Ε, ∀� ∈ �): � � = ∑∀�∀� ��ɛ
un conjunto de métricas para la robustez de configuraciones de
líneas de montaje (soluciones: ζ) en r-TSALB-ergo, frente al B. Restricciones para el modelo r-TSALBP-ergo con número
conjunto de planes de demanda (Ε). fijo de estaciones de trabajo
A. Parámetros y variables �� ∈ {0,1} , (∀� ∈ �, � ∈ �) (8)
� Conjunto de tipos de producto (�: � = 1, . . , |�|) � (9)
��ɛ ∈ {0,1} , (∀� ∈ �, � ∈ Ε)
�, �� Conjunto de tareas (�: � = 1, . . , |�|) y Conjunto de
tareas precedentes a la tarea � ∈ � (�� ⊆ �) �
��ɛ ∈ {0,1} , (∀� ∈ �, � ∈ Ε) (10)
� Conjunto de estaciones de trabajo (�: � = 1, . . , �) �
��ɛ ∈ {0,1} , (∀� ∈ �, � ∈ Ε) (11)
Ε Conjunto de planes de demanda (� ∈ Ε)
� �� = 1 , (∀� ∈ �) (12)
�, �� , Δ� Tiempo de ciclo, flexibilidad temporal y tiempo de
�∈�
proceso adicional en toda estación � ∈ �. Se define
ventana temporal así: � + Δ� = (1 + �� )� � �� ≥ 1 , (∀� ∈ �) (13)
�∈�
�, �� , Δ� Área lineal disponible, flexibilidad espacial y área
lineal adicional en toda estación � ∈ �. Se define � �(�� − �� ) ≤ 0 , (∀� ∈ �� ⊆ �) (14)
�∈�
ventana espacial así: � + Δ� = (1 + �� )�
� ) (15)
�, �� , Δ� Riesgo ergonómico admisible en toda estación � ∈ � ��ɛ �� ≤ (� + Δ� ��ɛ , (∀� ∈ �, � ∈ Ε)
�∈�
�, flexibilidad contingente y riesgo adicional en
�) (16)
cada estación. Se define ventana de contingencia o � ��ɛ �� ≤ (� + Δ� ��ɛ , (∀� ∈ �, � ∈ Ε)
�∈�
de riesgo así: � + Δ� = (1 + �� )�
�) (17)
��ɛ Tiempo de proceso promedio de la tarea � ∈ � en � ��ɛ �� ≤ (� + Δ� ��ɛ , (∀� ∈ �, � ∈ Ε)
�∈�
función del mix de productos en el plan de demanda
� ∈ Ε – ecuación (1) - Las condiciones (8)-(11) permiten forzar la integridad de la
��ɛ Área lineal promedio requerida por la tarea � ∈ � en variables de decisión del modelo. Las igualdades (12) sirven
función del mix de productos en el plan de demanda para asignar cada tarea a una y solo una estación de trabajo.
� ∈ Ε – ecuación (2) - Las restricciones (13) obligan a que toda estación tenga al
menos una tarea asignada. Las restricciones (14) aseguran la
�� , ��ɛ Categoría de riesgo y riesgo ergonómico promedio
satisfacción de las precedencias entre tareas. Finalmente, las
asociado a la tarea � ∈ � en función del mix de restricciones (15)-(17) limitan respectivamente el valor de los
productos en el plan de demanda � ∈ Ε – ecuación atributos temporales, espaciales y contingentes, en cada
(3) – Supondremos ��ɛ =�� ɛ ∀� ∈ � ⋏ ∀� ∈ Ε estación y en cada plan de demanda.
628
C. Métricas para la robustez en TSALBP-ergo V. EJEMPLOS ILUSTRATIVOS

(mr.1) Proporción de planes del conjunto E satisfechos por la A. Datos y condiciones
solución �0 , según la limitación del tiempo de ciclo �. Adoptamos un caso de estudio de la línea de producción de
1 ∣Ε∣ motores mixtos de la fábrica de Barcelona de Nissan Motor
��1 = 1 − � ��∈� ��ɛ � (18) Ibérica, evaluando la robustez de soluciones ante un conjunto
∣ Ε ∣ �=1
de planes de demanda en un entorno industrial.
(mr.2) Proporción de estaciones sin sobrecarga de trabajo. Es Los 7 planes seleccionados para este artículo (� ∈ Ε) tienen
decir, proporción de estaciones de la línea con tiempo una demanda diaria de 270 motores; los detalles se recogen en
de carga menor o igual que el tiempo de ciclo c. la Tabla I.
1 ∣�∣
��2 = 1 − � ��∈Ε �� (19) TABLA I. DEMADAS DIARIAS POR TIPO DE MOTOR Y PLAN ��,� � PARA
� �=1 LAS INSTANCIAS CATEGÓRICAS NISSAN-9ENG.I (� ∈ �).
(mr.3) Proporción del tiempo de proceso adicional concedido � ∈ � � = 1 � = 2 � = 3 � = 6 � = 9 � = 12 � = 18
(Δ� ) que no emplea la solución �0 , Es igual a 1 cuando �1 30 30 10 50 70 24 60
��1 = 1 o ��2 = 1. �2 30 30 10 50 70 23 60
�3 30 30 10 50 70 23 60
1
��3 = 1 − � max �0, � ��ɛ �� − � � : � � > 0, (20) �4 30 45 60 30 15 45 30
Δ� � � �5 30 45 60 30 15 45 30
∀�,� ∀�
�6 30 23 30 15 8 28 8
�� = 0 ⟹ ��3 = 1
�7 30 23 30 15 8 28 8
(mr.4) Proporción de planes del conjunto Ε satisfechos por la �8 30 22 30 15 7 27 7
solución �0 , según el área lineal disponible �. �9 30 22 30 15 7 27 7
1 ∣Ε∣ SUVs 90 90 30 150 210 70 180
��1 = 1 − � ��∈� ��ɛ � (21)
∣ Ε ∣ �=1 Vans 60 90 120 60 30 90 60
Truck 120 90 120 60 30 110 30
(mr.5) Proporción de estaciones que requieren un área lineal
Total 270 270 270 270 270 270 270
menor o igual que el área lineal disponible A.
∣�∣
1 � (22) En la línea se fabrican hasta 9 tipos de motores distintos
��2 = 1 − � ��∈Ε �� (�1 , . . , �9 ) con diferentes destinos y características de montaje:
� �=1
los tres primeros tipos son para vehículos SUVs; los tipos �4 y
(mr.6) Proporción del área lineal adicional concedida (Δ� ) que
�5 son para furgonetas (vans); y los cuatro últimos se destinan
no emplea la solución ζ0 . Es igual a 1 cuando ��1 = 1 o a camiones comerciales (trucks) de medio tonelaje. Para una
��2 = 1. demanda equilibrada (idéntica demanda para los 9 tipos) y un
tiempo de ciclo de 3 minutos, la línea consta de 21 estaciones
1 en serie con una longitud media de 4 metros cada una. El
��3 = 1 − � max �0, � ��ɛ �� − �� : � � > 0, (23)
Δ� �� número de tareas elementales para fabricar un motor asciende a
∀�,� ∀�
380 y su agrupación da lugar a 140 tareas de montaje. En
�� = 0 ⟹ ��3 = 1 [5],[16] se pueden consultar los tiempos de proceso ��ɛ , las
(mr.7) Proporción de planes del conjunto E satisfechos por la áreas lineales ��ɛ , las categorías de riesgo �� y los conjuntos de
solución �0 , según la limitación del riesgo �. precedencias �� de las 140 tareas de montaje.
1 ∣Ε∣
��1 = 1 − � ��∈� ��ɛ � (24) B. Resultados
∣ Ε ∣ �=1 Aquí analizamos cuatro configuraciones de línea mediante
(mr.8) Proporción de estaciones sin sobre-riesgo ergonómico: la aplicación de las métricas de robustez (mr.1-mr.9):
proporción de estaciones cuyo riesgo ergonómico no • Dos configuraciones de línea, ζ1 y ζ2 , con 18 estaciones,
excede al riesgo permisible �. 180s de ciclo, 5,5 metros de área lineal por estación, 500
1 ∣�∣ ergo-s de riesgo permitido y con coeficientes de flexibilidad
��2 = 1 − � ��∈Ε �� (25) (�� , �� , �� ) iguales al 5%. Las soluciones ζ1 y ζ2 se han
� �=1
obtenido mediante un IDEA adaptativo [7] y se muestran
(mr.9) Proporción del riesgo ergonómico adicional concedido en las Tablas II y III.
(Δ� ) que no emplea la solución �0 . Es igual a 1 cuando • Dos configuraciones de línea, ζ3 y ζ4 , con 25 estaciones,
��1 = 1 o ��2 = 1. 170s de ciclo, 3,5 metros de área lineal disponible por
estación, 320 ergo-s de riesgo permitido y con coeficientes
1 de flexibilidad (�� , �� , �� ) iguales al 5%. Las soluciones ζ3
��3 = 1 − � max �0, � ��ɛ �� − �� : � � > 0, (26)
Δ� �� y ζ4 se muestran en las Tablas IV y V y se han obtenido
∀�,� ∀�
mediante un algoritmo GRASP [16], cuyo desempeño ha
�� = 0 ⟹ ��3 = 1 sido contrastado con PLEM.
629
TABLA II. CONFIGURACIÓN �1 (18, 5,5, 500, 5%) IDEA ADAPTATIVO A modo de resumen, la Tabla X recoge los valores de las 9
� � ∈ �� : carga de las estaciones métricas para las 4 configuraciones �1 − �4 (∀� ∈ Ε).
1 1 7 8 9 11
TABLA IV. CONFIGURACIÓN �3 (25, 3,5, 320, 5%) GRASP_MAX
2 3 4 5 10 13 14
3 6 12 16 17 19 20 21 � � ∈ �� : carga de las estaciones
4 15 18 22 23 24 25 26 27 28 1 1 10
5 2 29 30 31 32 34 36 2 13 14 11 3 9 18
6 33 35 37 38 39 40 41 43 3 17 15 21 20 19
7 42 44 45 46 47 48 49 59 60 4 5 4 6 16
8 50 51 52 53 54 55 56 57 58 5 26 27 25 23 22 7
9 61 62 63 64 65 66 67 70 6 24 28 29 30 8
10 68 69 71 72 73 74 75 7 31 32 36 33 35 37 34
11 76 77 78 79 80 81 82 83 84 86 8 39 40 38 43 41 59
12 85 87 88 89 90 91 92 99 9 42 44 45 46 48
13 93 94 95 96 98 100 101 103 10 49 47 50 54 55 53
14 102 104 105 106 107 108 109 110 111 112 113 11 56 52 51 60 57 64
114 115 12 58 61 62 63 66 67
15 116 117 118 119 120 131 13 70 65 68 71 72
16 121 122 123 128 132 134 135 136 14 73 69 74 76
17 97 124 125 126 127 129 137 138 139 15 79 75 77 78 81 80 82
18 130 133 140 16 83 84 85 86 88 87 89
17 90 91 99 92
TABLA III. CONFIGURACIÓN �2 (18, 5,5, 500, 5%) IDEA ADAPTATIVO 18 98 100 101 102 94 103
� � ∈ �� : carga de las estaciones 19 106 104 108 105 113 109 111 115 114 112 107
20 12 2 116 118
1 1 3 7 10 11
21 119 120 117 131 132 134 135
2 4 5 8 9 13 14 18
22 121 136 93 95 122
3 6 12 15 16 17 20
23 123 124 125 126 127 96 129
4 22 23 24 25 28 29 30 31 32 34
24 128 137 130 133 97
5 2 33 35 36 37 38
25 138 139 140 110
6 39 40 41 42 43 44 45
7 46 47 48 49 52 53 54 55 56 TABLA V. CONFIGURACIÓN �4 (25, 3,5, 320, 5%) GRASP_MED. SE
8 50 51 57 58 59 60 61 62 MUESTRA LAS CARGA DE LAS ESTACIONES 9,10 Y 16-21. LAS CARGAS
9 63 64 65 66 67 68 69 71 72 RESTANTES SON IDÉNTICAS A LAS DE LA CONFIGURACIÓN �3 .
10 70 73 74 75 76 77 78 � � ∈ �� : carga de las estaciones
11 21 80 81 82 83 84 85 86 87 88 89 9 42 44 45 46 47
12 19 26 90 91 92 98 10 49 48 50 54 55 53
13 27 94 95 99 100 101 102 103 104 108 109 16 83 84 85 86 88 87 91
110 111 17 90 89 99 92
14 107 112 113 114 115 116 117 118 18 98 100 101 106 103
15 105 106 119 120 121 122 123 124 19 102 104 108 105 113 109 111 115 114 112 94
16 79 93 128 131 132 134 135 136 20 12 2 116 119
17 96 97 125 126 127 129 137 138 139 21 107 118 120 117 131 132 134 135
18 130 133 140
En las Tablas VI-IX mostramos los resultados resaltables TABLA VI. TIEMPOS DE CARGA Y RIESGO DE CARGA PARA LAS
ESTACIONES SATURADAS O SOBRECARGADAS DE LA CONFIGURACIÓN �1 .
para las cuatro configuraciones. Debemos hacer notar que las
cuatro configuraciones son fuertemente robustas en atributos Tiempos de carga �(�� )
�
espaciales: ��ɛ = 0 (∀� ∈ �, � ∈ Ε). �\� 1 2 3 6 9 12 8
La configuración �1 . (Tabla VI) es fuertemente robusta en 3 178,0 178,2 177,3 179,1 180,0 177,8 179,6
tiempo y en cuanto a riesgo ergonómico solo hay sobrecarga en 12 180,0 179,6 179,5 179,8 179,9 179,7 179,6
las estaciones 7 y 12, en los 7 planes, por debajo del 5% de 17 180,0 179,6 179,5 179,6 179,7 179,7 179,4
flexibilidad concedida. La configuración �2 (Tabla VII) es casi- max 180,0 179,6 179,5 179,8 180,0 179,7 179,6
fuertemente robusta en tiempos; en riesgo solo hay exceso en la Δ�� 0,00 0,00 0,00 0,00 0,00 0,00 0,00
estación 7 por debajo del 5% de flexibilidad concedida.
Riesgos de carga �(�� )
Por su parte, las configuraciones �3 y �4 , aun siendo
�\� 1 2 3 6 9 12 18
semejantes, tienen distintas propiedades (Tablas VIII y IX). En
efecto, �4 es fuertemente robusta en riesgo y �3 casi también lo 7 510,0 511,3 511,3 511,2 511,2 510,9 511,8
es. En cuanto al tiempo de carga, tanto �3 como �4 exceden 12 520,0 518,8 518,4 519,3 519,3 519,1 518,9
levemente el tiempo de ciclo. max 520,0 518,8 518,4 519,3 519,3 519,1 518,9
Δ�� 20,00 18,83 18,43 19,31 19,31 19,11 18,92
630
TABLA VII. TIEMPOS DE CARGA Y RIESGO DE CARGA PARA LAS carrocerías, vehículos, etc.), (iv) lista de materiales compleja y
ESTACIONES SATURADAS O SOBRECARGADAS DE LA CONFIGURACIÓN �2 .
con elevado número de componentes grandes y pesados, (v)
Tiempos de carga �(�� ) estaciones largas (300cm-1000cm), (vi) valores de los atributos
�\� 1 2 3 6 9 12 18 temporales, espaciales y de riesgo estables o con variabilidad
15 180,0 179,9 179,8 180,0 180,1 179,9 180,0 controlada, y (vii) demanda variable de los productos.
17 180,0 179,6 179,6 179,5 179,5 179,7 179,3 En trabajos futuros, propondremos metaheurísticas y otros
max 180,0 179,9 179,8 180,0 180,1 179,9 180,0 procedimientos híbridos, asistidos por la PLEM, para resolver
Δ�� 0,00 0,00 0,00 0,00 0,06 0,00 0,00 diversas variantes del r-TSALBP-ergo.
Riesgos de carga �(�� ) AGRADECIMIENTOS
�\� 1 2 3 6 9 12 18
Este trabajo ha sido financiado por el Ministerio de
7 510,0 511,1 511,1 510,9 510,9 510,8 511,5
Economía y Competitividad (Gobierno de España) con el
max 510,0 511,1 511,1 510,9 510,9 510,8 511,5 proyecto TIN2014-57497-P (FHI-SELM2).
Δ�� 10,00 11,09 11,13 10,94 10,94 10,83 11,46
REFERENCIAS
TABLA VIII. TIEMPOS DE CARGA Y RIESGO DE CARGA PARA LAS
ESTACIONES SATURADAS O SOBRECARGADAS DE LA CONFIGURACIÓN �3 . [1] Battaïa, O., Dolgui, A., 2013. A taxonomy of line balancing problems
and their solution approaches. International Journal of Production
Tiempos de carga �(�� ) Economics 142, 259–277.
�\� 1 2 3 6 9 12 18 [2] Boysen, N., Fliedner, M., Scholl, A., 2008. Assembly line balancing:
Which model to use when? International Journal of Production
25 170,0 170,8 171,5 170,0 169,4 170,8 170,1 Economics 111, 509–528.
max 170,0 170,8 171,5 170,0 169,4 170,8 170,1 [3] Scholl, A., Becker, C., 2006. State-of-the-art exact and heuristic solution
Δ�� 0,00 0,78 1,45 0,03 0,00 0,82 0,08 procedures for simple assembly line balancing. European Journal of
Riesgos de carga �(�� ) Operational Research 168, 666–693.
�\� 1 2 3 6 9 12 18 [4] Bautista, J., Pereira, J., 2007. Ant algorithms for a time and space
constrained assembly line balancing problem. European Journal of
20 320,0 320,1 319,9 320,2 320,2 320,0 320,3 Operational Research 177, 2016–2032.
max 320,0 320,1 319,9 320,2 320,2 320,0 320,3 [5] Bautista, J., Batalla-García, C., Alfaro-Pozo, R. 2016. Models for
Δ�� 0,00 0,09 0,00 0,20 0,20 0,01 0,32 assembly line balancing by temporal, spatial and ergonomic risk
attributes. European Journal of Operational Research 251, 814–829.
TABLA IX. TIEMPOS DE CARGA Y RIESGO DE CARGA PARA LAS [6] Chica, M., Cordón, O., Damas, S., Bautista, J., 2013. A robustness
ESTACIONES SATURADAS O SOBRECARGADAS DE LA CONFIGURACIÓN �4 . information and visualization model for time and space assembly line
balancing under uncertain demand. International Journal of Production
Tiempos de carga �(�� ) Economics 145, 761– 772.
�\� 1 2 3 6 9 12 18 [7] Chica, M., Bautista, J., Cordón, O., Damas, S. 2016. A multiobjective
21 170,0 170,7 170,9 170,7 170,5 170,5 171,0 model and evolutionary algorithms for robust time and space assembly
25 170,0 170,8 171,5 170,0 169,4 170,8 170,1 line balancing under uncertain demand. Omega 58, 55–68.
max 170,0 170,8 171,5 170,7 170,5 170,8 171,0 [8] Chica, M., Bautista, J., de Armas, J. 2018. Benefits of robust
multiobjective optimization for flexible automotive assembly line
Δ�� 0,00 0,78 1,45 0,66 0,54 0,82 0,97 balancing. Flexible Services and Manufacturing Journal, 1-29.
Riesgos de carga �(�� ) https://doi.org/10.1007/s10696-018-9309-y
�\� 1 2 3 6 9 12 18 [9] Beyer, H., Sendhoff, B., 2007. Robust optimization - a comprehensive
20 320,0 318,9 318,8 319,0 319,0 319,3 318,5 survey. Computer Methods in Applied Mechanics and Engineering 196,
3190–3218.
max 320,0 318,9 318,8 319,0 319,0 319,3 318,5
[10] Xu, W., Xiao, T., 2011. Strategic robust mixed model assembly line
Δ�� 0,00 0,00 0,00 0,00 0,00 0,00 0,00 balancing based on scenario planning. Tsinghua Science & Technology
16, 308–314.
TABLA X. VALORACIÓN SEGÚN MÉTRICAS DE ROBUSTEZ - [11] Simaria, A.S., Zanella de Sá, M., Vilarinho, P.M., 2009. Meeting
(��. 1 − ��. 9) - DE LAS 4 CONFIGURACIONES DE LÍNEA �1 − �4 (∀� ∈ Ε)..
demand variation using flexible u-shaped assembly lines. International
Journal of Production Research 47, 3937–3955.
��1 ��2 ��3 ��1 ��2 ��3 ��1,2,3
[12] Dolgui, A., Kovalev, S., 2012. Scenario based robust line balancing:
�1 1,00 1,00 1,00 0,00 0,89 0,91 1,00 Computational complexity. Discrete Applied Mathematics 160, 1955–
�2 0,86 0,89 0,99 0,00 0,94 0,93 1,00 1963.
�3 0,29 0,96 0,97 0,29 0,96 1,00 1,00 [13] Li, J., Gao, J., 2014. Balancing manual mixed-model assembly lines
�4 0,14 0,92 0,97 1,00 1,00 1,00 1,00 using overtime work in a demand variation environment. International
Journal of Production Research 52, 3552–3567.
VI. CONCLUSIONES [14] Gurevsky, E., Battaïa, O., Dolgui, A., 2012. Balancing of simple
assembly lines under variations of task processing times. Annals of
Hemos definido 9 métricas de robustez para el problema Operations Research 201, 265–286.
TSALBP-ergo basándonos en trabajos previos para TSALBP. [15] Hazir, Ö., Dolgui, A., 2013. Assembly line balancing under uncertainty:
Nuestra propuesta, r-TSALBP-ergo, será útil en las siguientes Robust optimization models and exact solution method. Computers &
circunstancias: (i) una línea de productos mixtos como sistema Industrial Engineering 65, 261–267.
productivo, (ii) un ensamblado complejo con adiestramiento y [16] Bautista-Valhondo, J., Alfaro-Pozo, R. 2018. A Case Study at the Nissan
especialización de los operarios y con tiempos de ciclo grandes Barcelona factory to minimize the ergonomic risk and its standard
deviation in a mixed-model assembly line. Progress in Artificial
(0.5’-15’), (iii) productos de grandes dimensiones (motores, Intelligence, 1-12. https://doi.org/10.1007/s13748-018-0153-9
631
Bioinspirados
(XIII MAEB)
A PLICACIONES DE
SIMHEURISTICS EN
L OGÍSTICA, T RANSPORTE Y
C IUDADES INTELIGENTES
Organizadores:
JAVIER FAULÍN, H ELENA R AMALHINHO Y Á NGEL JUAN
Agile Optimization for Routing Unmanned Aerial

Vehicles under Uncertainty
Javier Panadero∗ , Alfons Freixes∗† ,Jose M. Mozos∗ , and Angel A. Juan∗†
∗ IN3
- Computer Science Dept.
Universitat Oberta de Catalunya
Barcelona ,08018, Spain
{jpanaderom, jmozosr, ajuanp}@uoc.edu
† Euncet Business School
08225 Terrassa, Spain

[email protected]
Abstract—The use of unmanned aerial vehicles (UAVs) is intelligent transportation system (ITS), it would be possible to
gaining popularity in contexts such as smart cities, city logistics, replace human road support teams by a set of UAVs overflying
humanitarian logistics, natural disasters, or military operations. highways to monitor possible traffic violations and accidents,
One optimization challenge directly related to the use of UAVs is
the so-called team orienteering problem (TOP). In a TOP, each or for providing specific information to other transport users.
customer can either be visited only once by a single vehicle or not Technological support for interacting with other transport users
visited at all. Visiting each customer has associated a predefined is given by the ITS, dedicating a short-range communication
reward, and the driving ranges of vehicles are typically limited interface to UAV, which transmit information either vehicle-to-
by the duration of electric batteries. Due to the latter constraint, vehicle or vehicle-to-infrastructure. Using wireless links when
it is usual that not all customers can be visited. The main
goal is then to find a set of open tours that maximizes the being close to each other, connected UAV impose improved
total collected reward without exceeding the fleet capacity nor road safety and traffic efficiency. The execution of these
the driving range limitation. In this paper, we consider the specific roles requires coordination of and collaboration within
stochastic version of the problem, in which travel times are a group of UAVs. In particular, there is a need to design
modeled as random variables following theoretical probability effective routing plans for a group of UAVs that need to visit
distributions. To solve this stochastic version of the TOP, a
simheuristic algorithm combining a biased-randomized heuristic a series of locations in order to gather some information (e.g.,
with simulation techniques is proposed. One of the main goals of aerial pictures or videos, etc.). Thus, technological progress
our approach is to provide an ‘agile’ optimization methodology, is required in the fields of advanced algorithms and other
i.e., one lightweight algorithm that can be easily implemented in IT-based support tools to ensure: (i) a safe and effective
real-life scenarios under uncertainty and, at the same time, can navigation of UAV within the transportation infrastructure
provide solutions in real-time (just a few seconds or even less).
Index Terms—Metaheuristics, simulation, team orienteering
[7]; (ii) predictive analytics fed by critical data, which are
problem, unmanned aerial vehicles, agile optimization. needed for an efficient use of energy; and (iii) the use of
computer vision techniques and remote sensing information
I. I NTRODUCTION for processing aerial real-time video footage.
Initially proposed by [8], the team orienteering problem
The term ‘smart city’ refers to a series of urban systems and (TOP) is one realistic variation of the well-known vehicle
domains that are interconnected, via information technologies routing problem [9]. The TOP is gaining interest both in the
(ITs), with the purpose of optimizing their operations and scientific community and the industry due to the increasing
management [1]. Smart cities represent a multidisciplinary use of electric vehicles and unmanned aerial vehicles, where
research field that is under a continuous updating process driving range limitations need to be taken into account [10].
driven by urban, social, and technology evolution [2]. These Consider the following elements: (i) a set of customer nodes,
advances are generating new services and products for citizens, each of them with an associated reward score that can be
which also arises new challenges in data gathering, data collected the first time a customer is visited by any UAV; and
analytics, and efficient decision making. (ii) a team of m UAVs with limited driving-range capabilities.
Unmanned aerial vehicles (UAVs) are known for au- Then, the goal is to determine a set of m open routes (each of
tonomous operation and mobility. Though there are first stud- them connecting an origin depot with a destination depot),
ies available [3] [4], the usage of UAVs in smart cities is not which maximizes the total collected reward by visiting a subset
fully explored yet. Until today they were mainly used for and of available customers without violating the driving range
effectively integrated in military activities, surveillance, secu- constraint.
rity, precision agriculture and goods and services deliveries [5] Notice that each customer can either be visited once or
[6], while there are still concerns on their effective and reliable not visited at all. Also, due to the driving range limitation,
implementation in smart cities. With the use of a reliable and it is possible that not all customers can be visited. Being an
635
7 tion III describes our biased-randomized heuristic for solving

the deterministic TOP. Section IV describes our extension to
4 12
a simheuristic to solve the STOP. A round of computational
8 experiments for the STOP are described in Section V. Finally,
Route 1 4
6 Section VI summarizes the highlights of this paper and pro-
Origin Des$na$on
poses some future research lines.
(Node 0) (Node n+1)
II. R ELATED W ORK
6 T~ LogN(µ, σ) 7
Route 2 The team orienteering problem was first introduced in
10 [8]. To solve the TOP, they propose a heuristic approach
9
where the stops that are farthest from the start and the finish
2
8 nodes are selected as seeds for the team members, and all
3 7
possible remaining points are inserted into the routes using the
Fig. 1: Routing UAVs and the team orienteering problem cheapest insertion rule. If unassigned points remain, new team
routes are constructed. Additional approaches used to solve
the deterministic TOP have been proposed in the literature.
extension of the vehicle routing problem in which a subset Although we can find some exact methods, such as branch-
of customers have to be selected and a set of routes cover- and-cut [15] or branch-and-cut-and-price algorithms [16] to
ing them constructed, the TOP is also a NP-hard problem. solve the TOP, only small-scale instances can be solved with
Accordingly, different metaheuristic approaches have been these methods.
proposed in recent years to deal with large-scale instances [15] propose a particle swarm optimization (PSO) method
of the deterministic version of the problem. However, the to solve the TOP. Similarly, [17] present a multi-start simulated
stochastic counterpart, which considers real-life uncertainty in annealing (SA) algorithm to address the TOP. It integrates an
the form of random service and travel times, has received much SA stage inside a multi-start procedure to reduce the possi-
less attention. This paper analyzes a stochastic TOP variant in bility of getting trapped in a local optima. Genetic algorithms
which travel times are modeled as random variables (Figure 1). (GA) have been also proposed in this area. For instance, [18]
In particular, we consider the problem of recollecting as much introduce a GA which imitates the natural process of evolution
reward as possible from visiting customers using a fleet of m to solve the TOP. Other approach to solve the TOP is proposed
UAVs with driving ranges limited by the time-duration of their by [19]. These authors present a Pareto mimic algorithm,
batteries. An example of practical application could be the use which uses a mimic operator to generate a new solution by
of UAVs to take pictures of different locations after a natural imitating an incumbent solution.
disaster, a terrorist attack, or a humanitarian crisis. Notice The stochastic version of the orienteering problem has
that each of these pictures can provide valuable information only received attention in recent years. To the best of our
that can help to improve the conditions of the people affected knowledge, previous work has only considered the single-route
by the event or even to save their lives by making informed problem rather than the STOP that we analyze here. There
decisions on the more reliable evacuation paths. is also some variation in which aspects of the problem are
Finding a solution (set of open routes) that maximizes stochastic. For example, the original stochastic single-vehicle
the total expected reward is usually the main goal of the orienteering problem (OP) [20] defines the OP with stochastic
stochastic team orienteering problem (STOP). However, since profits, which assumes that only the scores associated with
solutions to the STOP are applied in a stochastic environment, each node are stochastic – in particular, it is assumed they
other statistical properties should be considered too. Thus, for follow a Normal probability distribution. There are also other
instance, one could be interested in solutions offering a high works that study the OP with stochastic travel times [21]–
reliability level, i.e., routing plans with a low probability of [24]. This version can be classified as the orienteering problem
violating the driving-range threshold. with stochastic weights. Notice that our work extends these
This paper proposes a simulation-optimization algorithm to previous ones by considering multiple vehicles or routes.
efficiently cope with the STOP. First, a biased-randomized In developing solutions to the STOP, one critical question
heuristic for solving the deterministic TOP is introduced. This is how to deal with open routes which exceed the designated
heuristic is then extended into a simheuristic algorithm [11] to time limit imposed by the driving-range constraint. In [25],
solve the stochastic TOP. Due to their effectiveness, simheuris- exceeding the time limit incurs in a penalty cost that is
tic algorithms are being increasingly used in solving different proportional to the amount exceeding it. A similar approach is
stochastic variants of the vehicle routing problem, like the used in [26]. An alternative concept is presented in [27], where
stochastic inventory routing problem [12], the stochastic waste the probability of exceeding the time limit must be lower than
collection problem [13], or the stochastic arc routing problem a threshold value. The problem presented by [21] is partially
[14]. different, since they do not force the vehicle to return to a set
The remaining sections of this paper are structured as of depots but, instead, it can stop at any location once the time
follows: Section II reviews related work on the TOP. Sec- limit is reached. Also, penalties are incurred if a vehicle does
636
not manage to visit a scheduled node within the time limit. Algorithm 1 Savings-based heuristic for the TOP
In contrast, [24] keep the hard constraint on the tour length 1: sol ← generateDummySolution(Inputs)
2: savingsList ← computeSortedSanvingsList(Inputs, α)
that is used in the deterministic version of the problem and 3: while (savingsList is not empty) do
abort the route if the expected arrival time to the destination 4: arc ← selectNextArcAtRandom(savingsList, β )
depot is equal to the remaining time. In the previous works, 5: iRoute ← getStartingRoute(arc)
6: jRoute ← getClosingRoute(arc)
solving methodologies such as VNS metaheuristics and two- 7: newRoute ← mergeRoutes(iRoute, jRoute)
stage stochastic optimization were employed. 8: travelTimeNewRoute ← calcRouteTravelTime(newRoute)
9: isMergeValid ← validateMergeDrivingCon-
straints(travelTimeNewRoute, drivingRange)
III. A B IASED -R ANDOMIZED H EURISTIC FOR ROUTING 10: if (isMergeValid) then
UAV S 11: sol ← updateSolution(newRoute, iRoute, jRoute, sol)
12: end if
A novel constructive heuristic for the TOP has been de- 13: deleteEdgeFromSavingList(arc)
signed as a first step in our solving approach. One of the 14: end while
15: sortRoutesByProfit(sol)
main goals of our proposed heuristic is to provide an ‘agile‘ 16: deleteRoutesByProfit(sol, maxVehicles)
optimization methodology. The term ‘agile‘ referring to sot- 17: return sol
fware development methodologies (‘agile‘ programming) was
introduced by Beck et. al. [28], and it refers to any rapid and
easy software development of high-quality. Inspired in this where sij = ti(n+1) + t0j − tij (Figure 2b), and α ∈ (0, 1).
definition, we propose an ‘agile‘ optimization methodology The specific value of α needs to be empirically tuned, since it
to develop optimization lightweight algorithms, which can be will depend on the heterogeneity of the customers in terms of
easily implemented in a short period of time, and they can be rewards. Thus, in a scenario with high heterogeneity, α will
used in a efficient way in real-life scenarios under uncertainty, be close to zero. On the contrary, α will be close to one for
providing solutions in real-time (just a few seconds). homogeneous scenarios. Notice that for each edge there are
The proposed heuristic, which has been designed following two associated savings, depending on the actual direction in
this ‘agile‘ optimization methodology, it is inspired on the which the edge is traversed. Thus, each edge generates two
well-known savings heuristic for the vehicle routing problem different arcs.
[29]. It has to be adapted to consider the particular character- After computing all the savings, the list of arcs can be
istics of the TOP, i.e.: (i) the origin depot could be different sorted from higher to lower savings. Then, a route-merging
from the destination one; (ii) not all the customers have to process, based on the savings list, is started. In each iteration,
be visited; and (iii) the reward collected by visiting nodes the savings list of arcs is randomized using a biased probability
must be considered during the construction of the routing plan. distribution, and an arc is selected (line 4). As discussed in
The goal was to design a new savings-based heuristic able to detail in Juan et al [31], the biased randomization of the
outperform the traditional one employed for solving the TOP savings list allows arcs to be selected in a different order
[30]. in each iteration, where arcs with higher savings are more
Algorithm 1 provides a high-level description of the con- likely to be selected than those with lower savings, while
structive heuristic. It starts by generating an initial dummy at the same time, the logic behind the savings heuristic is
solution (line 1), in which one route per customer is considered maintained. In our case, a skewed Geometric Distribution is
–i.e., for each customer i ∈ A, a vehicle departs from the employed to induce this biased randomization behaviour. The
origin depot (node 0), visits i, and then resumes its trip Geometric Distribution uses one single parameter, β, which
towards the destination depot (node n + 1) (Figure 2a). If is relatively easy to set since 0 < β < 1. After completing
any route in this dummy solution does not satisfy the driving- some preliminary tests with different values for and analysing
range constraint, the associated customer is discarded from the corresponding outcomes, we decided to set β = 0.3 in
the problem, since it cannot be reached with the current fleet our computational experiments. The selected arc connects two
of vehicles. Next, we compute the ‘savings’ associated with routes, which are merged into a new route as far as this new
each edge connecting two different customers (line 2), i.e.: the route does not violate the driving-range constraint (line 9).
benefits obtained by visiting both customers in the same route Finally, the list of routes are sorted according to the total
instead of using distinct routes. reward provided (line 15) to select as many routes from this
list as possible taking into account the restricted number of
In order to compute the savings associated with an edge, one
vehicles in the fleet.
has to consider both the travel time required to traverse that
This heuristic is encapsulated within a multi-start process.
edge as well as the aggregated reward generated by visiting
This allows to run the biased-randomised heuristic several
both customers. Thus, we define the concept of savings, s′ij
times, thus increasing our chances of finding a better solution.
as described in Equation 1. Notice that it takes into account
the trade-off between the classical time-based savings, sij , and IV. A S IMHEURISTIC FOR ROUTING UAV S UNDER
the aggregated reward, ui + uj , i.e.: U NCERTAINTY
Algorithm 2 provides an overview of our multi-stage
s′ij = α · sij + (1 − α) · (ui + uj ) (1) simheuristic approach, which extends the biased-randomized
637
1 expected return; and (ii) its reliability, measured in terms of

Route 1 the percentage of routes that are effectively completed without
violating the driving range constraint. Also, whenever the
2 stochastic value of the newSol outperforms that of the baseSol
Origin
Des$na$on and / or that of some elite solution (eliteSols), these solutions
(Node n+1)
(Node 0) Route 2 are updated to newSol.
V. C OMPUTATIONAL E XPERIMENTS : S TOCHASTIC C ASE
n
Route n There are not STOP instances to compare with in the
(a) Dummy Solution
literature. For that reason, we have extended the deterministic
instances proposed in [8] into stochastic ones.
ti(n+1) In our computational experiments, we have modeled the
i travel times Tij using Log-Normal probability distributions.
toi As discussed in [32], the Log-Normal distribution is a more
tij
natural choice than the Normal distribution when modeling
j non-negative random variables, such as the elapsed time until
tj(n+1) an event occurs (e.g., the time it takes the vehicle to traverse
Des$na$on
Origin
(Node n+1) a given edge). In a real-world application, historical data
(Node 0) toj
could be used to model each Tij by a different probability
(b) Time-based savings distribution. The Log-Normal has two parameters, namely: the
Fig. 2: Dummy solution (top) and time-based savings (down). location parameter, µ, and the scale parameter, σ. According
to the properties of the Log-Normal distribution, these param-
eters will be given by the following expressions considering
heuristic in order to deal with the STOP. In the first stage, stochastic travel times between nodes i and j:

a feasible initial solution (initSolution) is constructed using 1 V ar[Tij ]
µij = ln(E[Tij ]) − ln 1 + (2)
the savings-based heuristic described in Section III (line 1). 2 E[Tij ]2
During the second stage, an adaptive heuristic enhances the s
initial feasible solution by iteratively exploring the search V ar[Tij ]
σij = ln 1 + (3)

space and conducting a ‘reduced’ number of simulation runs E[Tij ]2

that allow to: (i) obtain observations on the total time em-
ployed by the current solution (from which the expected time In our experiments, which extend classical deterministic in-
and other statistics can be estimated); and (ii) provide feedback stances into stochastic ones, it is assumed that E[Tij ] = tij
that can be used by the heuristic to better guide the search (∀i, j ∈ N ), being tij the travel time provided in the determin-
(e.g., by updating the base solution according to the estimated istic instance. Similarly, it is considered that V ar[Tij ] = c·tij ,
statistics). From this stage, a reduced set of ‘elite’ solutions is being c ≥ 0 a design parameter. Notice that the deterministic
obtained. instances are a particular case of the stochastic ones, which
Notice that during the second stage, whenever a newSol is are obtained for c = 0. In our experiments, we have used the
‘promising’, it is sent through a fast Monte Carlo simulation value c = 0.05.
process (line 8) to estimate the following values: (i) the The classic deterministic benchmarks consist of 7 different
classes, Table I refers to class 1, and it shows: (i) the best-
known solution for the deterministic variant of the problem
Algorithm 2 Simheuristic approach (BKS), obtained from the existing TOP literature; (ii) our best
1: initSolution ← ComputeInitSolution(Inputs) solution for the deterministic variant of the problem (OBS-D);
2: fastSimulation(solution) ⊲ Monte Carlo Simulation
3: baseSol ← initSolution
(iii) the computational time in seconds to obtain the OBS-D;
4: while (ending condition is not met) do (iv) the gap between the BKS and the OBS-D; (v) the reward
5: newSol ← savingBasedHeuristic(Inputs, α, β) ⊲ biased-randomized of OBS-D when it is applied as a solution of the stochastic
heuristic
6: if (detProfit(newSol) improves detProfit(baseSol) then
variant of the problem (OBS-D-S); (vi) our best solution for
7: fastSimulation(newSol) ⊲ Monte Carlo Simulation the stochastic variant of the problem (OBS-S); and (vii) the
8: if (stochProfit(newSol) improves stochProfit(baseSol) then computational time in seconds to obtain the OBS-S.
9: baseSol ← newSol
10: if (stochProfit(baseSol) improves worstStochProfit(eliteSols)
Figure 3 shows, for the analyzed class, the percentage
then gaps between: (i) the best-found deterministic solution when
11: eliteSols ← update(eliteSols, baseSol) applied into stochastic conditions (OBS-D-S) and itself when
12: end if
13: end if
applied in a deterministic environment (OBS-D); and (ii) the
14: end if best-found stochastic solution when applied into stochastic
15: end while conditions (OBS-S) and the best-found solution for the deter-
16: return eliteSols
ministic version (OBS-D). Notice that the OBS-S boxplot is
638
TABLE I: Results for class 1 benchmark instances. VI. C ONCLUSION
Deterministic execution Stochastic execution
Instance BKS OBS-D Time (s) Gap (%) OBS-D-S OBS-S Time (s) The incorporation of unmanned aerial vehicles in urban
Reward [1] Reward [2] [3] [4](1-2) E[Reward] [5] E[Reward] [6] [7]
p1.2.b 15 15 0 0.0 14.3 14.3 4 areas describe promising research fields whose full potential
p1.2.c 20 20 0 0.0 18.2 18.2 4
p1.2.d 30 30 0 0.0 26.0 26.3 4 are still to be explored in future. Still, these innovations raise a
p1.2.e 45 45 0 0.0 41.7 42.2 4
p1.2.f 80 80 0 0.0 64.6 70.5 5 number of concerns and challenges that complicate decision-
p1.2.g 90 90 0 0.0 75.8 83.7 4
p1.2.h 110 110 0 0.0 97.5 103.6 17 making processes for citizens and city managers. New hybrid
p1.2.i 135 135 0 0.0 94.5 122.9 4
p1.2.j 155 155 0 0.0 123.1 141.0 5
optimization-simulation and optimization-machine-learning al-
p1.2.k
p1.2.l
175
195
175
195
0
5
0.0
0.0
124.2
125.8
163.3
179.5
7
9
gorithms have to be developed to efficiently face these chal-
p1.2.m
p1.2.n
215
235
215
235
9
0
0.0
0.0
170.2
152.9
201.4
218.8
16
5
lenges. Scenarios for dynamic and uncertain real-life features
p1.2.o
p1.2.p
240
250
240
250
4
0
0.0
0.0
204.4
167.3
230.7
230.9
7
5
have to be included.
p1.2.q 265 265 1 0.0 205.4 247.8 7
p1.2.r 280 280 21 0.0 168.9 259.9 4
p1.3.c 15 15 0 0.0 14.3 14.3 6
ACKNOWLEDGMENT
p1.3.d 15 15 0 0.0 15.0 15.0 6
p1.3.e 30 30 0 0.0 24.9 27.0 6 This work has been partially supported by the Spanish Min-
p1.3.f 40 40 0 0.0 31.8 32.6 23
p1.3.g 50 50 0 0.0 44.2 48.4 6 istry of Economy and Competitiveness, FEDER (TRA2015-
p1.3.h 70 70 1 0.0 66.3 66.3 11
p1.3.i 105 105 0 0.0 87.2 94.1 6 71883-REDT) and the Erasmus+ program (2016-1-ES01-
p1.3.j 115 115 0 0.0 90.7 102.2 6
p1.3.k 135 135 0 0.0 109.2 121.4 17 KA108-023465).
p1.3.l 155 155 0 0.0 124.0 138.8 13
p1.3.m 175 175 16 0.0 127.7 159.5 9
p1.3.n 190 190 1 0.0 152.2 175.1 15 R EFERENCES
p1.3.o 205 205 0 0.0 163.5 183.0 11
p1.3.p 220 220 1 0.0 177.5 199.0 32
p1.3.q 230 230 1 0.0 190.0 218.0 6 [1] S. E. Bibri and J. Krogstie, “On the social shaping dimensions of
p1.3.r 250 250 17 0.0 207.2 233.5 27 smart sustainable cities: A study in science, technology, and society,”
p1.4.d 15 15 0 0.0 14.3 14.3 8
p1.4.e 15 15 0 0.0 15.0 15.0 8
Sustainable Cities and Society, vol. 29, pp. 219–246, 2017.
p1.4.f 25 25 0 0.0 23.2 23.2 8 [2] M. Angelidou, “Smart cities: A conjuncture of four forces,” Cities,
p1.4.g 35 35 0 0.0 30.1 34.3 8
p1.4.h 45 45 0 0.0 37.9 40.8 9
vol. 47, pp. 95–106, 2015.
p1.4.i 60 60 0 0.0 48.5 55.0 8 [3] A. G. Foina, R. Sengupta, P. Lerchi, Z. Liu, and C. Krainer, “Drones in
p1.4.j 75 75 8 0.0 63.1 67.2 8 smart cities: Overcoming barriers through air traffic control research,”
p1.4.k 100 100 27 0.0 86.3 86.3 8
p1.4.l 120 120 0 0.0 107.1 116.0 9 in Research, Education and Development of Unmanned Aerial Systems
p1.4.m 130 130 0 0.0 112.0 124.9 10 (RED-UAS), 2015 Workshop on. IEEE, 2015, pp. 351–359.
p1.4.n 155 155 0 0.0 121.4 135.7 8
p1.4.o 165 165 0 0.0 129.6 149.0 28 [4] O. B. Jensen, “Drone city-power, design and aerial mobility in the age
p1.4.p 175 175 6 0.0 152.2 159.1 16 of” smart cities”,” Geographica Helvetica, vol. 71, no. 2, p. 67, 2016.
p1.4.q 190 190 6 0.0 167.1 171.9 8
p1.4.r 210 210 0 0.0 170.8 191.1 9 [5] H. Menouar, I. Guvenc, K. Akkaya, A. S. Uluagac, A. Kadri, and
Average: 3 0.0 10 A. Tuncer, “Uav-enabled intelligent transportation systems for the smart
city: Applications and challenges,” IEEE Communications Magazine,
vol. 55, no. 3, pp. 22–28, 2017.
[6] F. Mohammed, A. Idries, N. Mohamed, J. Al-Jaroodi, and I. Jawhar,
“Opportunities and challenges of using uavs for dubai smart city,” in New
Technologies, Mobility and Security (NTMS), 2014 6th International
Conference on. IEEE, 2014, pp. 1–4.
[7] E. N. Barmpounakis, E. I. Vlahogianni, and J. C. Golias, “Unmanned
aerial aircraft systems for transportation engineering: Current practice
and future challenges,” International Journal of Transportation Science
and Technology, vol. 5, no. 3, pp. 111–122, 2016.
[8] I.-M. Chao, B. Golden, and E. Wasil, “The team orienteering problem,”
[9] J. Caceres-Cruz, P. Arias, D. Guimarans, D. Riera, and A. A. Juan, “Rich
vehicle routing problem: Survey,” ACM Computing Surveys (CSUR),
vol. 47, no. 2, p. 32, 2015.
[10] A. A. Juan, J. Goentzel, and T. Bektaş, “Routing fleets with multiple
driving ranges: Is it possible to use greener fleet configurations?” Applied
Soft Computing, vol. 21, pp. 84–94, 2014.
[11] A. A. Juan, J. Faulin, S. E. Grasman, M. Rabe, and G. Figueira,
“A review of simheuristics: Extending metaheuristics to deal with
stochastic combinatorial optimization problems,” Operations Research
Perspectives, vol. 2, no. 1, pp. 62–72, 2015.
[12] A. Gruler, J. Panadero, J. de Armas, J. A. M. Pérez, and A. A. Juan, “A
Fig. 3: Boxplot comparison of gaps OBS-D-S and OBS-S w.r.t. variable neighborhood search simheuristic for the multiperiod inventory
OBS-D. routing problem with stochastic demands,” International Transactions
in Operational Research, 2018.
[13] A. Gruler, C. Fikar, A. A. Juan, P. Hirsch, and C. Contreras-Bolton,
“Supporting multi-depot and stochastic waste collection management in
clustered urban areas via simulation–optimization,” Journal of simula-
always closer to the OBS-D value than the OBS-D-S boxplot. tion, vol. 11, no. 1, pp. 11–19, 2017.
[14] S. Gonzalez-Martin, A. A. Juan, D. Riera, M. G. Elizondo, and J. J.
In other words, employing the best-found deterministic plan Ramos, “A simheuristic algorithm for solving the arc routing problem
into a stochastic environment usually leads to suboptimal with stochastic demands,” Journal of Simulation, vol. 12, no. 1, pp.
solutions. Notice also that the OBS-D value can be seen 53–66, 2018.
[15] D.-C. Dang, R. N. Guibadj, and A. Moukrim, “An effective pso-inspired
as an upper bound for the expected reward under stochastic algorithm for the team orienteering problem,” European Journal of
conditions. Operational Research, vol. 229, no. 2, pp. 332–344, 2013.
639
[16] M. Keshtkaran, K. Ziarati, A. Bettinelli, and D. Vigo, “Enhanced exact

solution methods for the team orienteering problem,” International
Journal of Production Research, vol. 54, pp. 591–601, 2015.
[17] S. Lin, “Solving the team orienteering problem using effective multi-start
simulated annealing,” Applied Soft Computing, vol. 13, pp. 1064–1073,
2013.
[18] J. Ferreira, A. Quintas, and J. Oliveira, “Solving the team orienteering
problem: developing a solution tool using a genetic algorithm approach,”
in Soft computing in industrial applications. Advances in Intelligent
Systems and Computing: 223. Springer, 2014, pp. 365–375.
[19] L. Ke, L. Zhai, J. Li, and F. Chan, “Pareto mimic algorithm: an approach
to the team orienteering problem,” Omega, vol. 61, pp. 155–166, 2015.
[20] T. Ilhan, S. Iravani, and M. Daskin, “The orienteering problem with
stochastic profits,” IIE Transactions, vol. 40, pp. 406–421, 2008.
[21] A. Campbell, M. Gendreau, and B. Thomas, “The orienteering problem
with stochastic travel and service times,” Annals of Operations Research,
vol. 186, pp. 61–81, 2011.
[22] V. Papapanagiotou, R. Montemanni, and L. Gambardella, “Objective
function evaluation methods for the orienteering problem with stochastic
travel and service times,” Journal of Applied Operations Research,
vol. 6, pp. 16–29, 2014.
[23] C. Verbeeck, P. Vansteenwegen, and E.-H. Aghezzaf, “Solving the
stochastic time-dependent orienteering problem with time windows,”
[24] L. Evers, K. Glorie, S. van der Ster, A. Barros, and H. Monsuur, “A
two-stage approach to the orienteering problem with stochastic weights,”
Computers and Operations Research, vol. 43, pp. 248–260, 2014.
[25] S. Teng, H. Ong, and H. Huang, “An integer l-shaped algorithm for
time-constrained traveling salesman problem with stochastic travel and
service times,” Asia-Pacific Journal of Operational Research, vol. 21,
pp. 241–257, 2004.
[26] H. C. Lau, W. Yeoh, P. Varakantham, D. T. Nguyen, and
H. Chen, “Dynamic stochastic orienteering problems for risk-aware
applications,” CoRR, vol. abs/1210.4874, 2012. [Online]. Available:
http://arxiv.org/abs/1210.4874
[27] H. Tang and E. Miller-Hooks, “A tabu search heuristic for the team
orienteering problem,” Computers & Operations Research, vol. 32, no. 6,
pp. 1379–1407, 2005.
[28] K. Beck, M. Beedle, A. van Bennekum, A. Cockburn, W. Cunningham,
M. Fowler, J. Grenning, J. Highsmith, A. Hunt, R. Jeffries, J. Kern,
B. Marick, R. C. Martin, S. Mellor, K. Schwaber, J. Sutherland,
and D. Thomas, “Manifesto for agile software development,” 2001.
[Online]. Available: http://www.agilemanifesto.org/
[29] G. Clarke and J. Wright, “Scheduling of vehicles from a central depot
to a number of delivery points,” Operations Research, vol. 12, pp. pp.
568–581, 1964.
[30] H. Tang and E. Miller-Hooks, “A tabu search heuristic for the team
orienteering problem,” Computers & Operations Research, vol. 32, no. 6,
pp. 1379–1407, 2005.
[31] A. A. Juan, J. Faulin, R. Ruiz, B. Barrios, and S. Caballé, “The sr-gcws
hybrid algorithm for solving the capacitated vehicle routing problem,”
Appl. Soft Comput., vol. 10, no. 1, pp. 215–224, Jan. 2010. [Online].
Available: http://dx.doi.org/10.1016/j.asoc.2009.07.003
[32] A. A. Juan, J. Faulin, S. E. Grasman, D. Riera, J. Marull, and C. Mendez,
“Using safety stocks and simulation to solve the vehicle routing problem
with stochastic demands,” Transportation Research Part C: Emerging
Technologies, vol. 19, no. 5, pp. 751–765, 2011.
640
A Simheuristic Algorithm for the Team

Orienteering Problem
Javier Faulin∗ ,Angel A. Juan†‡ , Lorena Reyes∗ , Javier Panadero† , Carlos Ospina∗ , Jose M. Mozos†
∗ ISC - Institute of Smart Cities.
Public University of Navarre
Pamplona, 31006, Spain
{javier.faulin, lorena.reyes}@unavarra.es
[email protected]
† IN3 - Computer Science Dept.
Universitat Oberta de Catalunya

Barcelona, 08018, Spain
{ajuanp, jpanaderom, jmozosr}@uoc.edu
‡ Euncet Business School
Terrassa, 08225, Spain
Abstract—Unmanned aerial vehicles (UAVs) or drones are nodes in N. Each customer i ∈ N has a stochastic reward
being utilized by logistics systems in the context of smart cities. (Ui ) and a service time (STi ). Similarly, each edge (i, j) is
Here, we present a current application of the uses of drones characterized by a traveling time (tij ). The total traveling time
through the Team Orienteering Problem (TOP). The TOP is
a combinatorial optimization problem aimed at a practical per route is limited by a driving range time (T lim), which
approach for the urban transportation problems, such as traffic represents the battery life of each UAV. The objective is to
monitoring, freight transport, information transfer, safety, emer- determine the subset of customers to be visited by each route
gency situations management and other uses. This abstract copes (including the visiting order) which maximizes the expected
with a TOP version in which a fleet of drones has to visit a reward considering the T lim as a hard constraint.
series of customers. We assume that each visit to customers relies
on a stochastic reward which implies a variable service time. The solution approach can be considered as a specialized
Thus, a simheuristic algorithm is proposed as a solving approach case of simulation-based optimization, where only metaheuris-
integrating simulation inside a multi-start heuristic framework. tics are employed as optimization components and the simula-
A series of computational experiments contribute to illustrate the tion feedback helps to better guide the metaheuristic searching
potential benefits of our work. process in a vast space of feasible solutions. In particular,
Index Terms—Team Orienteering Problem, stochastic Re-
wards, variable service times, simheuristic algorithm.. our simheuristic algorithm combines Monte Carlo simulation
(MCS) with a multi-start metaheuristic framework. All in all,
our simheuristic approach aims at finding routing solutions
I. I NTRODUCTION
offering both high expected rewards and reliability indexes.
In a supply chain, a transport system is typically defined Finally, an expanded version or this work can be read in [1],
as a robust set of links that allows a continuous flow of which presents a stochastic version of the TOP using UAVs.
resources such as information, money, and products. This set
of links connects suppliers, production locations, retailers, and II. S OLUTION APPROACH
customers. The introduction of new technologies allows to Our solving approach relies on a simheuristic algorithm, it is
consider real-time data that can be useful in order to identify composed of two different components: an optimization one
suitable links at each time. Moreover, the European Commis- –which searches for promising solutions– and a simulation
sion has proposed different initiatives and some governmental one –which assesses the promising solutions in a stochastic
projects to facilitate the emergence of sustainable and smart environment and guides the searching process. Regarding the
cities. Likewise, this transport system ensures quick responses optimization component, we use a multi-start meta framework
to dynamic conditions of markets. in which the constructive phase uses biased-randomization
Practical applications of the TOP rely on stochastic rewards techniques [2], [3]. Figure 1 describes our simheuristic algo-
and service times associated to the customers visits. Hence, rithm.
we propose a simheuristic algorithm to deal with a TOP In the multi-start procedure, a feasible solution is built for
with stochastic rewards and service times. This combinatorial deterministic version of the problem. There, the concept of
optimization problem can be described as an undirected graph ‘savings’ is introduced as a criterion for merging routes, and
G = (N, A), where N is a set of n nodes (including it is based on the savings in time associated with completing
customers as well as an origin and a destination depot) and the merged route instead of the two original ones. This concept
A = {(i, j)/i, j ∈ N } is the set of edges connecting all is extended to the concept of ‘preference’, which is a linear
641
TABLE I: Comparison of the simheuristic algorithm results
and the best known solutions (BKS).
b−a
Instance Tlim BKS BDS BSS (a) BDS* (b) b
(%)
p3.4.t 27.5 670 670 487.29 485.50 0.37
p4.4.d 20 38 38 27.46 27.16 1.08
p5.4.v 27.5 1320 1320 938.63 901.8 4.17
Average 1.88
expected that as c converges to zero, the results from the

stochastic version converge to those obtained in the determin-
istic scenario.
In order to validate the quality of our approach in the
deterministic environment, where results are available in the
literature, we compare our results with the best-known solution
(BKS). We solve the 3 instances from the set d proposed by
[4]. Each instance involves a number of UAVs (fleet size),
number of nodes, and maximum route duration T lim. The
traveling time is estimated under the assumption that U AV s
travel at a unitary speed. The performance of our approach
is reported in the columns BDS, BSS, BDS*, both for the
Fig. 1: Scheme of our algorithm. deterministic and the stochastic environments solution. Notice
that our simheuristic algorithm reaches the (deterministic)
BKS for all tested instances, even when the run time was
combination of savings and accumulated rewards. Then, a limited to 60 seconds.
merging that generates a greater accumulated reward will be Table I presents the expected reward associated with the
prioritized over another one with similar time-based savings. deterministic solution BDS, which is compared with our best
Only a merging can be completed if the total expected time stochastic solution BDS*. According to these results, the best
after the operation does not exceed the driving-range threshold. stochastic solution provides an expected reward which is, on
The concept of preference is used to generate a sorted list the average, up to 1.88% better than the expected reward
of potential mergings, and these are completed following the provided by the best deterministic solution when employed
corresponding order, from higher to lower preference. Further- in a stochastic environment. As a result, solutions for the
more, we employ biased-randomization techniques, selecting deterministic version of the problem should not be used in
the promising mergings using a probabilistic algorithm follow- solving the stochastic version, since they become suboptimal
ing a Geometric Distribution. Hence, merging operations with under uncertainty scenarios.
a larger preference are more likely to be selected.
Once a feasible solution with a high reward is determined,
IV. C ONCLUSION
it is defined as the best deterministic solution. Then, MCS is
incorporated to assess the quality of this solution, in terms of
This work presents a simheuristic algorithm to solve a
the expected reward and reliability (the probability that each
stochastic version of the TOP, where driving-range limitations
route does not exceeds the driving-range). Thus, a feasible
of unmanned aerial vehicles are also considered. Under un-
solution is iteratively constructed, building one element at a
certain conditions is hardly to ensure feasible solutions, i.e.,
time in the multi-start procedure. As a result, the simulation
a route can request more time to be completed than the one
procedure provides a feedback to simheuristic algorithm to
provided by the battery duration. Our simheuristic algorithm
better guide the searching process. At the end of this stage,
allows to assess the quality of promising solutions and the
the solution with the highest expected reward and reliability
estimation of the solution reliability.
level is defined as the best stochastic solution.
III. C OMPUTATIONAL RESULTS ACKNOWLEDGMENT
Since there are no benchmark instances for the TOP with
stochastic rewards and constrained driving ranges, we modified This work has been partially supported by the Spanish
and extended a deterministic data set from the literature. We Ministry of Economy and Competitiveness (TRA2013-48180-
assumed that the stochastic rewards, Ui , follow a Truncated C3-P and TRA2015-71883-REDT) FEDER, and the Ibero-
Normal Distribution with parameters µ(Ui ) and σ(Ui )). The American Program for Science and Technology for Develop-
value of σ(Ui ) is estimated as: c·µ(Ui ), where c is a parameter ment CYTED2014-515RT0489). Likewise, we want to thank
that allows exploring different levels of uncertainty. It is the support of the UPNA doctoral program.
642
R EFERENCES
[1] L. Reyes-Rubiano, J. M. Mozos, J. Panadero, C. Ospina-Trujillo, J. Faulin,
and A. Juan, “The team orienteering problem with stochastic service times
and driving-range limitations: A simheuristic approach. pending: presen-
tation and publication,” in Proceedings of the 2018 Winter Simulation
Conference, M. Rabe, A. Juan, N. Mustafee, A. Skoogh, S. Jain, and
B. Johansson, Eds., 2018.
[2] A. A. Juan, I. Pascual, D. Guimarans, and B. Barrios, “Combining biased
randomization with iterated local search for solving the multidepot vehicle
routing problem,” International Transactions in Operational Research,
vol. 22, no. 4, pp. 647–667, 2015.
[3] O. Dominguez, A. A. Juan, B. Barrios, J. Faulin, and A. Agustin,
“Using biased randomization for solving the two-dimensional loading
vehicle routing problem with heterogeneous fleet,” Annals of Operations
[4] I.-M. Chao, B. L. Golden, and E. A. Wasil, “The team orienteering
problem,” European Journal of Operational Research, vol. 88, no. 3,
pp. 464–474, 1996.
643
Current Trends in Simheuristics: from smart

transportation to agent-based simheuristics
Alejandro Estrada-Moreno, Angel A. Juan, Javier Panadero, Carles Serrat, and Alfons Freixes
Abstract—Simheuristics extend metaheuristics by adding a that we analyze other statistics such as its variance, different
simulation layer that allows the optimization component to deal percentile values, or its reliability level.
efficiently with scenarios under uncertainty. This presentation
reviews both initial as well as recent applications of simheuristics,
The main goals of this presentation are: (i) to provide a
mainly in the area of logistics and transportation. We also discuss commented review of recent applications of simheuristics in
a novel agent-based simheuristic (ABSH) approach that combines the area of transportation; and (ii) to analyze trends as well as
simheuristic and multi-agent systems to efficiently solve stochastic open research lines.
combinatorial optimization problems. The presentation is based
on papers [1], [2], and [3], which have been already accepted in
the prestigious Winter Simulation Conference. II. R ECENT A PPLICATIONS IN T RANSPORTATION
Index Terms—simheuristics, stochastic optimization, logistics
& transportation, agent-based simheuristics.
[6] discuss the need for optimizing urban waste collection
in modern smart cities and formulate the problem as an exten-
I. I NTRODUCTION sion of the vehicle-routing problem. The authors first develop a
Real-life optimization problems are often NP-hard and competitive metaheuristic, based on a variable neighborhood-
large-scale in nature, which makes traditional exact methods search framework, to solve the deterministic variant. Then,
inefficient to solve them.Thus, the use of heuristic and meta- they extend their approach into a simheuristic to cope with
heuristic algorithms to obtain high-quality solutions in low unexpected waste levels inside the containers. Their algorithm
computing times is required. With the increasing advances in is tested using a large-scaled benchmark set for the waste-
computing hardware and software, simulation has become a collection problem with several realistic constraints. Their
‘first-resource’ method for analyzing complex systems under results include a risk analysis considering the variance of the
uncertainty [4]. Thus, simulation is frequently employed in ar- waste level and vehicle safety capacities.
eas such as logistics and transportation, manufacturing, supply The uncapacitated facility-location problem with stochastic
chain management, or smart cities. These systems are modeled service costs is analyzed in [7]. First, the authors propose an
and then simulated to get insights on their performance under extremely fast savings-based heuristic, which generates real-
different base scenarios. Simulation, however, is not an opti- time solutions for the deterministic version of the problem.
mization tool. Thus, whenever a decision maker aims to find This can be extremely useful in telecommunication appli-
an optimal configuration for a system, she requires the use cations, where ‘good’ solutions are needed in just a few
of optimization methods. Often, the associated optimization milliseconds for large-scale networks.
problems are addressed by assuming deterministic inputs and [8] propose a simheuristic algorithm for solving the arc-
constraints, which allows us to simplify them but at the cost routing problem with stochastic demands. Here, the authors
of not considering the real-life uncertainty that characterizes use Monte Carlo simulation to extend the RandSHARP heuris-
these systems. tic, which was originally designed to solve the deterministic
Simheuristic algorithms integrate simulation methods in- version of the problem. During the design of the routing plan,
side a metaheuristic optimization framework to deal with they make use of safety stocks, which allow vehicles to deal
large-scale and NP-hard stochastic optimization problems. with unexpectedly high demands during the actual distribution
Hybridization of simulation techniques with metaheuristics process.
allows us to consider stochastic variables in the objective [9] consider a stochastic version of the capacitated facility-
function of the optimization problem, as well as probabilistic location problem, proposing two facility-location models
constraints in its mathematical formulation. As discussed in representing alternative distribution policies in e-commerce
[5], the simulation component deals with the uncertainty in the (outsourcing vs. in-house distribution). The multi-period
model and provides feedback to the metaheuristic component inventory-routing problem with stochastic customer demands
in order to guide the search in a more efficient way. Notice is analyzed in [10]. A variable neighborhood search is ex-
also that, when dealing with stochastic optimization problems, tended into a simheuristic algorithm to consider variations in
performance statistics other than expected values must be the forecasted demands. With the aim of finding optimal refill
taken into account: while in deterministic optimization one can policies for each customerperiod combination, the authors take
focus on finding a solution that minimizes cost or maximizes into account that the quantity serviced at the beginning of one
profits, a stochastic version of the problem might require period will affect the inventory levels at the end of that period.
644
III. C URRENT T RENDS • Integration with machine learning: being a flexible and
relatively simple approach, simheuristics can be inte-
Some of the following trends in the use of simheuristics can grated with machine-learning approaches and, in particu-
be identified and are expected to play a relevant role in future lar, with learnheuristics in order to consider optimization
publications on this topic, therefore constituting open research problems with dynamic inputs.
lines to be yet fully explored: • Multi-population simheuristics: all the examples reviewed
• A higher level of simulation-optimization integration: a here are based on single-population metaheuristics; how-
deeper integration between the metaheuristic component ever, integration of simulation within multi-population
and the simulation component, including increasing use metaheuristics (e.g., genetic algorithms, etc.) might be
of the feedback provided by the simulation better to guide worth exploring too since different individuals in a popu-
the search for better solutions. lation might be based on different statistics obtained from
• Additional objectives: a rising interest in considering the simulation component.
optimization goals different from the expected value of • Agent-based simheuristics: similar to the way agent-based
a solution for the stochastic optimization problem; this modeling and simulation extends the more traditional
includes measuring other statistics reliability/robustness concept of discrete-event simulation and benefits from
levels, and even considering multi-objective optimization distributed and parallel computing systems, one could
problems. consider agent-based simheuristics as a multi-agent ex-
• Systems of increasing complexity: moving from isolated tension of the simheuristic concept, where each agent is
logistics or transportation problems to integrated prob- an autonomous and differentiated simheuristic algorithm
lems that reflect the complexity of supply networks, that interacts with the rest of the agents while searching
where interactions between different echelon stages also for a near-optimal solution to a complex and stochastic
need to be considered in order to increase global effi- combinatorial optimization problem.
ciency. R EFERENCES
• Use of more sophisticated simulation approaches: as the
[1] A. A. Juan, D. W. Kelton, C. Currie, and J. Faulin, “Simheuristics
complexity of the systems increases, more advanced sim- applications: dealing with uncertainty in logistics, transportation, and
ulation approaches are required to take into account the other supply chain areas,” in Proceedings of the 2018 Winter Simulation
dynamic and possibly nonstationary time-evolution of the Conference, M. Rabe et al., Ed. Piscataway, New Jersey: IEEE Press,
2018.
system and the interactions among its many components. [2] J. Panadero, A. A. Juan, C. Corlu, J. Mozos, and S. Onggo, “Agent-
• Enhanced identification of promising solutions: to speed based simheuristics: extending simulation-optimization algorithms via
up the computations, during a typical simheuristic process distributed and parallel computing,” in Proceedings of the 2018 Winter
Simulation Conference, M. Rabe et al., Ed. Piscataway, New Jersey:
only a reduced set of solutions are classified as ‘promis- IEEE Press, 2018.
ing’ and sent to the simulation component; enhanced [3] A. Estrada-Moreno, C. Serrat, M. Nogal, M. Cavero, and A. A. Juan,
strategies to classify a new solution as a promising one “Distribution planning in a weather-dependent scenario with stochastic
traveling times: a simheuristic approach,” in Proceedings of the 2018
can be employed. Winter Simulation Conference, M. Rabe et al., Ed. Piscataway, New
• Statistically significant number of runs: in some of the Jersey: IEEE Press, 2018.
examples reviewed in this paper, a 2-stage approach [4] T. W. Lucas, W. D. Kelton, P. J. Sanchez, S. M. Sanchez, and B. L.
Anderson, “Changing the paradigm: Simulation, now a method of first
is used; in the first stage the promising solutions are resort,” Naval Research Logistics (NRL), vol. 62, no. 4, pp. 293–303,
simulated using a reduced number of runs, while in 2015.
the second stage longer simulations are executed on the [5] A. A. Juan, J. Faulin, S. E. Grasman, M. Rabe, and G. Figueira,
“A review of simheuristics: Extending metaheuristics to deal with
‘elite’ solutions provided in the first stage to increase stochastic combinatorial optimization problems,” Operations Research
the statistics’ accuracy and precision. However, statistical Perspectives, vol. 2, pp. 62–72, 2015.
concepts could be employed to set the precise number of [6] A. Gruler, C. L. Quintero, L. Calvet, and A. A. Juan, “Waste collection
under uncertainty: a simheuristic based on variable neighbourhood
runs required in each stage in order to obtain estimates search,” European Journal of Industrial Engineering, vol. 11, no. 2,
with a given level of precision. pp. 228–255, 2017.
• Extending the application fields: so far, most simheuris- [7] J. De Armas, A. A. Juan, J. M. Marquès, and J. P. Pedroso, “Solving
the deterministic and stochastic uncapacitated facility location problem:
tics have been applied in the area of transportation, from a heuristic to a simheuristic,” Journal of the Operational Research
logistics,and production.However, similar stochastic op- Society, vol. 68, no. 10, pp. 1161–1176, 2017. [Online]. Available:
timization problems can be found in other application https://doi.org/10.1057/s41274-016-0155-6
[8] S. Gonzalez-Martin, A. A. Juan, D. Riera, M. G. Elizondo, and J. J.
fields such as telecommunications, finance, health-care Ramos, “A simheuristic algorithm for solving the arc routing problem
systems, and smart cities. with stochastic demands,” Journal of Simulation, vol. 12, no. 1, pp.
• Heuristic-supported simulation: while the examples re- 53–66, 2018.
[9] A. Pages-Bernaus, H. Ramalhinho, A. A. Juan, and L. Calvet, “Design-
viewed here refer to optimization problems in which ing e-commerce supply chains: a stochastic facilitylocation approach,”
simulation is used to support the search carried out by International Transactions in Operational Research, 2017.
the metaheuristic, it is also possible to use heuristics [10] A. Gruler, J. Panadero, J. DeArmas, J. A. Moreno-Perez, and A. A.
Juan, “A variable neighborhood search simheuristic for the multi-
or metaheuristics to optimize certain system parameters period inventory routing problem with stochastic demands,” Interna-
during a large simulation experiment. tional Transactions in Operational Research, 2018.
645
Designing e-commerce supply chains

A stochastic facility–location approach
Adela Pagés-Bernaus Helena Ramalhinho

Department of Mathematics Department of Economics and Business
University of Lleida Universitat Pompeu Fabra
Lleida, Spain Barcelona, Spain
Angel A. Juan Laura Calvet

IN3 – Department of Computer Science IN3 – Department of Computer Science
Open University of Catalonia Open University of Catalonia
Barcelona, Spain Barcelona, Spain
Abstract— e-Commerce activity has been increasing during in the presence of uncertainty. Since the capacity at each DC is
recent years, and this trend is expected to continue in the near limited, the problem is modeled as a Capacitated Facility
future. e-Commerce practices are subject to uncertainty Location Problem (CFLP) with stochastic demands. There are
conditions and high variability in customers’ demands. two CFLP variants differing in whether customers can be
Considering these characteristics, we propose two facility– served from one DC (single source) or more (multiple source).
location models that represent alternative distribution policies in In this paper, it is assumed that customers can be served from a
e-commerce. These models take into account stochastic demands number R of different facilities. So, each customer will have at
as well as more than one regular supplier per customer. Two most R facilities as regular providers. This variant is denoted as
methodologies are then introduced to solve these stochastic
the CFLP with regular providers (CFLPrp).
versions of the well-known capacitated facility–location problem.
The first is a two-stage stochastic-programming approach that
uses an exact solver. However, we show that this approach is not II. SOLUTION APPROACH AND COMPUTATIONAL RESULTS
appropriate for tackle large-scale instances due to the To solve the proposed models, we propose two approaches:
computational effort required. Accordingly, we propose a one based on Deterministic Equivalent Model (DEM) and
simheuristic approach that solves large-scale instances in short
another based on simheuristics methods, which in this case the
computing times. An extensive set of benchmark instances
contribute to illustrate the efficiency of our approach, as well as
method proposed hybridizes an ILS metaheuristic with
its potential utility in modern e-commerce practices. simulation. The SimILS is an Iterated Local Search based
method, where the local search stage focuses on providing
Keywords—component; formatting; style; styling; insert (key configurations of open/closed facilities, as well as on the
words) selection of the regular DCs. In the simulation stage,
customers’ assignment decisions are made. Since the
simulation stage is time-consuming, only “promising”
I. THE E-COMMERCE SUPPLY CHAIN DESIGN PROBLEM
solutions are tested in a stochastic environment.
The e-commerce in developed countries is steadily
increasing, reaching a noticeable share of all commerce during The computational experiments are performed on the
the last years. One of the main strategic decisions that e- Beasley. For the small–medium instances, both approaches
commerce enterprises must face is the location of their provide solutions of similar quality (with an average gap of
facilities or distribution centers (DCs). Note that this decision −0.18% for model A and −0.41% for model B in favor of the
has an impact on the daily logistics activity and, consequently, stochastic-programming approach). However, the time
on the customers’ quality of service. employed by the SimILS approach is one order of magnitude
smaller. Moreover, for the larger instances G4 the SimILS
This summary presents the work of Pagés-Bernaus (2017) increases the required computing time but is able to provide
[1] published recently. The work presents mathematical models feasible solutions.
that represent the decisions how the online distributors select
the DC locations and how to perform the subsequent III. CONCLUSIONS
assignment of customers to these facilities.
This summary presents two facility–location models, which
The goal of this work is to study this supply-chain design consider stochastic demands as well as a restricted number of
problem and to analyze the impact of different delivery policies regular suppliers per customer. These models were inspired in
646
a real e-commerce supply design problem. We propose two instances in reasonable computing times, while providing also
different approaches to solve the models representing this competitive results for smaller instances
problem. On the one hand, we use a two-stage stochastic-
programming methodology. On the other hand, we propose a
simheuristic algorithm, combining an ILS metaheuristic with REFERENCES
simulation. According to the computational results obtained,
the stochastic-programming approach is efficient but limited to
small- and medium-sized instances. On the contrary, the [1] Pagès-Bernaus A., Ramalhinho H., Juan A.A., Calvet (2018), Designing
E-commerce Supply Chains: a stochastic facility-location approach,
proposed simheuristic approach is able to solve large-sized International Transactions in Operational Research (First published: 3
July 2017). DOI: 10.1111/itor.12433.
647
Bioinspirados
(XIII MAEB)
MAEB 7.2:
A LGORITMOS M ULTIOBJETIVO
Y A PLICACIONES
Resumen extractivo de texto multidocumento

usando un enfoque de optimización multiobjetivo
basado en colonia de abejas artificiales
Jesus M. Sanchez-Gomez Miguel A. Vega-Rodrı́guez Carlos J. Pérez
Departamento de Matemáticas Depto. Tecnologı́a de Computadores y Comunicaciones Departamento de Matemáticas
Universidad de Extremadura Universidad de Extremadura Universidad de Extremadura
Cáceres, España Cáceres, España Cáceres, España
Resumen—Los métodos automáticos de resumen de texto extractivos seleccionan subconjuntos del texto original. El
son cada vez más necesarios en la actualidad. Los enfoques objetivo principal del resumen extractivo multidocumento es
de resumen extractivo multidocumento pretenden obtener el representar la información más importante en una versión
contenido principal de una colección de documentos a la vez que
reducen la información redundante, lo que puede ser abordado reducida de los documentos originales, manteniendo los conte-
desde un enfoque de optimización multiobjetivo. En este trabajo nidos principales y reduciendo la redundancia. De esta manera,
se ha diseñado e implementado un algoritmo MOABC (Multi- los usuarios pueden obtener las ideas principales del texto de
Objective Artificial Bee Colony) para esta tarea. Los experimentos forma rápida.
se han realizado en base a conjuntos de datos de DUC (Document Como se ha definido, la naturaleza del resumen extractivo
Understanding Conferences), y se han evaluado con las métricas
ROUGE (Recall-Oriented Understudy for Gisting Evaluation). Los multidocumento es multiobjetivo, pero la mayorı́a de los
resultados muestran mejoras importantes: del 31,09 % y del enfoques en la literatura cientı́fica se basan en modelos de
18,63 % para el ROUGE-2 y del 8,43 % y del 6,09 % para el optimización mono-objetivo (p. ej. [5]). En estos enfoques
ROUGE-L, con respecto a los mejores resultados de enfoques solo se optimiza una función objetivo, la cual incluye a su vez
mono-objetivo y multiobjetivo de la literatura cientı́fica. Además, varios objetivos que deben ser ponderados. Esta asignación de
se ha demostrado que los valores ROUGE obtenidos son más
estables, con una reducción en la dispersión relativa de entre pesos es subjetiva, lo que influye mucho en la solución final.
620,63 % y 1333,95 %, es decir, entre 6 y 13 veces más robustos. Hasta la fecha solo se ha propuesto un enfoque de optimiza-
ción multiobjetivo [6], el cual ha obtenido mejores resultados
Palabras clave—Resumen de texto multidocumento, optimiza- que los enfoques mono-objetivo. Por lo tanto, el resumen
ción multiobjetivo, colonia de abejas artificiales, cobertura del automático de texto multidocumento mediante optimización
contenido, reducción de la redundancia.
multiobjetivo es una lı́nea de investigación muy reciente, en
la que la hipótesis principal es que al utilizar la optimización
I. I NTRODUCCI ÓN
multiobjetivo se pueden obtener mejores resultados que con la
En la actualidad, la cantidad de información en Internet crece optimización mono-objetivo.
de forma exponencial en cualquier tema, y los usuarios desean En este trabajo, el resumen extractivo multidocumento es
obtener solo la información más relevante sobre dicho tema lo abordado mediante el algoritmo MOABC (Multi-Objective Ar-
más rápido posible. Una forma de extraer esta información es tificial Bee Colony), el cual maximiza simultáneamente tanto
mediante herramientas de minerı́a de texto [1], con el fin de la cobertura del contenido como la reducción de la redundancia
poder generar automáticamente un resumen a partir de toda la de la colección de documentos. Los experimentos se han
información del tema en cuestión [2], cubriendo la información realizado en base al conjunto de datos de DUC (Document
más importante y evitando la redundancia de la misma. Understanding Conferences) y los rendimientos del modelo
Existen varios métodos de resumen automático: depen- se han evaluado con las métricas ROUGE (Recall-Oriented
diendo de si la información se obtiene de uno o de más Understudy for Gisting Evaluation). El enfoque propuesto ha
documentos, el resumen puede ser mono-documento o mul- obtenido resultados que mejoran las medias ROUGE de los
tidocumento [3]. Un resumen mono-documento reduce la mejores enfoques de la literatura cientı́fica, obteniendo además
información del documento a una breve representación, mien- resultados más estables.
tras que un resumen multidocumento selecciona información
de toda la colección de documentos. Además, los métodos II. T RABAJO RELACIONADO
también pueden ser abstractivos o extractivos [4]. Los métodos En esta sección se muestra una revisión de las principales
abstractivos pueden construir un resumen con palabras o frases técnicas de optimización que se han implementado para el
que no existen en el texto original, mientras que los métodos resumen extractivo multidocumento.
651
En primer lugar, se revisan los trabajos mono-objetivo, III. D EFINICI ÓN DEL PROBLEMA
donde todos los objetivos son ponderados subjetivamente para En esta sección se define el resumen de texto multidocumento
obtener una función única. [7] consideró el resumen orientado como un problema de optimización. Los métodos más usados
a consultas de documentos como un problema de optimiza- en este contexto son los métodos de representación de vectores
ción global con cuatro objetivos, en el que los experimentos de términos (palabras), donde cada oración se representa
se realizaron con enfoques linealizados y lexicográficos. [8] como un vector de términos, y la similitud entre oraciones
propuso un método genérico de resumen multidocumento se compara por pares mediante el uso de algún criterio. El
basado en la agrupación de oraciones, resolviéndolo con una criterio mayormente utilizado es la similitud coseno, como en
modificación del algoritmo de optimización de enjambre de [5] y [6].
partı́culas (PSO). [9] diseñó un modelo de resumen de texto
no supervisado basado en la programación lineal entera, que III-A. Similitud coseno
resolvió con un algoritmo de ramificación y poda (B&B) y
Dado el conjunto T = {t1 , t2 , . . . , tm }, que contiene los
un algoritmo PSO. [10] y [11] propusieron el resumen multi-
m términos distintos de la colección de documentos D.
documento como un problema de la p-mediana modificada,
Suponiendo un total de n oraciones, cada oración si de D
implementando [10] un algoritmo de evolución diferencial
se representa como un vector, si = (wi1 , wi2 , . . . , wim ), i =
(DE) autoadaptativo y [11] un algoritmo de evolución diferen-
1, 2, . . . , n, donde cada elemento es el peso de su término
cial basado en mutación y cruce autoadaptativos (DESAMC).
correspondiente. Este peso wik está asociado con el término
[12] y [13] abordaron el resumen de documentos como un
tk en la oración si , y puede calcularse usando el esquema
problema de programación no lineal 0-1, donde la función
frecuencia del término - frecuencia inversa de la oración
objetivo se definió como la media heroniana de los criterios,
(tf isf ), donde tf mide cuántas veces aparece el término
y el problema fue resuelto con el algoritmo PSO en ambos
en una oración, e isf mide cuántas oraciones de D contienen
casos. [5] consideró el resumen de documentos como un
el término [22], de la siguiente forma:
problema de optimización discreta, proponiendo un algoritmo
DE adaptativo para resolverlo. [14] y [15] consideraron la wik = tfik · log(n/nk ), (1)
programación booleana cuadrática, donde la función objetivo
era una combinación ponderada de los objetivos. En ambos donde tfik cuenta cuántas veces aparece el término tk en la
casos se implementó un algoritmo DE binario. [16] propuso el oración si , y log(n/nk ) es el factor isf , donde nk denota el
resumen de documentos como un problema de programación número de oraciones que contienen el término tk .
entera cuadrática, resolviéndolo con un algoritmo PSO. [17] El contenido principal de D se puede resumir cuantitativa-
describió un enfoque basado en optimización para el resumen mente con la media de los pesos de los m términos en T con
de documentos, implementando un algoritmo DE mejorado. un vector medio o = (o1 , o2 , . . . , om ), donde cada componente
[18] presentó el resumen de documentos como un problema se calcula como sigue:
de optimización lineal y no lineal, utilizando un algoritmo PSO n
para resolverlo. [19] describió el resumen multidocumento 1X
ok = wik , k = 1, 2, . . . , m. (2)
como un problema de optimización binaria, proponiendo un n i=1
algoritmo de selección elitista intergeneracional, recombina-
Finalmente, la similitud coseno se calcula a partir de
ción heterogénea y mutación cataclı́smica (CHC). En [20], el
los pesos previamente definidos, midiendo la semejanza
resumen de texto se trató como un problema de programación
entre las oraciones si = (wi1 , wi2 , . . . , wim ) y sj =
booleana, que se resolvió con un algoritmo DE. Finalmente,
(wj1 , wj2 , . . . , wjm ) de la siguiente forma:
[21] consideró el resumen multidocumento basado en el enfo-
Pm
que de proximidad tópica, para el cual se propuso un algoritmo wik wjk
DE autoadaptativo. sim(si , sj ) = qP k=1 P , i, j = 1, 2, . . . , n.
m 2 m 2
La optimización multiobjetivo resuelve los problemas de k=1 wik · k=1 wjk
rendimiento de los modelos mono-objetivo, optimizando ca- (3)

da función objetivo sin ponderaciones. En el único trabajo
III-B. Formulación del problema de optimización
multiobjetivo encontrado ([6]), se propuso un modelo de
resumen extractivo multidocumento basado en la optimización Dado el conjunto D = {d1 , d2 , d3 , . . . , dN }, que contiene
discreta, implementando un algoritmo genético de ordenación N documentos. D también se puede representar como un
no-dominada II (NSGA-II) para la resolución del problema. conjunto que contiene las n oraciones de la colección como
Los principales objetivos incluidos en estos trabajos son la D = {s1 , s2 , . . . , sn }. El objetivo es generar un resumen
cobertura del contenido y la reducción de la redundancia. Sin D̄ ⊂ D teniendo en cuenta los siguientes tres aspectos:
embargo, también existen otros criterios como la relevancia, la Longitud: el resumen generado D̄ debe tener una longitud
coherencia y la significancia, pero no son tan comunes como fija L (con cierta tolerancia).
los anteriores. Además, todos los trabajos llevaron a cabo la Cobertura del contenido: el tema principal de la colec-
experimentación utilizando los conjuntos de datos de DUC y ción de documentos D debe ser cubierto en el resumen
las métricas de evaluación ROUGE. D̄ incluyendo las oraciones apropiadas.
652
Reducción de la redundancia: el resumen D̄ no debe ser soluciones encontradas hasta ahora; y las abejas exploradoras,
redundante, es decir, las oraciones existentes en D que que se encargan de la exploración de nuevas soluciones cuando
son similares entre sı́ no deben repetirse en el resumen algunas de las soluciones actuales se agotan (cuando no se
generado. pueden mejorar más).
Este problema de resumen de texto implica la optimización Este algoritmo ha sido aplicado con éxito para resolver
simultánea de la cobertura del contenido y de la reducción problemas del mundo real en múltiples contextos, ver p. ej.
de la redundancia. Sin embargo, estos dos objetivos son [24] y [25]. Además, algunos autores han propuesto nuevas
contradictorios entre sı́, por lo que un enfoque de optimización variantes con el fin de mejorarlo (p. ej. [26] y [27]).
multiobjetivo es la forma natural de abordar este problema. En esta sección se propone un algoritmo MOABC. Antes de
Sea xi ∈ {0, 1} una variable de decisión binaria que describirlo, se explica el preprocesamiento de los documentos
considera la presencia (xi = 1) o la ausencia (xi = 0) de de entrada y los operadores de mutación y reparación.
la oración si en el resumen generado D̄. De esta forma, la IV-A. Preprocesamiento de entrada
representación de la solución (el vector de decisión) es la
siguiente: x = (x1 , x2 , . . . , xn ). Antes de la ejecución del algoritmo, los documentos de D
El primer objetivo a optimizar, Φcobertura (x), se refiere al deben ser preprocesados siguiendo estos pasos:
criterio de la cobertura del contenido. Dada cada oración si ∈ 1. Segmentación. Las oraciones de D se extraen por sepa-
D̄, la cobertura del contenido se expresa en base a la similitud rado para marcar el comienzo y el fin de cada una.
entre si y el conjunto de oraciones de D (representado por o). 2. Tokenización. Las palabras (términos) de cada oración
Por lo tanto, la siguiente función debe ser maximizada: son separadas token a token. Los signos de puntuación,
n
interrogación, exclamación... se eliminan en este paso.
3. Eliminación de las palabras vacı́as. Las palabras vacı́as
X
Φcobertura (x) = sim(si , o) · xi . (4)
i=1
de cada oración son eliminadas. Estas palabras son
aquellas que carecen de significado principal, como
El segundo objetivo a optimizar, Φred redund (x), se refiere artı́culos, preposiciones, conjunciones, etc. La lista de
a la redundancia de la información. En este caso, se define una palabras vacı́as usada está proporcionada en el paquete
variable de decisión binaria yij relacionada con la presencia ROUGE, y contiene 598 palabras [28].
simultánea (yij = 1) o la ausencia (yij = 0) de las oraciones 4. Stemming del resto de palabras. Las raı́ces del resto de
si y sj en el resumen generado D̄. Para cada par de oraciones palabras son extraı́das mediante el algoritmo de Porter
si , sj ∈ D̄ la similitud sim(si , sj ) debe ser minimizada. Esto [29], el cual ha sido ampliamente utilizado, convir-
es equivalente a maximizar la reducción de la redundancia, tiéndose en el estándar para los métodos de análisis
esto es, a maximizar la siguiente función: lexicográfico y para la recuperación de información en
1 un amplio rango de lenguajes [30].
Φred redund (x) = Pn−1 Pn P .
( i=1 j=i+1 sim(si ,sj )·yij )· ni=1 xi
(5) IV-B. Operador de mutación
Finalmente, el problema de optimización multiobjetivo del La operación de mutación consiste en agregar o eliminar
resumen extractivo multidocumento se formula como: oraciones en el resumen correspondiente. Este operador se rige
por la probabilidad de mutación pm ∈ (0, 1). Para cada oración
máx Φ(x) = {Φcobertura (x), Φred redund (x)}, (6) en una solución x se genera un número aleatorio ri ∼ U (0, 1).
Si ri ≤ pm , la oración si es candidata para la mutación, y si
n se cumple la siguiente condición:
X
sujeto a L − ε ≤ li · xi ≤ L + ε, (7) 1X
n
i=1 sim(si , o) ≥ sim(sj , o), (9)

n j=1
donde li es la longitud de la oración si y ε es la tolerancia
para la restricción de longitud del resumen, definida como: si se incluye en el resumen. De lo contrario, se elimina. Esta
condición verifica si la similitud entre si y o es mayor o menor
ε= máx li − mı́n li . (8) que la media de la similitud de las oraciones de D.
i=1,2,...,n i=1,2,...,n
IV. ABC MULTIOBJETIVO IV-C. Operador de reparación

El algoritmo ABC (Artificial Bee Colony) es un algoritmo de El operador de reparación comprueba que el resumen generado
optimización basado en población que se fundamenta en el no viola la restricción de longitud definida en la Ecuación
comportamiento inteligente de un enjambre o colonia de abejas 7. Antes de finalizar cada ciclo, cualquier resumen generado
[23]. El ABC simula el comportamiento de las abejas de la puede violar dicha restricción, la cual es verificada en ambas
miel para resolver problemas de optimización. Principalmente, direcciones. Si el resumen generado tiene una longitud inferior
existen tres tipos de abejas: las abejas obreras, que mantienen a la restricción menos la tolerancia, el resumen es descartado,
las soluciones actualmente conocidas del problema; las abejas ya que el número de resúmenes generados en este caso
observadoras, que permiten la explotación de las mejores es muy bajo (se ha verificado experimentalmente que estos
653
resúmenes se producen 6 veces menos que los resúmenes con Algoritmo 1 Pseudocódigo del MOABC.
una longitud superior a la restricción más la tolerancia). Por 1: Archivo N DS ← ∅
otro lado, si el resumen generado tiene una longitud superior 2: inicializar colonia()
a la restricción más la tolerancia, este resumen sı́ es reparado 3: for ciclo = 1 to ciclosmax do
como se explica a continuación. 4: enviar abejas obreras()
Dado el resumen generado D∗ , que incumple la restricción 5: rank y crowding(coloniatam )
de longitud, la operación de reparación elimina de D∗ la o 6: calcular probabilidades()
las oraciones más redundantes (las que tienen un alto grado 7: enviar abejas observadoras()
de similitud entre ellas). Para esto se considera un umbral de 8: enviar abejas exploradoras()
similitud δ = 0,9 (una concordancia del 90 %, también usada 9: rank y crowding(2 ∗ coloniatam )
en [6]). Las siguientes condiciones son comprobadas para cada 10: exportar colonia(Archivo N DS)
par de oraciones si y sj : 11: end for
{si , sj ∈ D∗ } ∧ {i 6= j} ∧ sim(si , sj ) ≥ δ i, j = 1, 2, . . . , n.
(10) sus dominancias, mientras que el segundo da preferencia
Si estas condiciones se cumplen, entonces se usa el operador a las soluciones que aportan mayor diferenciación (a las
de reparación, eliminando la peor oración. Para ello, se calcula más diversas) [32]. Una vez aplicados estos operadores, la
el siguiente valor de calidad para si y sj : selección se basa en las probabilidades calculadas en la lı́nea
calidadsi = sim(si , o) + ((sim(osum , o) − sim(osum−si , o)) · 10, 6, asignando mayores probabilidades a las mejores soluciones.
(11) En la lı́nea 7 se envı́an las abejas observadoras, cuya tarea
donde sim(osum , o) es la similitud entre el centro del resumen es seleccionar su abeja obrera asignada, teniendo en cuenta
generado (incluida la oración si ) y el centro de la colección las probabilidades de selección, para tratar de mejorarla (el
de documentos o, y sim(osum−si , o) es la similitud entre operador de mutación también es aplicado en este paso).
el centro del resumen generado (excluyendo en este caso la En este punto del algoritmo, el tamaño de la colonia se
oración si ) y el centro de la colección de documentos o. duplica (2 ∗ coloniatam ). Las últimas abejas, las exploradoras
Este segundo término tiene un orden de magnitud mayor (se (lı́nea 8), se encargan de verificar las soluciones agotadas,
multiplica por 10), ya que mide la calidad del resumen cuando que son aquellas que no han mejorado más después de un
se elimina la oración si . Finalmente, la oración con la calidad determinado número de intentos. Estas abejas agotadas son
más baja es eliminada del resumen, y este operador es aplicado reemplazadas por exploradoras, que son nuevas soluciones
hasta que la restricción de longitud requerida se cumple. generadas aleatoriamente. Para finalizar un ciclo, el tamaño
de la colonia se reduce al tamaño original (coloniatam ),
IV-D. Principales pasos del algoritmo aplicando los operadores rank y crowding nuevamente (lı́nea
En esta subsección se propone una adaptación del algoritmo 9), y se reparan las soluciones (cuando es necesario) para su
ABC para optimización multiobjetivo. Mientras que la opti- almacenamiento en el archivo Archivo NDS (lı́nea 10).
mización mono-objetivo devuelve la mejor solución encon-
V. R ESULTADOS EXPERIMENTALES
trada, la optimización multiobjetivo devuelve un conjunto de
soluciones que son no dominadas entre sı́. Una solución es V-A. Conjuntos de datos
no dominada cuando ninguna de las funciones objetivo se Los conjuntos de datos utilizados para medir el rendimiento
puede mejorar sin que se degrade alguna de las otras [31]. han sido proporcionados por DUC (Document Understanding
El conjunto de soluciones no dominadas se conoce como Conferences), siendo un banco de pruebas abierto de referencia
conjunto de Pareto, y su representación gráfica como frente para la evaluación de resúmenes automáticos. Las comparacio-
de Pareto. nes se han realizado con los trabajos [5] y [6], donde se han
El algoritmo MOABC se resume con el pseudocódigo del utilizado 10 temas del conjunto de datos DUC2002 (del d061j
Algoritmo 1, que contiene los pasos principales del mismo. al d070f) [33].
En primer lugar, se inicializa el archivo de almacenamiento
Archivo NDS, que contiene las soluciones no dominadas (lı́nea V-B. Métricas de evaluación
1). Después, la colonia inicial se genera aleatoriamente (lı́nea El rendimiento del modelo se ha evaluado mediante el uso de
2), es decir, para cada solución (resumen), las oraciones de D las métricas ROUGE (Recall-Oriented Understudy for Gisting
se seleccionan de forma aleatoria. Los pasos de las lı́neas 3 a Evaluation) [34], que es considerada la métrica de evaluación
11 se repiten durante un número máximo de ciclos ciclosmax . oficial para los resúmenes por DUC. En este caso, las dos
En el paso de las abejas obreras (lı́nea 4) se aplica una variantes de ROUGE usadas son: ROUGE-2 y ROUGE-L.
mutación para mejorar la solución, que será seleccionada Además de la media (M), se han considerado otras dos
solo si domina a la original. En la lı́nea 5 se utilizan dos estadı́sticas para la medición de la dispersión: el rango y un
operadores para determinar cuáles son las mejores soluciones coeficiente de variación estadı́stico. El rango (R) se calcula
asociadas a las abejas obreras: rank y crowding. El primero como R = ROU GEmejor −ROU GEpeor . Sin embargo, no es
clasifica las soluciones en diferentes frentes de Pareto según adimensional, por lo que también se muestra una modificación
654
Tabla I
M EDIAS (M), RANGOS (R) Y COEFICIENTES DE VARIACI ÓN (CV) DE LOS VALORES ROUGE-2 Y ROUGE-L. L OS MEJORES APARECEN SOMBREADOS .
ROUGE-2 ROUGE-L
Tema DE adaptativo [5] NSGA-II [6] Enfoque propuesto DE adaptativo [5] NSGA-II [6] Enfoque propuesto
M R CV M R CV M R CV M R CV M R CV M R CV
d061j 0,266 0,290 109,02 0,306 0,263 85,95 0,365 0,093 25,43 0,542 0,208 38,38 0,554 0,205 37,00 0,590 0,056 9,46
d062j 0,188 0,275 146,28 0,200 0,422 211,00 0,342 0,023 6,60 0,473 0,239 50,53 0,481 0,306 63,62 0,536 0,017 3,26
d063j 0,245 0,208 84,90 0,275 0,279 101,45 0,272 0,005 1,84 0,493 0,156 31,64 0,528 0,171 32,39 0,509 0,050 9,74
d064j 0,194 0,280 144,33 0,233 0,356 152,79 0,308 0,009 2,83 0,462 0,235 50,87 0,488 0,287 58,81 0,495 0,011 2,19
d065j 0,144 0,209 145,14 0,182 0,208 114,29 0,198 0,026 13,32 0,431 0,141 32,71 0,457 0,174 38,07 0,464 0,057 12,29
d066j 0,201 0,257 127,86 0,181 0,245 135,36 0,290 0,019 6,54 0,455 0,196 43,08 0,441 0,149 33,79 0,519 0,007 1,36
d067f 0,239 0,235 98,33 0,260 0,298 114,62 0,356 0,005 1,39 0,509 0,232 45,58 0,529 0,244 46,12 0,580 0,012 2,15
d068f 0,491 0,384 78,21 0,496 0,281 56,65 0,444 0,084 18,83 0,666 0,226 33,93 0,626 0,226 36,10 0,639 0,071 11,09
d069f 0,184 0,166 90,22 0,232 0,239 103,02 0,240 0,008 3,15 0,454 0,135 29,74 0,476 0,191 40,13 0,554 0,010 1,81
d070f 0,224 0,260 116,07 0,262 0,215 82,03 0,305 0,002 0,76 0,496 0,173 34,88 0,513 0,158 30,80 0,515 0,005 0,90
Media 0,238 0,256 114,03 0,263 0,281 115,72 0,312 0,027 8,07 0,498 0,194 39,13 0,509 0,211 41,68 0,540 0,030 5,43
del coeficiente de variación tradicional de Pearson (CV), que Tabla II

implica la relación entre el rango y la media. Puede expresarse C OMPARACI ÓN DE LA MEDIA (M), DEL RANGO (R) Y DEL COEFICIENTE
DE VARIACI ÓN (CV) ENTRE EL ENFOQUE PROPUESTO Y LOS OTROS
en términos de porcentaje como: ENFOQUES .
R
CV = · 100. (12) Mejora del enfoque propuesto ( %)
ROU GEmedia Enfoque ROUGE-2 ROUGE-L
V-C. Configuración de los experimentos M R CV M R CV
DE adaptativo [5] 31,09 848,15 1313,01 8,43 546,67 620,63
Los parámetros del MOABC se han elegido para realizar com- NSGA-II [6] 18,63 940,74 1333,95 6,09 603,33 667,59
paraciones justas con los resultados de los enfoques propuestos
en la literatura cientı́fica ([5] y [6]). Estos son: tamaño de
colonia, coloniatam = 50; número de ciclos, ciclosmax =
1000; probabilidad de mutación, pm = 0, 1; y el número de 31,09 %, y la del ROUGE-L en un 8,43 %. En segundo lugar,
repeticiones/ejecuciones independientes, repsmax = 20. el enfoque propuesto también supera al presentado en [6]. En
V-D. Resultados este caso, el algoritmo es un NSGA-II multiobjetivo. La media
del ROUGE-2 tiene una mejora del 18,63 %, y la del ROUGE-
Los resultados del MOABC son comparados con [6] (el único L del 6,09 %. Finalmente, los rangos y CV muestran que los
enfoque multiobjetivo existente en la literatura cientı́fica) y resultados del enfoque propuesto son mucho más robustos.
con [5] (el mejor enfoque mono-objetivo). La Tabla I presenta Para el ROUGE-2, el enfoque propuesto mejora la media de
la media, el rango y el CV de los valores de ROUGE-2 y los CV en más de un 1300 % (13 veces más robusto), y para el
ROUGE-L para cada tema y los valores medios de todos los ROUGE-L mejoran en más de un 600 % (6 veces más robusto).
temas para los tres enfoques comparados. Esto significa que las soluciones del MOABC son más estables
En los resultados obtenidos en la Tabla I se puede observar que las obtenidas en los otros dos enfoques.
que el enfoque propuesto supera a los otros dos, mejorando
a [5] en 9 de los 10 temas y a [6] en 8 de 10 para el
ROUGE-2, y en 9 de los 10 temas a ambos para el ROUGE-L. VI. C ONCLUSIONES Y TRABAJO FUTURO
Además, los rangos y los CV muestran que los resultados del
modelo propuesto son muy robustos. Considerando la media El problema de resumen multidocumento requiere la opti-
de los diez temas, para el ROUGE-2 el enfoque propuesto mización de más de una función objetivo, por lo que es
produce resultados con un CV medio de 8,07 %, mientras que necesario aplicar enfoques de optimización multiobjetivo. Por
en los otros dos enfoques son de 114,03 % y 115,72 %. Para primera vez, un enfoque basado en el algoritmo MOABC ha
el ROUGE-L, mientras que el CV está alrededor del 40 % en sido diseñado e implementado para este caso. Los resultados
los otros enfoques, en el modelo propuesto el valor es solo obtenidos no solo han mejorado en los valores ROUGE-2
del 5,43 %. Finalmente, la Tabla II muestra las mejoras en (31,09 % y 18,63 % mejor) y en ROUGE-L (8,43 % y 6,09 %
términos promedio del enfoque propuesto con respecto a los mejor), sino que también han mostrado una menor dispersión
otros enfoques. (alrededor de 1300 % y 600 % menos, es decir, alrededor de
Los resultados de la Tabla II dan lugar a las siguientes 13 y 6 veces más robusto) y, por lo tanto, la prueba de que
observaciones. En primer lugar, el enfoque propuesto mejora el enfoque propuesto es estadı́sticamente más sólido que los
al presentado en [5], donde el algoritmo es un DE adaptativo enfoques comparables publicados.
mono-objetivo. La media del ROUGE-2 es mejorada en un Como lı́nea de investigación futura, el enfoque se adaptará
655
para su aplicación en el software NeuroK 1 , que es una [12] R. M. Alguliev, R. M. Aliguliyev y C. A. Mehdiyev, “An optimization
plataforma de e-learning basada en la neurodidáctica [35]. El model and DPSO-EDA for document summarization,” International
Journal of Information Technology and Computer Science (IJITCS), vol.
algoritmo generará resúmenes de los contenidos de los estu- 3, no. 5, 2011, pp. 59–68.
diantes (mensajes, comentarios, observaciones o valoraciones), [13] R. M. Alguliev, R. M. Aliguliyev y N. R. Isazade, “Formulation of
en unidades de aprendizaje o en actividades concretas, lo que document summarization as a 0–1 nonlinear programming problem,”
Computers & Industrial Engineering, vol. 64, no. 1, 2013, pp. 94–102.
será útil para los profesores de los cursos para muchos propósi- [14] R. M. Alguliev, R. M. Aliguliyev y M. S. Hajirahimova, “Quadratic
tos, incluida la evaluación automática para las calificaciones. Boolean programming model and binary differential evolution algorithm
Otra lı́nea de investigación interesante es el análisis del for text summarization,” Problems of Information Technology, vol. 3, no.
2, 2012, pp. 20–29.
tiempo de CPU del algoritmo, con vistas a una posible pa- [15] R. M. Alguliev, R. M. Aliguliyev y M. S. Hajirahimova, “GenDocSum+
ralelización para mejorar el tiempo de ejecución. Las técnicas MCLR: Generic document summarization based on maximum coverage
basadas en programación paralela con OpenMP podrı́an ser and less redundancy,” Expert Systems with Applications, vol. 39, no.
16, 2012, pp. 12460–12473.
muy útiles, ya que este enfoque permite explotar el paralelismo [16] R. M. Alguliev, R. M. Aliguliyev y N. R. Isazade, “CDDS: Constraint-
existente en las arquitecturas multinúcleo actuales. driven document summarization models,” Expert Systems with Appli-
cations, vol. 40, no. 2, 2013, pp. 458–465.
[17] R. M. Alguliev, R. M. Aliguliyev y N. R. Isazade, “Multiple documents
AGRADECIMIENTOS summarization based on evolutionary optimization algorithm,” Expert
Esta investigación ha sido apoyada por el Ministerio de Systems with Applications, vol. 40, no. 5, 2013, pp. 1675–1689.
[18] R. M. Alguliev, R. M. Aliguliyev y C. A. Mehdiyev, “An optimization
Economı́a y Competitividad (Centro para el Desarrollo Tec- approach to automatic generic document summarization,” Computational
nológico Industrial, contrato IDI-20161039; Agencia Estatal Intelligence, vol. 29, no. 1, 2013, pp. 129–155.
de Investigación, proyectos TIN2016-76259-P y MTM2017- [19] M. Mendoza, C. Cobos, E. Leon, M. Lozano, F. Rodriguez y E. Herrera-
Viedma, “A new memetic algorithm for multi-document summarization
86875-C3-2-R), Junta de Extremadura (contrato AA-16-0017- based on CHC algorithm and greedy search,” En Mexican International
1, y proyectos GR18108 y GR18090), Cátedra ASPgems y Conference on Artificial Intelligence, Springer, 2014, pp. 125–138.
Unión Europea (Fondo Europeo de Desarrollo Regional). [20] R. M. Alguliev, R. M. Aliguliyev y N. R. Isazade, “An unsupervised
approach to generating generic summaries of documents,” Applied Soft
Computing, vol. 34, 2015, pp. 236–250.
R EFERENCIAS [21] K. Umam, F. W. Putro, G. Q. O. Pratamasunu, A. Z. Arifin y D. Pur-
witasari, “Coverage, Diversity, and Coherence Optimization for Multi-
[1] W. Fan y A. Bifet, “Mining big data: current status, and forecast to the Document Summarization,” Jurnal Ilmu Komputer dan Informasi, vol.
future,” ACM SIGKDD Explorations Newsletter, vol. 14, no. 2, 2013, 8, no. 1, 2015, pp. 1–10.
pp. 1–5. [22] G. Salton y C. Buckley, “Term-weighting approaches in automatic text
[2] H. Hashimi, A. Hafez y H. Mathkour, “Selection criteria for text mining retrieval,” Information Processing & Management, vol. 24, no. 5, 1988,
approaches,” Computers in Human Behavior, vol. 51, 2015, pp. 729–733. pp. 513–523.
[3] D. M. Zajic, B. J. Dorr y J. Lin, “Single-document and multi-document [23] D. Karaboga, “An idea based on honey bee swarm for numerical
summarization techniques for email threads using sentence compres- optimization,” Tech. rep., Technical Report-TR06. Erciyes University,
sion,” Information Processing & Management, vol. 44, no. 4, 2008, pp. Engineering Faculty, Computer Engineering Department, 2005.
1600–1610. [24] D. Karaboga y B. Basturk, “A powerful and efficient algorithm for
[4] X. Wan, “An exploration of document impact on graph-based multi- numerical function optimization: artificial bee colony (ABC) algorithm,”
document summarization,” En Proceedings of the Conference on Empi- Journal of Global Optimization, vol. 39, no. 3, 2007, pp. 459–471.
rical Methods in Natural Language Processing, Association for Compu- [25] D. Karaboga, B. Gorkemli, C. Ozturk y N. Karaboga, “A comprehen-
tational Linguistics, 2008, pp. 755–762. sive survey: artificial bee colony (ABC) algorithm and applications,”
[5] R. M. Alguliev, R. M. Aliguliyev y C. A. Mehdiyev, “Sentence selection Artificial Intelligence Review, vol. 42, no. 1, 2014, pp. 21–57.
for generic document summarization using an adaptive differential [26] M. S. Kıran y O. Fındık, “A directed artificial bee colony algorithm,”
evolution algorithm,” Swarm and Evolutionary Computation, vol. 1, no. Applied Soft Computing, vol. 26, 2015, pp. 454–462.
4, 2011, pp. 213–222. [27] M. S. Kıran, H. Hakli, M. Gunduz y H. Uguz, “Artificial bee colony
[6] H. H. Saleh, N. J. Kadhim y B. A. Attea, “A Genetic Based Optimiza- algorithm with variable search strategy for continuous optimization,”
tion Model for Extractive Multi-Document Text Summarization,” Iraqi Information Sciences 300, 2015, pp. 140–157.
Journal of Science, vol. 56, no. 2, 2015 pp. 1489–1498. [28] ROUGE Summary Evaluation Package, http://www.berouge.com/. [Ac-
[7] L. Huang, Y. He, F. Wei y W. Li, “Modeling document summarization cedido 20-Julio-2017].
as multi-objective optimization,” En Intelligent Information Technology [29] Porter stemming algorithm, http://www.tartarus.org/martin/
and Security Informatics (IITSI), 2010 Third International Symposium, PorterStemmer/. [Accedido 14-Junio-2018].
IEEE, 2010, pp. 382–386. [30] P. Willett, “The Porter stemming algorithm: then and now,” Program,
[8] R. M. Aliguliyev, “Clustering Techniques and Discrete Particle Swarm vol. 40, no. 3, 2006, pp. 219–223.
Optimization Algorithm for Multi-Document Summarization,” Compu- [31] C. C. Coello, C. Dhaenens y L. Jourdan, “Advances in multi-objective
tational Intelligence, vol. 26, no. 4, 2010, pp. 420–448. nature inspired computing,” SCI, vol. 272, Springer, 2010.
[9] R. M. Alguliev, R. M. Aliguliyev, M. S. Hajirahimova y C. A. Mehdiyev, [32] K. Deb, A. Pratap, S. Agarwal y T. Meyarivan, “A fast and elitist
“MCMR: Maximum coverage and minimum redundant text summariza- multiobjective genetic algorithm: NSGA-II,” IEEE Transactions on
tion model,” Expert Systems with Applications, vol. 38, no. 12, 2011, Evolutionary Computation, vol. 6, no. 2, 2002, pp. 182–197.
pp. 14514–14522. [33] Document Understanding Conference, http://duc.nist.gov. [Accedido 14-
[10] R. M. Alguliev, R. M. Aliguliyev y C. A. Mehdiyev, “pSum-Sade: Junio-2018].
a modified p-median problem and self-adaptive differential evolution [34] C.-Y. Lin, “Rouge: A package for automatic evaluation of summaries,”
algorithm for text summarization,” Applied Computational Intelligence En Text summarization branches out: Proceedings of the ACL-04
and Soft Computing, vol. 2011, 2011, pp. 1–13. workshop, vol. 8, Barcelona, Spain, 2004, pp. 74–81.
[11] R. M. Alguliev, R. M. Aliguliyev y N. R. Isazade, “DESAMC+ DocSum: [35] F. Calle-Alonso, A. Cuenca-Guevara, D. de la Mata Lara, J. M. Sanchez-
Differential evolution with self-adaptive mutation and crossover para- Gomez, M. A. Vega-Rodrı́guez y C. J. Perez Sanchez, “NeuroK: A
meters for multi-document summarization,” Knowledge-Based Systems, Collaborative e-Learning Platform based on Pedagogical Principles from
vol. 36, 2012, pp. 21–38. Neuroscience,” En Proceedings of the 9th International Conference on
Computer Supported Education (CSEDU 2017), vol. 1, Science and
1 https://neurok.es/ Technology Publications, 2017, pp. 550–555.
656
Algoritmo Multiobjetivo de Colonia de Abejas

Artificiales aplicado al Problema de Orientación
Rodrigo Martı́n-Moreno Miguel A. Vega-Rodrı́guez
Depto. Tecnologı́a de Computadores y Comunicaciones Depto. Tecnologı́a de Computadores y Comunicaciones
Universidad de Extremadura Universidad de Extremadura
Cáceres, España Cáceres, España
Resumen—Hemos desarrollado un nuevo algoritmo para la el algoritmo MOABC se aplica en la resolución de problemas
resolución de problemas de orientación multiobjetivo, que tienen de orientación multiobjetivo. Como veremos, los resultados
aplicación directa en el cálculo de rutas óptimas, logı́stica, o bien obtenidos son muy competitivos al compararlos con los de
el diseño de rutas turı́sticas, nuestra motivación principal. Los
turistas priorizan según sus gustos el visitar puntos de interés, otros algoritmos multiobjetivo (P-ACO y P-VNS) del estado
los cuales se pueden categorizar (p. ej. culturales u ocio), por lo del arte en este campo. Los experimentos han sido realizados
que es necesaria la utilización de sistemas expertos multiobjetivo. en instancias de test e instancias del mundo real (un total de
Para conseguir las mejores soluciones de Pareto, hemos adaptado 216 instancias agrupadas en 10 conjuntos), y hemos usado tres
el algoritmo de colonia de abejas artificiales al contexto multi- indicadores de calidad para comparar los resultados.
objetivo. El rendimiento del algoritmo se ha comparado con dos
algoritmos usados previamente en la literatura de los problemas Este artı́culo se estructura de la siguiente manera. La sección
de orientación multiobjetivo (P-ACO y P-VNS), y los resultados II introduce al lector en la investigación desarrollada en este
obtenidos indican que este nuevo algoritmo es acertado para campo. La sección III presenta la definición formal del pro-
resolver problemas de orientación multiobjetivo. blema y su formulación matemática. La sección IV desgrana
Palabras clave—Algoritmo de colonia de abejas artificiales, Op- nuestra estrategia multiobjetivo para resolver el problema. La
timización multiobjetivo, Problema de orientación, Inteligencia
de enjambre, Computación evolutiva. sección V muestra los resultados obtenidos y compara los
resultados de nuestro algoritmo con los de otros algoritmos
previamente publicados. Por último, la sección VI culmina este
I. I NTRODUCCI ÓN
artı́culo y muestra también posibles lı́neas de trabajo futuras.
Existe una gran variedad de sistemas de apoyo a la toma
de decisiones, usados para diferentes propósitos como mar- II. T RABAJO R ELACIONADO
keting, finanzas, logı́stica o recursos humanos, por ejemplo. La optimización multiobjetivo ha sido un campo importante,
Sin embargo, existen pocos sistemas para ayudar a la gente con bastantes trabajos de investigación, en las dos últimas
a diseñar rutas turı́sticas que encajen en sus preferencias, décadas. Dentro de ella, la resolución de MOOP es una área de
más bien se les ofrece un conjunto de rutas prefijadas poco gran aplicabilidad, aunque con poca actividad de investigación.
personalizables. Cuando los visitantes planean una visita a Hemos basado nuestro trabajo en el algoritmo ABC y
un destino, priorizan qué lugares o puntos de interés (POIs) lo hemos adaptado al contexto multiobjetivo. La elección
merecen ser visitados, teniendo en cuenta su presupuesto, del ABC se debe a que ha sido extensamente estudiado y
tiempo e interés y decidiendo su orden en la ruta. Por ello, aplicado para resolver problemas reales en múltiples campos
un sistema de apoyo a la toma de decisiones, que ayude a [3], incluyendo optimización mono-objetivo (p. ej. [4], [5] y
los visitantes en este proceso, puede ser muy interesante. En [6]) y optimización multiobjetivo (p. ej. [7], [8] y [9])
todo caso, la decisión final recaerá siempre sobre el visitante, Por otro lado, OP fue definido por [1], y algunos autores lo
ya que el sistema solo ofrecerá las mejores soluciones para han considerado como un tipo de TSP (Problema del Viajante)
sus requerimientos, pero no contemplará la parte emocional con beneficios (ver [10]) o TSP selectivo. En OP, cada vértice
de planear una visita a un destino. tiene asociado algún beneficio, y la finalidad es visitar un
El hecho de crear rutas que conecten POIs se define como un grupo de vértices que maximice la suma de los beneficios,
Problema de Orientación (OP) [1]. En este caso, nos centramos mientras se satisfaga la restricción de coste/longitud del tour.
en el Problema de Orientación MultiObjetivo (MOOP), donde Dos estudios completos del estado del arte del problema de
existen varias categorı́as para cada POI (p. ej.: cultural u orientación se pueden encontrar en [11] y [12].
ocio) y cada uno de ellos tiene diferentes beneficios para cada Relacionado con OP está el problema de orientación de
categorı́a. Hemos desarrollado un algoritmo MultiObjetivo de equipo o TOP (ver [13] y [14]), donde el problema se extiende
Colonia de Abejas Artificiales (MOABC), basándonos en el a múltiples tours.
algoritmo mono-objetivo ABC propuesto por [2], para resolver Con respecto a MOOP, el problema abordado en este
el MOOP de una manera competitiva. Es la primera vez que trabajo, muy pocas propuestas se pueden encontrar en la
657
literatura. Dentro del problema de orientación biobjetivo po- usan en todos los tours. La ecuación 7 garantiza que el coste
demos destacar [15] que usó el algoritmo P-ACO (Pareto Ant del tour no es superior al lı́mite establecido Cmax . En este
Colony Optimization) y el algoritmo P-VNS (Pareto Variable caso, resolveremos el problema de orientación biobjetivo, por
Neighborhood Search) combinados con PR (Path Relinking), lo que K = 2.
[16] que usó un algoritmo evolutivo también combinado con
IV. S OLUCI ÓN . N UEVO A LGORITMO M ULTIOBJETIVO
PR y [17] que utilizó GRASP combinado con PR.
En [18] se demostró que OP es NP-hard. Por ello, es necesario
III. D EFINICI ÓN DEL P ROBLEMA MOOP aplicar técnicas metaheurı́sticas en la resolución del problema
Puede modelarse como un grafo dirigido G = (V, A) con un de orientación multiobjetivo.
conjunto de vértices, V = {v0 , v1 , v2 , ..., vn+1 }, y un conjunto En esta sección explicamos el algoritmo MOABC que
de aristas, A = {(vi , vj ) : vi , vj ∈ V ∧ vi 6= vj ∧ vi 6= vn+1 ∧ hemos diseñado y desarrollado. Inicialmente el algoritmo
vj 6= v0 }. Cada vértice vi ∈ V \{v0 , vn+1 } tiene asociados K Colonia de Abejas Artificiales fue propuesto por [2] en el con-
beneficios bik (k = 1, ..., K). Los vértices inicial y final, v0 texto mono-objetivo. Nosotros lo hemos adaptado al contexto
y vn+1 , no tienen beneficios asociados. Además, cada arista multiobjetivo y particularmente a la resolución del problema
(vi , vj ) ∈ A tiene un coste cij que puede ser interpretado como de orientación multiobjetivo. Modelamos cada solución en
distancia, dinero o tiempo invertido para ir desde vi hasta vj . MOOP como una lista de puntos (aquellos que se han incluido
En todas las instancias usadas en este trabajo, v0 y vn+1 en el tour correspondiente), lo cual es la manera más natural
representan el mismo punto, por lo tanto, entendemos que para representar una solución para este problema.
cada solución es un “tour” en lugar de “ruta”. La finalidad del IV-A. Optimización Multiobjetivo
problema de orientación multiobjetivo es encontrar los mejores
Debido a la naturaleza multiobjetivo del problema a resolver,
tours (que maximicen los beneficios para todos los objetivos)
es muy difı́cil elegir una solución óptima donde todos los obje-
desde v0 hasta vn+1 , cumpliendo la restricción marcada de
tivos se maximicen. Sin embargo, si restringimos a soluciones
coste/longitud Cmax .
no dominadas, la elección se limitará a un conjunto razonable
Podemos definir matemáticamente el problema como:
de soluciones candidatas. Las siguientes definiciones ayudarán
a clarificar este aspecto.
maximizar F (x) = (f1 (x), ..., fK (x)), (1)
Una solución x domina a una solución x′ si x no es peor que
′
X
fk = (bik · yi ) (k = 1, ..., K), (2) x en ninguna de las funciones objetivo, y es mejor en al menos
vi ∈V \{v0 ,vn+1 } una de las funciones objetivo. Formalmente: para maximizar
F (x) = (f1 (x), ..., fK (x)), x domina x′ si fk (x) ≥ fk (x′ )
donde yi , una variable binaria, toma valor 1 cuando vi es
para todo k = 1, ..., K, y fk (x) > fk (x′ ) para al menos un k.
visitado, y 0 en caso contrario. Además, hay que tener en
Si esto ocurre, escribimos x ≻ x′ .
cuenta que:
Si ninguna solución domina a la solución x∗ , decimos que
∗
X
aij = yj (vj ∈ V \{v0 }), (3) x es no dominada o Pareto eficiente. En este caso, decimos
vi ∈V \{vj } que z ∗ = F (x∗ ) = (f1 (x∗ ), ..., fK (x∗ )) es un vector no
X dominado. El conjunto de todos los vectores no dominados es
aij = yi (vi ∈ V \{vn+1 }), (4) llamado frente de Pareto. La relación ≻ puede ser extendida
vj ∈V \{vi } desde el espacio de soluciones al espacio de objetivos. En ese
X caso, dados dos vectores z = (z1 , ..., zK ) y z ′ = (z1′ , ..., zK
′
),
aij ≤ |S| − 1 (S ⊆ V ∧ S 6= ∅), (5) ′ ′
escribimos z ≻ z si zk ≥ zk para todo k = 1, ..., K y zk > zk′
{vi ,vj }∈S
en al menos un k.
y0 = yn+1 = 1, (6)
X IV-B. MOABC
cij · aij ≤ Cmax , (7) El algoritmo ABC es un algoritmo metaheurı́stico, basado
(vi ,vj )∈A en inteligencia de enjambre, que se inspira en el compor-
  tamiento alimenticio de las colonias de abejas melı́feras y
aij ∈ {0, 1} (vi , vj ) ∈ A , (8) se compone de tres componentes principales: abejas obreras,
abejas observadoras y abejas exploradoras. Las abejas obreras
yi ∈ {0, 1} (vi ∈ V ). (9)
buscan fuentes de alimento (soluciones). Existen otros dos
La variable binaria aij toma valor 1 cuando (vi , vj ) ∈ A es comportamientos interesantes que se requieren para la auto-
usado, y 0 en caso contrario. La ecuación 1 indica que para organización y la inteligencia de enjambre: enviar nuevas
resolver MOOP hay que maximizar las diferentes funciones abejas (abejas observadoras) hacia las fuentes de alimento pro-
objetivo. La ecuación 2 define cada función objetivo como la metedoras (feedback positivo) y abandonar fuentes de alimento
suma de sus beneficios correspondientes. Las ecuaciones 3 y agotadas (feedback negativo), generando abejas exploradoras.
4 implican que para cada vértice visitado solo existe una arista Como hemos mencionado anteriormente, hemos adaptado
entrante y una arista saliente. La ecuación 5 impide subtours. el algoritmo ABC original al contexto multiobjetivo y en par-
La ecuación 6 implica que los puntos de comienzo y fin se ticular a la resolución de MOOP. Un pseudocódigo de nuestro
658
algoritmo MOABC se muestra en algoritmo 1. Las siguientes compara con la solución actual y si la primera domina a la
subsecciones detallan todas las partes de este algoritmo. segunda, entonces se reemplaza la solución actual para la abeja
obrera.
Algoritmo 1 Colonia de Abejas Artificiales Multiobjetivo
IV-E. Calcular Cantidad de Néctar
entrada: Tmax (tiempo máximo de ejecución), T P (tamaño
de la población) y limite (criterio de abandono) Usamos dos operadores multiobjetivo para determinar cuáles
salida: F ichero SN D (fichero con las soluciones no domi- son las mejores soluciones asociadas a las abejas obreras:
nadas) rank y crowding. El primero clasifica las soluciones en los
1: t ← 0; F ichero SN D ← ∅ diferentes frentes de Pareto acorde a sus relaciones de domi-
2: IniciarFuentesAlimento(T P ) ⊲ ver IV-C nancia, mientras que el segundo tiene en cuenta la distancia
3: while t < Tmax do de amontonamiento, que consigue variedad en las soluciones.
4: FaseAbejasObreras(T P ) ⊲ ver IV-D Una explicación más detallada de estos dos operadores puede
5: CalcularCantidadNectar(T P ) ⊲ ver IV-E encontrarse en [20]. Una vez calculados, los combinamos para
6: FaseAbejasObservadoras(T P ) ⊲ ver IV-F cada solución en un único valor (llamado fitness multiobjetivo
7: FaseAbejasExploradoras(T P , limite) ⊲ ver IV-G o M Of itness), según la ecuación 11. M Of itness es un
8: GuardarSND(F ichero SN D) ⊲ ver IV-H valor importante porque un mayor fitness multiobjetivo im-
9: end while plicará una mayor probabilidad de selección, fundamental en
la siguiente subsección.
IV-C. Iniciar Fuentes de Alimento 1

M Of itness(x) = 1 . (11)
Todas las soluciones (fuentes de alimento) de la población 2rank(x) + 1+crowding(x)
(T P : tamaño de la población) se generan aleatoriamente por
las abejas obreras siguiendo estos pasos: primero calculamos IV-F. Fase Abejas Observadoras
los 20 mejores movimientos desde cada punto a cualquier Las abejas obreras comparten la información del fitness de
otro. Este cálculo solo se realiza una vez y se usa cuando sea sus soluciones con las abejas observadoras, y estas eligen
necesario. Los mejores movimientos son calculados siguiendo sus soluciones de manera probabilı́stica basándose en las
la ecuación 10. Para ir desde i a j se calcula el ratioij , donde probabilidades calculadas en base a los valores M Of itness
bj1 y bj2 son los beneficios del punto j y cij es el coste para (ver ecuación 11). Aplicamos el método de selección de ruleta
ir desde i hasta j. Por lo tanto, la ecuación 10 relaciona los basado en fitness propuesto por [21]. Por ello, las mejores solu-
beneficios con el coste. Cabe destacar que los valores bj1 , bj2 ciones reclutarán más abejas observadoras (feedback positivo).
y cij son normalizados para evitar sesgos. Los movimientos La probabilidad p(xi ) por la que una solución xi es elegida
con mejor ratio se consideran mejores movimientos. por una abeja observadora se calcula con la ecuación 12.
(bj1 + bj2 ) M Of itness(xi )

ratioij = . (10) p(xi ) = PT P . (12)
cij m
m=1 M Of itness(x )
Después, comenzando por el punto inicial, seleccionamos Después de que una solución xi sea probabilı́sticamente
un movimiento de la lista de 20 movimientos. Este proceso elegida por una abeja observadora, se genera una solución
se repite hasta que no se pueden añadir más puntos por la vecina usando dos operadores: intercambio de vértices y
restricción de coste Cmax . Indicar que todos los tours finalizan acortamiento. Intercambio de vértices intenta reemplazar cada
en el punto de fin y que el resto de restricciones son también punto existente del tour por un punto no visitado. En cada
comprobadas durante la generación aleatoria de una solución. posición, el punto no visitado se selecciona a través de los
mejores 10 puntos (de acuerdo a la ecuación 10) no visitados
IV-D. Fase Abejas Obreras
para esa posición. Después, se usa la misma operación de
Las abejas obreras buscan mejores soluciones, dentro de sus acortamiento de la subsección IV-D para mejorar la solución.
vecindarios. Esto consiste en encontrar una solución vecina y Tras generar la solución vecina, se compara con la solución
evaluar su calidad. Para obtener soluciones vecinas para las original y si la primera no es dominada por la segunda,
abejas obreras, usamos dos operadores: acortamiento e inser- entonces se reemplaza la solución original para la abeja
ción. El acortamiento intenta reordenar los vértices, dentro de observadora.
un tour, para minimizar su coste. En este caso usamos el ope-
rador de acortamiento 2-opt propuesto por [19]. La inserción IV-G. Fase Abejas Exploradoras
comprueba si es factible insertar un nuevo punto después de Las abejas obreras y observadoras cuyas soluciones no pueden
realizar el acortamiento. Para cada posible inserción, se elige ser mejoradas después de un número de intentos, indicado por
de manera aleatoria uno de los mejores 10 puntos candidatos un parámetro de configuración del algoritmo MOABC llamado
(según ecuación 10) de los puntos no visitados. Cualquier limite, se convierten en abejas exploradoras y sus soluciones
posible inserción se realiza teniendo en cuenta la restricción son abandonadas. Destacar que MOABC utiliza más abejas
de coste Cmax . Después de generar la solución vecina, se exploradoras que el algoritmo ABC original, donde se utiliza
659
como mucho una por iteración [22]. En MOABC todas las 2 p273) con 20 instancias cada uno y con una restricción de
abejas obreras y observadoras con intentos >= limite se distancia máxima de tour (Cmax ) entre 1 y 20 kilómetros; y
convierten en exploradoras. En todo caso, las comparaciones 559, 562 y 2143 vértices (2 p559, 2 p562 y 2 p2143) con
con P-ACO y P-VNS (subsección V-C) son justas ya que 29 instancias y una Cmax desde 10 hasta 150 kilómetros.
se basan en la utilización del mismo tiempo de ejecución. Todas estas se proporcionan con una matriz de distancias entre
Las abejas exploradoras buscan de manera aleatoria nuevas vértices. Además, para estos 5 grupos de instancias se usa una
soluciones (mejorando la exploración del algoritmo). Por distancia de servicio entre vértices de 0,5 kilómetros que se
lo tanto, aquellas soluciones que no pueden ser mejoradas puede entender como el tiempo necesario para visitar un POI.
por explotación, son abandonadas (feedback negativo). La
nueva solución asociada a la abeja exploradora se genera V-B. Indicadores o Métricas de Calidad
aleatoriamente de la misma manera que en la subsección
IV-C. Posteriormente, la abeja exploradora intenta mejorar la Hemos usado el software disponible en http://www.tik.ee.ethz.
solución aplicando los tres operadores vistos anteriormente: ch/sop/pisa/?page=assessment.php para calcular los indicado-
inserción, intercambio y acortamiento. res, según las instrucciones proporcionadas por [24]. Todos los
indicadores usados en este trabajo han sido calculados usando
IV-H. Guardar Soluciones No Dominadas valores normalizados de las funciones objetivo. Para algunos
En cada iteración, las soluciones no dominadas se guardan indicadores unarios se necesita un conjunto de referencia, por
en un fichero para preservarlas mientras se generan nuevas lo que hemos generado un conjunto de referencia con las
soluciones. El operador utilizado para calcular las soluciones soluciones no dominadas de todas las ejecuciones de los algo-
no dominadas es el rank, el cual clasifica las soluciones en ritmos a comparar (MOABC, P-ACO y P-VNS). Hemos usado
diferentes frentes de Pareto de acuerdo a sus relaciones de las soluciones proporcionadas por [15] para cada instancia
dominancia. Además se usa el operador crowding que junto calculada por los algoritmos P-ACO y P-VNS, y realizado
con el operador rank es usado para ordenar las soluciones una comparación de acuerdo a varios indicadores o métricas
actuales. Una explicación más detallada de estos operadores utilizadas habitualmente en la literatura de optimización mul-
puede encontrarse en [20]. Después, las mejores T P (tamaño tiobjetivo: hipervolumen, épsilon unario y R3. Cada uno de
de la población) soluciones son tomadas por las abejas obreras estos tres indicadores se basa en diferentes propiedades, lo que
para la siguiente iteración y las soluciones no dominadas (con permite una evaluación completa y balanceada que incrementa
rank = 0) se guardan en Fichero SND. su fiabilidad. Puede encontrarse información detallada sobre
los indicadores hipervolumen, épsilon unario y R3 en [25],
V. R ESULTADOS [26] y [27] respectivamente.
Hemos implementado nuestro algoritmo MOABC en C++, con
el compilador GNU g++ 4.8.4 en Ubuntu Server 14.04 LTS 64 V-C. Comparación entre Algoritmos
bits. Todas las ejecuciones se han realizado en un procesador
Intel Pentium 4 D de 3,2 GHz y 1 GB de RAM, un entorno En esta subsección, comparamos los resultados obtenidos por
computacional muy similar al usado para los algoritmos P- MOABC con los resultados de los algoritmos P-ACO y P-
ACO y P-VNS. VNS [15]. Hemos usado el mismo número de ejecuciones
independientes que fueron usadas en esos algoritmos, 10
V-A. Instancias de Comparación ejecuciones por instancia. También hemos usado los resultados
Hemos utilizado las mismas instancias que fueron usadas por obtenidos por P-ACO y P-VNS en cada instancia, los cuales
[15] y que se encuentran disponibles en http://prolog.univie. utilizaron los parámetros de configuración más óptimos, como
ac.at/research/OP. Los conjuntos de instancias se pueden ca- puede comprobarse en [15]. En el caso de nuestro algoritmo
tegorizar en 10 grupos, de acuerdo al número de vértices. En MOABC, siguiendo las recomendaciones de [28], hemos estu-
cada grupo existen varias instancias con distinta restricción diado no solo el parámetro T P (tamaño de la población), sino
de longitud máxima de tour (Cmax ). Los primeros 3 grupos también el parámetro limite (criterio de abandono). Después
(2 p21, 2 p32 y 2 p33) con 21, 32 y 33 vértices, y 11, 18 de realizar tests preliminares con un rango de diferentes valo-
y 20 instancias respectivamente fueron creados por [1]. Los res para cada parámetro, hemos establecido la configuración
2 siguientes grupos (2 p64 y 2 p66) con 64 y 66 vértices, de los parámetros MOABC a un T P de 60 y un limite de 10.
y 14 y 26 instancias fueron propuestos por [23]. Estos 5 Todos los algoritmos fueron parados tras consumir el mismo
grupos fueron creados por sus autores con un único objetivo tiempo de ejecución, el usado por el algoritmo P-ACO. Los
(beneficio), por lo que [15] añadió un segundo objetivo. La tiempos de ejecución y resultados se encuentran disponibles
distancia entre vértices se calcula usando la fórmula de la en http://prolog.univie.ac.at/research/OP para todas las ejecu-
distancia Euclı́dea. Estos 5 grupos pueden considerarse como ciones e instancias de los algoritmos P-ACO y P-VNS.
instancias de test (benchmark). En primer lugar, mostramos una comparación de los re-
Los siguientes 5 grupos fueron creados totalmente por [15] y sultados obtenidos para el indicador hipervolumen (IH ). La
son instancias reales de algunas ciudades y regiones europeas. tabla I muestra los resultados de los tres algoritmos para cada
Dentro de estos 5 grupos tenemos 97 y 273 vértices (2 p97 y conjunto de instancias.
660
Tabla I los tres algoritmos y su comparación basada en el indicador

R ESULTADOS DEL INDICADOR HIPERVOLUMEN . L OS VALORES EN épsilon unario (Iǫ ). En pequeñas instancias, MOABC obtiene
NEGRITA INDICAN SUPERIORIDAD . L OS VALORES ALTOS SON MEJORES .
la mejor media en el indicador épsilon, y también obtiene
Conjuntos IH (MOABC) IH (P-ACO) IH (P-VNS) mejores resultados para los conjuntos de instancias 2 p21
2 p21 3,525 3,390 3,471 y 2 p32 que P-ACO y P-VNS. En instancias medianas,
2 p32 3,366 3,375 3,250 el algoritmo MOABC nuevamente consigue la mejor media
2 p33 3,575 3,638 3,615
en el indicador épsilon, y también los mejores resultados
Media (Pequeño) 3,489 3,468 3,445
2 p64 3,363 3,586 3,569
para 2 p97. En instancias grandes, MOABC es claramente
2 p66 3,346 3,609 3,554 mejor que P-ACO y P-VNS ya que obtiene los mejores
2 p97 3,501 3,315 3,335 resultados para todos los conjuntos de instancias grandes (las
Media (Mediano) 3,403 3,503 3,486 más complejas). Analizando la tabla II podemos observar que
2 p273 3,472 3,329 3,320 MOABC tiene la mejor media global del indicador épsilon,
2 p559 3,648 3,415 3,441
consiguiendo el mejor resultado en 7 de 10 conjuntos de
2 p562 3,634 3,451 3,370
2 p2143 3,640 3,144 2,839 instancias.
Media (Grande) 3,598 3,335 3,242
Media (Todos) 3,497 3,435 3,391 Tabla III
R ESULTADOS DEL INDICADOR R3. L OS VALORES EN NEGRITA INDICAN
SUPERIORIDAD . L OS VALORES BAJOS SON MEJORES .
La tabla I muestra la media de los resultados obtenidos por
conjunto de instancia. Por ejemplo, el conjunto de instancias Conjuntos IR3 (MOABC) IR3 (P-ACO) IR3 (P-VNS)
2 p21 tiene 11 instancias, por lo tanto, esta tabla muestra la 2 p21 0,000 0,031 0,010
2 p32 0,003 0,003 0,030
media de los resultados de 110 ejecuciones. Además, hemos
2 p33 0,018 0,005 0,010
agrupado los conjuntos de instancias en tres grupos, teniendo Media (Pequeño) 0,007 0,013 0,017
en cuenta sus tamaños (número de vértices): pequeño, mediano 2 p64 0,032 0,011 0,007
y grande; y mostrado su media de resultados. Finalmente, 2 p66 0,039 0,008 0,011
mostramos la media para todas las instancias. En instancias 2 p97 0,000 0,046 0,041
pequeñas, MOABC obtiene la mejor media de hipervolumen, Media (Mediano) 0,024 0,022 0,020
2 p273 0,030 0,067 0,063
y consigue mejores resultados en 2 p21 que P-ACO y P- 2 p559 0,011 0,054 0,048
VNS. En instancias medianas, el algoritmo MOABC obtiene 2 p562 0,010 0,041 0,059
el mejor hipervolumen para 2 p97. En instancias grandes, el 2 p2143 0,038 0,135 0,204
algoritmo MOABC es definitivamente superior que P-ACO y Media (Grande) 0,022 0,074 0,093
P-VNS, obteniendo los mejores hipervolúmenes para todas las Media (Todos) 0,018 0,036 0,043
instancias grandes (las más complicadas). De hecho, es aquı́
donde las diferencias entre los tres algoritmos son mayores, Finalmente, y usando la misma metodologı́a, la tabla III
especialmente en el conjunto de instancias con 2143 vértices muestra los resultados para los tres algoritmos y su com-
(2 p2143). Como conclusión, en la tabla I podemos ver que paración del indicador R3 (IR3 ). En pequeñas instancias,
MOABC tiene la mejor media global de hipervolumen. MOABC obtiene la mejor media del indicador R3, y también
los mejores resultados para los conjuntos de instancias 2 p21 y
Tabla II 2 p32. En instancias medianas, MOABC consigue los mejores
R ESULTADOS DEL INDICADOR ÉPSILON UNARIO . L OS VALORES EN resultados para el conjunto de instancias 2 p97. En instancias
NEGRITA INDICAN SUPERIORIDAD . L OS VALORES BAJOS SON MEJORES .
grandes, MOABC es definitivamente mejor que P-ACO y P-
Conjuntos Iǫ (MOABC) Iǫ (P-ACO) Iǫ (P-VNS) VNS, ya que como en los anteriores indicadores consigue los
2 p21 1,000 1,108 1,034 mejores resultados para todas las instancias grandes. Teniendo
2 p32 1,024 1,028 1,124 en cuenta la tabla III, podemos afirmar que MOABC tiene la
2 p33 1,074 1,032 1,050 mejor media global del indicador R3, obteniendo los mejores
Media (Pequeño) 1,032 1,056 1,069
resultados para 7 de 10 conjuntos de instancias.
2 p64 1,085 1,036 1,038
2 p66 1,104 1,033 1,049 Resumiendo los resultados de las tres tablas anteriores
2 p97 1,000 1,158 1,137 podemos concluir que:
Media (Mediano) 1,063 1,076 1,074 MOABC tiene la mejor media global para los tres indi-
2 p273 1,072 1,196 1,161 cadores (IH , Iǫ y IR3 ).
2 p559 1,037 1,118 1,113
2 p562 1,039 1,112 1,128
En las instancias pequeñas, MOABC obtiene la mejor
2 p2143 1,076 1,188 1,265 media para los tres indicadores, y generalmente, propor-
Media (Grande) 1,056 1,153 1,167 ciona mejores resultados que P-ACO y P-VNS en 2 de
Media (Todos) 1,050 1,095 1,103 3 conjuntos de instancias (2 p21 y 2 p32).
En las instancias medianas, de acuerdo con los tres
En segundo lugar, y usando la misma metodologı́a que en indicadores, MOABC claramente supera a los otros dos
el indicador anterior, la tabla II muestra los resultados para algoritmos (P-ACO y P-VNS) en el conjunto de instan-
661
cias 2 p97 (uno de los tres conjuntos de instancias del [6] S. Wang, Y. Zhang, Z. Dong, S. Du, G. Ji, J. Yan, J. Yang, Q. Wang,
grupo). C. Feng, P. Phillips, Feed-forward neural network optimized by hybri-
dization of PSO and ABC for abnormal brain detection, International
En las instancias grandes, MOABC es el mejor algoritmo, Journal of Imaging Systems and Technology 25 (2) (2015) 153–164.
teniendo en cuenta los tres indicadores, sus medias [7] W. Zou, Y. Zhu, H. Chen, B. Zhang, Solving multiobjective optimization
correspondientes, y también los resultados individuales problems using artificial bee colony algorithm, Discrete Dynamics in
Nature and Society 2011 (2011) 569784.
para cada uno de los 4 conjuntos de instancias de este [8] H. Zhang, Y. Zhu, W. Zou, X. Yan, A hybrid multi-objective artificial bee
grupo. Las diferencias respecto a los tres algoritmos colony algorithm for burdening optimization of copper strip production,
son especialmente mayores en el último conjunto de Applied Mathematical Modelling 36 (6) (2012) 2578–2591.
[9] J. Huo, L. Liu, An improved multi-objective artificial bee colony
instancias con 2143 vértices (el más difı́cil). optimization algorithm with regulation operators, Information 8 (1)
(2017) 18.
VI. C ONCLUSIONES [10] D. Feillet, P. Dejax, M. Gendreau, Traveling salesman problems with
Hemos desarrollado un enfoque metaheurı́stico para solucionar profits, Transportation Science 39 (2) (2005) 188–205.
[11] A. Gunawan, H. C. Lau, P. Vansteenwegen, Orienteering problem:
el problema de orientación multiobjetivo. Nuestra propuesta, A survey of recent variants, solution approaches and applications,
MOABC, es un algoritmo de optimización multiobjetivo basa- European Journal of Operational Research 255 (2) (2016) 315–332.
do en el comportamiento de las abejas melı́feras. MOABC ha [12] P. Vansteenwegen, W. Souffriau, D. V. Oudheusden, The orienteering
problem: A survey, European Journal of Operational Research 209 (1)
sido comparado con dos algoritmos multiobjetivo que fueron (2011) 1–10.
publicados anteriormente, P-ACO y P-VNS. Las comparacio- [13] P. Vansteenwegen, W. Souffriau, G. V. Berghe, D. V. Oudheusden, A
nes fueron realizadas usando instancias de test e instancias guided local search metaheuristic for the team orienteering problem,
European Journal of Operational Research 196 (1) (2009) 118–127.
del mundo real del problema de orientación, con un total [14] I.-M. Chao, B. L. Golden, E. A. Wasil, The team orienteering problem,
de 216 instancias agrupadas en 10 conjuntos. Utilizamos tres European Journal of Operational Research 88 (3) (1996) 464–474.
indicadores de calidad multiobjetivo, utilizados habitualmente [15] M. Schilde, K. F. Doerner, R. F. Hartl, G. Kiechle, Metaheuristics for
the bi-objective orienteering problem, Swarm Intelligence 3 (3) (2009)
en la literatura, para comparar los resultados de los tres algo- 179–201.
ritmos. MOABC es mejor en general que P-ACO y P-VNS, de [16] D. Purevsuren, G. Cui, S. ur Rehman, Evolutionary multiobjective
acuerdo a la media de los indicadores y sensiblemente mejor optimization algorithms with path relinking for bi-orienteering problem,
in: Software Engineering and Service Science (ICSESS), 2015 6th IEEE
cuanto mayor (más compleja) es la instancia del problema a International Conference on, 2015, pp. 132–135.
resolver (mayor número de vértices). Por lo tanto, podemos [17] R. Martı́, V. Campos, M. G. Resende, A. Duarte, Multiobjective GRASP
concluir que MOABC es una aproximación muy interesante with path relinking, European Journal of Operational Research 240 (1)
(2015) 54–71.
para resolver el problema de orientación. [18] B. L. Golden, L. Levy, R. Vohra, The orienteering problem, Naval
En el futuro intentaremos aplicar este enfoque a un pla- Research Logistics (NRL) 34 (3) (1987) 307–318.
nificador de rutas turı́sticas. Además, trataremos de mejorar [19] G. A. Croes, A method for solving traveling-salesman problems, Ope-
rations Research 6 (6) (1958) 791–812.
estos resultados usando otras estrategias distintas (p. ej.: otras [20] K. Deb, A. Pratap, S. Agarwal, T. Meyarivan, A fast and elitist multiob-
variantes de ABC u otros algoritmos evolutivos). Su diseño, jective genetic algorithm: NSGA-II, IEEE Transactions on Evolutionary
implementación y ejecución, y la comparación con algoritmos Computation 6 (2) (2002) 182–197.
[21] D. E. Goldberg, Genetic Algorithms in Search, Optimization and Ma-
multiobjetivo es interesante para futuras investigaciones. Final- chine Learning, Addison-Wesley Longman Publishing Co., Inc., Boston,
mente, la aplicación de MOABC en otros tipos de problemas MA, USA, 1989.
de orientación también supone una lı́nea interesante de trabajo. [22] M. Mernik, S.-H. Liu, D. Karaboga, M. Črepinšek, On clarifying
misconceptions when comparing variants of the Artificial Bee Colony
AGRADECIMIENTOS algorithm by offering a new implementation, Information Sciences 291
(2015) 115–127.
Este trabajo ha sido parcialmente financiado por la AEI [23] I.-M. Chao, B. L. Golden, E. A. Wasil, A fast and effective heuristic
(Agencia Estatal de Investigación, España) y el FEDER (Fon- for the orienteering problem, European Journal of Operational Research
88 (3) (1996) 475–489.
do Europeo de Desarrollo Regional, UE), bajo el proyecto [24] J. Knowles, L. Thiele, E. Zitzler, A tutorial on the performance assess-
TIN2016-76259-P (proyecto PROTEIN). Gracias también a la ment of stochastic multiobjective optimizers, Technical report no. 214,
Junta de Extremadura por la ayuda GR18090 otorgada al grupo Computer Engineering and Networks Laboratory (TIK), ETH Zurich,
Switzerland, revised version (Feb 2006).
de investigación TIC015. [25] N. Beume, C. M. Fonseca, M. López-Ibáñez, L. Paquete, J. Vahrenhold,
On the complexity of computing the hypervolume indicator, IEEE
R EFERENCIAS Transactions on Evolutionary Computation 13 (5) (2009) 1075–1082.
[1] T. Tsiligirides, Heuristic methods applied to orienteering, Journal of the [26] E. Zitzler, L. Thiele, M. Laumanns, C. M. Fonseca, V. G. da Fonseca,
Operational Research Society 35 (9) (1984) 797–809. Performance assessment of multiobjective optimizers: an analysis and
[2] D. Karaboga, B. Basturk, A powerful and efficient algorithm for review, IEEE Transactions on Evolutionary Computation 7 (2) (2003)
numerical function optimization: artificial bee colony (ABC) algorithm, 117–132.
Journal of Global Optimization 39 (3) (2007) 459–471. [27] M. P. Hansen, A. Jaszkiewicz, Evaluating the quality of approximations
[3] D. Karaboga, B. Gorkemli, C. Ozturk, N. Karaboga, A comprehensive to the non-dominated set, Tech. Rep. IMM-REP-1998-7, Institute of
survey: artificial bee colony (ABC) algorithm and applications, Artificial Mathematical Modelling, Technical University of Denmark (1998).
Intelligence Review 42 (1) (2014) 21–57. [28] N. Veček, S.-H. Liu, M. Črepinšek, M. Mernik, On the importance of the
[4] Y. Zhang, L. Wu, Optimal multi-level thresholding based on maximum artificial bee colony control parameter ‘limit’, Information Technology
Tsallis entropy via an artificial bee colony approach, Entropy 13 (4) and Control 46 (4) (2017) 566–604.
(2011) 841–859.
[5] Y. Zhang, L. Wu, S. Wang, Magnetic resonance brain image classi-
fication by an improved artificial bee colony algorithm, Progress In
Electromagnetics Research 116 (2011) 65–79.
662
Bioinspirados
(XIII MAEB)
MAEB 8.1:
A LGORITMOS M ULTIOBJETIVO
Y A PLICACIONES
Metaheurı́sticas hı́bridas para el problema del

apagado de celdas en redes 5G
Pablo H. Zapata-Cano∗, Francisco Luna†, Juan F. Valenzuela-Valdés∗, Antonio M. Mora∗ , Pablo Padilla∗
∗ Dpto.
de Teorı́a de la Señal, Telemática y Comunicaciones
CITIC, Universidad de Granada
[email protected], {juanvalenzuela, amorag, pablopadilla}@ugr.es
† Dpto. de Lenguajes y Ciencias de la Computación

[email protected]
Resumen—La densificación masiva de estaciones base (BS) tráfico máximas a las que hay que dar servicio. Esta forma de
es una de las tecnologı́as facilitadoras bien reconocidas por la proceder plantea un serio problema de consumo energético,
literatura para el desarrollo de la quinta generación de redes de ya que requiere mantener funcionando ese elevado número de
telecomunicaciones (5G). Su implementación, sin embargo, que
requiere el despliegue de miles de BSs por km2 , está en claro BSs, y es especialmente crı́tico en periodos de baja demanda
conflicto con uno de los requisitos de diseño de este tipo de redes, de tráfico, donde la red está infrautilizada. Una lı́nea de trabajo
que pretende tener un 90 % menos de consumo energético que la prometedora para reducir dicho consumo consiste en, dado
actual cuarta generación. Una forma de reducir el coste de estas un escenario fijo que puede representar a la demanda en
redes ultradensas consiste en apagar un subconjunto de BSs de un determinado intervalo de tiempo, apagar un subconjunto
forma que minimice su consumo energético pero, a su vez, se
maximice la capacidad de la misma. Es, por tanto, un problema de las BSs de forma que se minimice la energı́a por las
de optimización multi-objetivo. En este trabajo se propone un BSs y, a la vez, mantenga la red operativa maximizando su
nuevo operador especı́fico para el problema que es capaz de capacidad [4], [5]. Se trata de un problema de optimización
mejorar considerablemente la efectividad de varios algoritmos combinatoria NP-completo [6] cuyo espacio de búsqueda crece
multiobjetivo. Para ello, se han realizado experimentos con 9 exponencialmente con el número de BSs de la UDN.
escenarios de diferentes niveles de densificación tanto de BSs
como de usuarios que muestran un comportamiento consistente y La aproximación en este trabajo, dado los tamaños que
efectivo independientemente del algoritmo e instancia abordada. previstos para dichas redes, es usar metaheurı́sticas [7]. En
particular, el problema se ha formulado como un problema
de optimización multi-objetivo [8] ya que los dos criterios
I. I NTRODUCCI ÓN anteriores, consumo vs. capacidad, están en conflicto entre
La demanda de tráfico de datos en las redes de telefonı́a sı́, puesto que más BSs permiten potencialmente servir a
móvil ha crecido de manera constante desde el comienzo de más usuarios o UEs (del inglés, User Equipments), pero
estos sistemas de telecomunicación, y ası́ seguirá haciéndolo también se necesita más energı́a. En un estudio previo [9],
en el futuro, según transciende de diferentes informes tanto se ha abordado el problema utilizando dos metaheurı́sticas
de entidades públicas como privadas. En efecto, uno de estos multi-objetivo, una clásica como es NSGA-II [10], y otra
informes recientes elaborado por Ericcson expone que “El relativamente más reciente denominada MOCell [11]. La con-
tráfico de datos móvil total se espera que crezca a una tasa tribución del presente trabajo trata de incorporar conocimiento
compuesta anual del 42 %” [1], siendo los smarthpones la experto del problema en la búsqueda de ambos algoritmos
fuente del 90 % de este tráfico. Para dar servicio a semejante con un operador, denominado CSO (del inglés Cell Switch
demanda, las diferentes entidades, tanto públicas como priva- Off ), cuyo comportamiento se fundamenta en apagar aquellas
das, tienen sobre la mesa el desarrollo de la quinta generación BSs que no tienen UEs conectados. Hasta donde conocemos,
de redes de telefonı́a, la conocida como 5G. De entre las es la primera vez que se proponer un operador de búsqueda
diferentes tecnologı́as facilitadoras de los sistemas 5G [2], especı́fico para el problema del encendido/apagado de BSs en
la densificación de la red, i.e., el despliegue de miles de UDNs. Para mostrar su efectividad, se ha incorporado al ciclo
estaciones base (BS) de diferentes tipos por km2 , permite una evolutivo de NSGA-II y MOCell, dando lugar a sus versiones
mayor reutilización del espectro y, por tanto, incrementar en hı́bridas NSGA-IICSO y MOCellCSO , y se han comparado a
gran medida la capacidad del sistema. Son las denominadas las versiones canónicas de los algoritmos sobre un conjunto de
redes ultra-densas o Ultra-Dense Networks (UDNs) [3]. 9 escenarios diferentes que utilizan una densificación creciente
El despliegue de UDNs impone muchas tareas complejas tanto en BSs como en UEs. Los resultados han mostrado que
a diferentes niveles de la red (backhauling, coordinación de se trata de un operador que permite mejorar considerablemente
handovers, etc.), y se realiza en base a unas estimaciones de la búsqueda de ambas metaheurı́sticas multi-objetivo.
665
Tabla I: Parámetros del modelo para BSs y UEs
Celda Parámetro LL LM LH ML MM MH HL HM HH
Gtx 14
macro
f 2 GHz (BW = 100 MHz)
Gtx 12
pico1 micro2 micro1

f 3.5 GHz (BW = 175 MHz)
λmicro1
P [BS/km2 ] 100 100 100 200 200 200 300 300 300
Gtx 10
f 5 GHz (BW = 250 MHz)
λmicro2
P [BS/km2 ] 100 100 100 200 200 200 300 300 300
Gtx 5
f 10 GHz (BW = 500 MHz)
λpico1
P [BS/km2 ] 500 500 500 600 600 600 700 700 700
Gtx 7
pico2
f 14 GHz (BW = 700 MHz)

λpico2
P [BS/km2 ] 500 500 500 600 600 600 700 700 700
Gtx 4
femto2 femto1
f 28 GHz (BW = 1400 MHz)

λfPemto1 [BS/km2 ] 1000 1000 1000 2000 2000 2000 3000 3000 3000
Gtx 3
f 66 GHz (BW = 3300 MHz)
λfPemto2 [BS/km2 ] 1000 1000 1000 2000 2000 2000 3000 3000 3000
UEs λU
P
E [U E/km2 ] 1000 1000 1000 2000 2000 2000 3000 3000 3000
El resto del trabajo se organiza como sigue: la siguiente en el intervalo [2.0, 4.0] para cada una de las 10 regiones. El
sección detalla el modelado de las UDNs y el cálculo de las ratio señal-interferencia más ruido (Signal to Interference plus
funciones objetivo. La Sección III describe el operador CSO y Noise Ration o SINR) para el UE k, se calcula como:
su integración en los ciclos evolutivos de NSGA-II y MOCell. Prx,j,k [mW ]
La metodologı́a de los experimentos y el análisis de resultados SIN Rk = PM
se realiza en la Sección IV. Por último, la Sección V incluye Prx,i,k [mW ] − Prx,j,k [mW ] + Pn [mW ]
i=1
(4)
las principales conclusiones del trabajo y las lı́neas de trabajo
donde Prx,j,k es la potencia recibida por el UE k de la BS j,
futuro que se abren a partir de él.
el sumatorio es la potencia total recibida por el UE k desde
II. M ODELADO DEL PROBLEMA todas las BSs activas y operando a la misma frecuencia que
Esta sección se dedica a la descripción del modelo de UDN j, y Pn es la potencia del ruido, calculada como:
utilizado. Se considera un área de servicio de 500 × 500 m2 , Pn = −174 + 10 log10 BWj (5)
que se ha discretizado utilizando una malla de 100×100 puntos
(también llamados “pixels” o elementos de área) distribuidos siendo BWj el ancho de banda de la BS j, definida como el
uniformemente y, por tanto, cada uno cubre un área de 25 m2 5 % de la frecuencia de operación de la BS. La Tabla I incluye
donde la potencia de la señal se asume constante. La UDN todos los valores para los parámetros del modelo. Finalmente,
está dividida en 10 regiones diferentes, cada una con unas la capacidad del UE k es:
condiciones de propagación diferentes. Ck [bps] = BWkj [Hz] ∗ log2 (1 + SIN Rk ) (6)
Para calcular la potencia de señal recibida en cada punto,
Prx [dBm], se ha utilizado el siguiente esquema: donde BWkj es el ancho de banda asignado al UE k cuando
se conecta a la BS j, asumiendo una planificación en round-
Prx [dBm] = Ptx [dBm] + P Loss[dB] (1) robin, esto es:
BWj
donde Prx es la potencia recibida en dBm, Ptx es la potencia BWkj = (7)
Nj
transmitida en dBm, y P Loss son las pérdidas globales de
señal, que depende de las condiciones de propagación de cada considerando Nj como el número de UEs conectados a la BS
región, y se calcula como: j. La polı́tica de asignación de UEs a BSs es que un UE siem-
pre es servido por la BS con mayor SINR, independientemente
P Loss[dB] = GA + P A (2) del tipo de BS.
siendo GA las ganancias de las dos antenas (transmisión y El modelo de UDN usado en este trabajo utiliza 4 tipos de
recepción), y P A las pérdidas de transmisión en el espacio, celdas que tienen diferentes tamaños (i.e., zonas de cobertura).
calculadas como: Ordenadas según su tamaño, tenemos femtoceldas, picoceldas,
K microceldas y macroceldas. De los tres primeros tipos, además,
λ
P A[dB] = (3) se han definido dos subtipos (ver Tabla I), con lo que suman
2∗π∗d un total de 7 tipos de celdas diferentes. Las BSs que sirven a
donde d es la distancia Euclidea del punto correspondiente a la dichas celdas tienen todas una potencia de transmisión Ptx =
BS, K es el exponente de pérdidas, que varı́a aleatoriamente 750mW , por lo que su cobertura real está definida por sus
666
frecuencias de operación y las consiguientes pérdidas que se Algoritmo 1 Pseudocódigo del operador CSO
inducen en el cálculo de la SINR (a mayor frecuencia, menor 1: C ← celdas(U DN )
cobertura). 2: for c in C do
Las BSs se despliegan utilizando un Proceso de Poisson 3: if (UEsConectados(c) == 0) then
(PPP) independiente con diferentes densidades (definidas por 4: apagar(c)
λBS
P ). Los UEs también se posicionan usando una PPP con 5: end if
valor λUEP , pero utilizando atractores sociales (SAs por sus 6: end for
siglas en inglés), siguiendo el procedimiento propuesto en
[12]. Este esquema de despliegue usa, además, dos factores
α and µβ , que indican cómo de fuerte es la atracción de BSs III-B. El operador CSO
a SAs, y de SAs a UEs. Los valores usados en las simulaciones
Para incorporar información del problema a la búsqueda
son α = µβ = 0.25.
de las metaheurı́sticas, el operador CSO recorre todas las
La parametrización detallada de los 9 escenarios abordados
celdas de la solución candidata, y apaga aquellas que no están
en este trabajo se incluye en la Tabla I. Los nombres en
sirviendo a ningún UE.
las nueve últimas columnas, XY, indican la densidad del
Su aparente simpleza no impide que sea un operador con
despliegue de BSs y UEs, respectivamente, de forma que X,Y
gran capacidad de intensificación de la búsqueda y, como
= {L,M,H} significa un despliegue de baja (L), media (M) o
se verá más adelante en la sección experimental, se ha de
alta (H) densidad para BSs (parámetro λBS P del PPP) y UEs
aplicar con precaución. Hay que tener en cuenta que si,
(parámetro λUEP del PPP). Los parámetros G tx y f de cada
en cada solución candidata, se apagan todas las celdas que
tipo de celda se refieren a la ganancia en transmisión y la
no tienen usuarios conectados, se impide que el algoritmo
frecuencia de operación de la BS, respectivamente.
pueda evolucionar soluciones que reasignen UEs de una BS
El cálculo de las funciones objetivo se realiza como sigue.
a otra vacı́a, puesto que todas estarı́an apagadas al aplicar el
Para el primer objetivo, que mide el consumo eléctrico, cuenta
operador.
el número de BSs que están activas en la solución candidata
de la metaheurı́stica. Se asume que, una vez encendidas sólo III-C. Los algoritmos hı́bridos NSGA-IICSO y MOCellCSO
se considera la potencia de transmisión, que tiene valor Ptx =
750mW para todos los tipos. Para calcular la capacidad total Esta sección se articula en base a la plantilla genérica de
del sistema, como medida de la cantidad de información que metaheurı́stica multiobjetivo (Algoritmo 2) a partir de la cual
pueden recibir (donwlink) los UEs presentes en la UDN, se usa se describen las versiones canónicas de NSGA-II y MOCell
el siguiente procedimiento: primero, los UEs se asignan a las para, posteriormente, detallar los cambios necesarios para
BSs que les proporcionan mejor SINR; segundo, el ancho de introducir el operador CSO.
banda disponible en la BS se reparte entre los UEs conectados; El algoritmo NSGA-II (Non-dominated Sorting Genetic Al-
y, finalmente, se calcula la capacidad para cada uno de ellos gorithm II por sus siglas en inglés) fue propuesto por Deb et al.
según la Ecuación 6 y se agrega la de todos. en [10]. Se trata de un algoritmo genético cuyo funcionamiento
se basa en generar, a partir de una población Pt , otra auxiliar
III. M ETAHEUR ÍSTICAS H ÍBRIDAS : EL OPERADOR CSO Qt usando los operadores genéticos de selección, cruce y
En esta sección se detalla, en primer lugar, la representa- mutación (lı́nea 8 del Algoritmo 2); entonces, las soluciones
ción utilizada para abordar el problema y los consiguientes incluidas en Pt ∪Qt se ordenan según su rango y, aquellas con
operadores genéticos, en segundo lugar, el operador CSO, la mejor valor de este indicador de calidad, con las que pasan a
contribución de este trabajo, y, finalmente, una breve descrip- la siguiente generación Pt+1 (lı́nea 11). En caso de tener que
ción de las metaheurı́sticas multi-objetivo utilizadas y cómo seleccionar entre individuos de mismo rango, NSGA-II utiliza
integran al operador dentro de su ciclo evolutivo.
III-A. Representación y operadores genéticos Algoritmo 2 Plantilla de una metaheurı́stica multi-objetivo
La representación utilizada para las soluciones candidatas 1: S(0) ← GenerarSolucionesIniciales()
es el clásico array de bits en el que cada bit representa 2: A(0) ← ∅
a una celda de la UDN e indica si está encendida (’1’) o 3: Evaluar(S)
apagada (’0’). Los operadores de selección, cruce y mutación 4: A(0) ← Actualizar(A(0), S(0))
son, respectivamente, torneo binario, cruce de dos puntos con 5: t←0
cr = 0.9, y bit flip con mr = 1/L, donde L es el número de 6: while not CondiciónDeParada( ) do
BSs de la UDN. La condición de parada consiste en computar 7: t←t+1
100000 evaluaciones de función. Todos los algoritmos de este 8: S(t) ← OperadoresGenéticos(A(t − 1), S(t − 1))
trabajo comparten la implementación tanto la representación 9: Evaluar(S ′(t))
de soluciones, como de los operadores, ya que están integrados 10: A(t) ← Actualizar(A(t), S ′ (t))
en el framework para optimización multiobjetivo jMetal1 . 11: end while
1 https://github.com/jMetal/ 12: Salida: A
667
Algoritmo 3 NSGA-IICSO y MOCellCSO a maximizar cuyos valores dependen de la escala arbitraria de
8: S(t) ← OperadoresGenéticos(A(t − 1), S(t − 1)) los valores de las funciones objetivo. Para su uso correcto, en
9: S ′ (t) ← CSO(S(t)) caso de no disponer del frente óptimo de Pareto, se genera un
10: Evaluar(S ′(t)) frente de referencia (RPF) para cada instancia del problema,
11: A(t) ← Actualizar(A(t), S ′ (t)) compuesto por todas las soluciones no dominadas encontradas
por todos los algoritmos para el mismo. Con ese RPF, se
normaliza cada aproximación al frente antes de calcular el
un estimador de densidad que prioriza aquellas que están en valor del HV. Para dotar a estos resultados de confianza
las zonas menos pobladas de la aproximación al frente. estadı́stica, se ha comprobado primero la normalidad (test de
Por su parte, MOCell (Multi-Objective Cellular Genetic Kolmogorov-Smirnov) y homocedasticidad (Test de Levene)
Algorithm por sus siglas en inglés) es un algoritmo genético de las muestras y, una vez verificadas ambas condiciones, se
celular propuesto en [11]. Como muchos otras metaheurı́sti- ha usado un test paramétrico (test one-way ANOVA) para
cas multi-objetivo, MOCell incluye un archivo externo para verificar si se rechaza la hipótesis nula. Por último, se ha
almacenar las soluciones no-dominadas que encuentra durante aplicado el test de Tukey para realizar la comparación por
su ejecución (lı́nea 4 del Algoritmo 2). Este archivo está pares. En todos los casos se ha utilizado un nivel de confianza
acotado y usa el mismo estimador de densidad de NSGA- del 95 %.
II para mantener la diversidad en su aproximación al frente Si bien el HV permite comparar varios algoritmos numéri-
de Pareto. Su diferencia fundamental radica en la relación de camente, desde el punto de vista del experto que ha de elegir
vecindad entre las soluciones, que se disponen en una malla una solución del frente, este indicador no da información sobre
toroidal 2D. El operador de selección escoge una solución de la forma en la que se distribuyen las soluciones no-dominadas
dicho vecindario y otra desde el archivo externo. Después de a lo largo de las diferentes aproximaciones al frente de Pareto.
aplicar los operadores de cruce y mutación, el nuevo individuo Las attainment surfaces tienen precisamente esa funcionalidad.
generado se compara con el actual y lo reemplaza si es mejor; Son una representación gráfica del rendimiento esperado y su
si ambas soluciones son no-dominadas, MOCell reemplaza el variabilidad de diferentes ejecuciones de un algoritmo multi-
peor individuo del vecindario. En estos dos últimos casos, el objetivo. Informalmente, la 50 %-attainment surface se podrı́a
nuevo individuo se añade al archivo externo. considerar como la aproximación promedio al frente de Pareto,
La integración del operador CSO dentro del ciclo evolutivo es decir, serı́a el equivalente a la mediana en el caso mono-
de NSGA-II y MOCell se consigue reemplazando las lı́neas 8 objetivo.
a 10 del Algoritmo 2 por las lı́neas del algoritmo Algoritmo 3, IV-B. Resultados
es decir, justo después de aplicar los operadores genéticos, y
antes de evaluar para determinar su incorporación o no a la Se ha planteado un diseño experimental para medir el efecto
siguiente generación de soluciones del algoritmo. Esto permite de la hibridación entre NSGA-II y MOCell, y el operador
apagar aquellas celdas que no está sirviendo a ningún UE. Su CSO. Para ello, se han planteado dos tasas de aplicación de
aplicación, como el cruce y la mutación, depende de una tasa este último: 0.01 y 0.1, que se han usado como superı́ndice
de aplicación, csor , sobre la que se han diseñado diferentes en el nombre para distinguirlos. Ası́, se puede ver que, por
experimentos para ver su impacto. cada algoritmo, hay tres columnas: su versión canónica y las
versiones hı́bridas con tasa de aplicación de 0.01 y 0.1. En la
IV. E XPERIMENTACI ÓN Tabla II, que incluye los resultados del HV, usa un fondo en
Esta sección describe la metodologı́a utilizada para la reali- gris los mejores valores de este indicador por cada algoritmo.
zación de los experimentos que muestran la efectividad de las Hay una primera conclusión clara: la hibridación mejora
nuevas propuestas hı́bridas, NSGA-IICSO y MOCellCSO , ası́ la búsqueda de los algoritmos, ya que, en ningún escenario,
como el análisis de los resultados obtenidos. un algoritmo canónico ha sido mejor que uno hı́brido. Esto
es un resultado muy prometedor porque existen pocas apro-
IV-A. Metodologı́a ximaciones hı́bridas en el dominio y es un terreno amplı́simo
Dado que las metaheurı́sticas son algoritmos estocásticos, por explorar. La segunda es que, entre las versiones hı́bridas,
se han realizado 30 ejecuciones independientes para cada aquellas que usan una tasa de aplicación más pequeña (0.01
algoritmo en cada uno de los nueve escenarios. Cada ejecución vs. 0.1) permiten alcanzar mejores aproximaciones al frente
genera una instancia aleatoria del problema, pero se usan las de Pareto. Después de inspeccionar trazas de las ejecuciones
mismas 30 semillas para garantizar que todos los algoritmos (no incluidas por falta de espacio), se puede observar que el
abordan el mismo conjunto de instancias. Se han utilizado operador tiene un gran efecto en la diversidad de la población,
dos indicadores para medir la calidad de las aproximaciones es decir, si se aplica con mucha frecuencia, termina apagando
al frente de Pareto alcanzadas por los cuatro algoritmos: el en gran medida las mismas celdas y cercena el nuevo material
hypervolume (HV) [13] y las superficies de consecución (del genético creado por los operadores de cruce y mutación.
inglés attaiment surfaces) [14]. Si nos detenemos un poco más en los números concretos
El HV está considerado como uno de los indicadores más y se analizan según las instancias, se puede observar que las
fiables dentro de la comunidad multi-objetivo. Es un indicador diferencias en el HV se hace más manifiesta a medida que
668
Tabla II: Resultados del HV para todos los algoritmos sobre los 9 escenarios
NSGA-II NSGA-II0.01
CSO NSGA-II0.1
CSO MOCell MOCell0.01
CSO MOCell0.1
CSO
0.4560 0.5372 0.5296 0.4737 0.5359 0.5329
LL
±0.1017 ±0.1263 ±0.1250 ±0.1180 ±0.1250 ±0.1274
0.4364 0.5404 0.5338 0.4155 0.5385 0.5351
LM
±0.0929 ±0.1141 ±0.1179 ±0.0928 ±0.1155 ±0.1145
0.4548 0.5408 0.5371 0.4324 0.5340 0.5371
LH
±0.1027 ±0.1274 ±0.1271 ±0.0903 ±0.1252 ±0.1248
0.3288 0.4907 0.4853 0.3584 0.4892 0.4867
ML
±0.0698 ±0.1045 ±0.1045 ±0.0817 ±0.1059 ±0.1032
0.3904 0.5573 0.5455 0.3947 0.5554 0.5508
MM
±0.0728 ±0.1095 ±0.1045 ±0.0728 ±0.1061 ±0.1044
0.3243 0.5356 0.5401 0.3194 0.5235 0.5565
MH
±0.0580 ±0.0948 ±0.0874 ±0.0650 ±0.0925 ±0.0954
0.1316 0.5117 0.4981 0.2681 0.5142 0.5051
HL
±0.0798 ±0.1071 ±0.1093 ±0.0729 ±0.1076 ±0.1093
0.1103 0.4837 0.4714 0.2157 0.4790 0.4743
HM
±0.0706 ±0.0921 ±0.0900 ±0.0679 ±0.0920 ±0.0903
0.1518 0.4852 0.4717 0.2335 0.4774 0.4690
HH
±0.0681 ±0.0905 ±0.0917 ±0.0619 ±0.0863 ±0.0880
aumenta la densidad tanto de BSs como de UEs. Es decir, a estaciones base que serán necesarios para la quinta generación
medida que las instancias se hacen más grandes y complejas, de sistemas de telecomunicación. Se ha formulado como un
el efecto del operador es mucho más determinante. Esto es problema de optimización multi-objetivo en el que se ha de
además consistente para ambos algoritmos, ya que NSGA-II minimizar el consumo (número de BSs activas), a la vez que
y MOCell tienen unos promedios de HV de 0.1313 y 0.2390 se ha de aumentar la capacidad (GBps en downlink). Se ha
en las instancias HX, respectivamente, cuando las versiones propuesto un nuevo operador de búsqueda local, llamado CSO,
hı́bridas están en torno a 0.4935 y 0.4902. que se ha integrado dentro de dos algoritmos del dominio, uno
Un último efecto del operador CSO sobre los algoritmos muy bien conocido, NSGA-II, y otro más reciente, pero que ha
es que reduce e incluso invierte las mejoras en la búsqueda resultado en una mejor exploración del espacio de búsqueda,
existentes entre NSGA-II y MOCell. Con esto nos referimos denominado MOCell. Las versiones hı́bridas, NSGA-IICSO
a que, tanto en el trabajo previo [9], como en los valores y MOCellCSO , han alcanzado aproximaciones al frente de
del HV alcanzados por los algoritmos canónicos, MOCell Pareto del problema con una mejora notable en el indicador
supera claramente a NSGA-II. Sin embargo, cuando se usa el HV, si bien las attainment surfaces han mostrado que el
operador CSO, la situación se invierte, y es NSGA-II el que operado ha centrado la búsqueda en zonas con UDNs que
obtiene valores más altos de este indicador. Las diferencias activan un bajo número de BSs, y también de menor capacidad.
son mı́nimas y estadisticamente no significativas según el test Como trabajo futuro se pretende seguir diseñando operadores
de Tukey, pero viene a poner de manifiesto que el motor de de búsqueda que equilibren ambos objetivos, ası́ como el
búsqueda de NSGA-II ha integrado mejor el operador CSO. impacto de los mismos en otras metaheurı́sticas multi-objetivo
La corroboración gráfica de lo que muestra el HV se puede del dominio.
observar en las attainment surfaces (Fig. 1). A medida que
R ECONOCIMIENTOS
los escenarios son más densos, las aproximaciones medianas
al frente de las versiones canónicas se van separando cada Este trabajo ha sido financiado parcialmente por el Minis-
vez más de las versiones hı́bridas. Sin embargo, se aprecia terio de Economı́a y Competitividad y los fondos FEDER
un efecto que el HV oculta, y de ahı́ la importancia de con los proyectos TIN2016-75097-P, TIN2014-56494-C4-3-
tener representaciones gráficas de los frentes obtenidos: las P, TIN2017-85727-C4-2-P y TEC2015-68752. Francisco Luna
versiones hı́bridas muestrean mucho más las zonas del espacio también agradece la ayuda de la Universidad de Málaga
de búsqueda que contienen pocas BSs activas (áreas más hacia y el proyecto PPIT.UMA.B12017/15 del I Plan Propio de
la izquierda), pero las versiones canónicas obtienen soluciones Investigación y Transferencia.
R EFERENCIAS
no-dominadas con muchas BSs operativas (mayor consumo),
pero también de mayor capacidad (áreas más a la izquierda). [1] Ericsson, “Mobility Report,” White Paper, no. June, 2017.
[Online]. Available: https://www.ericsson.com/assets/local/mobility-
Esto está provocado porque el operador CSO, en realidad, sólo report/documents/2017/ericsson-mobility-report-june-2017.pdf
mejora uno de los objetivos (consumo), descuidando el otro [2] D. Lopez-Perez, M. Ding, H. Claussen, and A. H. Jafari, “Towards 1
(capacidad). Gbps/UE in Cellular Systems: Understanding Ultra-Dense Small Cell
Deployments,” IEEE Communications Surveys & Tutorials, vol. 17,
V. C ONCLUSIONES no. 4, pp. 2078–2101, 2015.
[3] X. Ge, S. Tu, G. Mao, C.-X. Wang, and T. Han, “5G Ultra-Dense
Este trabajo se ha planteado la resolución del apagado Cellular Networks,” IEEE Wireless Communications, vol. 23, no. 1, pp.
de celdas en el contexto de los despliegues ultradensos de 72–79, feb 2016.
669
500 900 1100

450 800 1000
Capacidad (Gbps)
Capacidad (Gbps)
Capacidad (Gbps)
400 700 900
350 600 800
700
300 500
600
250 400
500
200 NSGA-II 300 NSGA-II 400 NSGA-II
150 NSGA-IICSO 200 NSGA-IICSO 300 NSGA-IICSO
100 MOCell 100 MOCell MOCell
MOCellCSO MOCellCSO 200 MOCellCSO
50 0 100
0 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80 90
BSs activas BSs activas BSs activas
(a) Escenario LL (b) Escenario LM (c) Escenario LH
700 1400 1800

600 1200 1600
Capacidad (Gbps)
Capacidad (Gbps)
Capacidad (Gbps)
1400
500 1000
1200
400 800 1000
300 600 800
NSGA-II NSGA-II 600 NSGA-II
200 400
NSGA-IICSO NSGA-IICSO 400 NSGA-IICSO
100 MOCell 200 MOCell 200 MOCell
MOCellCSO MOCellCSO MOCellCSO
0 0 0
0 10 20 30 40 50 60 70 80 90 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
(d) Escenario ML (e) Escenario MM (f) Escenario MH
900 1800 2500

800 1600
Capacidad (Gbps)
Capacidad (Gbps)
Capacidad (Gbps)
1400 2000
700
600 1200
1500
1000
500
800
400 1000
NSGA-II 600 NSGA-II NSGA-II
300 NSGA-IICSO 400 NSGA-IICSO NSGA-IICSO
500
200 MOCell 200 MOCell MOCell
MOCellCSO MOCellCSO MOCellCSO
100 0 0
0 20 40 60 80 100 120 0 20 40 60 80 100120140160180 0 20 40 60 80 100120140160180200
(g) Escenario HL (h) Escenario HM (i) Escenario HH
Figura 1: Attaiment surfaces de NSGA-II, MOCell y sus versiones hı́bridas, NSGA-IICSO y MOCellCSO , para los 9 escenarios
considerados
[4] Q.-N. Le-The, T. Beitelmal, F. Lagum, S. S. Szyszkowicz, and H. Ya- objective cellular genetic algorithm,” in IEEE 5G World Forum, 9-11
nikomeroglu, “Cell Switch-Off Algorithms for Spatially Irregular Base July, Santa Clara, USA, 2018, pp. 422–426.
Station Deployments,” IEEE Wireless Communications Letters, vol. 6, [10] K. Deb, A. Pratap, S. Agarwal, and T. Meyarivan, “A fast and elitist
no. 3, pp. 354–357, jun 2017. multiobjective genetic algorithm: NSGA-II,” IEEE Transactions on
[5] F. Lagum, Q.-N. Le-The, T. Beitelmal, S. S. Szyszkowicz, and H. Ya- Evolutionary Computation, vol. 6, no. 2, pp. 182 – 197, 2002.
nikomeroglu, “Cell Switch-Off for Networks Deployed With Variable [11] A. J. Nebro, J. J. Durillo, F. Luna, B. Dorronsoro, and E. Alba, “Mocell:
Spatial Regularity,” IEEE Wireless Communications Letters, vol. 6, no. 2, A cellular genetic algorithm for multiobjective optimization,” Int. J. of
pp. 234–237, apr 2017. Intelligent Systems, vol. 24, no. 7, pp. 723 – 725, 2009.
[6] D. Gonzalez G., J. Hamalainen, H. Yanikomeroglu, M. Garcia-Lozano, [12] M. Mirahsan, R. Schoenen, and H. Yanikomeroglu, “HetHetNets: He-
and G. Senarath, “A Novel Multiobjective Cell Switch-Off Framework terogeneous Traffic Distribution in Heterogeneous Wireless Cellular
for Cellular Networks,” IEEE Access, vol. 4, pp. 7883–7898, 2016. Networks,” IEEE Journal on Selected Areas in Communications, vol. 33,
[7] C. Blum and A. Roli, “Metaheuristics in combinatorial optimiza- no. 10, pp. 2252–2265, 2015.
tion: Overview and conceptual comparison,” ACM Computing Surveys, [13] E. Zitzler and L. Thiele, “Multiobjective evolutionary algorithms: a
vol. 35, no. 3, pp. 268–308, 2003. comparative case study and the strength pareto approach,” IEEE Trans.
[8] D. Gonzalez Gonzalez, E. Mutafungwa, B. Haile, J. Hämäläinen, and Evolutionary Computation, vol. 3, no. 4, pp. 257–271, 1999.
H. Poveda, “A Planning and Optimization Framework for Ultra Dense [14] J. Knowles, “A summary-attainment-surface plotting method for visua-
Cellular Deployments,” Mobile Information Systems, vol. 2017, pp. 1– lizing the performance of stochastic multiobjective optimizers,” in 5th
17, 2017. International Conference on Intelligent Systems Design and Applications
[9] F. Luna, J. F. Valenzuela-Valdés, R. Luque-Baena, J. M. Cruz, and (ISDA’05), 2005, pp. 552 – 557.
P. Padilla, “Addressing the 5g cell switch-off problem with a multi-
670
MOEA-EFEP: Un algoritmo evolutivo

multi-objetivo para la extracción de patrones
emergentes difusos
A.M. Garcia-Vico, C.J. Carmona, P. González, M.J. del Jesus
Departamento de Informática, Instituto Andaluz Interuniversitario en Data Science and Computational Intelligence
Universidad de Jaén, Jaén, España
{agvico|ccarmona|pglez|mjjesus}@ujaen.es
Resumen—Este trabajo es un resumen del publicado por los

autores en la revista IEEE Transactions on Fuzzy Systems [1] en
el que se presenta un nuevo modelo evolutivo multi-objetivo para 
la extracción de patrones emergentes difusos con un gran balance 0,
 Si Sop1 (X) = Sop2 (X) = 0,
entre la capacidad descriptiva de los mismos y su fiabilidad. GR(X) = ∞, Si Sop1 (X) = 0 ∧ Sop2 (X) 6= 0,
Index Terms—Descubrimiento de reglas descriptivas supervisa-  Sop2 (X) ,

en otro caso
Sop1 (X)
das, minerı́a de patrones emergentes, algoritmos evolutivos multi-
(1)
objetivo, sistemas difusos evolutivos.
donde Sopi (X) indica el soporte del patrón X en el con-
junto de datos i. EPM tiene como objetivos principales la
I. R ESUMEN descripción de caracterı́sticas discriminativas entre clases, la
descripción de fenómenos emergentes en datos temporales,
Tradicionalmente, en minerı́a de datos se distinguen dos donde el primero de estos objetivos ha sido el más desarrollado
enfoques claramente diferenciados: un enfoque predictivo, a lo largo de la literatura.
cuyo objetivo es la obtención de un modelo para la predicción El principal problema de la extracción de patrones emergen-
del valor de una variable de interés en nuevas instancias tes reside en su propia definición, ya que definen un espacio
no vistas hasta el momento, utilizando para ello aprendizaje de búsqueda que no es convexo debido a que el GR es una
supervisado; y un enfoque descriptivo con el objetivo de crear proporción de soportes [9]. Esto permite que aquellos patrones
un modelo que describa relaciones interesantes en los datos con soportes más altos puedan tener un GR menor que aquellos
utilizando para ello habitualmente aprendizaje no supervisado. patrones con soportes menores. Por esta razón a lo largo de
Sin embargo, a lo largo de la literatura se han ido desarrollando la literatura se han desarrollado diferentes tipos de patro-
una serie de técnicas que se encuentran a medio camino entre nes emergentes, como por ejemplo los patrones emergentes
ambos enfoques, agrupadas bajo el nombre de “descubrimiento Jumping [10] o los patrones emergentes χ2 [11]. Asimismo,
de reglas descriptivas basadas en aprendizaje supervisado” se han desarrollado diferentes técnicas de extracción como
(SDRD) [2], [3] cuyo propósito es la obtención de un modelo las técnicas basadas en lı́mites o en árboles con el objetivo
descriptivo con de conocimiento relevante sobre una variable de extraer de manera eficiente aquellos de mayor calidad y
de interés en un conjunto de datos. poder discriminativo. Sin embargo, la gran mayorı́a de estos
El principal objetivo de las técnicas SDRD no es la extrac- métodos han sido completamente enfocados a clasificación
ción de un modelo con el fin de clasificar nuevas instancias, ignorando por completo las capacidades descriptivas de los
sino la obtención de un modelo que permita describir de mismos. No obstante, en los últimos años se han desarrollado
una manera simple y fácilmente comprensible el fenómeno técnicas basadas en algoritmos evolutivos que han permitido la
subyacente en los datos por parte de los expertos. Por tanto, extracción de patrones emergentes con un buen balance entre
en este grupo de tareas se agrupan todas aquellas técnicas las capacidades descriptivas y la fiabilidad de las mismas [8].
de minerı́a de datos que utilizan un modelo de reglas y Nuestra aportación a la literatura es un algoritmo genético
aprendizaje supervisado para obtener conocimiento descriptivo multi-objetivo que permite la extracción de patrones emer-
sobre los datos, como por ejemplo el descubrimiento de gentes difusos llamado MOEA-EFEP (Multi-Objective Evolu-
subgrupos [4], [5], la minerı́a de conjuntos de contraste [6] tionary Algorithm for the Extraction of Fuzzy Emerging Pat-
o la minerı́a de patrones emergentes [7], [8], entre otras. terns). MOEA-EFEP utiliza lógica difusa para el tratamiento
La minerı́a de patrones emergentes (EPM) se define como de variables de tipo numérico con el fin de evitar pérdidas de
la búsqueda de todos los patrones que, dados dos conjuntos de información y mejorar la interpretabilidad de los resultados.
datos D1 y D2 , tengan un ı́ndice de crecimiento (GR) mayor Asimismo, MOEA-EFEP está basado en el algoritmo multi-
a un umbral ρ > 1. Este ı́ndice de crecimiento se define como objetivo NSGA-II [12], el cual ha sido modificado para que el
la siguiente función: proceso de búsqueda esté orientado a la extracción de patrones
671
emergentes de gran calidad, es decir, un conjunto de patrones entre generalidad y fiabilidad de los resultados. Por otro lado,
simple, con gran capacidad de generalización y fiable. se demostró la calidad de las reglas extraı́das mediante el uso
En concreto, MOEA-EFEP emplea un enfoque “cromosoma del filtro de post-procesamiento basado en valores de confianza
= regla” en el que un individuo de la población representa una mayores al 60 %. Por último, MOEA-EFEP superó de manera
regla potencial y el resultado final es el conjunto formado por significativa al resto de métodos comparados en cuanto a la
la unión de varios individuos. En este punto, es importante generalidad de las reglas descriptivas con una fiabilidad similar
remarcar que MOEA-EFEP representa tanto el antecedente utilizando para ello un número de reglas mucho menor. Por lo
como el consecuente de la regla por lo que puede extraer tanto, MOEA-EFEP es un algoritmo que obtiene un modelo
patrones emergentes para todas las clases del problema en de patrones emergentes con el mejor balance generalidad-
una única ejecución. Asimismo, se permite el uso de dos fiabilidad ası́ como el modelo de reglas más simple.
representaciones del conocimiento diferentes en función de
AGRADECIMIENTOS
las necesidades del problema: reglas canónicas, formadas por
conjunciones de pares atributo-valor o bien reglas en forma Este trabajo ha sido subvencionado por el Ministerı́o de
normal disyuntiva (DNF) donde se permite que un atributo Economı́a y Competitividad bajo el proyecto TIN2015-68454-
pueda tener más de un posible valor mediante disyunciones. R y el contrato predoctoral FPI referencia BES-2016-077738
Los individuos de la población interactúan entre si mediante asociado al mismo (Fondos FEDER).
el uso de un enfoque cooperativo-competitivo. Este enfoque se R EFERENCIAS
basa, por un lado, en la competición propia de un algoritmo
[1] A. M. Garcı́a-Vico, C. J. Carmona, P. González, and M. J. del Jesus,
evolutivo a través de los operadores genéticos. Dichos opera- “Moea-efep: Multi-objective evolutionary algorithm for extracting fuzzy
dores son, en concreto, un operador de inicialización guiada, emerging patterns,” IEEE Transactions on Fuzzy Systems, In Press.
que genera individuos con pocas variables y, por tanto, muy [2] P. Kralj-Novak, N. Lavrac, and G. I. Webb, “Supervised Descriptive
Rule Discovery: A Unifying Survey of Constrast Set, Emerging Pateern
generales; un operador de cruce multi-punto; un operador de and Subgroup Mining,” Journal of Machine Learning Research, vol. 10,
mutación orientada con capacidad para eliminar o modificar pp. 377–403, 2009.
aleatoriamente un gen de un individuo; y el operador de [3] C. J. Carmona, M. J. del Jesus, and F. Herrera, “A Unifying Analysis
for the Supervised Descriptive Rule Discovery via the Weighted Relative
reemplazo de la población basado en la ordenación rápida Accuracy,” Knowledge-Based Systems, vol. 139, pp. 89–100, 2018.
por frentes de dominancia propia del algoritmo NSGA-II. [4] W. Kloesgen, “Explora: A Multipattern and Multistrategy Discovery
Asimismo, se utiliza una población élite y un mecanismo de Assistant,” in Advances in Knowledge Discovery and Data Mining.
American Association for Artificial Intelligence, 1996, pp. 249–271.
competición adicional basado en el proceso de competición [5] S. Wrobel, “An Algorithm for Multi-relational Discovery of Subgroups,”
de tokens [13]. En la actualización de esta población élite in Proc. of the 1st European Symposium on Principles of Data Mining
es cuando los individuos cooperan entre sı́ con el objetivo and Knowledge Discovery, ser. LNAI, vol. 1263. Springer, 1997, pp.
78–87.
de obtener una población élite con la atipicidad [3] media [6] S. D. Bay and M. J. Pazzani, “Detecting group differences: Mining
más elevada. Esta población élite se actualiza en el operador contrast sets,” Data Mining and Knowledge Discovery, vol. 5, no. 3, pp.
de reinicialización, que se activa si la población actual no ha 213–246, 2001.
[7] G. Z. Dong and J. Y. Li, “Efficient Mining of Emerging Patterns:
sido capaz de cubrir ejemplos no cubiertos anteriormente por Discovering Trends and Differences,” in Proc. of the 5th ACM SIGKDD
un 5 % del total de las evaluaciones totales con el objetivo de International Conference on Knowledge Discovery and Data Mining.
evitar estancamientos en óptimos locales. ACM Press, 1999, pp. 43–52.
[8] A. M. Garcı́a-Vico, C. J. Carmona, D. Martı́n, M. Garcı́a-Borroto,
Finalmente, una vez termina el proceso evolutivo, se realiza and M. J. del Jesus, “An overview of emerging pattern mining in
un filtro de post-procesamiento con el fin de eliminar aquellas supervised descriptive rule discovery: Taxonomy, empirical study, trends
reglas que no tengan una calidad suficiente para el experto. and prospects,” WIREs: Data Mining and Knowledge Discovery, vol. 8,
no. 1, 2018.
En concreto, para el algoritmo MOEA-EFEP se proponen tres [9] L. Wang, H. Zhao, G. Dong, and J. Li, “On the complexity of finding
filtros diferentes: obtener patrones con un valor de confianza emerging patterns,” in Proc. of the 28th Annual International Computer
superior al 60 %, obtener sólo patrones minimales u obtener Software and Applications Conference, vol. 2, 2004, pp. 126–129.
[10] G. Z. Dong, J. Y. Li, and X. Zhang, “Discovering jumping emerging
sólo patrones maximales. patterns and experiments on real datasets,” in Proc. on International
La validez del método propuesto se estudia a través de un Database Conference Heterogeneous and Internet Databases, 1999, pp.
exhaustivo estudio experimental con 50 conjuntos de datos con 155–168.
[11] K. Ramamohanarao and H. Fan, “Patterns Based Classifiers,” World
tres objetivos diferentes: por un lado, se plantea la elección Wide Web, vol. 10, no. 1, pp. 71–83, 2007.
de la mejor representación del conocimiento; por otro, se [12] K. Deb, A. Pratap, S. Agrawal, and T. Meyarivan, “A fast and elitist
plantea la elección del mejor filtrado de post-procesamiento y, multiobjective genetic algorithm: NSGA-II,” IEEE Transactions Evolu-
tionary Computation, vol. 6, no. 2, pp. 182–197, 2002.
finalmente, se compara MOEA-EFEP con aquellos métodos [13] K. S. Leung, Y. Leung, L. So, and K. F. Yam, “Rule Learning in
más relevantes para EPM en función de su metodologı́a de Expert Systems Using Genetic Algorithm: 1, Concepts,” in Proc. of
extracción de patrones tal y como se expone en [8]. Todos los the 2nd International Conference on Fuzzy Logic and Neural Networks,
K. Jizuka, Ed., 1992, pp. 201–204.
resultados obtenidos han sido avalados mediante el uso de test
estadı́sticos no-paramétricos.
En el estudio experimental realizado se demuestra que la
capacidad de las reglas en forma normal disyuntiva para la
extracción de patrones emergentes con un mayor equilibrio
672
Bioinspirados
(XIII MAEB)
A LGORITMOS PARALELOS
Organizadores:
E NRIQUE A LBA Y GABRIEL LUQUE
Explotación de Paralelismo Multinivel e Hı́brido en

Metaheurı́sticas Hı́bridas
José M. Cecilia, Baldomero Imbernón
Bioinformatics and High Performance Computing Research Group (BIO-HPC)
Polytechnic School, University Católica San Antonio of Murcia (UCAM)
Murcia, Spain
{jmcecilia,bimbernon}@ucam.edu
Javier Cuenca José-Matı́as Cutillas-Lozano, Domingo Giménez

Department of Engineering and Technology of Computers Department of Computing and Systems
University of Murcia University of Murcia
Murcia, Spain Murcia, Spain
[email protected] {josematias.cutillas,domingo}@um.es
Resumen—Los sistemas computacionales actuales están forma- Integrated Core), por lo que se está trabajando en la adaptación
dos por nodos que comprenden CPUs multicore junto con uno o y optimización de software para este tipo de sistemas hı́bridos,
varios coprocesadores (normalmente GPUs pero ocasionalmente y, en particular, hay trabajos sobre metaheurı́sticas para GPU
también MICs), de forma que se dispone de un sistema hı́brido
y heterogéneo. Por otro lado, el desarrollo de metaheurı́sticas [9], [10]. Además, el hardware sobre el que se trabaja es
hı́bridas y de hiperheurı́sticas que trabajan sobre ellas también hı́brido y heterogéneo, con elementos computacionales con
sigue una estructura hı́brida, en la que se puede explotar arquitecturas distintas, en distinto número y distinta velocidad,
paralelismo multinivel para llevar a cabo computaciones con y está organizado en muchos casos de forma jerárquica (un
distinto volumen de cómputo (heterogéneas). En este trabajo cluster con nodos hı́bridos multicore+GPU, GPUs organizadas
analizamos la combinación de paralelismo hı́brido y heterogéneo
a los dos niveles, de software y de hardware, en la aplicación en grids y bloques...).
de metaheurı́sticas hı́bridas. Se realizan experimentos con la Esta situación propicia la lı́nea de trabajo que se presenta:
aplicación de metaheurı́sticas a dos problemas, uno de docking análisis de la combinación de las caracterı́sticas hı́bridas, hete-
de moléculas y otro de modelos de autoregresión vectorial, sobre rogéneas y jerárquicas de software y hardware para explotar el
nodos multicore+multiGPU. paralelismo y obtener beneficios en cuanto a reducir el tiempo
Index Terms—metaheurı́sticas, hiperheurı́sticas, paralelismo
hı́brido, paralelismo heterogéneo, docking de moléculas, modelos de ejecución o mejorar las soluciones obtenidas.
de autoregresión vectorial Trabajamos con metaheurı́sticas hı́bridas desarrolladas a
partir de un esquema parametrizado [11], que combina carac-
I. I NTRODUCCI ÓN terı́sticas de metaheurı́sticas distribuidas y de búsqueda local, y
se ha aplicado a diversidad de problemas: p-hub, asignación de
Las metaheurı́sticas se utilizan para la aproximación de
tareas a procesos, y modelado de ecuaciones simultáneas [11];
soluciones de problemas de gran dificultad computacional [1]–
consumo de electricidad en explotación de pozos de agua [12];
[3]. Hay variedad de métodos metaheurı́sticos, básicamente
determinación de constantes en ecuaciones cinéticas [13], etc.
agrupados en dos clases: distribuidos o basados en poblaciones
Además, al estar el esquema parametrizado, se puede utilizar
[4], [5], y de búsqueda local, y también métodos hı́bridos
para diseñar hiperheurı́sticas que buscan en el espacio de los
[6], [7] que combinan las caracterı́sticas de diferentes me-
parámetros que determinan las metaheurı́sticas [14].
taheurı́sticas para una mejor adaptación al problema con el
El esquema parametrizado se puede ampliar a esquemas
que se trabaja. Ası́, el software es hı́brido al combinar distintas
paralelos que incluyen parámetros de paralelismo dependiendo
técnicas, y heterogéneo en el sentido de que cada uno de sus
del sistema computacional destino (memoria compartida [15]
componentes tiene un coste computacional distinto.
o paso de mensajes [16]), con una paralelización unificada
Con la aparición de la computación paralela se han de-
para las distintas metaheurı́sticas hı́bridas del esquema.
sarrollado versiones paralelas de las metaheurı́sticas, o nuevas
Analizamos la adaptación del esquema metaheurı́stico
metaheurı́sticas paralelas [8]. Los nodos de la mayorı́a de
parametrizado a sistemas más complejos: nodos multico-
los sistemas computacionales actuales están formados por
re+multiGPU, posiblemente con GPUs de distintas carac-
sistemas multinúcleo junto con coprocesadores, que son prin-
terı́sticas. Y los problemas a los que se aplican las me-
cipalmente GPUs (Graphics Processing Unit)) y MICs (Many
taheurı́sticas tienen una caracterı́stica que facilita el uso efi-
Subvencionado por MINECO y fondos FEDER de la Comisión Europea, ciente de la alta capacidad computacional de los coprocesa-
TIN2015-66972-C5-3-R y TIN2016-78799-P (AEI/FEDER, UE). dores: alto coste de cálculo del fitness, que puede delegarse a
675
las GPUs. III. E SQUEMAS PARALELOS PARA

Se utilizan dos problemas: docking de moléculas y mode- MULTICORE + MULTI GPU
lado de autoregresión vectorial; y un tercer problema es la
búsqueda por medio de hiperheurı́sticas (programadas como Hemos desarrollado esquemas paralelos para memoria com-
metaheurı́sticas) de metaheurı́sticas apropiadas para estos dos partida [15] y paso de mensajes [16], y hemos analizado
problemas básicos. El mayor coste computacional reside en la utilización de esquemas parametrizados en la resolución
el cálculo del fitness, y en las hiperheurı́sticas el cálculo del de problemas particulares en nodos con coprocesadores. Por
fitness se hace a su vez con la aplicación de metaheurı́sticas ejemplo, en [17] se analiza la aplicación de hiperheurı́sticas
al problema básico. al problema de docking en un MIC. El esquema paralelo
El resto del trabajo está estructurado de la siguiente manera. es el de memoria compartida, pero los MIC pueden ser
La Sección II muestra el esquema metaheurı́stico parame- considerados manycore más que multicore al ser el número de
trizado que se utiliza, y se comentan las caracterı́sticas de procesos mucho más elevado, y esto hace que la explotación
las hiperheurı́sticas sobre este esquema. Las posibilidades del paralelismo a varios niveles (en la hiperheurı́stica y las
de paralelización del esquema para multicore+multiGPU se metaheurı́sticas donde ella busca) sea más adecuado para estos
comentan en la Sección III. Los dos problemas básicos usados sistemas.
como casos de prueba se describen en la Sección IV, y la En el caso de la explotación de paralelismo de GPUs el
Sección V muestra algunos resultados experimentales en la esquema paralelo es distinto de los dos anteriores, pues la
aplicación a los dos problemas básicos y a hiperheurı́sticas programación en GPUs sigue un modelo SIMD. El desarrollo
para el problema del docking. Las conclusiones y posibles de metaheurı́sticas para GPUs es un campo de investigación
trabajos futuros se resumen en la Sección VI. actual [9], [10], y hemos utilizado el esquema parametrizado
para el problema del docking en nodos con GPUs, ya sean
II. E SQUEMA PARAMETRIZADO DE M ETAHEUR ÍSTICAS E locales o virtualizadas [18], lo que acelera la computación y
H IPERHEUR ÍSTICAS facilita encontrar soluciones mejores en menor tiempo.
Resumimos las ideas generales de los esquemas me- En este trabajo analizamos por primera vez el diseño de
taheurı́sticos parametrizados usados en este trabajo. Se pueden metaheurı́sticas parametrizadas de forma general para explotar
encontrar más detalles del esquema, de su aplicación a varios toda la capacidad computacional que proporcionan los nodos
problemas de optimización y un estudio estadı́stico de la multicore+multiGPU. Para analizar el problema de forma
influencia de los parámetros en [11]. El esquema se muestra en general consideramos dos problemas, que además tienen alto
el Algoritmo 1. Incluye Parámetros Metaheurı́sticos en cada coste computacional, lo que es necesario para que la explota-
una de las funciones básicas. No es un esquema general que ción eficiente de los coprocesadores muestre todo su potencial.
incluya todas las posibles metaheurı́sticas (incontables) sino Las metaheurı́sticas y las hiperheurı́sticas que trabajan sobre
que depende de la implementación de las funciones básicas ellas siguen el mismo esquema parametrizado (algoritmos 1 y
y de los parámetros que se incluyan en ellas. Instancias 2), con diferencias en la implementación de las funciones y
concretas de los parámetros pueden dar lugar a metaheurı́sticas los parámetros, dependiendo del problema subyacente a que
básicas o a hibridaciones suyas. Por ejemplo, en [11] se se aplican. Ası́, la versión de memoria compartida es común
implementan versiones de Algoritmos Genéticos, Búsqueda a metaheurı́sticas e hyperheurı́sticas (Algoritmo 3), y consiste
Dispersa y GRASP (Greedy Randomized Adaptive Search en la paralelización independiente de las funciones básicas
Procedure), y otras de las referencias mencionadas incluyen del esquema, con inclusión de parámetros de paralelismo
también Búsqueda Tabú. La mayorı́a de los parámetros son que determinan el número de hilos a usar en cada función.
generales para el esquema, pero puede haber algunos propios Hay funciones donde se tratan varios elementos dentro de un
del problema al que se aplican las metaheurı́sticas. Una bucle, y se paraleliza el bucle estableciendo un determinado
descripción detallada se encuentra en las referencias previas. número de hilos. En las funciones de mejora se tratan varios
Las hiperheurı́sticas que consideramos son a la vez me- elementos, en un bucle que se paraleliza con un cierto número
taheurı́sticas con el mismo esquema parametrizado, pero el de hilos, y para cada elemento se analiza su vecindad, lo que
significado de los parámetros es distinto, ya que depende se hace con otro bucle con un número de hilos diferente en
del problema al que se aplican, que en este caso es el un segundo nivel de paralelismo. Como las hiperheurı́sticas
de búsqueda de metaheurı́sticas hı́bridas satisfactorias para llaman a metaheurı́sticas para el cálculo del fitness, llegamos
el problema básico considerado. El esquema metaheurı́stico a tener en algunos casos hasta cuatro niveles de paralelismo, y
para implementar hiperheurı́sticas se muestra en el Algorit- se podrı́a determinar en número de hilos en cada nivel para la
mo 2. Es igual al del Algoritmo 1 con la única diferencia mayor reducción del tiempo de ejecución teniendo en cuenta
los elementos con los que se trabaja (ahora son vectores las caracterı́sticas del sistema computacional [17].
de parámetros metaheurı́sticos) y el fitness asociado a cada En sistemas con paralelismo hı́brido multicore+multiGPU el
elemento (metaheurı́stica), que se obtiene con la aplicación código correrá en la CPU, que delegará a GPU partes con alto
de la metaheurı́stica representada por el vector de parámetros coste computacional. El paralelismo de GPU puede explotarse
metaheurı́sticos a uno o varios problemas de entrenamiento. a distintos niveles de entre los que aparecen en el esquema de
Algunas formas de calcular el fitness se discuten en [14]. memoria compartida. Los datos con los que trabajar en GPU se
676
Algorithm 1 Esquema metaheurı́stico parametrizado
Initialize(S,ParamIni) //Generación del conjunto inicial, posiblemente con mejora de elementos
while (not EndCondition(S,ParamEnd)) do
SS=Select(S,ParamSel) //Selección de elementos para combinación
SS1=Combine(SS,ParamCom) //Combinación de pares de elementos
SS2=Improve(S,SS1,ParamImp) //Mejora de algunos elementos, posiblemente con diversificación
S=Include(S,SS1,SS2,ParamInc) //Actualización del conjunto de referencia
end while
Algorithm 2 Esquema metaheurı́stico parametrizado para la implementación de hiperheurı́sticas

Initialize(S,ParamIni) //Generación de un conjunto inicial de metaheurı́sticas
SS=Select(S,ParamSel) //Selección de metaheurı́sticas para combinación
SS1=Combine(SS,ParamCom) //Combinación de pares de metaheurı́sticas para obtener nuevas metaheurı́sticas
SS2=Improve(S,SS1,ParamImp) //Mejora y diversificación de metaheurı́sticas para obtener otras más apropiadas
para el problema con que se trabaja
S=Include(S,SS1,SS2,ParamInc) //Actualización del conjunto de metaheurı́sticas
end while
Algorithm 3 Versión de Memoria Compartida del esquema metaheurı́stico parametrizado

Initialize(S,ParamIni,HilosIni) //Número de hilos en la generación, y número de hilos sobre los elementos a
mejorar y un segundo nivel para hilos que analizan la vecindad
SS=Select(S,ParamSel,HilosSel) //Número de hilos en bucle de selección
SS1=Combine(SS,ParamCom,HilosCom) //Número de hilos en bucle de combinación
SS2=Improve(S,SS1,ParamImp,HilosImp) //Número de hilos sobre los elementos a mejorar o diversificar, y un
segundo nivel para hilos que analizan la vecindad
S=Include(S,SS1,SS2,ParamInc,HilosInc) //Número de hilos en bucles para tratar los elementos a incluir
end while
transfieren de CPU a GPU, y los resultados a la inversa, y las Además, algunas funciones conllevan comparaciones y
transferencias CPU-GPU pueden ser costosas, por lo que habrá bifurcaciones en el análisis de la vecindad, por lo que,
que realizar implementaciones donde se solapen computación de nuevo, no tenemos un modelo SIMD.
y transferencias, y además el volumen de trabajo a realizar en En un siguiente nivel las GPUs se utilizarı́an para el
GPU en cada llamada debe ser grande. Algunos niveles a los cálculo del fitness. Como en algunas funciones hay que
que pueden trabajar las GPUs en el esquema del Algoritmo 3 calcular el fitness de los objetos obtenidos (en la gene-
son: ración inicial, al combinar, al analizar vecindades en las
funciones de mejora), se pueden agrupar los cálculos de
El mayor nivel corresponde al esquema de islas, con los fitness de todos los elementos, que se realizarı́an de
una isla por GPU en un sistema multicore+multiGPU, nuevo en un bucle, con cada hilo delegando el cálculo de
dividiendo los conjuntos en subconjuntos y asignando un elemento a la GPU que tiene asociada. De esta forma
cada subconjunto a una GPU. El trabajo que se delega a el trabajo que realizan las GPUs puede seguir el modelo
las GPU es de propsito general y no sigue el modelo SIMD si el cálculo del fitness se realiza a través de
SIMD, que es el más adecuado para obtener buenas funciones matriciales, como es el caso de los problemas
prestaciones en GPU. con los que experimentamos en este trabajo.
Si bajamos a nivel de paralelización dentro de cada En un último nivel serı́an todas las GPUs las que co-
función básica, el esquema se ejecuta en CPU y las laboraran en el cálculo del fitness de cada individuo.
funciones trabajan sobre elementos por medio de bucles, Podrı́a ser una buena opción cuando este cálculo tenga
con cada iteración del bucle realizada por un hilo. Cada un alto coste computacional, lo que puede ocurrir con
hilo puede tener asociada una GPU a la que delega el las hiperheurı́sticas, donde el cálculo conlleva la aplica-
tratamiento del elemento, que se transfiere a la GPU, que ción completa de una metaheurı́stica a una instancia del
devuelve a CPU el resultado. Las funciones básicas tienen problema básico.
costes distintos, por lo que habrá que determinar para
cada una, dependiendo de cómo esté implementada, si es La mejor opción puede ser una combinación de las dos
conveniente delegar el trabajo a GPU o realizarlo en CPU. versiones intermedias, determinando el nivel al que trabajan las
677
GPU dependiendo del coste de la rutina básica y del número de IV-B. Modelos de Autoregresión Vectoriales
elementos que se trate en cada nivel. El Algoritmo 4 muestra Consideramos d parámetros de los que se han tomado
los puntos en los que se pueden usar las GPUs. Para cada valores en t instantes de tiempo. Los valores para el ins-
rutina se indica con CPU o GPU el componente donde se tante k, 1 ≤ k ≤ t, se almacenan en un vector y (k) =

ejecuta. Las rutinas sobre CPU usan paralelismo OpenMP. En (k) (k)
y1 , . . . , y d ∈ R1×d . Y los t vectores de datos se pueden
las rutinas de mejora hay que determinar en cuál de los dos
niveles de paralelismo es preferible utilizar las GPUs. organizar en una matriz Y ∈ Rt×d :
 
(1) (1)
Algorithm 4 Asignación de trabajo a CPU y GPU en y1 . . . yd
 . .. .. 
un esquema parametrizado de metaheurı́sticas para multico-  . . (1)
. . 


re+multiGPU (t)
y1
(t)
. . . yd
InitializeCPU(Sini,ParamIni)
ComputefitnessGPU(Sini,ParamIni) Consideramos también dependencias temporales con i ins-
ImproveGPU(Sini,Sref,ParamImpIni) //2 posibles niveles tantes de tiempo anteriores. Puede haber variables externas al
while not EndConditionCPU(Sref,ParamEndCon) do modelo, vector z, con e variables. La dependencia de vectores
SelectCPU(Sref,Ssel,ParamSel) de datos de un instante j en función de los vectores de datos
CombineCPU(Ssel,Scom,ParamCom) de instantes anteriores (hasta i para las variables internas y k
ComputefitnessGPU(Scom,ParamCom) para las externas) se puede representar como
DiversifyCPU(Sref,Scom,Sdiv,ParamDiv)
ComputefitnessGPU(Sdiv,ParamDiv) y (j) ≈ y (j−1) A1 + y (j−2) A2 + . . . + y (j−i) Ai +
ImproveGPU(Scom,Sdiv,ParamImp) //2 posibles niveles
IncludeCPU(Scom,Sdiv,Sref,ParamInc) z (j−1) B1 + z (j−2) B2 + . . . + z (j−k) Bk + a (2)
end while donde Al , 1 ≤ l ≤ i, son matrices de dimensión d × d que
representan la dependencia de los datos con los valores de l
instantes anteriores, Bl , 1 ≤ l ≤ k, son matrices de tamaño
IV. P ROBLEMAS B ÁSICOS
e × d, y a es un vector de términos independientes.
Se comentan las caracterı́sticas generales de los dos proble- Cada elemento del espacio de búsqueda de una metaheurı́sti-
mas de optimización que se han utilizado en los experimentos. ca viene dado por los valores de las matrices A, B y a, y el
fitness se obtiene con multiplicaciones matriciales y la norma
IV-A. Docking de Moléculas de la diferencia entre los valores de la serie temporal (ecuación
Se dispone de una molécula de gran dimensión (receptor) 1) y los que se obtienen en cada instante de tiempo utilizando
y otra menor (ligando), y se quiere encontrar la mejor forma los instantes anteriores y dichas matrices (ecuación 2) [20].
en que el ligando se acopla con el receptor, de acuerdo con Ası́, también ahora las operaciones son apropiadas para el
una función de scoring. En la bibliografı́a se encuentran varias modelo SIMD, pero las dimensiones (d, e, i, k) son bastante
funciones que se pueden usar [19], y en ellas se mide el acopla- menores que en el problema anterior.
miento considerando cada átomo en el receptor y el ligando,
con lo que son funciones de alto coste y con un esquema V. R ESULTADOS E XPERIMENTALES
de cómputo regular, que es apropiado para ser utilizado en Se resumen los resultados de los experimentos realizados en
GPU. Cada posición del ligando viene determinada por tres nodos computacionales con CPUs y GPUs de distintos tipos
coordenadas para indicar la posición en el espacio de un átomo y uno de ellos con varias GPUS:
de referencia, y otras tres para indicar los giros con respecto a marte: contiene un hexa-core CPU AMD Phenom II X6
esta referencia; además, el ligando puede tener puntos donde 1075T a 3.00 GHz, con arquitectura x86-64, 16 GB de
se puede flexionar. Ası́, cada elemento viene determinado por RAM, cachés privadas L1 y L2 de 64 KB y 512 KB, y
las variables que indican la posición del ligando. Además, una caché L3 de 6 MB compartida por todos los núcleos.
hay varias regiones independientes (spots) en la superficie Incluye una GPU NVidia GeForce GTX 480 (Fermi) con
del receptor donde el ligando puede acoplarse, por lo que la 1536 MB de memoria global y 480 núcleos CUDA (15
búsqueda en los spots se realiza de forma idependiente, lo Streaming Multiprocessors y 32 Streaming Processors por
que significa que las metaheurı́sticas realizan la búsqueda con SM).
poblaciones independientes para cada spot. Teniendo en cuenta saturno: tiene 4 CPU Intel Xeon E7530 (hexa-core) a
que el número de spots puede ser de unos cientos, y el número 1.87 GHz, con arquitectura x86-64, 32 GB de RAM,
de átomos de receptor y ligando de unos miles y unos cientos, cachés privadas L1 y L2 de 32 KB y 256 KB por núcleo,
el coste computacional de la aplicación de metaheurı́sticas y una caché L3 de 12 MB compartida por los núcleos
a este problema es alto, y es conveniente la utilización de de cada socket. Incluye una GPU NVidia Tesla K20c
sistemas de altas prestaciones del tipo multicore+multiGPU, (Kepler) con 4800 MB de memoria global y 2496 núcleos
posiblemente con GPUs virtualizadas para disponer de mayor CUDA (13 Streaming Multiprocessors y 192 Streaming
potencia computacional [18]. Processors por SM).
678
jupiter: con 2 CPU Intel Xeon E5-2620 (hexa-core) a 1x1x6 6x1x1 3x2x1 2x3x1 1x6x1
2.00 GHz, con arquitectura x86-64, 32 GB de memoria 800
RAM, cachés privadas L1 y L2 de 32 KB y 256 KB 600
por núcleo, y una caché L3 de 15 MB compartida por 400
los núcleos en cada socket. Incluye 6 GPUs: 2 NVidia 200
Tesla C2075 (Fermi) con 5375 MB de memoria global y 0
448 núcleos CUDA (14 Streaming Multiprocessors y 32 venus marte jupiter saturno
Streaming Processors per SM), y 4 GPUs en dos placas,
cada una es una con 2 NVidia GeForce GTX 590 (Fermi) Figura 1. Tiempo de ejecución (segundos) con la versión de memoria
con 1536 MB de memoria global y 512 núcleos CUDA compartida para una hiperheurı́stica, con diferentes combinaciones de número
(16 Streaming Multiprocessors y 32 Streaming Processors de hilos en tres niveles de paralelismo, con un total de seis hilos y en los
cuatro nodos considerados.
por SM).
venus: con 2 CPU Intel Xeon E5-2620 (hexa-core) a
2.40 GHz, arquitectura x86-64, 64 GB de memoria RAM, Tabla II
C OMPARACI ÓN DEL TIEMPO DE EJECUCI ÓN ( EN SEGUNDOS ) DE TRES
cachés privadas L1 y L2 de 32 KB y 256 KB por núcleo, y HIPERHEUR ÍSTICAS CON PARALELISMO DE MEMORIA COMPARTIDA EN
una caché L3 de 15 MB compartida por todos los núcleos CPU Y CON PARALELISMO GPU, EN LOS CUATRO NODOS CONSIDERADOS .
de un socket. Incluye una GPU NVidia GeForce GT 640
H1 H2 H3
(Kepler) con 1024 MB de Global Memory y 384 núcleos marte
CUDA (2 Streaming Multiprocessors y 192 Streaming multicore 13035 4541 23957
Processors por SM). multicore+GPU 903 335 1348
CPU/GPU 14.44 13.56 17.77
La Tabla I compara los tiempos obtenidos en jupiter con venus
paralelismo GPU (sólo se usa una Tesla C2075) y con CPU multicore 4021 1423 6346
con un núcleo, para seis metaheurı́sticas hı́bridas aplicadas al multicore+GPU 3197 1857 5065
CPU/GPU 1.26 0.77 9.67
problema de docking de moléculas con el par receptor-ligando jupiter
COMT (se pueden consultar los detalles en [21]). Se alcanza multicore 8045 3509 14115
un speed-up de GPU con respecto a CPU de alrededor de 43. multicore+GPU 990 514 1459
CPU/GPU 8.13 6.83 9.67
La ventaja de usar GPUs es clara, incluso en este caso en que saturno
la GPU se usa sólo en el cálculo de la función de scoring. multicore 6150 1595 8582
multicore+GPU 563 200 823
CPU/GPU 10.92 7.98 10.43
Tabla I
T IEMPO DE EJECUCI ÓN ( EN SEGUNDOS ) DE VERSIONES CPU Y GPU, Y
SPEED - UP DE GPU RESPECTO A CPU, PARA DIFERENTES
METAHEUR ÍSTICAS APLICADAS AL PAR RECEPTOR - LIGANDO COMT, EN
JUPITER
en tres niveles de paralelismo, con un total de seis hilos
y en los cuatro nodos considerados. Se obtienen resultados
Metaheuristic CPU GPU CPU/GPU similares con otras hiperheurı́sticas. La mejor combinación
M1 140.48 10.42 39.35
M2 193.67 13.81 43.55
de hilos es 1 × 1 × 6 en todos los nodos, con algunas
M3 1,911.52 9.62 54.16 diferencias en la comparación de las distintas combinaciones
M4 209.56 9.59 34.43 dependiendo del nodo, lo que es normal dada la distinta
M5 262.65 8.55 35.51
M6 1,379.93 10.39 53.89
capacidad computacional de los nodos y que hay aleatoriedad
en las ejecuciones. Para evitar la aleatoriedad se deberı́an
El par con el que se ha experimentado para los resultados realizar varias ejecuciones por cada combinación, pero, dado
de la Tabla I es pequeño pero los tiempos de ejecución pueden el alto coste computacional, esto conllevarı́a unos tiempos de
ser grandes dependiendo de la metaheurı́stica. En el caso de experimentación excesivos.
las hiperheurı́sticas, el tiempo crece enormemente dado que se La Tabla II compara el tiempo de ejecución de tres hi-
busca en un espacio de metaheurı́sticas. En una hiperheurı́stica perheurı́sticas cuando se explota paralelismo de memoria
se puede tener hasta cuatro niveles de paralelismo (dos en compartida con un número de hilos igual al número de cores
la hiperheurı́stica y hasta dos en la metaheurı́stica), por lo en el nodo y cuando se usa GPU para el cálculo de las
que es necesario experimentar con las distintas combinaciones funciones de scoring. Se ha usado de nuevo el par COMT.
del número de hilos en los cuatro niveles para obtener la Se comprueba que el tiempo de ejecución es mucho mayor
mejor combinación. Para simplificar la experimentación dado que el de una única metaheurı́stica, y el tiempo de ejecución
que el tiempo de cada experimento es bastante largo, hemos con la explotación del paralelismo hı́brido multicore+GPU es
considerado los tres niveles de paralelismo de mayor nivel, en general mucho menor que con paralelismo de memoria
con lo que las metaheurı́sticas usan sólo paralelismo de un compartida. Sólo en el caso de venus, que tiene la CPU más
nivel. La Figura 1 compara el tiempo de ejecución (segundos) rápida y la GPU más lenta, son los tiempos comparables.
con la versión de memoria compartida para una hiperheurı́stica El uso de GPU también puede dar resultados satisfactorios
particular, con diferentes combinaciones de número de hilos para el problema de modelos de autoregresión vectorial, pero
679
en este caso el coste computacional es mucho menor que en optimización la forma óptima de utilizar el esquema: número
el docking de moléculas, por lo que el uso de GPU resulta de hilos y forma de uso de las GPUs en cada nivel.
ventajoso sólo para problemas muy grandes que seguramente
R EFERENCIAS
no se corresponden con casos de aplicaciones reales. Por
ejemplo, en jupiter, cuando se utiliza una única GPU en el [1] Z. Michalewicz and D. B. Fogel, How to Solve It: Modern Heuristics.
Springer, 2002.
nivel más bajo (cálculo del fitness, que en este caso es una [2] J. Hromkovič, Algorithmics for Hard Problems. Springer, second ed.,
multiplicación de matrices y el cálculo de la norma), con 2003.
valores de los parámetros t = 200, d = 4, e = 2, i = 3 [3] J. Dréo, A. Pétrowski, P. Siarry, and E. Taillard, Metaheuristics for Hard
Optimization. Springer, 2005.
y k = 2 el speed-up de GPU respecto a CPU es 0.83, con lo [4] F. Glover and G. A. Kochenberger, Handbook of Metaheuristics. Kluwer,
que es preferible no usar GPU. Pero para problemas mayores 2003.
el speed-up aumenta: para d = 5, e = 3, i = 3 y k = 2 es [5] E.-G. Talbi, Metaheuristics - From Design to Implementation. New
York: Wiley, 2009.
0.92, y para d = 5, e = 3, ty = 4 y tz = 2 llega a 1.25. [6] G. R. Raidl, “A unified view on hybrid metaheuristics,” in Hybrid
El uso de más GPUs reduce el tiempo de ejecución sólo Metaheuristics, Third International Workshop, LNCS, vol. 4030, pp. 1–
para tamaños muy grandes, por lo que para este problema es 12, October 2006.
[7] C. Blum, J. Puchinger, G. R. Raidl, and A. Roli, “Hybrid metaheuristics
necesario optimizar más la utilización de GPUs. Un ejemplo es in combinatorial optimization: A survey,” Appl. Soft Comput., vol. 11,
la asignación dinámica de trabajo. En una ejecución en jupiter no. 6, pp. 4135–4151, 2011.
con cuatro GPUs (dos de cada tipo) y tamaños mayores que [8] E. Alba, Parallel Metaheuristics: A New Class of Algorithms. New York:
Wiley-Interscience, 2005.
en el experimento anterior (t = 500), el tiempo de ejecución [9] E.-G. Talbi and G. Hasle, “Metaheuristics on GPUs,” J. Parallel Distrib.
fue 1854 segundos cuando se asignó el cálculo del fitness a Comput., vol. 73, no. 1, pp. 1–3, 2013.
las GPUs con el mismo número de elementos para cada GPU. [10] M. Essaid, L. Idoumghar, J. Lepagnot, and M. Brévilliers, “GPU para-
llelization strategies for metaheuristics: a survey,” International Journal
Al asignar de forma estática el doble de elementos a las GPUs of Parallel, Emergent and Distributed Systems, vol. 0, no. 0, pp. 1–26,
más rápidas (en teorı́a son el doble de rápidas) el tiempo subió 2018.
a 2249 segundos. Y el menor tiempo se obtuvo con asignación [11] F. Almeida, D. Giménez, J.-J. López-Espı́n, and M. Pérez-Pérez, “Para-
meterised schemes of metaheuristics: basic ideas and applications with
dinámica, con 1598 segundos. Genetic algorithms, Scatter Search and GRASP,” IEEE Transactions on
Systems, Man and Cybernetics, Part A: Systems and Humans, vol. 43,
no. 3, pp. 570–586, 2013.
VI. C ONCLUSIONES Y T RABAJOS F UTUROS [12] L.-G. Cutillas-Lozano, J.-M. Cutillas-Lozano, and D. Giménez, “Mode-
ling shared-memory metaheuristic schemes for electricity consumption,”
En este trabajo se discute la utilización de paralelismo in Distributed Computing and Artificial Intelligence - 9th International
hı́brido multicore+multiGPU en la aplicación de metaheurı́sti- Conference, pp. 33–40, 2012.
cas hı́bridas basadas en un esquema parametrizado de me- [13] J. Cutillas-Lozano and D. Giménez, “Determination of the kinetic cons-
tants of a chemical reaction in heterogeneous phase using parameterized
taheurı́sticas. En el esquema hay paralelismo en distintos nive- metaheuristics,” in Proceedings of the International Conference on
les, y se analiza en qué niveles serı́a conveniente la utilización Computational Science, pp. 787–796, 2013.
de GPUs. Además, sobre el esquema se pueden desarrollar [14] J. Cutillas-Lozano, D. Giménez, and F. Almeida, “Hyperheuristics based
on parametrized metaheuristic schemes,” in Proceedings of the Genetic
hiperheurı́sticas que se implementan como metaheurı́sticas con and Evolutionary Computation Conference, pp. 361–368, 2015.
ese esquema y que buscan en el espacio de metaheurı́sticas [15] F. Almeida, D. Giménez, and J.-J. López-Espı́n, “A parameterized
para un problema básico implementadas con el mismo es- shared-memory scheme for parameterized metaheuristics,” The Journal
of Supercomputing, vol. 58, no. 3, pp. 292–301, 2011.
quema. Como el esquema paralelo parametrizado tiene dos [16] J. Cutillas-Lozano and D. Giménez, “Optimizing a parameterized
niveles de paralelismo, la implementación de hiperheurı́sticas message-passing metaheuristic scheme on a heterogeneous cluster,” Soft
da lugar a un máximo de cuatro niveles, y se debe analizar la Comput., vol. 21, no. 19, pp. 5557–5572, 2017.
[17] J. M. Cecilia, J. Cutillas-Lozano, D. Giménez, and B. Imbernón, “Ex-
mejor combinación de hilos en cada nivel y en qué partes del ploiting multilevel parallelism on a many-core system for the application
esquema paralelo utilizar GPU. of hyperheuristics to a molecular docking problem,” The Journal of
Supercomputing, vol. 74, no. 5, pp. 1803–1814, 2018.
Se han considerado dos problemas básicos para analizar el [18] B. Imbernón, J. Prades, D. Giménez, J. M. Cecilia, and F. Silla,
esquema: docking de moléculas y modelos de autoregresión “Enhancing large-scale docking simulation on heterogeneous systems:
vectorial. Los dos problemas tienen alto coste computacional An MPI vs rcuda study,” Future Generation Comp. Syst., vol. 79, pp. 26–
37, 2018.
y el cálculo del fitness se hace con computación matricial [19] G. Schneider, “Virtual screening and fast automated docking methods,”
que sigue un esquema SIMD, por lo que se puede explotar Drug Discovery Today, vol. 7, pp. 64–70, Jan. 2002.
paralelismo GPU. Para el primer problema, dado el tamaño [20] A. L. Castaño, J. Cuenca, J.-M. Cutillas-Lozano, D. Giménez, J. J.
López-Espı́n, and A. Pérez-Bernabeu, “Parallelism on hybrid metaheu-
de las moléculas con las que se realiza el docking, el tiempo ristics for vector autoregression models,” in International Conference on
de ejecución es muy elevado, y se alcanza una gran reducción High Performance Computing & Simulation, August 2018.
del tiempo con respecto a CPU cuando se utiliza paralelismo [21] B. Imbernón, J. M. Cecilia, and D. Giménez, “Enhancing metaheuristic-
based virtual screening methods on massively parallel and heterogeneous
hı́brido multicore+GPU. En el otro problema, el uso de GPU systems,” in Proceedings of the 7th International Workshop on Program-
es ventajoso sólo para problemas grandes, que no se corres- ming Models and Applications for Multicores and Manycores, pp. 50–58,
ponden con aplicaciones en uso. 2016.
El mismo esquema puede ser utilizado en otros problemas,
y estamos centrando nuestra investigación en el análisis de
cómo determinar en función de los costes del problema de
680
Optimización evolutiva multiobjetivo distribuida

mediante aplicación selectiva de operadores
Pablo Garcı́a-Sánchez Julio Ortega, Jesús González, Pedro A. Castillo,
Departamento de Ingenierı́a Informática Juan Julián Merelo, Antonio M. Mora y Antonio Fernández-Ares
Universidad de Cádiz Departamento de Arquitectura y Tecnologı́a de Computadores
Puerto Real, España Universidad de Granada
[email protected] Granada, España
[email protected]
Resumen—Este trabajo presenta un nuevo enfoque, llamado Los EAs se han extendido a la optimización multiobjetivo a
aplicación selectiva de operadores, para hacer frente a problemas través de un buen número de Algoritmos Evolutivos Multiob-
no separables en el entorno de los algoritmos co-evolutivos mul- jetivo (MOEAs, por sus siglas en inglés) [5]. Se han utilizado
tiobjetivo: en lugar de compartir secciones de individuos, cada
procesador aplica los operadores de variación a un subconjunto diferentes enfoques para paralelizar los EAs, ya que cada
especı́fico de todo el individuo. Esto evita pasos adicionales para individuo puede ser considerado como una unidad indepen-
recomponer los individuos completos de otras islas antes de ser diente [6], [7]. Los métodos clásicos, como los EAs paralelos
evaluados. globales (Maestro-Esclavo), o los algoritmos espacialmente
En este trabajo se pretende demostrar que la decisión au- estructurados (Modelo de isla o EAs celulares) se han aplicado
tomática del tamaño de la sección solapada, es capaz de obtener
mejores resultados que la utilización del mismo tamaño indepen-
con éxito en el pasado [8]. Sin embargo, en el caso de los
dientemente del número de islas. Para ello se ha comparado con MOEAs, estos enfoques [2] necesitan ocuparse de todo el
otras técnicas evolutivas colaborativas considerando diferentes conjunto de soluciones, el FP. Esto implica el uso de diferentes
números de islas y problemas. El análisis de los resultados mecanismos de distribución y compartición, ya que existe un
experimentales obtenidos, utilizando diferentes métricas, muestra equilibrio entre la mejora obtenida a partir de la paralelización
que nuestro enfoque puede proporcionar mejoras estadı́sticamen-
te significativas con respecto al algoritmo base en problemas
y la necesidad de recombinar globalmente los resultados para
multiobjetivo de alta dimensionalidad. identificar con precisión el FP [9].
Index Terms—Algoritmos multiobjetivo, NSGA-II, modelo de Las MOPs del mundo real normalmente requieren un alto
islas, algoritmos evolutivos distribuidos número de variables de decisión, lo que significa que los
MOEAs necesitan tratar con individuos grandes y gastar
un tiempo significativo adicional para el cruce, mutación y
I. I NTRODUCCI ÓN
migración. Diferentes autores han propuesto métodos para
Los problemas de optimización multiobjetivo (MOP por sus dividir el espacio de decisión (el cromosoma) para mejorar
siglas en inglés) son aquellos en los que varios objetivos tienen el rendimiento y la calidad de las soluciones. En este aspecto,
que ser optimizados a la vez [1]. Resolver un MOP implica el modelo de co-evolución es un modelo distribuido por
optimizar una función compuesta por varias funciones de dimensiones en el que un problema de alta dimensionalidad se
coste independientes, una por objetivo. En estos problemas el divide en otros de dimensiones más bajas [7], que evolucionan
objetivo es obtener un conjunto de soluciones que sean mejores por separado. Un ejemplo de aplicación de esta técnica fue
que el resto, considerando todos los objetivos; este conjunto descrito en [10]. El método presentado en ese trabajo involu-
se conoce como el Frente de Pareto (FP). Las soluciones en cra a diferentes trabajadores que evolucionan subpoblaciones
este conjunto son no dominadas, lo que significa que no hay creadas y recombinadas por un proceso maestro, el cual realiza
otra solución que sea igual o mejor para todos los objetivos. diferentes alternativas de recombinación de las partes devueltas
Este aspecto de la búsqueda de soluciones no dominadas, por los procesos de los trabajadores.
ası́ como, en muchos casos, el tamaño del propio espacio de Un enfoque similar utilizado para resolver este tipo de
búsqueda, implica una alta demanda de tiempo computacional, problemas es el de la aplicación de la Aplicación Selectiva de
lo que lleva a la propuesta de métodos paralelos y distribuidos Operadores (ASO) presentado en este documento. En este ca-
para resolverlos [2], [3], uno de los cuales son los algoritmos so, cada isla se ocupa de la totalidad del cromosoma, pero sólo
evolutivos (EAs) [4]. modifica un fragmento en la fase de cruce y mutación en fun-
ción del número de islas, utilizando todo el cromosoma para el
Trabajo financiado por los proyectos SPIP2017-02116 (Dirección General cálculo del fitness. Esto permite hacer frente a problemas que
de Tráfico), EphemeCH TIN2014-56494-C4-3-P, TIN2015-67020-P, DeepBio no se pueden descomponer. En nuestro trabajo anterior [11]
TIN2017-85727-C4-2-P y TEC2015-68752 (Ministerio de Economı́a y Com- utilizamos este método de manera preliminar. En ese trabajo
petitividad y Fondos FEDER) y PR2018-056 (Programa de Fomento e Impulso
de la Investigación y de la Transferencia de la Universidad de Cádiz 2018- demostramos que la aplicación de los operadores de variación
2019). sólo sobre secciones especı́ficas de todo el cromosoma mejora
681
la calidad de las soluciones en el mismo tiempo de cálculo para método de solapamiento, fue utilizado en primer lugar en el
un algoritmo multi-objetivo basado en islas. Además, en lugar trabajo de Dorronsoro et al. [18], obteniendo un rendimiento
de hacer que cada isla se centre en un subconjunto disjunto del superlinear en varios casos. Recientemente, este enfoque tam-
cromosoma, el uso de secciones solapadas (compartidas) del bién ha sido probado utilizando un algoritmo de optimización
cromosoma puede mejorar la calidad de las soluciones cuando de enjambre de partı́culas (PSO) [19], obteniendo también
se aumenta el número de islas. mejoras significativas en la velocidad y calidad de la solución.
Esto nos motiva a continuar esta lı́nea de investigación El enfoque descrito por Dorronsoro et al. también ha sido
utilizando un entorno más adecuado: un cluster real con hasta utilizado por Kimovski et al. [10], pero implementando un
128 nodos y una parametrización más completa. Además de método maestro-esclavo que divide la población en varios
comparar los métodos anteriores en esta nueva configuración procesadores. Como en trabajos anteriores, cada nodo ejecuta
experimental, en este trabajo proponemos un nuevo método un MOEA paralelo que sólo afecta a una porción de los indi-
que automáticamente establece el tamaño del solapamiento. viduos y el proceso maestro recibe todas las subpoblaciones
en función del número de islas disponibles, comparándolo con a combinar cada cierto número de generaciones. Se utilizaron
versiones anteriores. hasta 8 procesadores y se compararon varias alternativas de
El resto del documento está organizado de la siguiente combinación. La principal diferencia de nuestro trabajo con
manera: después del estado del arte en MOEAs distribuidos y respecto a los trabajos anteriores es que nuestro enfoque no
co-evolutivos, la metodologı́a utilizada y los algoritmos com- difunde todas las soluciones a todas las islas para la recombi-
parados se describen en la Sección III. Después se presentan nación, sino sólo una solución a una isla aleatoria, necesitando
los resultados de los experimentos (Sección V), Finalmente, menos tiempo de comunicación. Además, los enfoques de
se discuten las conclusiones y el trabajo futuro 1 . Dorronsoro o Kimovsky limitaron el número máximo de islas
a 8, mientras que en este documento hemos utilizado hasta
II. E STADO DEL ARTE 128 islas.
Desde principios de la década de los 2000, los EAs dis- En nuestro trabajo anterior [11] utilizamos algunas de las
tribuidos y paralelos se han utilizado principalmente para ideas mencionadas anteriormente para comparar dos dMOEAs
aprovechar sistemas como clusters o grids [12]. Pero en el diferentes. El primero dividió el cromosoma en P secciones,
caso de los MOEAs, la distribución y paralelización es más siendo P el número de islas. Cada isla p sólo realizó la muta-
difı́cil que en los EAs con un solo objetivo. Esto se debe a ción y el cruce en esa parte (pth ) del cromosoma (la aplicación
que en diferentes pasos del algoritmo el conjunto completo de selectiva de operadores), mientras que el fitness se calculó
soluciones dependientes, el FP, debe ser gestionado como un usando el individuo entero. Después de un cierto número de
todo, dedicando tiempo a reunir a todos los individuos de los generaciones, los individuos fueron migrados al azar a otras
diferentes procesadores o islas. islas. Las métricas de rendimiento se calcularon al final de
Para resolver este problema, algunos autores han propuesto la ejecución. El segundo método, la aplicación selectiva de
el uso de enfoques Maestro-Esclavo. Por ejemplo, [13] com- operadores con islas solapadas, usaba las secciones pth−1 y
paró diferentes enfoques maestro-esclavo: sı́ncrono generacio- pth+1 de cada cromosoma, además de la parte pth . Usando la
nal, ası́ncrono generacional y ası́ncrono estacionario, siendo misma cantidad de tiempo, ambos métodos obtuvieron mejores
esta última la opción más prometedora. resultados que un algoritmo de baseline que se ocupaba de
También se ha explorado otro tipo de enfoques. El trabajo todo el cromosoma en cada isla para el cruce y la mutación.
de Deb et al. [14] fue uno de los primeros enfoques para Descubrimos que el rendimiento utilizando uno u otro método
MOEAs distribuidos (dMOEAs). En ese trabajo, el domi- depende del número de secciones de los individuos y del
nio de las soluciones se divide en las islas mediante una número de islas utilizadas. Esto nos motivó a encontrar un
transformación de coordenadas. En ese trabajo, los autores nuevo método automático para seleccionar este número de
concluyeron que dividir el espacio de búsqueda es una buena secciones del cromosoma a utilizar, dependiendo del número
idea, aunque lograr esto no es trivial. La división del espacio de islas. Además, se realizaron experimentos previos en un
de búsqueda ha sido explorada por otros investigadores, por modelo de isla sı́ncrona con un único procesador y con un
ejemplo, dividiendo la población en élites y subpoblaciones número limitado de islas (8, 32 y 128). En este trabajo se
de búsqueda [15], o separándola en procesadores por objetivo han utilizado 8, 16, 32, 64 y 128 islas, y en esta ocasión
[16]. Otros autores, como [17] utilizan la migración para los experimentos se han realizado en un cluster paralelo. Por
aceptar individuos basados en la diversidad, y emigran desde lo tanto, al mismo tiempo, estamos proponiendo un nuevo
áreas no superpobladas. método para dividir el espacio de búsqueda individual según
Abordar este tipo de problemas usando co-evolución coope- el número de subpoblaciones que evolucionan, y también
rativa también ha sido estudiado en varios trabajos con enfo- validando el enfoque anterior.
ques más cercanos al que aquı́ se presenta. El enfoque de III. M ETODOLOG ÍA
centrarse en una porción del cromosoma, como en nuestro
El objetivo de esta sección es explicar la metodologı́a que
1 Nota: una versión extendida de este artı́culo está siendo revisada en la hemos seguido para comparar las diferentes versiones de la
revista Applied Soft-Computing selección de secciones a modificar en cada isla.
682
En este trabajo analizamos varios algoritmos basados en IV. E XPERIMENTOS

ASO que hemos implementado con respecto un algoritmo En esta subsección se describen los indicadores de calidad
baseline multiobjetivo paralelo. Los métodos propuestos, uti- utilizados y los experimentos. Los indicadores de calidad
lizando diferentes esquemas de solapamiento, se basan en elegidos son:
NSGA-II, como casi todos los trabajos discutidos anterior- Hipervolumen (HV): mide el área formada por todas las
mente [13]–[18]. Por lo tanto, hemos utilizado un algoritmo soluciones no dominadas encontradas con respecto a un
NSGA-II básico distribuido sin solapar secciones como base- punto de referencia. Los valores más altos implican una
line (B). mejor calidad del FP.
Este algoritmo básico distribuye la población entre P islas; Distancia Generacional Invertida (IGD): calcula la distan-
después de un número fijo de generaciones, un individuo en cia del conjunto de soluciones obtenidas al FP óptimo.
una isla dada es migrado a otra isla al azar, evitando ası́ En esta métrica, cuanto más bajo, mejor.
sincronizar el FP global cada cierto número de generaciones Spread (S): Mide la dispersión entre soluciones, teniendo
como lo hacen otros métodos descritos en la Sección 2. Al en cuenta la distancia euclı́dea entre soluciones consecu-
final de cada ejecución, los FPs de todas las islas se agregan tivas. Como en la métrica anterior, cuanto menor sea el
en uno nuevo y se evalúan las medidas de calidad. valor, mejor, ya que implica soluciones distribuidas a lo
Se pueden idear diferentes alternativas de ASO para evo-
largo de todo el FP.
lucionar las subpoblaciones de acuerdo con el espacio de
Hemos elegido estas métricas no sólo porque se han utiliza-
decisión a explorar por cada isla. Al igual que en la baseline
do ampliamente, especialmente en algunos de los documentos
(B), un individuo es migrado a otra isla al azar después de un
presentados en la Sección II, como [13], [15], [17], [18],
número fijo de generaciones. En la nueva isla, este individuo
sino también porque cubren diferentes criterios de calidad. La
será considerado como uno más en la isla, cruzado y mutado
formulación matemática de estas métricas se puede encontrar
de la misma manera, dependiendo del identificador de la nueva
en [18].
isla (de 1 a P ). Nótese que, a diferencia de otros trabajos
El tamaño del cromosoma (L) es de 2048. También se
como los descritos por Talbi et al. [12], todas las islas tratan
ha comparado un número diferente de islas (P ): 8, 16, 32,
con cromosomas completos para el cálculo del fitness, por lo
64 y 128. Este número máximo de islas también ha sido
que nuestro enfoque puede tratar con problemas separables y
utilizado en un trabajo anterior en la literatura [17]. El cruce
no separables.
Concretamente hemos comparado las siguientes versiones: y la mutación elegidos, SBX y polinomial, también han sido
utilizados previamente por otros autores en [13].
ASO con islas disjuntas (D) En este enfoque, cada indi-
El benchmark ZDT [20] ha sido elegido debido a que es el
viduo del tamaño L se divide en trozos de P del tamaño
más utilizado en esta área [13]–[15], [17]. Este benchmark
L/P . Cada isla p sólo realiza crossover y mutación en
incluye varias funciones, con diferentes caracterı́sticas que
la parte pth de los individuos.
son representativas de los problemas de optimización del
ASO con secciones solapadas (S) Este enfoque es
mundo real. La formulación matemática de cada función está
similar al anterior, pero cada isla también utiliza los
disponible en [20].
trozos de p + 1 y p − 1 (usando el módulo) del individuo
El criterio utilizado para terminar un experimento ha sido
para el cruce y la migración. Por lo tanto, existe algún
el tiempo de ejecución: 100 segundos por ejecución. Según
tipo de solapamiento de las partes cruzadas y mutadas
Alba y Luque [21], otros criterios de parada como el número
entre las islas.
de evaluaciones necesarias para alcanzar una solución, pue-
ASO automático con secciones solapadas (A) Como
den ser engañosos dependiendo del escenario estudiado. En
en el método anterior, las secciones a tratar por los
nuestro caso hemos utilizado el tiempo en lugar del número
operadores se solapan, pero en lugar de usar una sección
de evaluaciones, en primer lugar porque nuestra hipótesis
extra a cada lado de la sección p (p + 1 y p − 1), usa
argumenta que el tiempo ahorrado en el cruce y la mutación se
fragmentos c a cada lado (p + c y p − c), siendo c un
puede gastar en mejorar las subpoblaciones y se pueden lograr
valor que depende del número de islas.
más operaciones y migraciones. Además, estamos utilizando
Como primera aproximación para calcular automáticamente
un número diferente de islas (con diferentes tamaños de
este valor, se han utilizado los resultados mostrados en [11]
subpoblación) y eso podrı́a llevar a diferentes tiempos de
como base para obtener c. En ese trabajo, el método de
ejecución, por lo que serı́a difı́cil comparar diferentes tiempos
solapamiento (cuando c = 1) obtuvo mejores resultados si
y calidad de soluciones al mismo tiempo.
el número de islas era mayor de 8. Por el contrario, cuando
Hemos usado el framework ECJ [22] para ejecutar los
el número de islas es pequeño, no es necesario solaparlas.
experimentos. El código fuente usado puede descargarse de
Por lo tanto, hemos usado este conocimiento para proponer la
nuestro repositorio GitHub2 bajo una licencia LGPL V3.
fórmula c = round(0,2 ∗ P − 1)/2 para calcular las secciones
El modelo de isla se ha ejecutado de forma ası́ncrona,
extra a solapar. Por lo tanto, cuando P = 8 entonces c = 0
utilizando el modelo de intercambio distribuido de interpo-
(equivalente a D), cuando P = 16 entonces c = 1 (equivalente
blación de ECJ, en un cluster de 16 nodos, cada uno con 16
a S), y ası́ sucesivamente. La figura 1 explica el método A,
asumiendo que c = 2, por ejemplo. 2 https://github.com/hpmoon/hpmoon-islands
683
Figura 1. ASO solapado automáticamente (A): cada isla p modifica los p + c, pth y p − c componentes (en gris) de los individuos usando operadores
genéticos (cruce y mutación). Además, cada isla evalúa a sus propios individuos usando el cromosoma completo. Después de un número dado de generaciones
coopera con las otras islas a través de la migración. Se calcula c dependiendo del número de islas. En este caso, c = 2.
Nombre del parámetro Valor

Tamaño global de la población (N ) 1024
de referencia, hemos elegido el valor (1,9) ya que ninguna de
Selección Torneo Binario las soluciones existentes en todos los frentes obtenidas durante
Tipo de reemplazo Generacional todas las ejecuciones están dominadas por él.
Tipo de crossover SBX
Tipo de mutación Polinomial Se ha realizado una prueba de significación de Kruskal-
Probabilidad de mutación 1/L Wallis a las métricas de todas las ejecuciones de las configu-
Individuos por migración 1 raciones, ya que la prueba de Kolmogorov-Smirnov detectó
Generaciones entre migración 5
Selección para migración Torneo Binario
distribuciones no normales. Los resultados medios de cada
Ejecuciones por configuración 30 configuración se muestran en la Tabla II. Como se explicó
Número de islas (P ) 8, 16, 32, 64 and 128 anteriormente, cuando P = 8 los resultados de A son equiva-
Tamaño del cromosoma (L) 2048 lentes a los obtenidos por D (porque c = 0), y cuando P = 16
Tiempo de ejecución (s) 100
son equivalentes a S (c = 1). Nos referimos a esta equivalencia
Tabla I
PAR ÁMETROS Y OPERADORES USADOS EN LOS EXPERIMENTOS . con la palabra Equiv- en las tablas.
Los resultados muestran que la división del cromosoma pro-
duce una mejora en todos los indicadores de calidad utilizando
la versión automática (A) (Tabla II), superando incluso los
procesadores Intel(R) Xeon(R) CPU E5520 @2.27GHz, 16 métodos solapado (S) y disjunto (D). Por lo tanto, existe
GB RAM, tarjetas de red Broadcom NetXtreme II BCM5716 algún tipo de punto lı́mite en la longitud de los cromosomas
1000Base-T (C0) PCI Express, CentOS 6.8 y Java Versión donde un método será preferible a otro, además de depender
1.8.0 80. del número de islas y del tamaño de la población.
El conjunto total de parámetros usados se muestra en la Esto puede explicarse comparando el número de soluciones
Tabla I. no dominadas de cada frente y el número medio de genera-
ciones (Tabla III). Aumentar el número de islas implica más
V. R ESULTADOS
generaciones con todos los métodos (lógicamente, ya que hay
Para calcular la calidad de los FPs obtenidos en cada menos individuos en cada isla). Pero también, los métodos
configuración se han utilizado diferentes métricas, explicadas ASO se acercan al número de generaciones con la baseline
anteriormente. Como el HV requiere que se calcule un punto al aumentar el número de islas. Sin embargo el tiempo de
684
HV Spread IGD
#Island B D S A B D S A B D S A
ZDT1
8 0.891 0.953 0.937 Equiv-D 0.681 0.635 B 0.661 D Equiv-D 0.015 0.002 0.005 Equiv-D
16 0.884 0.850 0.942 Equiv-S 0.705 0.908 0.670 B Equiv-S 0.016 0.022 0.004 Equiv-S
32 0.851 0.674 0.859 B 0.900 0.754 0.868 0.826 D 0.763 B 0.023 0.062 0.020 B 0.012
64 0.800 0.608 0.697 0.824 B 0.808 0.880 0.861 B 0.823 B 0.033 0.078 0.056 0.027
128 0.735 0.582 0.613 0.745 0.841 0.888 0.878 D 0.865 S 0.047 0.084 0.075 0.043
ZDT2
16 0.831 0.833 B 0.884 Equiv-S 0.810 1.001 0.802 B Equiv-S 0.023 0.022 B 0.009 Equiv-S
32 0.800 0.628 0.800 B 0.817 0.848 0.974 0.983 D 0.908 0.031 0.082 0.032 B 0.027
64 0.729 0.491 0.623 0.716 0.909 0.967 0.979 D 0.997 BD 0.052 0.121 0.084 0.055 B
128 0.630 0.441 0.500 0.614 B 0.957 0.989 0.978 D 0.994 BS 0.080 0.136 0.119 0.085 B
ZDT3
16 0.911 0.876 B 0.963 Equiv-S 0.864 0.899 B 0.837 B Equiv-S 0.010 0.014 0.003 Equiv-S
32 0.884 0.710 0.883 B 0.931 0.856 0.870 B 0.842 B 0.842 BDS 0.013 0.032 0.013 B 0.008
64 0.828 0.645 0.728 0.854 0.878 0.896 B 0.871 BD 0.873 BDS 0.019 0.040 0.030 0.016 B
128 0.770 0.620 0.651 0.773 B 0.887 0.901 B 0.890 BD 0.885 BDS 0.026 0.043 0.039 0.025 B
ZDT6
8 0.271 0.398 0.323 Equiv-D 0.982 0.982 B 0.994 Equiv-D 0.171 0.115 0.149 Equiv-D
16 0.275 0.295 B 0.354 Equiv-S 0.981 0.970 B 1.006 Equiv-S 0.170 0.161 B 0.136 Equiv-S
32 0.239 0.123 0.240 0.254 0.989 0.991 B 0.982 BD 0.999 BD 0.186 0.235 0.185 B 0.179
64 0.184 0.068 0.125 0.178 B 0.985 0.982 B 0.992 B 0.995 BS 0.209 0.259 0.235 0.212
128 0.128 0.051 0.071 0.124 B 0.991 0.992 B 0.988 BD 1.003 0.233 0.266 0.257 0.235 B
Tabla II
M ÉTRICAS DE CALIDAD MEDIA OBTENIDAS DESPU ÉS DE 30 EJECUCIONES POR CONFIGURACI ÓN , PARA LOS 4 M ÉTODOS COMPARADOS : baseline (B),
DISJUNTO (D), SOLAPADO (S) Y SOLAPADO AUTOM ÁTICO (A). L OS ACR ÓNIMOS QUE APARECEN JUNTO A LOS VALORES INDICAN QUE NO HAY
DIFERENCIAS SIGNIFICATIVAS CON RESPECTO A ESE M ÉTODO PARA ESE VALOR . L OS MEJORES VALORES EST ÁN MARCADOS EN NEGRITA . E QUIV-X
IMPLICA QUE EL VALOR ES EL MISMO QUE EL DE EJECUTAR X , YA QUE AMBAS CONFIGURACIONES SER ÍAN IGUALES .
Average solutions per front Generations

#Island B D S A B D S A
ZDT1
8 137.733 47.167 119.933 B Equiv-D 175.067 225.667 207.933 Equiv-D
16 92.633 38.233 47.533 D Equiv-S 204.867 238.533 232.900 Equiv-S
32 56.167 41.167 28.667 32.567 S 225.433 243.833 242.533 242.000 S
64 50.900 49.667 B 35.600 25.367 236.500 245.967 245.700 244.033 D
128 45.767 64.933 44.167 B 31.867 242.800 247.000 247.000 D 245.733
ZDT2
8 64.267 22.733 56.867 B Equiv-D 175.633 226.000 208.100 Equiv-D
16 52.300 10.733 20.067 D Equiv-S 205.033 238.867 233.100 Equiv-S
32 34.400 10.367 10.433 D 17.900 S 225.600 244.267 242.633 242.000 S
64 24.600 10.900 9.267 D 12.867 DS 236.700 246.000 245.767 244.033 D
128 18.667 17.833 B 10.367 12.933 S 243.367 247.000 247.000 d 245.833
ZDT3
8 163.767 83.367 119.467 Equiv-D 176.533 226.400 207.700 Equiv-D
16 108.467 49.433 47.700 D Equiv-S 205.333 238.467 232.933 Equiv-S
32 72.133 44.333 31.833 36.533 S 225.100 243.900 242.433 242.000 S
64 54.867 57.600 B 40.633 29.300 236.333 245.933 245.733 244.000 D
128 50.600 72.133 49.033 B 34.933 243.200 247.000 247.000 D 245.833
ZDT6
8 22.133 13.833 14.433 D Equiv-D 175.733 226.100 207.767 Equiv-D
16 20.767 15.867 13.300 D Equiv-S 205.033 238.433 232.933 Equiv-S
32 22.600 10.700 10.033 D 11.967 DS 225.833 243.667 242.500 242.000 S
64 19.033 11.267 10.533 D 10.567 DS 236.433 245.900 245.833 244.000 D
128 15.800 24.500 11.600 12.233 DS 243.800 247.000 247.000 D 245.533
Tabla III
P ROMEDIO DE GENERACIONES Y PROMEDIO DE SOLUCIONES POR FRENTE , OBTENIDOS DESPU ÉS DE 30 EJECUCIONES POR CONFIGURACI ÓN , PARA LOS 4
M ÉTODOS COMPARADOS : baseline (B), DISJUNTO (D), SOLAPADO (S) Y SOLAPADO AUTOM ÁTICO (A). L OS ACR ÓNIMOS QUE APARECEN JUNTO A LOS
VALORES INDICAN QUE NO HAY DIFERENCIAS SIGNIFICATIVAS CON RESPECTO A ESE M ÉTODO PARA ESE VALOR . E QUIV-X IMPLICA QUE EL VALOR ES
EL MISMO QUE EL DE EJECUTAR X , YA QUE AMBAS CONFIGURACIONES SER ÍAN IGUALES .
migración es lo suficientemente grande como para no mejorar en la mayorı́a de las configuraciones comparadas.
el número de generaciones con respecto a la baseline, incluso
en el menor número de islas. Por lo tanto, más generaciones no VI. C ONCLUSIONES
significan necesariamente mejorar la solución del FP global, Los problemas que requieren un alto rendimiento y que
sino centrarse en diferentes elementos del cromosoma. Como tratan con un gran número de variables de decisión pueden
se ha dicho anteriormente, cada isla desconoce los FPs de aprovecharse de la división del espacio de decisión que
las otras islas, y están tratando de optimizar sus soluciones proporcionan los algoritmos paralelos y distribuidos. Esto se
independientemente. Con respecto al número promedio de puede hacer en dMOEAs mediante la aplicación selectiva
soluciones por frente, hay una clara diferencia con la baseline, de operadores (ASO), es decir, dividiendo el cromosoma en
donde este valor es en la mayorı́a de los casos, menos de diferentes partes, cada una modificada por una isla diferente.
la mitad. El número de soluciones no dominadas también Este trabajo compara un NSGA-II distribuido, como baseline,
implica un mejor indicador de Spread, donde la baseline con tres estrategias diferentes para separar el cromosoma
obtiene mejores (o no significativamente diferentes) valores (partes disjuntas o solapadas), utilizando distintos números de
islas. Los resultados muestran que estos métodos pueden lograr
685
métricas de mejor calidad que el baseline en la misma cantidad [12] E. Talbi, S. Mostaghim, T. Okabe, H. Ishibuchi, G. Rudolph, and
de tiempo. C. A. C. Coello, “Parallel approaches for multiobjective optimization,”
in Multiobjective Optimization, Interactive and Evolutionary Approaches
Los resultados obtenidos también muestran que al aumentar [outcome of Dagstuhl seminars]., ser. Lecture Notes in Computer
el número de islas, el método de solapamiento automático Science, J. Branke, K. Deb, K. Miettinen, and R. Slowinski, Eds., vol.
(A) mejora significativamente los resultados con respecto a 5252. Springer, 2008, pp. 349–372.
[13] A. J. Nebro and J. J. Durillo, “A study of the parallelization of the
los métodos disjunto y solapado. El estudio de este factor multi-objective metaheuristic MOEA/D,” in Learning and Intelligent
con más tipos de problemas y nuevas configuraciones del Optimization, 4th International Conference, LION 4, Venice, Italy,
tamaño de la población y la longitud de los cromosomas January 18-22, 2010. Selected Papers, ser. Lecture Notes in Computer
Science, C. Blum and R. Battiti, Eds., vol. 6073. Springer, 2010, pp.
puede abordarse en el futuro. Por ejemplo, comparar diferentes 303–317.
maneras de calcular c usando funciones lineales, logarı́tmicas [14] K. Deb, P. Zope, and A. Jain, “Distributed computing of Pareto-
o exponenciales dependiendo del tamaño de la población, optimal solutions with evolutionary algorithms,” in Evolutionary Multi-
Criterion Optimization, Second International Conference, EMO 2003,
número de islas, tamaño del cromosoma, u otros valores. Faro, Portugal, April 8-11, 2003, Proceedings, ser. Lecture Notes in
Además, se podrı́a realizar un análisis de la diversidad de los Computer Science, C. M. Fonseca, P. J. Fleming, E. Zitzler, K. Deb,
individuos de cada isla durante la ejecución del algoritmo para and L. Thiele, Eds., vol. 2632. Springer, 2003, pp. 534–549.
[15] W. Zhi-xin and G. Ju, “A parallel genetic algorithm in multi-objective
comprender su influencia en los resultados. optimization,” in Control and Decision Conference, 2009. CCDC ’09.
Asimismo, podrı́an utilizarse implementaciones más dis- Chinese, June 2009, pp. 3497–3501.
[16] N. Xiao and M. P. Armstrong, “A specialized island model and its
tribuidas en varios sistemas (como GPUs o clusters hete- application in multiobjective optimization,” in Genetic and Evolutionary
rogéneos) con diferentes cantidades de islas/procesadores para Computation - GECCO 2003, Genetic and Evolutionary Computation
realizar un estudio de escalabilidad de los diferentes métodos, Conference, Chicago, IL, USA, July 12-16, 2003. Proceedings, Part II,
ser. Lecture Notes in Computer Science, E. Cantú-Paz, J. A. Foster,
siendo el tiempo de transmisión entre islas un tema relevante a K. Deb, L. Davis, R. Roy, U. O’Reilly, H. Beyer, R. K. Standish,
tratar. También pueden compararse otros MOEAs disponibles G. Kendall, S. W. Wilson, M. Harman, J. Wegener, D. Dasgupta, M. A.
en la literatura, como SPEA o MOEA/D. Además, podrı́an Potter, A. C. Schultz, K. A. Dowsland, N. Jonoska, and J. F. Miller,
Eds., vol. 2724. Springer, 2003, pp. 1530–1540.
utilizarse otros benchmarks y problemas reales para validar [17] M. Märtens and D. Izzo, “The asynchronous island model and NSGA-
este enfoque. II: study of a new migration operator and its performance,” in Genetic
and Evolutionary Computation Conference, GECCO ’13, Amsterdam,
The Netherlands, July 6-10, 2013, C. Blum and E. Alba, Eds. ACM,
R EFERENCIAS 2013, pp. 1173–1180.
[18] B. Dorronsoro, G. Danoy, A. J. Nebro, and P. Bouvry, “Achieving super-
[1] A. M. Mora, P. Garcı́a-Sánchez, J. J. Merelo-Guervós, and P. A. Casti- linear performance in parallel multi-objective evolutionary algorithms by
llo, “Pareto-based multi-colony multi-objective ant colony optimization means of cooperative coevolution,” Computers & OR, vol. 40, no. 6, pp.
algorithms: an island model proposal,” Soft Comput., vol. 17, no. 7, pp. 1552–1563, 2013.
1175–1207, 2013. [19] A. Atashpendar, B. Dorronsoro, G. Danoy, and P. Bouvry, “A scalable
[2] F. Luna and E. Alba, “Parallel multiobjective evolutionary algorithms,” parallel cooperative coevolutionary PSO algorithm for multi-objective
in Springer Handbook of Computational Intelligence, J. Kacprzyk and optimization,” J. Parallel Distrib. Comput., vol. 112, pp. 111–125, 2018.
W. Pedrycz, Eds. Springer, 2015, pp. 1017–1031. [20] E. Zitzler, K. Deb, and L. Thiele, “Comparison of Multiobjective
[3] A. Mukhopadhyay, U. Maulik, S. Bandyopadhyay, and C. A. C. Coello, Evolutionary Algorithms: Empirical Results,” Evol. Comput., vol. 8,
“A survey of multiobjective evolutionary algorithms for data mining: no. 2, pp. 173–195, 2000.
Part I,” IEEE T. Evolut. Comput., vol. 18, no. 1, pp. 4–19, 2014. [21] E. Alba and G. Luque, “Evaluation of parallel metaheuristics,” in
[4] A. E. Eiben and J. E. Smith, Introduction to Evolutionary Computing, Empirical Methods for the Analysis of Algorithms, Workshop EMAA
ser. Natural Computing Series. Springer, 2015. 2006, Proceedings, L. Paquete, M. Chiarandini, and D. Basso, Eds.,
[5] E.-G. Talbi, “A unified view of parallel multi-objective evolutionary Reykjavik, Iceland, 2006, pp. 9–14.
algorithms,” J. Parallel Distrib. Comput., pp.–, 2018, in press. [22] S. Luke et al., “ECJ: A Java-based Evolutionary Computation and
[Online]. Available: https://www.sciencedirect.com/science/article/pii/ Genetic Programming Research System,” 2009, available at http://www.
S074373151830279X cs.umd.edu/projects/plus/ec/ecj.
[6] E. Alba, G. Luque, and S. Nesmachnow, “Parallel metaheuristics: recent
advances and new trends,” Int. T. Oper. Res., vol. 20, no. 1, pp. 1–48,
2013.
[7] Y. Gong, W. Chen, Z. Zhan, J. Zhang, Y. Li, Q. Zhang, and J. Li,
“Distributed evolutionary algorithms and their models: A survey of the
state-of-the-art,” Appl. Soft Comput., vol. 34, pp. 286–300, 2015.
[8] E. Alba and M. Tomassini, “Parallelism and evolutionary algorithms,”
IEEE Trans. Evolutionary Computation, vol. 6, no. 5, pp. 443–462, 2002.
[9] J. Branke, H. Schmeck, K. Deb, and R. S. Maheshwar, “Parallelizing
multi-objective evolutionary algorithms: cone separation,” in Procee-
dings of the IEEE Congress on Evolutionary Computation, CEC 2004,
19-23 June 2004, Portland, OR, USA. IEEE, 2004, pp. 1952–1957.
[10] D. Kimovski, J. Ortega, A. Ortiz, and R. Baños, “Parallel alternatives
for evolutionary multi-objective optimization in unsupervised feature
selection,” Expert Syst. Appl., vol. 42, no. 9, pp. 4239–4252, 2015.
[11] P. Garcı́a-Sánchez, J. Ortega, J. González, P. A. Castillo, and J. J. Merelo,
“Addressing high dimensional multi-objective optimization problems by
coevolutionary islands with overlapping search spaces,” in Applications
of Evolutionary Computation - 19th European Conference, EvoApplica-
tions 2016, Porto, Portugal, March 30 - April 1, 2016, Proceedings, Part
II, ser. Lecture Notes in Computer Science, G. Squillero and P. Burelli,
Eds., vol. 9598. Springer, 2016, pp. 107–117.
686
Análisis de Diseños Paralelos Multiobjetivo y

Polı́ticas de Planificación en Biologı́a Evolutiva
Sergio Santander-Jiménez Miguel A. Vega-Rodrı́guez Leonel Sousa
INESC-ID, IST, Universidade de Lisboa, INTIA, Universidad de Extremadura, INESC-ID, IST, Universidade de Lisboa,
Lisboa 1000-029, Portugal Cáceres 10003, España Lisboa 1000-029, Portugal
Resumen—Las metaheurı́sticas paralelas representan una de verse afectados por dos fuentes principales de desequilibrio
las técnicas de mayor popularidad para abordar la resolución de de carga. Al nivel del diseño metaheurı́stico, los operadores
problemas de optimización complejos. Sin embargo, una de las de búsqueda pueden mostrar distintos requisitos temporales,
cuestiones principales que surgen al emplear estos métodos viene
dada por la aparición potencial de problemas de desequilibrio de hecho que puede volverse más remarcable en situaciones de
carga. De hecho, la complejidad de los problemas de optimización cambio de contexto de explotación a exploración (o viceversa).
actuales obliga a la adopción de múltiples estrategias de búsqueda Al nivel de implementación del problema, las soluciones gene-
condicionales dentro de la metaheurı́stica, lo cual incide en el radas pueden mostrar caracterı́sticas divergentes que influyen,
impacto que implica el desequilibrio de carga en el rendimiento por ejemplo, en los cálculos efectuados en las funciones
paralelo. Este trabajo analiza diferentes polı́ticas de planificación
y diseños algorı́tmicos para abordar el desequilibrio de carga en objetivo, dando lugar a tiempos de evaluación no homogéneos.
la metaheurı́stica Multiobjective Shuffled Frog-Leaping Algorithm. Estas cuestiones implican un aumento de la sobrecarga y, con-
Tomando como caso de estudio un problema de biologı́a evolutiva, secuentemente, un empeoramiento del rendimiento paralelo.
la reconstrucción filogenética, abordamos la evaluación de tres Ası́, las metaheurı́sticas paralelas deben considerar este
polı́ticas de planificación en el algoritmo original, ası́ como tipo de factores para conseguir una explotación precisa de
una alternativa de diseño basada en el uso de contadores. Los
resultados obtenidos en cuatro bases de datos reales dan cuenta los recursos hardware. Este trabajo se focaliza en el análisis
de la influencia de las aproximaciones estudiadas en los tiempos de distintas polı́ticas de planificación y diseños para abordar
de sobrecarga, destacando los beneficios de integrar polı́ticas problemas de desequilibrio de carga. Adoptamos como caso
dinámicas y diseños que respeten las mecánicas del algoritmo. de estudio un problema de biologı́a evolutiva: la inferencia de
Index Terms—Biologı́a evolutiva, desequilibrio de carga, relaciones ancestrales entre especies [2]. En escenario mono-
computación paralela, metaheurı́sticas multiobjetivo
objetivo, existen propuestas como IQ-TREE [3] y GARLI [4]
que han dado cuenta de los beneficios de emplear computación
I. I NTRODUCCI ÓN
de altas prestaciones y métodos bioinspirados de búsqueda
La resolución eficiente de problemas de optimización se en este problema. Las aproximaciones multiobjetivo también
ha convertido en una de las lı́neas de investigación predo- representan una tendencia significativa en el caso de datos
minantes en multitud de dominios cientı́ficos. En contextos de ADN [5], al contribuir potencialmente a la resolución de
reales, es obligatorio el diseño de aproximaciones algorı́tmicas problemas de incongruencia en contextos reales.
innovadoras para cumplir los requisitos de calidad de solución Abordaremos este problema biológico desde la perspectiva
y, al mismo tiempo, lidiar con la naturaleza NP-completa de multiobjetivo, usando una metaheurı́stica basada en población
estos problemas. Sin embargo, la dificultad de estos proce- denominada Multiobjective Shuffled Frog-Leaping Algorithm
sos de optimización continúa creciendo con la adopción de (MO-SFLA) [6]. Bajo implementaciones MPI+OpenMP, exa-
formulaciones más realistas, escenarios Big Data, múltiples minaremos el impacto de distintas polı́ticas de planificación
funciones objetivo, etc. Ası́, es habitual la presencia de tiempos (estática, guiada y dinámica) en el rendimiento paralelo del
de ejecución elevados que resultan inasumibles incluso al em- diseño algorı́tmico original, ası́ como diseños alternativos de
plear técnicas estocásticas de resolución. Las metaheurı́sticas la aproximación. El análisis planteado será efectuado sobre
paralelas han demostrado aplicabilidad potencial para lidiar cuatro instancias reales del problema basadas en secuencias
con estas cuestiones, obteniendo resultados significativos [1]. de proteı́nas, las cuales presentan un nivel superior de com-
A pesar de la naturaleza intrı́nsecamente paralela de las plejidad con respecto a otros tipos de datos biológicos [7]. La
metaheurı́sticas basadas en población, estos métodos pueden bondad de los resultados obtenidos será estudiada mediante
comparativas con otros métodos del estado del arte.
Este trabajo ha sido parcialmente financiado por la AEI (Agencia Estatal de
Investigación, España) y el FEDER (Fondo Europeo de Desarrollo Regional, Este artı́culo se organiza del siguiente modo. La Sección
UE), bajo el proyecto TIN2016-76259-P (proyecto PROTEIN), ası́ como por II detalla la formulación del problema estudiado. La Sección
la FCT (Fundação para a Ciência e a Tecnologia, Portugal) bajo los proyec- III describe diseños y polı́ticas de planificación para MO-
tos UID/CEC/50021/2013 y LISBOA-01-0145-FEDER-031901 (PTDC/CCI-
COM/31901/2017, HiPErBio). Sergio Santander-Jiménez agradece a la FCT el SFLA, examinándose resultados en la Sección IV. Finalmente,
soporte recibido a través del contrato postdoctoral SFRH/BPD/119220/2016. la Sección V destaca conclusiones y lı́neas futuras de trabajo.
687
II. F ORMULACI ÓN DEL P ROBLEMA cada posible valor de estado de carácter a cualquier otro. Bajo
esta función, se da prioridad a la solución T = (V, E) que
La inferencia de relaciones ancestrales entre organismos
maximice el valor de verosimilitud L(T ) [2]:
representa uno de los problemas más importantes en biologı́a
evolutiva [2]. Dicho problema involucra el estudio de un
alineamiento múltiple de secuencias de tamaño N ×M (donde
M X
Y
L(T ) = πx [Pxy (tru )Lp (ui = y)]
N es el número de secuencias y M la longitud de secuencia), (2)
i=1 x,y∈Λ
el cual es procesado para identificar patrones de divergencia y
similitud. Esta información es utilizada para inferir organismos ×[Pxy (trv ) Lp (vi = y)],
ancestrales hipotéticos y definir el curso de la evolución a donde Λ es el alfabeto de estados de carácter (aminoácidos
través de una estructura arborescente, conocida como árbol en el caso de secuencias de proteı́nas), πx la probabilidad
filogenético T = (V, E). En particular, los nodos internos estacionaria de observar el valor de estado x, r ∈ V la raı́z de
del conjunto de nodos V describen los ancestros potenciales T con hijos u, v ∈ V , Pxy (t) la probabilidad de mutación de
cuya evolución dio lugar a los organismos caracterizados en x a otro estado y en un tiempo t (siendo tru y trv la longitud
el alineamiento de entrada, organismos que se localizan en los de las ramas (r, u), (r, v) ∈ E), y Lp (ui = y), Lp (vi = y) las
nodos hoja. La definición de relaciones evolutivas se efectúa a verosimilitudes parciales de observar y en ui y vi .
través del conjunto de ramas E, donde se definen los enlaces III. D ESCRIPCI ÓN DE M ÉTODOS
ancestro-descendiente entre nodos emparentados.
MO-SFLA es una metaheurı́stica que integra mecanismos
La aplicación de procedimientos de optimización en este
multiobjetivo en el método frog leaping optimization [8].
problema tienen por objeto identificar el árbol filogenético
En cada iteración, los popSize individuos que conforman
que maximice o minimice un determinado criterio de op-
la población son ordenados (según sus valores de fitness)
timalidad biológico, lo cual implica la exploración de un
y distribuidos uniformemente en m particiones denominadas
espacio de filogenias S. La principal cuestión que surge en
memeplexes. Cada memeplex contiene n=popSize/m indivi-
este contexto viene dada por el crecimiento exponencial de
duos, cuya evolución se produce separadamente durante nl
S con el número de secuencias N , definiéndose el número
pasos de aprendizaje. Una vez todos los memeplexes han sido
de posibles soluciones candidatas en S de acuerdo al doble
procesados, son combinados para permitir una compartición
factorial (2N − 5)!! [2]. Otros factores, tales como la longitud
de información entre todos los memeplexes, actualizando la
de secuencia M , el tipo de datos contenido en el alineamiento
población para la siguiente generación.
(por ejemplo, aminoácidos) y la consideración conjunta de
Para la adaptación al problema abordado, MO-SFLA in-
múltiples criterios de optimalidad, contribuyen al elevado coste
cluye una representación del individuo basada en matrices
computacional del problema. Todo ello impide la aplicación
de distancia filogenéticas. Una solución candidata vendrá
de aproximaciones serie tradicionales.
codificada por una matriz simétrica δ que contiene en cada
En este artı́culo, afrontamos estas cuestiones mediante apro-
entrada δ[x, y] la distancia evolutiva entre los organismos x
ximaciones metaheurı́sticas paralelas. La formulación adopta-
e y. El mapeo de soluciones desde este espacio de decisión
da del problema involucra la optimización de dos funciones
matricial al espacio de filogenias se lleva a cabo mediante el
objetivo: parsimonia y verosimilitud. Por un lado, la par-
método de reconstrucción de árboles filogenéticos BIONJ [2].
simonia cuantifica el número de cambios observados entre
La etapa de inicialización de la población considerará matrices
las secuencias de nodos emparentados. El objetivo radica en
de distancia calculadas a partir de topologı́as filogenéticas
inferir la hipótesis evolutiva más simple, dando prioridad a
iniciales generadas mediante técnicas de bootstraping [2].
la solución T = (V, E) que minimice el número de cambios
El Pseudocódigo 1 detalla el diseño original de MO-SFLA,
medidos a través del valor de parsimonia P (T ) [2]:
el cual realiza el proceso de optimización hasta que un
determinado criterio de parada (en nuestro caso, un máximo de
X
M X
P (T ) = C(ui , vi ), (1) evaluaciones) es satisfecho. Al comienzo de cada generación,
i=1 (u,v)∈E los individuos de la población son ordenados según su calidad
multiobjetivo (lı́nea 7 en el Pseudocódigo 1), manteniendo
donde (u, v) ∈ E representa la rama de la topologı́a que las popSize soluciones más prometedoras conforme a sus
conecta dos nodos u, v ∈ V , ui y vi son los valores de estado valores de ranking Pareto (fast non-dominated sort) y densidad
del i-ésimo carácter de las secuencias correspondientes a u y (distancia de crowding) [9]. Tras la ordenación, se definen los
v, y C(ui , vi ) indica las mutaciones observadas entre u y v memeplexes mediante la distribución de individuos de manera
(C(ui , vi )=1 si ui 6= vi y C(ui , vi )=0 en caso contrario). iterativa, asignando el individuo i-ésimo al memeplex i %m.
Por su parte, la función de verosimilitud establece una La generación de nuevas soluciones candidatas dentro de
medida probabilı́stica de la plausibilidad de que el árbol cada memeplex se realiza mediante la definición de distintos
filogenético evaluado haya dado lugar efectivo a la diversidad operadores de búsqueda (lı́neas 17-26), que son aplicados
observada en el alineamiento de entrada. Los cálculos de según el estado actual del proceso de optimización. Dado
′
verosimilitud se realizan conforme a modelos de evolución un memeplex M emi , generamos una nueva solución Pnew
que definen las probabilidades de observar mutaciones desde conforme a la siguiente formulación:
688
Pseudocódigo 1 MO-SFLA Paralelo multicore: 1) el procesamiento de memeplexes puede efec-
1: MPI_Init /* inicializando proceso MPI #i */ tuarse de manera independiente de una memeplex a otro; y
2: #pragma omp parallel num_threads (num_hilos)
3: mientras ! criterio de parada (maxEval) hacer 2) la generación de soluciones candidatas dentro del mismo
4: /* Definición y asignación de memeplexes */ memeplex no presenta dependencias de un paso de aprendizaje
5: #pragma omp single
6: si proceso maestro entonces (iteración del bucle) a otro. Estos dos niveles son apropiados
7: {Mem1 ... Memm } ← Ordenación y Distribución (P , popSize) para su explotación mediante MPI+OpenMP [10], [11].
8: BestGlobal ← Identificar Mejor Global ({Mem1 ... Memm })
9: /* ∀i : i = 2 a m */ En cada generación, un proceso maestro se encargará ini-
10: MPI_Send (Memi , n, i), MPI_Send (BestGlobal, 1, i) cialmente de la gestión de la población y la definición de
11: si no
12: MPI_Recv (Memi , n, master id), MPI_Recv (BestGlobal, 1, master id) memeplexes, distribuyendo adecuadamente los individuos. Los
13: fin si memeplexes resultantes serán asignados a distintos proce-
14: BestLocal ← Identificar Mejor Local (Memi )
15: /* Tareas paralelas: evolución del memeplex asignado */ sos trabajadores mediante las funciones MPI MPI_Send y
16: #pragma omp for MPI_Recv (lı́nea 10 en el Pseudocódigo 1 para el lado
17: para j = 1 to nl hacer
18: ′
Pnew ← Aprendizaje Mejor Local (BestLocal, Memi(n−j) ) emisor - maestro, y lı́nea 12 para el lado receptor - traba-
′
19: si ! Pnew
′
≻ Memi(n−j) entonces jador). Concluida la comunicación, cada proceso (incluyendo
20: Pnew ← Aprendizaje Mejor Global (BestGlobal, Memi(n−j) )
21: ′
si ! Pnew ≻ Memi(n−j) entonces el maestro) realizará el procesamiento de los memeplexes
22: ′
Pnew ← Búsqueda Local (Memi(n−j) ) asignados (lı́neas 15-26), usando la directiva #pragma omp
23: fin si
24: fin si
for para distribuir las iteraciones del bucle entre los hilos
25: Memi(n−j) ← Pnew ′
de ejecución. Terminado el procesamiento de memeplexes,
26: fin para
27: /* Entrega de resultados */
los resultados obtenidos son comunicados mediante funciones
28: #pragma omp single MPI al proceso maestro (lı́neas 31 -maestro, y 35 - trabajador),
29: si proceso maestro entonces
30: /* ∀i : i = 2 a m */
efectuándose entonces las tareas finales de la generación.
31: MPI_Recv (Memi , n, i) En este diseño, los procesos se ven afectados por distintas
32: P ← Mezclar Memeplexes (P , {Mem1 ... Memm })
fuentes de desequilibrio de carga. En primer lugar, la me-
33: ParetoFront ← Actualizar Frente de Pareto (P )
34: si no taheurı́stica plantea hasta tres estrategias de búsqueda dife-
35: MPI_Send (Memi , n, master id)
rentes que pueden ser ejecutadas en una misma iteración del
36: fin si
37: fin mientras bucle paralelo definido en la lı́nea 17. Ası́, cada iteración puede
38: MPI_Finalize /* finalizando proceso MPI #i */
implicar un número variable de operaciones en conformidad
con el éxito de las estrategias aplicadas. Además, la generación
de una nueva solución candidata involucra dos mecanismos es-
pecı́ficos del problema: la reconstrucción del árbol y el cómpu-
to de las funciones objetivo. Estas operaciones se caracterizan
Dxy = rand() · (Ref.δ[x, y] − M emij .δ[x, y]), (3)
no solo por el hecho de incluir cálculos computacionalmente
′
Pnew .δ[x, y] = M emij .δ[x, y] + Dxy , (4) costosos, sino también por presentar divergencias en tiempo
de ejecución según las caracterı́sticas de la solución candidata.
donde rand() es un número aleatorio de una distribución Para afrontar dichos problemas de desequilibrio de carga,
uniforme en el rango [0, 1] y M emij el individuo en M emi consideraremos primero el uso de las polı́ticas de planificación
procesado en el paso de aprendizaje j. Ref representa una de bucles paralelos definidas en el estándar OpenMP. Concre-
solución que es tomada como referencia durante este proceso. tamente, examinamos tres aproximaciones diferentes:
Inicialmente, se toma como Ref el mejor individuo local de 1. Estática. Las iteraciones son divididas en bloques que
′
M emi (lı́nea 18). En caso de que la solución resultante Pnew se asignan de manera estática a cada hilo en modo
no mejore a M emij , se repite el proceso anterior tomando round-robin según el identificador de hilo. Dado que
como Ref el mejor individuo global de toda la población (lı́nea esto no permite la resolución de desequilibrios de carga
20). Si sigue sin observarse mejora, se aplica una búsqueda potenciales (al tener cada hilo sus iteraciones asignadas a
local basada en los operadores topológicos nearest neighbour priori), usaremos esta polı́tica como punto de referencia.
interchange y subtree pruning and regrafting [2] (lı́nea 22). 2. Dinámica. En esta aproximación, los hilos solicitan
Al final de la generación (lı́neas 32, 33), los memeplexes gradualmente nuevas iteraciones al terminar las que han
son reunificados para actualizar la estructura de la población, ido manejado previamente. Ası́, los hilos más rápidos
la cual es usada a su vez para identificar soluciones no pueden comenzar el procesamiento de nuevos bloques
dominadas y ası́ almacenarlas en la estructura ParetoFront. Al inmediatamente tras acabar su carga de trabajo inicial.
satisfacerse el criterio de parada, dicha estructura contendrá 3. Guiada. De manera similar a la aproximación dinámica,
las soluciones no dominadas encontradas a lo largo de la la planificación guiada permite la asignación gradual de
ejecución, representando la salida del algoritmo. iteraciones a los hilos. Se asignan nuevas iteraciones
mediante bloques de tamaño proporcional al número de
III-A. Diseños Paralelos y Polı́ticas de Planificación iteraciones aún no asignadas dividido entre el número de
MO-SFLA presenta dos caracterı́sticas clave que hacen a hilos, reduciendo estos bloques de manera exponencial
esta metaheurı́stica adecuada para su ejecución en clusters hasta un mı́nimo de 1 (configuración estándar).
689
Pseudocódigo 2 MO-SFLA Paralelo Basado en Contadores Tabla I
1: MPI_Init /* inicializando proceso MPI #i */ C ONJUNTOS DE DATOS DE P ROTE ÍNAS U SADOS EN LA
2: #pragma omp parallel num_threads (num_hilos) E XPERIMENTACI ÓN
3: mientras ! criterio de parada (maxEval) hacer
Instancia N M Organismo Modelo Evolutivo [2]
5: BestGlobal, {Mem1 ... Memm } ← Gestionar Población (P , popSize)
6: Asignación Memeplex-Proceso (BestGlobal, Memi , i) /*∀i : i = 2 a m*/ M88x3329 88 3329 Hongos termófilos [12] LG+Γ
7: Bestlocal ← Identificar Mejor Local (Memi ) M187x814 187 814 Hongos micorrı́cicos [13] LG+Γ
8: #pragma omp for M260x1781 260 1781 Beta vulgaris [14] JTT+Γ
9: para j = 1 to nl hacer M355x1263 355 1263 Hemiascomicetos [15] LG+Γ
10: switch (Memi(n−j) .counter)
′
11: caso 0: Pnew ← Aprendizaje Mejor Local (Bestlocal , Memi(n−j) )
′
12: caso 1: Pnew ← Aprendizaje Mejor Global (Bestglobal , Memi(n−j) )
′ Tabla II
13: caso 2: Pnew ← Búsqueda Local (Memi(n−j) )
14: ′
si Pnew ≻ Memi(n−j) || Memi(n−j) .counter == 2 entonces C OMPARATIVA PARALELA (S PEEDUPS SU Y E FICIENCIA EF)
′
15: Memi(n−j) ← Pnew , Memi(n−j) .counter ← 0
16: si no M88x3329 (Tserie = 57111,63 segundos)
17: Memi(n−j) .counter ← Memi(n−j) .counter + 1
Estática Dinámica Guiada Contadores
18: fin si
19: fin para Cores SU EF( %) SU EF( %) SU EF( %) SU EF( %)
8 6,93 86,59 7,21 90,10 7,09 88,65 7,81 97,67
21: Comunicación de Resultados (Memi , master id) /*∀i : i = 2 a m*/ 16 11,58 72,38 13,53 84,57 13,31 83,18 14,94 93,38
22: P , ParetoFront ← Tareas Finales de la Generación (P , {Mem1 ... Memm }) 32 19,10 59,69 22,83 71,36 22,34 69,82 28,18 88,06
23: fin mientras 48 26,18 54,54 28,88 60,17 27,84 57,99 39,86 83,04
24: MPI_Finalize /* finalizando proceso MPI #i */
M187x814 (Tserie = 44171,92 segundos)
8 6,16 77,06 6,54 81,78 6,46 80,74 7,70 96,27
16 10,70 66,88 12,18 76,12 11,96 74,78 14,75 92,19
Una alternativa a esta aproximación radica en la adaptación 32 18,58 58,06 21,85 68,28 20,99 65,60 27,71 86,59
48 23,96 49,92 28,33 59,03 26,04 54,25 39,66 82,63
del diseño para que cada iteración del bucle de procesamiento M260x1781 (Tserie = 66748,33 segundos)
de memeplexes ejecute solo una de las estrategias de búsqueda 8 7,37 92,16 7,69 96,18 7,55 94,33 7,86 98,28
definidas. Esta idea viene plasmada en el Pseudocódigo 2, la 16 12,75 79,69 14,18 88,61 13,70 85,61 15,65 97,81
32 20,45 63,91 23,29 72,78 22,51 70,36 29,20 91,25
cual se basa en el empleo de contadores para medir el número 48 26,36 54,92 30,21 62,94 27,90 58,11 40,56 84,49
de intentos en que un individuo de la población no ha sido M355x1263 (Tserie = 96219,62 segundos)
mejorado. En función del valor de este contador, se decide 8 6,79 84,90 7,47 93,40 7,22 90,21 7,92 98,95
la estrategia de búsqueda a ser aplicada sobre dicho individuo 16 11,92 74,50 13,76 86,03 13,69 85,56 15,68 98,00
32 21,96 68,63 25,59 79,97 23,77 74,28 29,87 93,34
(lı́neas 10-13 del Pseudocódigo 2). Dado un individuo M emij , 48 29,30 61,04 32,97 68,69 30,80 64,17 42,63 88,82
un valor de 0 en su contador implicará la generación de la
nueva solución empleando el mejor individuo local de M emi ,
mientras que un valor de 1 conllevará el empleo del mejor de MO-SFLA fueron establecidos a los siguientes valores:
individuo global y un valor de 2 la búsqueda local. En caso popSize = 128, m = 4, n = 32, nl = 32, maxEval = 10000.
de observarse mejora, el contador asociado será reinicializado
IV-A. Evaluación del Rendimiento Paralelo
y la solución almacenada en M emij (lı́nea 15). En caso
contrario, la solución generada es descartada y el contador Con objeto de examinar el rendimiento paralelo, empleare-
de M emij incrementado (lı́nea 17). De esta manera, en la mos las métricas paralelas de aceleración o speedup y eficien-
siguiente generación el proceso trabajador efectuará un nuevo cia [11]. Consideraremos los resultados temporales medianos
intento sobre M emij considerando una estrategia de búsqueda (procedentes de 11 ejecuciones independientes por experimen-
diferente. Como en la versión original, se pueden emplear las to) obtenidos sobre distintos tamaños del sistema (8, 16, 32
polı́ticas de planificación de OpenMP para complementar el y 48 cores). La Tabla II presenta los resultados observados,
mecanismo de balanceo basado en contadores. ası́ como los tiempos de la versión serie de MO-SFLA Tserie
usados como referencia en el cálculo de las métricas paralelas.
IV. R ESULTADOS E XPERIMENTALES Centrándonos en primer lugar en los resultados del diseño
En esta sección abordamos la evaluación experimental de original (columnas 2, 3 - versión estática, 4, 5 - dinámica, y
los diseños paralelos y polı́ticas de planificación considerados 6, 7 - guiada), es posible observar el efecto del desequilibrio
para MO-SFLA. Para ello, examinaremos el rendimiento pa- de carga en el rendimiento de la versión inicial estática. De
ralelo obtenido en cuatro bases de datos reales de proteı́nas, hecho, la polı́tica estática no resulta adecuada para superar el
las cuales son descritas en la Tabla I. La experimentación fue umbral de 50 % de eficiencia en el caso de instancias como
efectuada sobre 4 nodos de cómputo de una infraestructura M187x814 con 48 cores, lo cual sugiere una baja utilización
clúster con interconexión Gigabit Ethernet. Estos nodos están de los recursos hardware disponibles. Por su parte, el empleo
compuestos por procesadores AMD Opteron 6174 de 12 cores de polı́ticas de planificación dinámica da lugar a una reducción
a 2,2GHZ (un total de 48 cores disponibles) con 12MB de considerable en la sobrecarga de la versión estática, reduciendo
memoria caché L3 y 16GB de RAM DDR3, Ubuntu 14.04LTS los tiempos de espera a nivel de hilos hasta un 33,6 % (para
como sistema operativo y el compilador GCC 5.2.1. la instancia M355x1263) y los de sincronización inter-proceso
De acuerdo a las caracterı́sticas del clúster empleado y los hasta un 45,4 % (M187x814). Esto implica que, para el diseño
estudios paramétricos efectuados, los parámetros de entrada original de MO-SFLA, la planificación dinámica consigue el
690
eficiencias medias de 88,5 % (8 cores), 82,3 % (16 cores),

70,0 % (32 cores) y 58,6 % (48 cores). Con respecto a la
versión estática, la planificación guiada reduce hasta un 13,7 %
(M355x1263) los tiempos de espera entre hilos, ası́ como hasta
un 33,3 % (M187x814) la sincronización entre procesos. Sin
embargo, estos resultados no igualan la calidad de la polı́tica
dinámica, la cual representa la aproximación más adecuada en
el contexto del diseño original de MO-SFLA.
Considerando estos resultados, hemos aplicado la polı́tica
dinámica a su vez en el diseño basado en contadores de MO-
(a) M88x3329 SFLA. Los speedups y eficiencias obtenidos son mostrados en
las columnas 8, 9 de la Tabla II. Conforme a estos resultados,
el mecanismo alternativo estudiado consigue mejorar de ma-
nera significativa la escalabilidad paralela del diseño original,
consiguiendo factores de aceleración medios de 7,8x (8 cores),
15,1x (16 cores), 28,7x (32 cores) y 40,7x (48 cores). A través
de un mayor equilibrado de tareas en el bucle paralelo de
procesamiento de memeplexes, esta alternativa permite reducir
los tiempos de espera entre hilos hasta un 72,1 % (M88x3329),
dando lugar a una reducción de hasta 92,0 % (M187x814) en
los tiempos de sincronización entre procesos. Como resultado,
el diseño basado en contadores obtiene una eficiencia media
(b) M187x814 de 84,7 % para 48 cores, representando una mejora notable
con respecto al 62,7 % de la versión original dinámica.
Para validar la bondad de estos resultados, la Figura 1
presenta una comparativa de rendimiento paralelo entre el
diseño original con planificación dinámica de MO-SFLA, el
diseño basado en contadores, y la herramienta filogenética
paralela IQ-TREE (la cual integra técnicas MPI+OpenMP)
[3]. Estos resultados dan cuenta de que el diseño original
dinámico obtiene una mejorı́a con respecto a IQ-TREE a
partir de escenarios de 32 / 48 cores para M187x814, ası́
como en M260x1781 y, especialmente, M355x1263. Por su
parte, el diseño basado en contadores presenta las mejores
(c) M260x1781 propiedades de escalabilidad de la comparativa, mejorando de
manera significativa los resultados de IQ-TREE en todos los
escenarios de evaluación considerados. Todo ello redunda en la
relevancia de la estrategia adoptada para minimizar problemas
de balanceo de carga en el diseño algorı́tmico de MO-SFLA.
IV-B. Resultados Biológicos

A continuación abordamos la validación de calidad de
solución del método, usando resultados medianos de 31 ejecu-
ciones independientes por instancia. En primer lugar, exami-
naremos el rendimiento multiobjetivo mediante el empleo de
la métrica de hipervolumen (usando los puntos de referencia
(d) M355x1263 definidos en [6]). En este contexto, es preciso señalar que,
para este problema, no se observaron diferencias estadı́stica-
Figura 1. Comparativas de Rendimiento Paralelo (MO-SFLA Original mente significativas entre las muestras de hipervolumen de la
Dinámico, MO-SFLA Basado en Contadores e IQ-TREE)
versión original de MO-SFLA y la versión basada en conta-
dores, de acuerdo a los tests de ANOVA / Wilcoxon-Mann-
Whitney [16]. La Tabla III introduce los valores medianos
rendimiento paralelo más satisfactorio en la comparativa, con de hipervolumen observados, en comparación a los obtenidos
eficiencias medias de 90,4 % (8 cores), 83,8 % (16 cores), por el algoritmo estándar NSGA-II [9]. MO-SFLA es capaz
73,1 % (32 cores) y 62,7 % (48 cores). En esta comparativa, de obtener valores de hipervolumen en el rango 75,39 % -
la polı́tica guiada representa un escenario intermedio, con 81,99 %, en comparación a los hipervolúmenes de 74,95 % -
691
Tabla III basadas en datos de secuencias de proteı́nas. Para el diseño

C OMPARATIVAS M ULTIOBJETIVO : H IPERVOLUMEN original, la aproximación dinámica dio lugar a un rendimiento
más satisfactorio que el resto de polı́ticas, mejorando la
Instancia MO-SFLA NSGA-II
eficiencia media del algoritmo de 55,2 % (versión estática) a
M88x3329 75,39±0,04 74,95±0,12
M187x814 77,58±0,58 76,20±0,58
62,7 % para 48 cores. Además, la introducción del mecanismo
M260x1781 80,71±0,23 77,46±0,91 alternativo de balanceo basado en contadores permitió ir un
M355x1263 81,99±0,19 80,52±0,22 paso más allá en la explotación de los recursos hardware,
demostrando eficiencias hasta de 88,8 % sin afectar signifi-
Tabla IV cativamente a la calidad de los frentes de Pareto generados.
C OMPARATIVAS F ILOGEN ÉTICAS : PARSIMONIA Como trabajo futuro, pretendemos afrontar la explotación de
recursos de computación heterogénea para acelerar el método
Instancia MO-SFLA TNT
propuesto, explorando alternativas dependientes e indepen-
M88x3329 33490 33490 dientes el problema. Se estudiarán a su vez estrategias adap-
M187x814 29847 29847
M260x1781 43529 43529 tativas para mejorar las capacidades de búsqueda en espacios
M355x1263 54823 54823 de decisión difı́ciles de abordar, ası́ como la evaluación del
diseño en otros problemas bioinformáticos.
Tabla V R EFERENCIAS
C OMPARATIVAS F ILOGEN ÉTICAS : V EROSIMILITUD
[1] E. Alba, G. Luque, and S. Nesmachnow, “Parallel metaheuristics: recent
Instancia MO-SFLA IQ-TREE GARLI advances and new trends,” International Transactions in Operational
M88x3329 -149094,84 -149094,84 -149111,00 [2] P. Lemey, M. Salemi, and A.-M. Vandamme, The Phylogenetic Hand-
M187x814 -133871,90 -133871,96 -133876,72 book: a Practical Approach to Phylogenetic Analysis and Hypothesis
M260x1781 -163895,79 -163899,10 -163982,64 Testing. Cambridge: Cambridge Univ. Press, 2009.
M355x1263 -231186,34 -231301,11 -231859,24 [3] L. Nguyen, H. Schmidt, A. Haeseler, and B. Minh, “IQ-TREE: A fast
and effective stochastic algorithm for estimating maximum likelihood
phylogenies,” Mol. Biol. Evol., vol. 32, no. 1, pp. 268–274, 2015.
[4] A. L. Bazinet, D. J. Zwickl, and M. P. Cummings, “A Gateway for
80,52 % mostrados por NSGA-II. Estos resultados sugieren Phylogenetic Analysis Powered by Grid Computing Featuring GARLI
que MO-SFLA da lugar a la obtención de frentes de Pareto 2.0,” Systematic Biology, vol. 63, no. 5, pp. 812–818, 2014.
[5] W. Cancino, L. Jourdan, E.-G. Talbi, and A. C. B. Delbem, “Parallel
de calidad significativa en todas las instancias analizadas. Multi-Objective Approaches for Inferring Phylogenies,” in Proc. of
Las Tablas IV y V introducen comparativas de calidad EVOBIO’2010, ser. LNCS, vol. 6023. Springer, 2010, pp. 26–37.
biológica con otros métodos filogenéticos del estado del arte. [6] S. Santander-Jiménez, M. A. Vega-Rodrı́guez, and L. Sousa, “Multi-
objective Frog-Leaping Optimization for the Study of Ancestral Rela-
En la Tabla IV, comparamos dicha calidad desde la perspectiva tionships in Protein Data,” IEEE Trans. Evol. Comput., pp. 1–14 (DOI:
de parsimonia con respecto a la herramienta heurı́stica TNT 10.1109/TEVC.2017.2 774 599), 2018.
[17]. Según este criterio, el método multiobjetivo MO-SFLA [7] H. Matsuda, H. Yamashita, and Y. Kaneda, “Molecular Phylogenetic
Analysis using both DNA and Amino Acid Sequence Data and Its
es capaz de mantener, en todas las instancias analizadas, la Parallelization,” Genome Informatics, vol. 5, pp. 120–129, 1994.
calidad filogenética obtenida por TNT. Por su parte, la Tabla [8] A. Sarkheyli, A. M. Zain, and S. Sharif, “The role of basic, modified
V presenta una comparativa de resultados de verosimilitud con and hybrid shuffled frog leaping algorithm on optimization problems: a
review,” Soft Computing, vol. 19, no. 7, pp. 2011–2038, 2015.
IQ-TREE [3] y el algoritmo evolutivo GARLI [4]. Conforme [9] K. Deb, A. Pratap, S. Agarwal, and T. Meyarivan, “A Fast and Eli-
a los resultados obtenidos, MO-SFLA da lugar a una mejora tist Multi–Objective Genetic Algorithm: NSGA-II,” IEEE Trans. Evol.
en verosimilitud en las instancias con mayor número de se- Comput., vol. 6, no. 2, pp. 182–197, 2002.
[10] W. Gropp, W. Lusk, and A. Skjellum, Using MPI: Portable Parallel Pro-
cuencias, confirmando la bondad de las soluciones generadas. gramming with the Message Passing Interface. 3rd edition. Cambridge,
MA, USA: The MIT Press, 2014.
V. C ONCLUSIONES [11] R. van der Pas, E. Stotzer, and C. Terboven, Using OpenMP - The Next
Este trabajo ha versado sobre la evaluación de diseños pa- Step. Cambridge, MA, USA: The MIT Press, 2017.
[12] I. Morgenstern et al., “A molecular phylogeny of thermophilic fungi,”
ralelos y polı́ticas de planificación para solucionar problemas Fungal Biology, vol. 116, no. 4, pp. 489–502, 2012.
de balanceo de carga en métodos metaheurı́sticos. Usando [13] A. Kovalchuk, A. Kohler, F. Martin, and F. O. Asiegbu, “Diversity
como caso de estudio una metaheurı́stica multiobjetivo para and evolution of ABC proteins in mycorrhiza-forming fungi,” BMC
Evolutionary Biology, vol. 15, no. 249, pp. 1–19, 2015.
reconstrucción filogenética, MO-SFLA, hemos identificado las [14] R. Stracke et al., “Genome-wide identification and characterisation of
distintas fuentes de desequilibrio de carga presentes en su R2R3-MYB genes in sugar beet (Beta vulgaris),” BMC Plant Biology,
diseño algorı́tmico. Para afrontarlos, hemos considerado el uso vol. 14, no. 249, pp. 1–17, 2014.
[15] P. J. Dias and I. Sá-Correia, “The drug:H+ antiporters of family 2
de distintas polı́ticas de planificación del estándar OpenMP (DHA2), siderophore transporters (ARN) and glutathione:h+antiporters
(estática, dinámica y guiada), ası́ como una aproximación (GEX) have a common evolutionary origin in hemiascomycete yeasts,”
algorı́tmica alternativa basada en el empleo de contadores para BMC Genomics, vol. 14, no. 901, pp. 1–22, 2013.
[16] D. J. Sheskin, Handbook of Parametric and Nonparametric Statistical
equilibrar la carga de trabajo de los hilos de ejecución. Procedures. 5th edition. NY, USA: Chapman & Hall/CRC, 2011.
Hemos evaluado experimentalmente las técnicas planteadas [17] P. A. Goloboff and S. A. Catalano, “TNT version 1.5, including a
en un clúster multicore compuesto por 48 núcleos de proce- full implementation of phylogenetic morphometrics,” Cladistics, vol. 32,
no. 3, pp. 221–238, 2016.
samiento, empleando para ello cuatro instancias del problema
692
Developing Genetic Algorithms using Different

MapReduce Frameworks: MPI vs. Hadoop*
Carolina Salto Gabriela Minetti Enrique Alba, Gabriel Luque

Facultad de Ingenierı́a CONICET Departamento de Lenguajes
Universidad Nacional de La Pampa Argentina Universidad de Málaga
Argentina [email protected] Málaga, Spain
[email protected] {eat,gabriel}@lcc.uma.es
Abstract—MapReduce is a quite popular paradigm, which

allows to no specialized users to use large parallel computational
platforms in a transparent way. Hadoop is the most used
implementation of this paradigm, and in fact, for a large amount
of users the word Hadoop and MapReduce are interchangable.
But, there are other frameworks that implement this program-
ming paradigm, such as MapReduce-MPI. Since, optimization
techniques can be greatly beneficiary of this kind of data-
intensive computing modeling, in this paper, we analyze the
performance effect of developing genetic algorithms (GA) using
different frameworks of MapReduce (MRGA). In particular, we
implement MRGA using Hadoop and MR-MPI frameworks.
We analyze and compare both implementations considering
relevant aspects such as efficiency and scalability to solve a large
dimension problem. The results show a similar efficiency level
between the algorithms but Hadoop presents a better scalability.
Index Terms—
693
Bioinspirados
(XIII MAEB)
A PLICACIONES EN M EDICINA
Y B IOTECNOLOGÍA
Organizadores:
JOSÉ M ANUEL COLMENAR Y JOSÉ IGNACIO H IDALGO
Strain Design as Multiobjective Network

Interdiction Problem: A Preliminary Approach*
Marina Torres Shouyong Jiang David Pelta Marcus Kaiser

Dept. of Computer Science and A.I. School of Computing Dept. of Computer Science and A.I. School of Computing
Universidad de Granada Newcastle University Universidad de Granada Newcastle University
Granada, Spain Newcastle, U.K. Granada, Spain Newcastle, U.K.
[email protected] [email protected] [email protected] [email protected]
Natalio Krasnogor
School of Computing
Newcastle University
Newcastle, U.K.
[email protected]
Abstract—Computer-aided techniques have been widely ap-

plied to analyse the biological circuits of microorganisms and
facilitate rational modification of metabolic networks for strain
design in order to maximise the production of desired bio-
chemicals for metabolic engineering. Most existing computational
methods for strain design formulate the network redesign as a
bilevel optimisation problem. While such methods have shown
great promise for strain design, this paper employs the idea of
network interdiction to fulfil the task. Strain design as a Multiob-
jective Network Interdiction Problem (MO-NIP) is proposed for
which two objectives are optimised (biomass and bioengineering
product) simultaneously in addition to the minimisation of the
costs of genetic perturbations (design costs). An initial approach
to solve the MO-NIP consists on a Nondominated Sorting Genetic
Algorithm (NSGA-II). The shown examples demonstrate the
usefulness of the proposed formulation for the MO-NIP and the
feasibility of the NSGA-II as a problem solver.
Index Terms—strain design, network interdiction, metabolic
networks, multiobjective bilevel optimisation
697
Un análisis de soluciones basadas en

Programación Genética para resolver
problemas de regresión simbólica de datos de
medidores continuos de glucosa
J. Ignacio Hidalgo, José Manuel Velasco, Juan Lanchares, Sergio Contador y Oscar Garnica
Universidad Complutense de Madrid
C/. Prof. José Garcı́a Santesmases 9, 28040, Madrid, España
Email: [email protected]
Resumen—Diabetes es el nombre de un grupo de en- paciente puede desarrollar complicaciones graves a lar-
fermedades metabólicas asociadas con la incapacidad del go plazo, incluyendo enfermedades cardiacas, ceguera,
cuerpo para regular los niveles de glucosa en sangre. Una insuficiencia renal o úlceras en los pies [3, 4].
solución ideal para la diabetes serı́a un páncreas artificial
que fuera capaz de mantener un buen control de los La DMT1 solo puede tratarse con insulina sintética
niveles de azúcar en la sangre y permitir que el paciente inyectada en el torrente sanguı́neo. Sin embargo, esta
tenga una vida normal, retrasando al mismo tiempo la no es una tarea fácil. Una dosis excesiva de insulina
aparición de complicaciones. Debido a esto, un páncreas puede producir hipoglucemia (definida como un valor
artificial necesita realizar predicciones precisas de la de glucosa en sangre inferior a 70 mg/dl). Si la
evolución de la glucosa utilizando diferentes horizontes de
tiempo. En este artı́culo analizamos diversas técnicas para hipoglucemia es muy grave (glucosa inferior a 50
la predicción de la glucosa. En concreto, comparamos mg/dl), puede llevar a la pérdida del conocimiento
la programación genética con selección estricta, una y a un coma diabético. En la Figura 1 podemos ver
aproximación más tradicional de programación genética la evolución de los niveles de glucosa en sangre en
y ARIM A con ventana de 24 y 48 horas. El análisis de un paciente diabético. Se observa como los niveles
los resultados se realiza utilizando las métricas Clarke
Error Grid y Parkes Error Grid. de glucosa se encuentran en la zona de hiperglucemia
durante un periodo largo de tiempo y, los episodios de
I. I NTRODUCCI ÓN hiperglucemia grave o hipoglucemia son frecuentes.
Algunos pacientes con complicaciones graves han
El páncreas es una glándula del sistema endocrino sido operados mediante un trasplante de páncreas, pero
que produce insulina y glucagón. Estas dos hormonas esta opción puede producir varios problemas nuevos.
mantienen los niveles de glucosa en sangre dentro El paciente trasplantado debe tomar medicamentos
de los rangos óptimos y regulan el metabolismo de inmunosupresores para evitar que su sistema inmune
los carbohidratos. Existe un grupo de enfermedades ataque su nuevo páncreas, y este tratamiento puede
metabólicas asociadas con la incapacidad del cuerpo coadyuvar al desarrollo de infecciones bacterianas o
para regular el metabolismo que pueden producir ni- virales y cáncer. Una solución ideal para la DMT1 serı́a
veles elevados de glucosa en sangre durante un periodo un Páncreas Artificial (PA) [5] capaz de mantener el
de tiempo prolongado. Estas enfermedades se llaman control de los niveles de azúcar en la sangre y permitir
Diabetes [1]. En 2015, se estimó que más de 415 que el paciente tenga una vida normal, evitando al
millones de personas en todo el mundo la padecı́an mismo tiempo, o al menos retrasando, la aparición
[2]. La Diabetes Mellitus Tipo 1 (DMT1), que suele de complicaciones. En la Figura 2 se muestra la
manifestarse en edades tempranas, representa el 10 % estructura básica de un PA. Uno de los componentes es
de este número. La DMT1 es un trastorno autoinmune un sistema continuo de monitorización de la glucosa
crónico por el que el sistema inmune ataca las células que consiste en un biosensor [6, 7] (generalmente un
secretoras de insulina del páncreas. El resultado es que sensor que mide el nivel de glucosa intersticial [8]) y
las células no asimilan el azúcar y, como consecuencia, un transmisor inalámbrico. El otro componente es un
hay un aumento en los niveles de glucosa en sangre dispositivo integrado con varias funcionalidades. Por
que se conoce como hiperglucemia (niveles de glucosa un lado, recibe las muestras de glucosa y las almacena.
en sangre superiores a 140 mg/dl). Si esta situación Por otro lado, controla una bomba de insulina; un
se extiende durante un largo periodo de tiempo, el dispositivo que inyecta bolos de insulina en el torrente
698
sanguı́neo. Para determinar la cantidad de insulina, el nal de programación genética y el método ARIM A
dispositivo tiene en cuenta varios factores, entre los que con ventana de 24 y 48 horas. Además, queremos
se encuentran el tipo y las caracterı́sticas de la insulina. ver si los resultados tienen una interpretación correcta
Principalmente, hay cuatro tipos de insulinas (insulina comparándolos utilizando las métricas de Clarke Error
de acción rápida, de acción corta, de acción intermedia Grid y Parkes Error Grid.
y de acción lenta) que se clasifican dependiendo del
tiempo de retraso antes de que comiencen a actuar Blood Glucose Levels − 8 Days
(inicio), el momento en que la insulina alcanza su Region

Severe−Hyperglycemia
máximo efecto (pico) y la demora final hasta que cesa Hyperglycemia
Hypoglycemia
su efecto (duración). La insulina de acción rápida, 300
Legend
Glucose
tiene un inicio entre 5-15 minutos, un pico entre 30-60
minutos y una duración entre 3-5 horas. La insulina de
acción corta o regular, tiene un inicio de 30 minutos,
Glucose
un pico entre 2-3 horas y una duración entre 3-6 horas. 200
La insulina de acción intermedia, tiene un inicio entre

2-4 horas, un pico entre 4-12 horas y una duración
entre 12-18 horas. La insulina de acción lenta tiene
un inicio entre 1-2 horas, un pico entre 6-8 horas 100
y una duración entre 6-23 horas, dependiendo de la

dosis suministrada. Debido a esto, surge la necesidad 0 200 400 600 800
de realizar predicciones precisas de la evolución de la Samples
glucosa utilizando diferentes horizontes de tiempo. Figura 1: Valores de Glucosa Reales - 8 Dı́as
Esta investigación está motivada por el desafı́o de
predecir con precisión los niveles futuros de glucosa
para que un sistema automático pueda decidir cuándo
y cuánta insulina inyectar a fin de mantener el nivel
de azúcar en la sangre en un rango saludable. Al
mismo tiempo, es muy importante para un sistema de
control de la glucosa en sangre, evitar las predicciones
que puedan desencadenar tratamientos innecesarios o,
incluso peor, tratamientos que son perjudiciales para el
paciente. Aunque hay algunas aproximaciones clásicas,
todavı́a hay mucho trabajo por hacer para las predic-
ciones dentro de un horizonte de más de 60 minutos.
Una solución que ha demostrado ser adecuada para
predecir los niveles de glucosa es la utilización de
algoritmos basados en la Evolución Gramatical (EG)
[9]. Sin embargo, uno de los principales obstáculos
que encontraron los investigadores para entrenar a los Figura 2: Páncreas Artificial
modelos de EG es la escasez de cantidades signifi-
cativas de datos. Como en muchos otros campos de El resto del artı́culo está organizado de la siguiente
la medicina, la recopilación de datos de pacientes manera. La sección II describe los antecedentes teóri-
diabéticos reales es muy compleja. Los modelos de cos de las técnicas empleadas y explica en detalle
EG entrenados con un pequeño conjunto de datos, por nuestra metodologı́a. El trabajo experimental y los
lo general, sufren de sobreajuste y tienen un poder resultados se muestran en la sección III.
de predicción limitado. Para evitar esta situación, en
[10] se ha propuesto aumentar los registros de datos II. M ÉTODOS
de glucosa con datos sintéticos con buenos resultados. Nuestra propuesta es aplicar varias técnicas de
También se han realizado otras comparativas entre aprendizaje con el fin de obtener modelos personali-
técnicas relacionadas con la EG, como la Programación zados para la predicción del nivel de glucosa de cada
Genética (PG) con selección estricta. Sin embargo, esta paciente siguiendo un enfoque en el que los modelos
última tiene un alto tiempo de ejecución. se extraen de los datos. Llevaremos a cabo una primera
En este artı́culo investigamos otras opciones; en fase de entrenamiento sobre un conjunto de datos de
concreto queremos comparar la programación genética pacientes que producirán un número de modelos que
con selección estricta, una aproximación más tradicio- se evaluarán en una fase de prueba con datos de
699
los mismos pacientes. Consideramos una ventana de En este artı́culo vamos a utilizar el modelo de
predicción de 2 horas. Los datos están disponibles absorción de Berger y Rodband [11] que describe la
en forma de series temporales con observaciones a farmacocinética para distintos tipos de insulina.
intervalos de cinco minutos. Se adquieren las series de A partir de las series temporales de glucosa, insulina
glucosa, ingestas de carbohidratos e insulinas. Hemos y carbohidratos, definimos un conjunto de caracterı́sti-
transformado este problema de predicción de series cas que describimos a continuación.
de tiempo en múltiples problemas de regresión inde- Agregamos los valores de las series en intervalos de
pendientes, donde el objetivo es encontrar modelos tiempo que se calculan utilizando la siguiente ecuación:
independientes para la predicción de la glucosa en
P
sangre a 2 horas. De esta manera podemos aplicar i∈rango (Xi+1 )
cualquier técnica de regresión, incluida la regresión media(X, t, rango) = (2)
|rango|
simbólica usando PG.
Un inconveniente de esta transformación es que los El objetivo es reducir el número de caracterı́sticas
modelos no nos permiten hacer predicciones sobre utilizadas para generar los modelos. Para cada instante
ningún otro punto de la ventana de predicción. Sin de tiempo t definimos el conjunto de caracterı́sticas
embargo, esto no es un problema desde un punto de F (t) que describen los valores históricos Fhis de las
vista práctico, ya que para los pacientes diabéticos es series temporales G, I y C, ası́ como los valores
suficiente con predecir los valores de cuatro puntos futuros Ff ut de I y C:
distintos en la ventana de predicción. La ventaja es
que podemos utilizar los datos de los sistemas de F (t) = Fhis (G, t) ∪ Fhis (I, t) ∪ Fhis (C, t)∪
(3)
Monitorización Continua de la Glucosa (MCG) di- Ff ut (I, t) ∪ Ff ut (C, t) ∪ {G, I, C}
rectamente para hacer recomendaciones de insulina
basadas en distintos horizontes temporales, utilizando Fhis (X, t) = {media(X, t, [−15, 0]),
las ecuaciones dadas por los modelos obtenidos.
media(X, t, [−30, −15]),
Nuestro objetivo es obtener el siguiente modelo:
media(X, t, [−45, −30]),
Ĝt+120 =ft+120 ((Gt+i , i ∈ (−240 . . . 0)), (4)
(1) media(X, t, [−60, −45]),
(It+i , Ct+i , i ∈ (−240 . . . + 120)) media(X, t, [−90, −60]),
donde t es el tiempo en minutos y estamos haciendo media(X, t, [−120, −90])}
predicciones hasta 120 minutos. G es la serie temporal
de valores medidos de concentración de glucosa en Ff ut (X, t) = {media(X, t, [0, 15]),
sangre, I es la serie temporal de insulina (bomba y media(X, t, [15, 30]),
bolo), y C es la cantidad de carbohidratos ingeridos
media(X, t, [30, 45]),
según lo estimado por los pacientes. En cada instante
temporal, los datos de t de hasta 4 horas antes están media(X, t, [45, 60]),
(5)
disponibles para la predicción. Para generar los mo- media(X, t, [60, 75]),
delos de predicción ft+120 usamos ARIM A y PG media(X, t, [75, 90]),
basada en árboles para la evolución de los modelos
media(X, t, [90, 105]),
de regresión simbólica. Adicionalmente, consideramos
dos predictores de referencia: Last y Avg. El primero media(X, t, [105, 120])}
considera la predicción como el último valor de gluco- II-B. Programación Genética
sa conocido. El segundo considera la predicción como
Para cada paciente se crean cuatro modelos dife-
la glucosa media de los últimos valores conocidos en
rentes basados en programación genética (P G, P G2,
un intervalo de 2 horas.
P G2com y P GOS) para predecir el nivel de glucosa a
II-A. Preprocesado de datos 2 horas. Se utiliza validación cruzada de 10 iteraciones
(10-fold Cross-Validation).
Los pacientes diabéticos pueden inyectarse insulina Cada modelo se generó usando el algoritmo de
de dos formas: mediante múltiples dosis de insulina regresión simbólica basada en programación genética
inyectada manualmente o mediante una bomba (infu- disponible en el software de código abierto Heuris-
sor continuo) de insulina. Existen tres categorı́as de ticLab versión 3.3.15 [12]. Para el conjunto de ter-
insulina: minales utilizamos las series temporales de glucosa,
Insulina Basal insulina, y carbohidratos para los modelos P G, P G2
Insulina Preprandial y P GOS; para P G2com utilizamos además las carac-
Insulina Correctora terı́sticas precalculadas en el apartado Preprocesado
700
de datos. En todos los modelos utilizamos también de Pearson entre los valores reales de glucosa en
constantes. Cada valor se acompaña con un peso de sangre y los valores obtenidos con el modelo [17].
valor real que se inicializa aleatoreamente usando una Los modelos de predicción finalmente seleccionados
distribución Normal N (µ = 1, σ = 1), y se muta se escalan linealmente para minimizar la suma de
aleatoriamente añadiendo un valor muestreado de N (µ los errores al cuadrado entre los valores reales y los
= 0, σ = 0.05). Las constantes con valores reales son resultados del modelo.
inicializadas al azar usando una distribución uniforme
U (-20.0, 20.0), y la mutación de constantes agrega un II-C. ARIMA
valor muestreado de N (µ = 0, σ = 1.0). El modelo autorregresivo integrado de media móvil
El conjunto de funciones utilizado es: {+, −, ∗, o ARIM A (Auto Regressive Integrated Moving Ave-
/, log(x), exp(x)}, donde se utilizan las variantes rage) es un modelo estadı́stico que utiliza variacio-
protegidas de las funciones división y logaritmo [13]. nes y regresiones de los datos, en particular series
Los modelos en la población inicial se han generado temporales, con el fin de encontrar los parámetros
usando Probabistic Tree Creator (PTC) [14] utilizan- del modelo más adecuados para predecir los valores
do diferentes tamaños para la población, y para los futuros. Se suele expresar como ARIM A(p, d, q),
árboles un lı́mite para la profundida máxima y un donde los parámetros p, d y q, indican el orden de las
máximo número de nodos permitidos. Las mismas distintas componentes del modelo (p es la componente
restricciones de profundidad y tamaño se han aplicado autorregresiva, d la integrada y q la media móvil). Si se
en las operaciones de cruce y mutación. Para el cruce, considera el efecto de la estacionalidad de los datos, el
utilizamos un operador de cruce de subárbol. Para la modelo toma la forma ARIM A(p, q, d)(P, Q, D)m , y
mutación utilizamos una variedad de operadores que está dado por la siguiente ecuación:
reemplaza un subconjunto completo del árbol con un
árbol inicializado al azar, o mutan todos los nodos del Φ(B m )φ(B)(1 − B m )D (1 − B)d yt =
árbol, o mutan solo un nodo del árbol seleccionado de (6)
c + Θ(B m )θ(B)εt
forma aleatoria. El operador de mutación seleccionado
al azar se ejecuta después de cada operación de cruce donde εt es ruido blanco con media 0 y varianza
con una tasa de mutación diferente. Utilizamos un σ 2 , B es el operador de retroceso, y φ(z), θ(z),
número máximo de generaciones y selección de aptitud Φ(z)yΘ(z), son polinomios de orden p, q, P y Q,
proporcional de padres. No hemos sintonizado los respectivamente.
parámetros de la PG especı́ficamente para esta tarea Uno de los principales problemas en el uso de los
de modelado, pero utilizamos configuraciones estándar modelos ARIM A es que el proceso de selección del
robustas. orden de las componentes generalmente se considera
Para P G y P GOS, utilizamos un tamaño de po- subjetivo y difı́cil de aplicar. Por eso, hemos utilizado
blación de 100 individuos y una profundidad máxima el modelo estacional auto.arima [18] con el software
de árbol de 8. El número máximo de generaciones es libre de análisis estadı́stico R versión 3.3.1 [19], que
25 con una tasa de mutación del 25 %. Para P G2 busca de forma automática las componentes del mo-
y P G2com , utilizamos un tamaño de población de delo seleccionando el orden apropiado.
300 individuos y una profundidad máxima de árbol
de 11. El número máximo de generaciones es 100 II-D. Clarke-Parkes Error Grid
con una tasa de mutación del 15 %. En todos los La precisión de las predicciones se analizan con
casos utilizamos un máximo número de nodos de árbol Clarke Error Grid y Parkes Error Grid. Clarke Error
permitidos de 100. Grid [20] se desarrolló para calcular la precisión clı́nica
En el caso de P GOS utilizamos selección estricta de los sistemas de MCG en sangre para todo el rango
de descendientes [15]. Cuando se usa selección estricta, de valores de glucosa, mediante las diferencias entre
los descendientes solo se aceptan si son mejores que los valores medidos por el sistema de medición y
ambos padres, en caso contrario son descartados. Esto los valores de referencia. Análogamente, se puede
tiene el efecto de que múltiples intentos repetidos de utilizar para calcular las diferencias entre los valores
selección de padres, el cruce, la mutación opcional y estimados en una predicción y los valores reales o de
la evaluación de la aptitud, son necesarios hasta que referencia. Los valores se representan en un gráfico con
uno de los descendientes se agrega a la población de coordenadas cartesianas donde el eje X representa los
la próxima generación [16]. El umbral de presión de valores reales y el eje Y los valores de la predicción,
selección para detener el algoritmo se estableció en siendo Y = X la predicción ideal, donde el valor real
100. coincide con el valor de la predicción. La particulari-
La función objetivo utilizada en todos los casos dad de esta representación es que el gráfico se divide
se calcula con el coeficiente de determinación R2 en cinco zonas dependiendo del grado de precisión
701
de las estimaciones de la glucosa. A continuación Tabla I: Número de observables disponibles para cada
describimos cada una de las zonas: paciente.
Paciente Observables
Zonas A y B: los valores en la zona A representan 559 10149
los valores de glucosa que se desvı́an de los 563 11853
valores de referencia menos del 20 %, o aquellos 570 10580
575 11697
que están en el rango de hipoglucemia (<70 588 12395
mg/dl), cuando la referencia es también <70 591 10601
mg/dl. Los valores en la zona B se desvı́an de los
valores de referencia en más del 20 %, aunque
el tratamiento clı́nico será correcto con una alta Tabla II: Caracterı́sticas de cada paciente para los
probabilidad. Los valores que se encuentran den- niveles de glucosa.
tro de las zonas A y B son clı́nicamente exactos Paciente Media Std T G<70 T G>250 T G[70,180]
y/o aceptables y, por lo tanto, el tratamiento [mg/dl] [mg/dl] [ %] [ %] [ %]
será clı́nicamente correcto. Tratamos estas dos 559 167.22 70.50 3.95 13.11 55.54
563 145.73 49.43 2.10 2.35 74.86
zonas de forma combinada en el análisis de los 570 187.22 62.37 1.80 17.16 43.75
resultados de nuestro experimento. 575 139.76 58.06 8.04 4.57 70.21
Zona C: los valores en esta zona pueden ser 588 165.09 50.60 0.94 4.96 63.47
591 156.83 57.38 3.02 7.03 64.62
peligrosos en algunas situaciones. El objetivo es
minimizar las predicciones incluidas en esta zona.
Zonas D-E: los valores incluidos en estas zonas Tabla III: Tiempos medios de ejecución de los modelos
son potencialmente peligrosos, ya que la predic- junto con su desviación tı́pica.
ción está lejos de ser aceptable y el tratamiento
Modelo Tiempo
indicado será diferente del correcto, y contrario [min]
en la zona E. De nuevo, el objetivo es minimizar PG 1.54 ± 0.14
las predicciones incluidas en esta zona. ARIM A 24h 15.18 ± 2.24
P G2com 19.76 ± 1.62
Parkes Error Grid [21] se publicó en 2000 como P G2 20.11 ± 1.73
ARIM A 48h 24.40 ± 4.42
una alternativa al uso de Clarke Error Grid. En él se P GOS 1453.43 ± 140.60
redefinen las zonas basándose en las zonas de Clarke
y en los lı́mites establecidos por 100 médicos expertos
en diabetes en una encuesta realizada en la conferencia Tabla IV: Predicciones (en porcentaje) a 2h obtenidas
American Diabetes Association Meetings de junio de para las distintas zonas con Clarke-Parkes Error Grid
1994. Estas definiciones son más flexibles, y permiten con ARIM A con entrenamiento de 24h y 48h.
incorporar el conocimiento de expertos para asignar las Paciente
zonas basándose en su experiencia.
Zona 559 563 570 575 588 591
Clarke con Entrenamiento de 24h

A 39.94 45.65 58.52 40.90 52.29 40.22
III. R ESULTADOS E XPERIMENTALES B 44.87 47.83 34.41 45.34 42.96 49.16
C 8.06 3.31 3.91 3.95 1.72 3.76
D 5.59 2.68 2.74 7.47 2.48 5.21
Se realiza un estudio retrospectivo de seis pacien- E 1.54 0.53 0.43 2.34 0.55 1.65
tes con DMT1. Los datasets utilizados proceden de Parkes con Entrenamiento de 24h
A 43.13 46.47 61.99 43.18 52.78 42.75
la Universidad de Ohio [22]. En concreto, hay dos B 42.43 45.55 32.55 42.01 41.66 46.91
hombres (563 y 570) y cuatro mujeres (559, 575, 588 C 12.25 7.47 4.96 12.69 5.08 8.78
y 591). Los datos son recolectados durante un periodo D 2.17 0.51 0.50 2.11 0.48 1.56
E 0.01 0.00 0.00 0.01 0.00 0.00
de ocho semanas mediante MCG intersticial registrada Clarke con Entrenamiento de 48h
con el sistema Medtronic 530G ( Medtronic).
c Todos A 38.01 46.81 61.30 41.93 52.75 41.95
los pacientes siguen una terapia con bomba de insulina. B 47.67 47.42 33.61 44.33 42.92 48.43
El número de observables por paciente que tenemos C 6.19 2.23 2.33 3.54 1.27 2.80
D 6.95 2.98 2.59 8.24 2.68 5.29
se muestran en la Tabla I. Las caracterı́sticas de cada E 1.17 0.56 0.17 1.95 0.38 1.54
paciente se muestran en la Tabla II. Para cada paciente Parkes con Entrenamiento de 48h
se calcula la glucosa media, la desviación estándar, A 40.23 47.32 63.93 43.99 53.03 43.67
B 45.67 45.59 31.00 41.23 41.44 45.66
y los porcentajes de tiempo donde el paciente tiene C 12.32 6.53 4.79 12.79 5.00 8.85
niveles de glucosa por debajo de 70 mg/dl, por encima D 1.79 0.57 0.28 1.97 0.53 1.79
de 250 mg/dl, y en el rango [70, 180] mg/dl. E 0.00 0.00 0.00 0.01 0.00 0.04
702
Las Tablas IV, V y VI (V y VI en ANEXO I) SpringerBriefs in Applied Sciences and Technology,

recogen los resultados para ARIM A y PG para las 2013.
distintas zonas en términos de los errores Clarke y [7] Eun-Hyung Yoo and Soo-Youn Lee. Glucose biosen-
sors: An overview of use in clinical practice. Sensors,
Parkes. 10(5):4558–4576, 2010.
Podemos observar que en algunos pacientes en los [8] Alexander Hildenbrand Hansen, Anne Katrine
que el control es muy bueno, las técnicas funcionan Duun-Henriksen, Rune Juhl, Signe Schmidt, Kirsten
de una manera similar. No obstante, el mejor modelo Nørgaard, John Bagterp Jørgensen, and Henrik
generado que más porcentajes de valores tiene en las Madsen. Predicting plasma glucose from interstitial
glucose observations using bayesian methods. Journal
zonas A y B es P G2com , donde el porcentaje medio of Diabetes Science and Technology, 8(2):321–330,
en las zonas ha sido 91.95 ± 4.27 [ %]. El modelo 2014.
generado con PG que más porcentajes de valores tiene [9] J. Ignacio Hidalgo, Esther Maqueda, José L. Risco-
en las zonas A y B es P G2com (aparece en 8 de los 12 Martı́n, Alfredo Cuesta-Infante, J. Manuel Colmenar,
casos). El segundo modelo es P GOS (aparece en 4 de and Javier Nobel. glucmodel: A monitoring and mo-
deling system for chronic diseases applied to diabetes.
los 12 casos). Comparando P G con P GOS, el modelo Journal of Biomedical Informatics, 48:183 – 192, 2014.
mejora cuando se utiliza selección de descendencia. [10] Jose Manuel Velasco, Oscar Garnica, Juan Lanchares,
Comparando P G2 con P G2com , el modelo mejora Marta Botella, and J. Ignacio Hidalgo. Combining
cuando se utlizan más variables (en este caso las data augmentation, edas and grammatical evolution for
caracterı́sticas) para entrenarlo. El modelo generado blood glucose forecasting. Memetic Computing, Jun
2018.
con ARIM A que más porcentajes de valores tiene en [11] Markus Berger and David Rodbard. Computer simula-
las zonas A y B es ARIM A con entrenamiento de 48h tion of plasma insulin and glucose dynamics after sub-
(aparece en 11 de los 12 casos). El modelo ARIM A cutaneous insulin injection. Diabetes care, 12(10):725–
mejora cuando se utiliza un periodo de tiempo de 736, 1989.
entrenamiento más largo. [12] S. Wagner and M. Affenzeller. Heuristiclab: A generic
and extensible optimization environment. pages 538–
El modelo P GOS no obtiene mejores resultados 541, 2005.
en la predicción a 2 horas. Por lo tanto, el tiempo [13] John R. Koza. Genetic Programming: On the Program-
empleado en la obtención del modelo (Tabla III) puede ming of Computers by Means of Natural Selection. MIT
ser fundamental para la calidad de las predicciones y Press, Cambridge, MA, USA, 1992.
para la seguridad del paciente. También constatamos [14] Sean Luke. Two fast tree-creation algorithms for ge-
netic programming. IEEE Trans. Evolutionary Compu-
que la métrica Parkes es más precisa que Clarke y por tation, 4:274–283, 2000.
consiguiente, más conveniente. [15] M. Affenzeller and S. Wagner. Offspring selection: A
new self-adaptive selection scheme for genetic algo-
AGRADECIMIENTOS rithms. pages 218–221, 2005.
Este trabajo ha sido financiado por el Ministerio [16] Michael Affenzeller, Stephan Winkler, Stefan Wagner,
de Economı́a y Competitividad de España a través and Andreas Beham. Genetic algorithms and genetic
programming: Modern concepts and practical applica-
de los proyectos con referencias TIN2014-54806-R y tions. 01 2009.
TIN2015-65460-C2. [17] Maarten Keijzer. Improving symbolic regression with
interval arithmetic and linear scaling. pages 70–82,
2003.
R EFERENCIAS [18] Rob Hyndman and Yeasmin Khandakar. Automatic
[1] Leonid Poretsky Ed. Principles of Diabetes Mellitus - time series forecasting: The forecast package for r.
2017. Springer International Publishing, 2017. Journal of Statistical Software, Articles, 27(3):1–22,
[2] James Stephen Krinsley and Richard L. Jones. Cost 2008.
analysis of intensive glycemic control in critically ill [19] R Core Team. R: A Language and Environment for
adult patients. Chest, 129(3):644 – 650, 2006. Statistical Computing. R Foundation for Statistical
[3] American Diabetes Association. Intensive diabetes Computing, Vienna, Austria, 2013.
treatment and cardiovascular outcomes in type 1 dia- [20] W.L. Clarke, D. Cox, L.A. Gonder Frederick, W. Carter,
betes: The dcct/edic study 30-year follow-up. Diabetes and S.L. Pohl. Evaluating clinical accuracy of systems
Care, 2016. for self-monitoring of blood glucose. Diabetes Care,
[4] Ya-Xiong Tao (Eds.). Glucose Homeostatis and the 10(5):622–628, September 1987.
Pathogenesis of Diabetes Mellitus. Progress in Mole- [21] Pardo S Ginsberg BH. Parkes JL, Slatin SL. A new
cular Biology and Translational Science 121. Academic consensus error grid to evaluate the clinical significance
Press, 1 edition, 2014. of inaccuracies in the measurement of blood glucose.
[5] Giuseppe De Nicolao, Lalo Magni, Chiara Dalla Man, Diabetes Care, 23(8):1143–1148., 2000.
and Claudio Cobelli. Modeling and control of diabetes: [22] Cindy Marling and Razvan Bunescu. The ohiot1dm
Towards the artificial pancreas. {IFAC} Proceedings dataset for blood glucose level prediction - draft.
Volumes, 44(1):7092 – 7101, 2011. 18th {IFAC} World
Congress.
[6] Emma P. Córcoles and Martyn G. Boutelle. Biosen-
sors and Invasive Monitoring in Clinical Applications.
703
A NEXO I
Tabla V: Predicciones (en porcentaje) obtenidas para las distintas zonas con Clarke Error Grid para las medias y
desviaciones tı́picas de los valores obtenidos con validación cruzada de cada paciente para los distintos modelos
con horizonte de tiempo a 2 horas.
t+120 train t+120 test
Modelo A+B C D E A+B C D E
Paciente 559
Avg 84.4 ± 0.6 1.1 ± 0.2 0.1 ± 0.4 1.5 ± 0.2 81.9 ± 7.2 5.2 ± 9.2 11.1 ± 6.9 1.8 ± 2.2
Last 84.8 ± 0.8 7.3 ± 0.4 6.6 ± 0.3 1.3 ± 0.1 84.8 ± 6.9 7.3 ± 3.7 6.6 ± 2.5 1.3 ± 1.0
PG 88.1 ± 1.3 1.2 ± 0.4 10.2 ± 2.9 0.5 ± 0.2 88.3 ± 5.6 1.2 ± 0.9 10.1 ± 3.5 0.5 ± 0.5
P G2 89.3 ± 0.6 1.3 ± 0.1 8.8 ± 0.5 0.6 ± 0.1 89.2 ± 4.4 1.4 ± 0.8 8.8 ± 2.8 0.5 ± 0.5
P G2com 90.2 ± 0.7 1.3 ± 0.2 8.1 ± 0.4 0.4 ± 0.0 90.0 ± 4.2 1.5 ± 0.9 8.1 ± 2.8 0.4 ± 0.4
P GOS 89.6 ± 0.5 1.4 ± 0.2 8.3 ± 0.4 0.6 ± 0.1 89.5 ± 4.9 1.6 ± 0.7 8.3 ± 2.7 0.6 ± 0.6
Paciente 563
Avg 94.4 ± 0.9 0.0 ± 0.0 5.2 ± 0.3 0.3 ± 0.1 94.3 ± 7.9 0.4 ± 0.9 4.8 ± 2.6 0.5 ± 1.1
Last 94.4 ± 0.3 2.1 ± 0.1 2.8 ± 0.2 0.6 ± 0.1 94.4 ± 2.6 2.1 ± 1.0 2.8 ± 2.1 0.6 ± 0.6
PG 94.9 ± 2.5 0.2 ± 0.1 4.7 ± 0.7 0.2 ± 0.1 94.8 ± 6.0 0.2 ± 0.3 4.7 ± 2.9 0.3 ± 0.4
P G2 94.8 ± 2.9 0.1 ± 0.1 5.0 ± 0.8 0.1 ± 0.1 94.2 ± 7.1 0.1 ± 0.3 5.5 ± 4.0 0.1 ± 0.3
P G2com 95.5 ± 0.7 0.3 ± 0.1 4.1 ± 0.3 0.2 ± 0.1 95.2 ± 6.7 0.3 ± 0.3 4.4 ± 2.8 0.2 ± 0.3
P GOS 95.4 ± 10.8 0.1 ± 0.0 4.3 ± 1.1 0.1 ± 0.1 94.8 ± 13.2 0.2 ± 0.3 4.8 ± 3.0 0.2 ± 0.4
Paciente 570
Avg 90.9 ± 1.4 1.6 ± 0.2 6.8 ± 0.7 0.7 ± 0.1 89.7 ± 10.0 2.9 ± 4.3 7.1 ± 7.5 0.3 ± 0.7
Last 94.6 ± 0.9 2.2 ± 0.2 2.9 ± 0.3 0.3 ± 0.0 94.6 ± 8.3 2.2 ± 1.5 2.9 ± 2.5 0.3 ± 0.4
PG 95.8 ± 2.4 1.0 ± 0.2 2.9 ± 0.7 0.3 ± 0.4 95.7 ± 10.7 0.9 ± 0.9 3.1 ± 3.1 0.2 ± 0.4
P G2 95.8 ± 1.1 0.9 ± 0.1 3.0 ± 0.3 0.2 ± 0.0 95.9 ± 10.4 1.0 ± 0.9 3.0 ± 3.0 0.2 ± 0.4
P G2com 96.2 ± 2.3 0.8 ± 0.1 2.6 ± 0.6 0.4 ± 0.4 96.0 ± 10.5 0.9 ± 0.7 2.8 ± 2.7 0.3 ± 0.4
P GOS 95.9 ± 1.0 0.9 ± 0.1 3.0 ± 0.3 0.2 ± 0.0 95.7 ± 9.9 0.9 ± 0.9 3.2 ± 3.2 0.2 ± 0.4
Paciente 575
Avg 85.6 ± 0.6 0.1 ± 0.1 13.9 ± 0.5 0.4 ± 0.2 84.9 ± 4.2 0.8 ± 2.2 13.9 ± 4.7 0.4 ± 1.0
Last 86.0 ± 0.6 3.4 ± 0.3 7.5 ± 0.4 3.0 ± 0.2 86.0 ± 5.6 3.4 ± 2.3 7.5 ± 3.5 3.0 ± 2.0
PG 86.9 ± 0.5 0.3 ± 0.1 12.4 ± 0.5 0.3 ± 0.1 86.9 ± 7.0 0.3 ± 0.5 12.5 ± 4.1 0.3 ± 0.4
P G2 87.2 ± 0.7 0.3 ± 0.1 12.2 ± 0.6 0.3 ± 0.1 87.0 ± 7.0 0.3 ± 0.5 12.3 ± 4.1 0.4 ± 0.4
P G2com 87.5 ± 0.9 0.3 ± 0.1 11.9 ± 0.6 0.3 ± 0.1 87.5 ± 8.9 0.4 ± 0.5 11.7 ± 3.8 0.4 ± 0.5
P GOS 87.5 ± 0.7 0.1 ± 0.1 12.0 ± 0.6 0.4 ± 0.1 87.3 ± 6.5 0.1 ± 0.2 12.2 ± 3.9 0.4 ± 0.3
Paciente 588
Avg 94.4 ± 0.7 0.2 ± 0.0 5.4 ± 0.5 0.0 ± 0.0 94.4 ± 6.6 0.3 ± 0.5 5.2 ± 4.3 0.0 ± 0.1
Last 95.8 ± 0.6 1.4 ± 0.1 2.3 ± 0.2 0.5 ± 0.1 95.8 ± 5.9 1.4 ± 1.0 2.3 ± 1.6 0.5 ± 0.8
PG 95.6 ± 2.9 0.2 ± 0.1 4.0 ± 1.5 0.1 ± 0.1 95.8 ± 8.0 0.2 ± 0.3 3.9 ± 2.4 0.1 ± 0.3
P G2 96.1 ± 0.8 0.2 ± 0.1 3.5 ± 0.3 0.1 ± 0.0 96.1 ± 7.4 0.2 ± 0.3 3.5 ± 2.1 0.1 ± 0.3
P G2com 96.3 ± 0.9 0.2 ± 0.1 3.4 ± 0.3 0.1 ± 0.0 96.1 ± 7.6 0.3 ± 0.3 3.5 ± 2.2 0.1 ± 0.2
P GOS 95.3 ± 3.6 0.2 ± 0.1 4.4 ± 1.9 0.1 ± 0.1 95.4 ± 8.6 0.3 ± 0.4 4.3 ± 4.0 0.0 ± 0.1
Paciente 591
Avg 88.6 ± 1.1 0.2 ± 0.1 10.6 ± 0.7 0.6 ± 0.1 88.0 ± 6.6 0.3 ± 0.4 11.3 ± 6.1 0.5 ± 0.7
Last 90.4 ± 0.2 2.8 ± 0.2 5.4 ± 0.2 1.5 ± 0.1 90.4 ± 2.5 2.8 ± 2.0 5.4 ± 1.7 1.5 ± 0.9
PG 90.7 ± 0.7 0.4 ± 0.1 8.6 ± 0.9 0.3 ± 0.1 90.3 ± 6.1 0.4 ± 0.4 9.0 ± 3.8 0.3 ± 0.5
P G2 91.1 ± 0.5 0.4 ± 0.1 8.1 ± 0.3 0.4 ± 0.1 90.9 ± 5.9 0.5 ± 0.5 8.2 ± 2.9 0.4 ± 0.5
P G2com 91.2 ± 1.3 0.5 ± 0.1 7.9 ± 1.0 0.3 ± 0.1 91.4 ± 5.0 0.5 ± 0.6 7.8 ± 2.7 0.4 ± 0.5
P GOS 91.5 ± 0.6 0.5 ± 0.1 7.6 ± 0.3 0.5 ± 0.1 91.4 ± 5.9 0.4 ± 0.4 7.7 ± 2.9 0.5 ± 0.5
704
Tabla VI: Predicciones (en porcentaje) obtenidas para las distintas zonas con Parkes Error Grid para las medias y
desviaciones tı́picas de los valores obtenidos con validación cruzada de cada paciente para los distintos modelos
con horizonte de tiempo a 2 horas.
t+120 train t+120 test
Modelo A+B C D E A+B C D E
Paciente 559
Avg 81.5 ± 0.7 15.8 ± 0.5 2.7 ± 0.3 0.0 ± 0.0 80.8 ± 7.3 14.9 ± 4.0 4.3 ± 5.4 0.0 ± 0.0
Last 84.8 ± 0.7 13.1 ± 0.4 2.1 ± 0.1 0.0 ± 0.0 84.8 ± 6.5 13.1 ± 3.3 2.1 ± 1.0 0.0 ± 0.0
PG 86.1 ± 1.5 12.2 ± 1.6 1.7 ± 0.2 0.0 ± 0.0 85.8 ± 6.4 12.4 ± 2.3 1.7 ± 1.7 0.0 ± 0.0
P G2 86.6 ± 0.7 11.7 ± 0.4 1.7 ± 0.2 0.0 ± 0.0 86.5 ± 4.8 11.8 ± 2.4 1.8 ± 1.7 0.0 ± 0.0
P G2com 87.9 ± 0.6 10.8 ± 0.4 1.4 ± 0.1 0.0 ± 0.0 87.8 ± 4.4 10.7 ± 2.1 1.5 ± 1.4 0.0 ± 0.0
P GOS 86.7 ± 0.6 11.6 ± 0.4 1.7 ± 0.2 0.0 ± 0.0 86.3 ± 4.9 11.8 ± 2.3 1.8 ± 1.6 0.0 ± 0.0
Paciente 563
Avg 90.7 ± 0.9 8.8 ± 0.6 0.5 ± 0.1 0.0 ± 0.0 89.0 ± 5.9 10.1 ± 6.6 0.9 ± 1.4 0.0 ± 0.0
Last 92.0 ± 0.3 7.1 ± 0.3 0.8 ± 0.1 0.0 ± 0.0 92.0 ± 2.4 7.1 ± 2.5 0.8 ± 0.7 0.0 ± 0.0
PG 92.4 ± 2.6 7.1 ± 0.7 0.5 ± 0.1 0.0 ± 0.0 91.8 ± 6.1 7.6 ± 4.2 0.5 ± 0.6 0.0 ± 0.0
P G2 92.4 ± 3.2 7.2 ± 1.1 0.4 ± 0.1 0.0 ± 0.0 92.1 ± 8.1 7.4 ± 4.4 0.5 ± 0.8 0.0 ± 0.0
P G2com 93.6 ± 0.6 6.0 ± 0.4 0.4 ± 0.1 0.0 ± 0.0 93.2 ± 7.2 6.3 ± 3.9 0.4 ± 0.6 0.0 ± 0.0
P GOS 93.7 ± 11.6 5.9 ± 2.0 0.3 ± 0.1 0.0 ± 0.0 93.3 ± 13.7 6.3 ± 4.5 0.4 ± 0.5 0.0 ± 0.0
Paciente 570
Avg 89.8 ± 1.7 8.7 ± 0.7 1.5 ± 0.2 0.0 ± 0.0 91.1 ± 15.0 8.0 ± 4.6 1.0 ± 1.1 0.0 ± 0.0
Last 94.9 ± 0.9 4.6 ± 0.3 0.5 ± 0.1 0.0 ± 0.0 94.9 ± 7.8 4.6 ± 2.4 0.5 ± 0.6 0.0 ± 0.0
PG 93.9 ± 2.3 5.4 ± 0.6 0.6 ± 0.4 0.0 ± 0.0 94.1 ± 10.3 5.4 ± 3.4 0.5 ± 0.6 0.0 ± 0.0
P G2 94.3 ± 1.1 5.3 ± 0.4 0.5 ± 0.1 0.0 ± 0.0 94.0 ± 9.4 5.5 ± 3.8 0.5 ± 0.6 0.0 ± 0.0
P G2com 94.6 ± 1.6 4.9 ± 0.7 0.6 ± 0.3 0.0 ± 0.0 94.4 ± 9.1 5.1 ± 3.9 0.5 ± 0.6 0.0 ± 0.0
P GOS 94.3 ± 1.1 5.1 ± 0.4 0.5 ± 0.1 0.0 ± 0.0 93.9 ± 9.0 5.6 ± 3.8 0.5 ± 0.6 0.0 ± 0.0
Paciente 575
Avg 83.9 ± 0.6 13.4 ± 0.5 2.7 ± 0.2 0.0 ± 0.0 82.5 ± 5.8 15.1 ± 3.4 2.4 ± 1.3 0.0 ± 0.0
Last 83.2 ± 0.5 14.4 ± 0.7 2.3 ± 0.1 0.0 ± 0.0 83.2 ± 4.7 14.4 ± 6.1 2.3 ± 1.1 0.0 ± 0.0
PG 84.6 ± 0.4 13.4 ± 0.6 1.9 ± 0.2 0.0 ± 0.0 84.4 ± 6.1 13.7 ± 6.0 1.9 ± 0.8 0.0 ± 0.0
P G2 84.7 ± 0.6 13.5 ± 0.6 1.8 ± 0.2 0.0 ± 0.0 84.5 ± 6.2 13.6 ± 6.2 1.9 ± 0.9 0.0 ± 0.0
P G2com 86.7 ± 1.2 11.9 ± 0.4 1.4 ± 0.1 0.0 ± 0.0 86.4 ± 7.7 12.2 ± 6.0 1.5 ± 1.0 0.0 ± 0.0
P GOS 84.7 ± 0.6 13.5 ± 0.7 1.8 ± 0.1 0.0 ± 0.0 84.4 ± 5.9 13.8 ± 6.1 1.8 ± 0.9 0.0 ± 0.0
Paciente 588
Avg 94.6 ± 0.8 5.1 ± 0.4 0.3 ± 0.1 0.0 ± 0.0 95.0 ± 7.0 4.7 ± 3.3 0.4 ± 0.6 0.0 ± 0.0
Last 94.3 ± 0.7 5.1 ± 0.3 0.6 ± 0.1 0.0 ± 0.0 94.3 ± 6.9 5.1 ± 2.6 0.6 ± 0.8 0.0 ± 0.0
PG 94.9 ± 3.8 4.7 ± 0.5 0.4 ± 0.1 0.0 ± 0.0 94.7 ± 7.4 4.8 ± 3.2 0.4 ± 0.7 0.0 ± 0.0
P G2 95.1 ± 0.8 4.5 ± 0.3 0.4 ± 0.1 0.0 ± 0.0 94.9 ± 7.0 4.6 ± 3.2 0.5 ± 0.8 0.0 ± 0.0
P G2com 95.3 ± 0.8 4.4 ± 0.3 0.4 ± 0.1 0.0 ± 0.0 95.0 ± 7.1 4.6 ± 3.4 0.4 ± 0.7 0.0 ± 0.0
P GOS 94.9 ± 5.0 4.5 ± 0.4 0.5 ± 0.1 0.0 ± 0.0 94.3 ± 8.0 5.2 ± 3.9 0.5 ± 0.9 0.0 ± 0.0
Paciente 591
Avg 87.0 ± 1.0 11.2 ± 0.3 1.8 ± 0.2 0.0 ± 0.0 87.3 ± 6.4 10.8 ± 3.8 1.8 ± 2.2 0.0 ± 0.0
Last 89.8 ± 0.3 8.6 ± 0.3 1.6 ± 0.1 0.0 ± 0.0 89.8 ± 2.8 8.6 ± 2.9 1.6 ± 1.0 0.0 ± 0.0
PG 90.2 ± 1.0 8.2 ± 0.6 1.6 ± 0.2 0.0 ± 0.0 90.2 ± 5.8 8.2 ± 3.4 1.7 ± 1.8 0.0 ± 0.0
P G2 90.6 ± 0.5 7.7 ± 0.3 1.6 ± 0.2 0.0 ± 0.0 90.4 ± 6.0 8.0 ± 3.0 1.7 ± 1.8 0.0 ± 0.0
P G2com 90.2 ± 1.6 8.4 ± 0.7 1.4 ± 0.2 0.0 ± 0.0 89.9 ± 5.2 8.6 ± 3.5 1.5 ± 1.5 0.0 ± 0.0
P GOS 90.8 ± 0.6 7.7 ± 0.3 1.5 ± 0.2 0.0 ± 0.0 90.5 ± 6.4 7.7 ± 2.7 1.7 ± 1.7 0.0 ± 0.0
705
Registrado de Imagen Médica mediante Algoritmos

de Optimización basados en Arrecifes de Coral
E. Bermejo∗ , M. Chica† , S. Damas∗ , S. Salcedo-Sanz‡ and O. Cordón∗§
∗ Instituto Andaluz en Data Science and Computational Intelligence (DaSCI), Universidad de Granada, Granada 18071.
Email: [email protected],[email protected]
† School of Electrical Engineering and Computing, The University of Newcastle, Callaghan 2380, Australia.
‡ Departamento de Teorı́a de la Señal y Comunicaciones, Universidad de Alcalá, Alcalá de Henares 28805.
§ Centro de Investigación en Tecnologı́as de la Información, Universidad de Granada, Granada 18071
Resumen—El Registrado de Imágenes (RI) conlleva la trans- de extracción de caracterı́sticas, una etapa propensa a errores
formación de un conjunto de imágenes en un sistema de coorde- si la información extraı́da no es suficientemente representativa.
nadas común. Generalmente, la búsqueda de la correspondencia Por otro lado, los enfoques de intensidades permiten procesar
óptima entre imágenes es considerada un problema de optimiza-
ción. Los enfoques basados en metaheurı́sticas permiten resolver un volumen de datos mayor, a costa de incrementar los
el problema de RI superando las numerosas limitaciones de los requisitos computacionales [2]. Ası́, la alineación se guı́a por
métodos tradicionales. En esta contribución consideraremos un la distribución de intensidades (niveles de gris) de la imagen,
reciente método bio-inspirado: Optimización por Arrecifes de aumentando la precisión de estos métodos, pero también su
Coral (CRO). Este novedoso algoritmo simula los fenómenos sensibilidad al ruido o a las condiciones de iluminación.
naturales que subyacen a un arrecife de coral. Adaptaremos el
algoritmo siguiendo dos enfoques de registrado diferentes: basado Métodos tradicionales, como Iterative Closest Point (ICP)
en caracterı́sticas y basado en intensidades. Además, diseñaremos [3] tienden a quedar atrapados en mı́nimos locales debido a
un exhaustivo estudio experimental considerando un problema de factores como el ruido, la discretización o la desalineación
RI médica con resonancias magnéticas cerebrales. Los resultados entre imágenes. Mientras tanto, aquellos basados en algoritmos
muestran cómo CRO supera al estado del arte en RI tanto en evolutivos u otras metaheurı́sticas (MHs) permiten superar
robustez como en precisión y eficiencia siguiendo ambos enfoques.
estas desventajas y ofrecen un buen rendimiento que los hace
idóneos para problemas de RI médica.
I. I NTRODUCCI ÓN Hasta la fecha se han propuesto numerosos estudios com-
En el ámbito de la imagen médica existe un gran interés en parativos para analizar el rendimiento de diferentes MHs en
relacionar la información procedente de diferentes imágenes. problemas de RI empleando modelos craneales e imágenes
Esta tarea es relevante en un gran número de aplicaciones: médicas en 3D [4], [5]. En ambos estudios se incluyen
diagnóstico, monitorización y seguimiento de enfermedades o métodos de RI relevantes: ICP, una versión adaptativa de des-
cirugı́a asistida, entre otras. Generalmente, estas aplicaciones censo de gradiente estocástico (ASGD) y algoritmos genéticos
requieren la integración de información visual adquirida por (GAs). Entre las diversas MHs destaca una versión memética
diferentes dispositivos o condiciones. Ası́, el Registrado de del método scatter search (SS) propuesta en [4] y extendida
Imágenes (RI) [1] es considerado como una tarea de prepro- en [6], obteniendo resultados excelentes y consolidando su do-
cesamiento esencial en imagen médica, ya que permite alinear minancia en el estado del arte sobre métodos convencionales.
múltiples imágenes con contenido común. Recientemente se ha propuesto una MH bio-inspirada de-
Generalmente, los métodos de RI consideran una trans- nominada Coral Reefs Optimization (CRO) [7]. CRO es un
formación espacial para alinear imágenes solapando regiones algoritmo evolutivo basado en la simulación de los fenómenos
coincidentes. El problema se trata como un proceso de opti- naturales que ocurren durante la formación de un arrecife de
mización iterativo que explora el espacio de transformaciones coral. A lo largo de su vida, los corales atraviesan diversas
posibles. La calidad de una solución se define ası́ por el grado fases, como la reproducción, el asentamiento de larvas o
de semejanza entre imágenes tras la transformación, que se la lucha por un espacio en el arrecife donde sobrevivir.
mide mediante una métrica de similitud [2]. CRO emula dichos procesos favoreciendo un equilibrio entre
El proceso de RI permite emplear una imagen completa diversidad y especificidad, ingredientes idóneos para abordar
(enfoque de intensidades) o basarse en partes distintivas de problemas complejos de optimización.
la imagen (caracterı́sticas). Los enfoques de caracterı́sticas [1] Dados los buenos resultados de CRO en diferentes pro-
agilizan el proceso de optimización reduciendo la complejidad blemáticas reales, consideramos que su diseño puede com-
del problema, al usar una porción de las imágenes. Sin portarse adecuadamente en problemas de RI complejos. Ası́,
embargo, estos métodos dependen en gran medida del proceso en este trabajo diseñamos un nuevo método de RI basado en
706
CRO donde tanto la función objetivo como la codificación han caracterı́sticas correspondientes. Enfoques de intensidades se
sido adaptados a un problema concreto de RI médica. basan en la relación entre distribuciones de intensidad para
Para validar nuestra propuesta, hemos desarrollado un ex- evaluar la similitud. Existen multitud de métricas disponibles
haustivo estudio experimental comparando CRO contra algu- (correlación normalizada (CN) o información mutua (IM),
nos métodos evolutivos del estado del arte en RI, considerando entre otras) y su idoneidad viene determinada por el proceso
tanto enfoques de intensidades como de caracterı́sticas. Esta de adquisición y la relación entre imágenes.
comparativa es una extensión de nuestra propuesta donde Por último, el optimizador refina la solución hasta alcanzar
adaptamos CRO al enfoque de intensidades [8]. Se han utili- un criterio de parada (cuando se encuentra una solución
zado pares de imágenes monomodales extraı́das de Brainweb, adecuada o se realiza un número determinado de iteraciones).
dataset disponible gracias a McGill University [9]. Ası́, la optimización de la transformación espacial supone un
proceso de búsqueda iterativo sobre el espacio de transfor-
II. R EGISTRADO DE I M ÁGENES : P LANTEAMIENTO maciones geométricas. De acuerdo con las caracterı́sticas del
Generalmente, en los problemas de RI médica se parte espacio de búsqueda, podemos encontrar dos estrategias dife-
de dos imágenes, una de referencia o modelo (IM ), y una rentes. El registrado puede considerarse como un problema de
imagen móvil o escena (IE ) que se alinea con la geometrı́a optimización continua cuando la búsqueda se realiza en base
del modelo. El objetivo del proceso de registrado es encontrar a los parámetros de la transformación. Alternativamente, la
una transformación geométrica T que haga el modelo IM y la búsqueda se puede realizar en el espacio de correspondencias
escena transformada T (IE ) sean lo más similares posible. El entre pares de caracterı́sticas (enfoque de caracterı́sticas) o
grado de semejanza entre imágenes se mide considerando una entre áreas de la imagen (enfoque de intensidades).
métrica de similitud. Ası́, el RI se formula como un problema
de maximización en el espacio de transformaciones: A. Algoritmos evolutivos relevantes en RI médica
RI basado en intensidades
argmax Similitud (IM , T (IE )).
T ∈ Transformaciones r-GA∗ , Valsecchi et al.: r-GA∗ se basa en un algoritmo
genético [10]. El optimizador está diseñado en codificación
El proceso iterativo de un método de RI consta de tres
real donde una solución almacena los parámetros de la trans-
componentes principales: el modelo de transformación, la
formación en un vector. Los operadores genéticos también
métrica de similitud, y el optimizador. En primer lugar,
son reales: cruce por mezcla alfa (BLX-α) [11] y mutación
el optimizador estima una transformación geométrica para
aleatoria. r-GA∗ es capaz de adaptar diferentes métricas de
alinear las imágenes, que viene determinada por el modelo
similitud y distintos modelos de transformación. Además,
de transformación. La Figura 1 ilustra el efecto de aplicar
integra el uso de múltiples resoluciones en combinación con
diferentes tipos de transformación a una resonancia magnética
un mecanismo de reinicio y adaptación al espacio de búsqueda.
(IRM) cerebral. La elección del modelo adecuado depende
Estos mecanismos permiten agilizar el proceso de optimiza-
tanto de la aplicación concreta como de la naturaleza de las
ción y mitigar una convergencia prematura.
imágenes. En ciertos contextos un modelo más simple (trans-
formación de traslación) puede ser adecuado, mientras que SS∗ , Valsecchi et al.: SS∗ [6] es una variante del diseño
otras aplicaciones que suponen una estimación de movimiento original de scatter search o búsqueda dispersa, donde el
requieren modelos deformables. De cualquier forma, el tipo de conjunto de referencia se divide en dos para contener las
transformación debe ser seleccionado cuidadosamente, ya que soluciones más diversas y las de mayor calidad. El algoritmo
de esta elección dependen tanto los requisitos computacionales han sido diseñados especı́ficamente para RI [4]. Ası́, SS∗
en base al número de parámetros a estimar, como los efectos considera el uso de memoria basada en frecuencia para el
geométricos resultantes de la transformación. método de diversificación, la combinación de soluciones se
basa en el cruce BLX-α, y el método de mejora en el
operador PMX-α [12]. El método de actualización clasifica
las soluciones según su calidad o diversidad. Finalmente, el
método de control de duplicación previene la aparición de
copias idénticas de una solución en la población.
Figura 1: Aplicación de diferentes modelos de transformación: RI basado en caracterı́sticas

similitud, finidad y b-spline, sobre una escena inicial. HE-GA, He y Narayana: Propuesto en [13], considera
un diseño genético con codificación real combinado con
Tras ello, la métrica de similitud mide la calidad de la dividing rectangle, un método de optimización global basado
alineación entre la escena transformada y el modelo. La en ramificación y poda. El genético sigue un modelo gene-
elección de esta métrica es un paso crucial en el diseño de racional elitista con cruce aritmético y mutación uniforme,
cualquier método de RI y depende del enfoque considerado. aplicado para estimar una solución preliminar. Esta solución
Enfoques de caracterı́sticas suelen considerar el error cuadráti- es posteriormente refinada por búsqueda local. Incorpora un
co medio (ECM) como métrica para medir la distancia entre mecanismo de reinicio para evitar una convergencia prematura.
707
SS, Santamarı́a et al.: Este método basado en SS fue IV. D ISE ÑO E XPERIMENTAL
originalmente diseñado para problemas de RI de rango [4]. Los Diseñamos un estudio experimental considerando los algo-
autores adoptan una métrica de similitud basada en el error ritmos descritos en la Sección A ya que mejoran el comporta-
cuadrático mediano (ECMed), robusta a imágenes con bajo miento de alternativas clásicas [5], [6], [8], [10]. Ası́, preten-
solapamiento, integran una estructura de datos para acelerar demos realizar un análisis exhaustivo del comportamiento de
el cálculo de la función objetivo, y una búsqueda local basada nuestra propuesta en comparación con los métodos evolutivos
en cruce (XLS) como método de mejora. SS también incluye más relevantes en un problema de RI médica.
un mecanismo de reinicio para evitar mı́nimos locales.
A. Escenarios y dataset de imágenes
III. C ORAL R EEFS O PTIMIZATION A LGORITHM
Las imágenes mono-modales utilizadas en esta experimen-
CRO [7], [14] es un algoritmo evolutivo basado en los pro- tación han sido obtenidas de un repositorio público muy
cesos naturales de un arrecife de coral. Denominamos R a un conocido, BrainWeb (McGill University [9]). Este dataset se
arrecife representado por una cuadrı́cula R1 × R2 , donde cada compone de imágenes cerebrales simuladas a partir de IRMs
posición (i, j) permite albergar a un coral, Ci,j , que representa sintéticas. Con el objetivo de considerar diferentes niveles de
una solución al problema de optimización considerado. El complejidad, las imágenes contienen ruido (hasta un 5 %) y
algoritmo inicializa varios corales en posiciones aleatorias de múltiples lesiones (esclerosis). Las imágenes tienen un tamaño
R, dejando huecos libres para el asentamiento de futuras gene- común de 60 × 181 × 217 voxels.
raciones de corales. La ratio entre posiciones libres/ocupadas A partir de la curvatura cerebral de cada imagen extraemos
viene dado por un parámetro ρ0 , donde 0 < ρ0 < 1. un conjunto de puntos mediante un detector de lı́neas de cresta
Existen diferentes mecanismos reproductivos en un arrecife [15]. En enfoques de caracterı́sticas, los valores heurı́sticos
de coral. En CRO se recrean aplicando diferentes operadores de curvatura se emplean para guiar al optimizador durante la
de forma secuencial durante la segunda fase del algoritmo: estimación de la transformación de registrado.
1. Reproducción sexual externa (Broadcast Spawning). Para generar diferentes escenarios, cada imagen ha sido
En cada iteración k del algoritmo se aplica: transformada usando una de las cuatro transformaciones de
1.a. Selección uniforme de una fracción aleatoria Fb similitud (aplicando rotación, traslación y escalado uniforme)
de corales (denominados broadcast spawners) con de la Tabla I. En total, el estudio consta de 16 instancias
respecto al total de corales existentes en el arrecife. de RI creadas a partir de pares de imágenes con diferentes
1.b. Formación de larvas. Se eligen dos broadcast spaw- transformaciones. Los escenarios son: I1 vs. Ti (I2 ), I1 vs.
ners y se aplica un operador de cruce. Una vez Ti (I3 ), I1 vs. Ti (I4 ), e I2 vs. Ti (I4 ), para i = 1, 2, 3, 4.
seleccionados, éstos no vuelven a atravesar otra Tabla I: Parámetros de la transformación: ángulo de rota-
etapa reproductiva durante la iteración k. La selec- ción (λ), eje de rotación (ax , ay , az ), vector de traslación
ción puede ser uniforme, aleatoria o proporcional (tx , ty , tz ), y factor de escalado uniforme s.
al fitness (selección por ruleta).
2. Reproducción sexual interna (Brooding). La repro- λ ax ay az tx ty tz s
ducción de los corales hermafroditas se modela como T1 115 -0.863 0.259 0.431 -26 15.5 -4.6 1
T2 168 0.676 -0.290 0.676 6 5.5 -4.6 0.8
una mutación sobre una fracción de los corales restantes T3 235 -0.303 -0.808 0.505 16 -5.5 -4.6 1
1 − Fb . En estos casos, un porcentaje Pi del coral muta. T4 276.9 -0.872 0.436 -0.218 -12 5.5 -24.6 1.2
3. Asentamiento de larvas. Las nuevas larvas generadas
seleccionan una posición aleatoria del arrecife para
formarse, siempre que la posición (i, j) esté libre. En B. Diseño Experimental y Configuración
caso de que esté ocupada, la nueva larva se asentará si Los métodos de la comparativa difieren en el proceso de
su valor de fitness mejora a la del coral existente. El optimización: los enfoques de caracterı́sticas se guı́an por los
máximo número de intentos para ocupar una posición en puntos de curvatura y las métricas ECM o ECMed, mientras
cada iteración k está limitado por el parámetro η = 3. que los enfoques de intensidades se guı́an por los valores de
4. Reproducción asexual. Los corales pueden fragmentar- intensidad y métricas como CN o IM. Los resultados de dife-
se y reasentarse en el arrecife (budding). CRO modela rentes métricas no son comparables, por lo que es necesario
este mecanismo ordenando los corales por su nivel de definir un marco comparativo para evaluar objetivamente los
vida (fitness f (Cij )). Una pequeña fracción (Fa ) de los resultados de la alineación. Ası́, consideramos una medida
corales se duplica, muta con probabilidad Pa , e intenta común para evaluar la calidad de todas las soluciones. Una
asentarse en el arrecife como en el paso 3. vez el algoritmo alcanza una solución, se calcula el ECM entre
5. Depredación. Tras cada iteración k, se simula la muerte las caracterı́sticas anatómicas (lı́neas de cresta) de la escena
de un pequeño número de corales, liberando espacio en transformada y las del modelo. Este valor será usado como
el arrecife para la siguiente generación. La depredación comparativa de la calidad final para todos los métodos.
se aplica con una probabilidad muy pequeña (Pd ) a una La transformación de similitud que relaciona las imágenes
fracción Fd de corales con peor vida. considera un rango de [−30, 30] para los parámetros de la
708
Tabla II: Parameter configuration for considered IR methods.
r-GA∗ SS∗ CRO∗ HE-GA SS CRO
Individuos 100 Tamaño población 12 Tamaño arrecife 80 Individuos 60 Tamaño población 30 Tamaño arrecife 70
Generaciones 75 Generaciones 18 Generaciones 65 Reinicios 5 Reinicios 5 Reinicios 15
Reinicios 5 Reinicios 3 Reinicios 8 Factor α 0.3 XLS iter. 100 XLS iter. 100
Torneo 3 PMX iter. 12 PMX iter. 15 Prob. cruce 0.7 Factor α 0.3 ρ0 0.6
Factor α 0.3 Factor α 0.3 ρ0 0.6 Prob. mutación 0.2 Conjunto Referencia 8 Fbroad 0.9
Prob. cruce 0.5 conjunto referencia 4 Fbroad 0.8 Pd 0.05
Prob. mutación 0.1 Pd 0.15 k 3
traslación y [0,75, 1,25] para el factor de escalado. No se aplica un reinicio del algoritmo un número determinado de
aplica restricción en el ángulo de rotación ([0, 360]), ni en sus veces. La mejor solución de esta etapa pasa a la etapa de refi-
ejes ([−1, 1]). De esta forma, la transformación se codifica nado. Dado el gran volumen de datos, el tiempo de ejecución
mediante un vector real de siete parámetros en el enfoque total de cada algoritmo se ha limitado a 180 segundos.
de intensidades: versor de rotación (θx , θy , θz ), vector de Diseño de métodos basados en caracterı́sticas:: Implemen-
traslación (tx , ty , tz ) y escalado uniforme s. En el enfoque de tados en C++ y compilados con la herramienta GNU/g++,
caracterı́sticas, la rotación se codifica con cuatro parámetros: siguen una estructura similar al enfoque de intensidades.
tres para el eje de rotación (rx , ry , rz ) y uno para el ángulo Puesto que ECM ha sido elegido para la comparativa final,
θr , resultando en una codificación de ocho parámetros. consideramos una métrica de optimización diferente para
Para evaluar CRO en comparación con el estado del ar- evitar favorecer este diseño. Ası́, consideramos una variante
te en RI (Sección A), diseñamos un estudio experimental de ECMed especı́ficamente diseñada para IR:
considerando métodos representativos de ambos enfoques (in-
F (f, IE , IM ) =
tensidades y caracterı́sticas). Ası́, comparamos seis métodos
X
N
diferentes: i) Enfoque de intensidades: r-GA∗ , SS∗ y CRO∗ . w1 ·(1/(1+ pi + t~i )− p~j ‘ ||))+w2 ·(1/(1+|pec −pm )),
||(sR~
ii) Enfoque de caracterı́sticas: HE-GA, SS y CRO. i=1
Dadas las diferencias en términos de requisitos compu- donde f es la solución que codifica los parámetros de la
tacionales, la configuración de parámetros óptima para cada transformación; pi es un punto 3D de la escena y pj su corres-
algoritmo varı́a según el enfoque considerado (ver Tabla II). pondencia más cercana en el modelo utilizando una estructura
Estos parámetros han sido ajustados manualmente con un par de indexación (grid closest point); w1 y w2 (w1 +w2 =1) son
de imágenes no incluido en la experimentación para evitar pesos para balancear los términos de la función; pec es el radio
sesgos. Se han seguido las directrices marcadas por los autores de la esfera que engloba la escena transformada y pm el radio
en estudios previos [5], [7]. A continuación detallamos las de la esfera sobre el modelo. Nótese que el primer término de
caracterı́sticas distintivas de los métodos: F corresponde con la función ECMed entre puntos vecinos.
Diseño de metodos basados en intensidades:: La imple- Como componentes especı́ficos de este enfoque, se aplica
mentación se ha realizado en Elastix [16], una herramienta el reinicio de la población cuando el optimizador detecta
open-source especı́ficamente diseñada para RI médica de in- estancamiento, por ejemplo, tras 15 iteraciones sin mejora.
tensidades. El método basado en CRO se ha propuesto en [8] El conjunto de caracterı́sticas (lı́neas de cresta) es bastante
con resultados prometedores. El optimizador se guı́a por la reducido, por lo que no se requiere una estrategia multi-
métrica normalizada de información mutua (IMN): resolución y el tiempo de parada se limita a 20 segundos.
P P
b∈IB pAB (a, b) log(pA (a)pB (b))
NMI(IA , IB ) = P a∈IA
P , C. Análisis de Resultados
a∈IA b∈IB pAB (a, b) log pAB (a, b)
En la Tabla III se recogen los resultados de la alineación
donde pAB es la probabilidad conjunta y pA , pB son las entre imágenes: el error entre pares de caracterı́sticas (ECM)
probabilidades marginales discretas de las intensidades de las y el ranking parcial de cada método en los 16 escenarios.
imágenes. Nótese que el mı́nimo valor posible de ECM se explica por los
Además, el diseño de los enfoques de intensidades integra niveles de ruido y la presencia de lesiones en la comparación
dos componentes: i) Multi-resolución para reducir el coste entre imágenes. El valor óptimo de ECM se ha resaltado entre
computacional del proceso, mediante una reducción de la paréntesis en la Tabla III. Además, se ha realizado un análisis
resolución y un suavizado gaussiano para crear dos represen- estadı́stico sobre los valores medios para buscar diferencias
taciones (pirámides) de la imagen. En la primera resolución, significativas entre el algoritmo con mejor ranking y el resto.
el optimizador considera una pirámide de baja resolución para Los resultados del ranking, test de Bonferroni-Dunn y test de
aproximar la transformación. La segunda resolución consiste Holm se recogen en la Tabla IV.
en una etapa de refinado para mejorar la calidad de la En general, los métodos basados en caracterı́sticas mejoran
alineación. ii) Mecanismo de reinicio para asegurar que el a sus homólogos de intensidades en la mayorı́a instancias.
algoritmo es capaz de recuperarse de un posible estancamiento El diseño del optimizador hace que este tipo de métodos
y encuentre una buena solución. En la primera resolución, se pueda alcanzar una mayor precisión en menor tiempo. Ası́,
709
Tabla III: Mı́nimo (m), media (µ) y desviación estándar (sd) para los valores de ECM (mm) y ranking medio (R) para cada
instancia de RI. Las columnas subrayadas corresponden con los métodos basados en intensidades.
I1 vs T1 (I2 ) [31] I1 vs T2 (I2 ) [31] I1 vs T3 (I2 ) [31] I1 vs T4 (I2 ) [31]
Algorithm m µ sd R m µ sd R m µ sd R m µ sd R
r-GA∗ 37.32 134 >99 6 39.60 86.43 44 5 43.29 5506 >99 6 32.19 84.36 91 6
HE-GA 42.69 101 47 5 31.85 44.27 17 4 31.96 42.19 9 4 32.88 59.23 28 5
SS∗ 36.01 38.14 5.9 4 36.53 38.96 2.9 3 36.78 1755 >99 5 32.65 32.96 0.7 4
SS 32.06 32.84 2.2 2 32.11 119 >99 6 32.17 41.08 47 2 32.00 32.25 0.1 2
CRO∗ 36.35 36.79 0.3 3 36.26 36.78 0.3 2 40.72 41.41 0.5 3 32.67 32.79 0.1 3
CRO 32.11 32.25 0.1 1 32.10 33.96 5.3 1 32.14 32.27 0.1 1 32.14 32.24 0.0 1
m µ sd R m µ sd R m µ sd R m µ sd R
r-GA∗ 50.61 142 >99 6 45.61 97.75 81 6 66.00 8470 >99 6 42.93 86.11 53 5
HE-GA 61.65 122 48 5 42.91 61.01 24 4 56.52 74.44 18 5 58.74 114 42 6
SS∗ 50.20 61.34 50 4 43.65 46.36 3.9 3 55.22 57.85 3.2 4 44.68 45.18 0.3 4
SS 42.96 58.69 59 3 43.08 83.82 >99 5 43.06 50.95 41 2 42.95 43.44 0.6 2
CRO∗ 51.23 51.77 0.3 2 43.54 43.73 0.1 1 55.78 56.53 0.4 3 44.61 45.17 0.3 3
CRO 43.01 43.29 0.2 1 42.94 44.06 2.9 2 42.97 43.45 0.2 1 42.87 43.39 0.3 1
r-GA∗ 51.06 151 >99 6 58.92 124 98 4 60.76 9428.7 >99 6 46.44 82.74 45 5
HE-GA 60.07 119 51 5 843 1011 >99 6 51.18 78.92 25 5 51.35 92.56 30 6
SS∗ 52.53 53.67 1.3 3 46.48 48.12 1.5 2 54.32 60.10 5.2 3 46.65 47.58 0.5 3
SS 46.79 61.77 77 4 46.52 154 >99 5 46.87 64.26 68 4 46.67 47.33 0.5 1
CRO∗ 52.78 53.24 0.3 2 46.02 46.37 0.1 1 57.46 58.02 0.3 2 47.03 47.70 0.3 4
CRO 46.66 48.85 6.0 1 46.77 48.80 3.4 3 46.80 47.57 0.6 1 46.64 47.37 0.6 2
r-GA∗ 32.15 3293 >99 6 32.20 68.26 33 6 33.38 3656 >99 6 29.53 57.89 32 5
HE-GA 33.59 94.40 35 5 29.94 46.64 41 5 29.88 37.67 14 3 31.34 78.25 33 6
SS∗ 34.80 35.66 0.5 3 30.36 33.07 3.7 3 38.85 43.70 9.6 5 28.44 29.69 0.5 4
SS 28.54 44.21 79 4 28.61 35.27 35 4 28.46 28.80 0.1 1 28.57 28.75 0.1 1
CRO∗ 35.06 35.54 0.2 2 30.25 30.47 0.1 2 39.11 40.66 0.5 4 29.36 29.64 0.1 3
CRO 28.32 28.79 0.3 1 28.61 29.01 0.6 1 28.57 28.82 0.1 2 28.59 28.76 0.1 2
el enfoque de caracterı́sticas permite a los métodos obtener Al aplicar el test estadı́stico de Friedman obtenemos un
mejores resultados mı́nimos, a expensas de incrementar la resultado de χ2F = 92,0, con un p-valor correspondiente de
varianza. Por otro lado, los resultados de los métodos basados < 10−16 . Dado que p es menor que el nivel de significancia
en intensidades (excepto r-GA∗ ) son más robustos, obteniendo considerado (α = 0,01), el test concluye que hay diferencias
una menor desviación que los métodos de caracterı́sticas. significativas entre métodos. Complementamos el análisis con
Ambos genéticos tienen un comportamiento inestable, pero el test de Holm (Tabla IV) comparando CRO (control) con
alcanzan buenos resultados mı́nimos. r-GA∗ alcanza la última el resto de métodos. El p-valor resultante para ambos tests
posición del ranking (5.63) debido a obtener los mayores erro- revela que existen diferencias significativas entre CRO y tanto
res en la comparativa. A pesar de su pobre comportamiento, los métodos genéticos como aquellos basados en SS.
HE-GA es capaz de obtener el mejor resultado mı́nimo en tres
Tabla IV: Ranking de Friedman y resultados estadı́sticos con
de los dieciséis escenarios, con un ranking de 4.94.
CRO como método de control para los test de Bonferroni y
SS∗ y SS mejoran considerablemente a los genéticos, con Holm, de acuerdo con el valor medio de ECM.
un comportamiento consistente excepto en cuatro escenarios,
donde no terminan de converger. Ası́, los métodos basados en Ranking Bonferroni-Dunn p Holm p
SS alcanzan las posiciones medias del ranking (3.0 y 3.56, CRO 1.38 - -
CRO∗ 2.50 0,44 0,09
respectivamente). Aunque tienen un rendimiento similar en SS 3.00 0,07 < 0,05
cuanto al ECM, SS mejora a SS∗ al obtener mejores resultados SS∗ 3.56 < 0,01 < 0,01
HE-GA 4.94 < 0,01 < 0,01
mı́nimos a pesar de su mayor desviación estándar. r-GA∗ 5.63 < 10−10 < 10−10
En cuanto a nuestras propuestas, CRO∗ obtiene mejor ECM
medio que ambos métodos basados en SS, pero es incapaz de Por último, incluimos un análisis visual de los resultados
alcanzar su precisión en valores mı́nimos. Por otro lado, la obtenidos en uno de los escenarios más complejos. La Figura 2
adaptación al enfoque de caracterı́sticas (CRO) mejora tanto muestra la mejor alineación entre imágenes obtenida por cada
a CRO∗ como al actual método del estado del arte, SS. En algoritmo. Destacamos los resultados de nuestras propuestas
cuanto al ECM medio, CRO mejora a SS en doce escenarios. basadas en CRO, en especial el enfoque de caracterı́sticas, ya
Ası́, CRO∗ alcanza la segunda posición con 2.5, mientras que mejoran considerablemente la precisión de la alineación
que CRO es primero con un ranking de 1.38, gracias a su resultante.
excelente balance entre exploración y explotación. Ambos
enfoques basados en CRO son capaces de mejorar al actual V. C ONCLUSIONES
estado del arte en RI, destacando nuestra propuesta basada en En este trabajo describimos el diseño e implementación de
caracterı́sticas por obtener el mejor rendimiento. una novedosa técnica bio-inspirada, conocida como CRO, para
710
CRO obtiene unos resultados excelentes considerando ambos

enfoques de registrado, y mejora a métodos consolidados en RI
demostrando gran robustez y eficiencia al abordar problemas
de optimización complejos como es el RI médica.
AGRADECIMIENTOS
Este trabajo ha sido financiado parcialmente por los pro-
yectos: TIN2015-67661-P, incluyendo al Fondo Europeo de
Desarrollo Regional (ERDF), al Ministerio de Economı́a y
TIN2014-54583-C2-2-R, de la Comisión Interministerial de
HE-GA (51.2) vs. r-GA∗ (60.8) Ciencia y Tecnologı́a (CICYT).
R EFERENCIAS
[1] B. Zitová and J. Flusser, “Image registration methods: A survey,” Image
and Vision Computing, vol. 21, no. 11, pp. 977–1000, 2003.
[2] A. A. Goshtasby, 2-D and 3-D Image Registration. Wiley Interscience,
2005.
[3] P. J. Besl and N. D. McKay, “A Method for Registration of 3-D Shapes,”
IEEE Trans. on Pattern Analysis and Machine Intelligence, vol. 14,
no. 2, pp. 239–256, 1992.
[4] J. Santamarı́a, O. Cordón, S. Damas, J. Garcı́a-Torres, and A. Quirin,
“Performance evaluation of memetic approaches in 3D reconstruction of
forensic objects,” Soft Computing, vol. 13, no. 8-9, pp. 883–904, 2009.
SS (46.9) vs. SS∗ (54.3) [5] S. Damas, O. Cordón, and J. Santamarı́a, “Medical Image Registra-
tion Using Evolutionary Computation: An Experimental Survey,” IEEE
Computational Intelligence Magazine, vol. 6, no. 4, pp. 26–42, 2011.
[6] A. Valsecchi, S. Damas, J. Santamarı́a, and L. Marrakchi-Kacem,
“Intensity-based image registration using scatter search,” Artificial In-
telligence in Medicine, vol. 60, no. 3, pp. 151–163, 2014.
[7] S. Salcedo-Sanz, J. Del Ser, I. Landa-Torres, S. Gil-López, and J. A.
Portilla-Figueras, “The coral reefs optimization algorithm: A novel me-
taheuristic for efficiently solving optimization problems,” The Scientific
World Journal, vol. 2014, pp. 1–15, 2014.
[8] E. Bermejo, M. Chica, S. Salcedo-Sanz, and O. Cordon, “Coral Reef
Optimization for Intensity-based Medical Image Registration,” in IEEE
Congress on Evolutionary Computation, CEC 2017 - Proceedings.
IEEE, 2017, pp. 533–540.
CRO (46.8) vs. CRO∗ (57.5) [9] D. L. Collins, A. P. Zijdenbos, V. Kollkian, J. G. Sled, N. J. Kabani,
C. J. Holmes, and A. C. Evans, “Design and construction of a realistic
Figura 2: Resultados del solapamiento entre el modelo (azul) digital brain phantom,” IEEE Trans. on Medical Imaging, vol. 17, pp.
463–468, 1998.
y la escena (amarillo). La figura aporta una comparativa de los [10] A. Valsecchi, S. Damas, J. Santamaria, and L. Marrakchi-Kacem,
resultados entre el enfoque de caracterı́sticas (izquierda) y de “Genetic algorithms for Voxel-based medical image registration,” in
intensidades (derecha) para el escenario n◦ 11 (I1 vs. T3 (I4 )). 2013 Fourth International Workshop on Computational Intelligence in
Medical Imaging (CIMI), apr 2013, pp. 22–29.
Entre paréntesis se indica el mı́nimo ECM alcanzado. [11] M. Takahashi and H. Kita, “A crossover operator using indepen-
dent component analysis for real-coded genetic algorithms,” Procee-
dings of the 2001 Congress on Evolutionary Computation (IEEE Cat.
No.01TH8546), vol. 1, pp. 643–649, 2001.
resolver el problema de RI médica en 3D de forma robusta y [12] M. Lozano, F. Herrera, N. Krasnogor, and D. Molina, “Real-coded
memetic algorithms with crossover hill-climbing.” Evolutionary compu-
eficiente. En particular, abordamos el problema considerando tation, vol. 12, no. 3, pp. 273–302, 2004.
dos enfoques, usando la distribución de intensidades de las [13] R. He and P. A. Narayana, “Global optimization of mutual information:
imágenes y un conjunto reducido de puntos caracterı́sticos, application to three-dimensional retrospective registration of magne-
tic resonance images,” Computerized Medical Imaging and Graphics,
cada uno con diferentes niveles de complejidad. CRO integra vol. 26, no. 4, pp. 277–292, 2002.
en su diseño una estrategia de búsqueda balanceada, que le [14] Salcedo-Sanz, “A review on the coral reefs optimization algorithm:
permite obtener resultados excelentes en diferentes problemas new development lines and current applications,” Progress in Artificial
Intelligence, vol. 6, no. 1, pp. 1–15, 2017.
reales. Ası́, adaptamos CRO al problema de RI siguiendo [15] O. Monga, S. Benayoun, and O. Faugeras, “From partial derivatives of
ambos enfoques y analizamos su comportamiento. 3-D density images to ridge lines,” in Proceedings 1992 IEEE Computer
Society Conference on Computer Vision and Pattern Recognition, vol.
Para evaluar el rendimiento de nuestra propuesta compa- 1808. Champaign, Illinois, USA: IEEE, 1992, pp. 354–359.
ramos ambas implementaciones de CRO con algunos de los [16] S. Klein, M. Staring, K. Murphy, M. A. Viergever, and J. P. W. Pluim,
métodos evolutivos más relevantes de la literatura en RI. Di- “Elastix: A toolbox for intensity-based medical image registration,”
IEEE Trans. on Medical Imaging, vol. 29, no. 1, pp. 196–205, 2010.
señamos un exhaustivo estudio experimental con 16 escenarios
de RI mono-modal a partir de cuatro IMRs cerebrales sintéti-
cos, con diferentes niveles de ruido y lesiones. Las imágenes
provienen del repositorio BrainWeb (McGill University [9]).
711
Registrado de imágenes 3D-2D para identificación

forense mediante comparación de radiografı́as
Oscar Gómez∗ , Oscar Ibáñez∗ , Andrea Valsecchi∗ , Oscar Cordón∗ y Tzipi Kahana†
∗ Instituto Andaluz Interuniversitario DaSCI (Data Science and Computational Intelligence), Universidad de Granada, España
† Facultad de Medicina, Universidad Hebrea de Jerusalén, Jerusalen, Israel
Emails: [email protected], [email protected], [email protected],

[email protected], [email protected]
Abstract—La comparación de radiografı́as es una técnica [1] es la única técnica SFI considerada primaria por la Interpol
de identificación forense que conlleva la comparación manual (junto con la comparación de implantes quirúrgicos) [5]. En
de radiografı́as ante-mortem (AM) y post-mortem (PM). Sin la literatura, numerosas estructuras anatómicas como huesos
embargo, éste es un proceso lento y propenso a errores por lo
que su utilidad se ve reducida. El objetivo de este trabajo es y cavidades se han mostrado útiles para realizar una identifi-
proponer y validar un nuevo paradigma asistido por ordenador cación positiva [6]. Éstas están localizadas principalmente en
para comparación de radiografı́as. En concreto, se centra en la zona del cráneo (p. ej. dientes [7] y los senos frontales [8]
reproducir de manera automática los parámetros de adquisición y del pecho (p. ej. clavı́culas [9] y vértebras [10]). Aunque
de la radiografı́a AM en una proyección del modelo 3D PM también hay otras fueras de estas regiones tales como los
mediante una metodologı́a basada en el registrado de imágenes
3D-2D. Este proceso de registrado será guiado por la silueta huesos de la mano [11] y la rótula [12], entre muchas otras.
de la estructura anatómica utilizada para identificar en la Sin embargo, a pesar de ser el método más empleado y útil
radiografı́a AM y un modelo 3D PM de la misma. El problema en SFI, su aplicación todavı́a se basa en una comparación
de optimización subyacente es complejo ya que no se puede manual de los datos AM-PM a través de un proceso de
asumir una inicialización cercana y tampoco se puede depender
del valor de intensidad de los pı́xeles (enfoque tradicional en
inspección visual que depende por completo de la habilidad
imagen médica). Para abordarlo se ha utilizado una meta- y experiencia del experto. Como consecuencia, su utilidad se
heurı́stica, differential evolution, y un método clásico que ha reduce debido a que es un proceso tedioso y propenso a errores
sido adaptado para este problema concreto. Se han realizado debidos al cansancio del experto.
múltiples experimentos para estudiar la precisión y robustez de
Guiados por el análisis de la literatura forense, se han
la propuesta utilizando imágenes sintéticas de clavı́culas, rótula
y senos frontales obteniendo resultados prometedores. distinguido tres etapas consecutivas en proceso automático de
Index Terms—Identificación forense, comparación de radio- identificación mediante CR:
grafı́as, registrado de imágenes 3D-2D, computación evolutiva.
1) Obtención de los datos AM de todos los candidatos
y el procesado del material PM. Incluye la mejora y
I. I NTRODUCCI ÓN segmentación de las imágenes AM y PM.
La identificación forense es de suma importancia en nuestra 2) Producir una radiografı́a PM que simule la transfor-
sociedad [1]. Los métodos principales de identificación son mación proyectiva de cada una de las radiografı́as AM
la odontologı́a forense, el análisis de huellas dactilares y del candidato.
el análisis de ADN. Sin embargo, la aplicación de estos 3) Toma de decisiones en base a la superposición obtenida,
métodos no es posible cuando no se dispone de la suficiente junto con otros factores tales como la calidad de las
información ante-mortem (AM) o post-mortem (PM) debido imágenes o el poder discriminatorio del hueso utilizado.
a la falta de datos por estado de conservación del cadáver Pese a la necesidad de métodos automáticos, esta técnica ha
y/o la ausencia de muestras AM contra las que comparar. sido objeto de pocos trabajos de investigación. En concreto,
En este aspecto, las técnicas de identificación basadas en se han utilizado técnicas de morfometrı́a geométrica, tales
el esqueleto (SFI, por sus siglas en inglés, skeleton-based como el análisis de la elı́ptica de Fourier, para la CR de
forensic identification) pueden suponer la última posibilidad de senos frontales [13], bóvedas craneales [14], clavı́culas [15],
identificación. Esto es debido a que el esqueleto generalmente y rótulas [12]. El enfoque de los dos primeros trabajos
sobrevive a procesos de descomposición natural y no natural, consiste en la segmentación manual del hueso o cavidad en
como por ejemplo es habitual en escenarios de desastres las radiografı́as AM y PM y finalmente compararlas utilizando
masivos. el análisis de la elı́ptica de Fourier. Mientras tanto, los dos
Las técnicas de SFI son usadas para identificación y/o últimos se basan en la adquisición de modelos 3D de los
filtrado dependiendo del poder identificativo de cada hueso o huesos PM utilizando un escáner de luz estructurada, pero la
cavidad [2]. Dentro de las técnicas de SFI, las más importantes decisión final aún implica la comparación de la segmentación
son la superposición craneofacial [3], la reconstrucción facial de la radiografı́a AM contra un conjunto predefinido de
[4] y la comparación de radiografı́as (CR). En concreto, CR imágenes obtenidas a través de rotaciones pre-establecidas
712
del modelo 3D PM. No hay, sin embargo, ningún método establecer una correspondencia entre los puntos 3D y 2D. Los
automático que busque la mejor proyección posible del modelo datos 3D son el hueso o cavidad PM en forma de un modelo
3D. de superficie PM 3D, ya sea que se obtiene al segmentar
El proceso de superposición para CR es complejo debido una imagen volumétrica como una CT o directamente desde
principalmente a dos razones. La primera, la radiografı́a AM un escáner 3D. Los datos 2D son la silueta del hueso en
fue tomada en unas condiciones desconocidas y por tanto no una radiografı́a AM. Los métodos de RI 3D-2D IR para
se puede asumir una inicialización cercana. La segunda, las dominios médicos [21], [22] pueden asumir que trabajan en
intensidades en las imágenes no son fiables o incluso hay es- un entorno controlado. En consecuencia pueden limitar la
cenarios en los que no se dispone de ellas (véase la Sección 2). transformación a solo 6 grados de libertad (trasladaciones y
Esto lleva a que las técnicas habituales de registro de imágenes rotaciones) sin tener en cuenta los parámetros relacionados
(RI) 3D-2D no sean adecuadas para CR y se deben investigar con las distorsiones de perspectiva. Además utilizan inicial-
técnicas diferentes para resolverlo satisfactoriamente, como la izaciones cercanas al Ground Truth (p. ej. en [22] consideran
utilización de algoritmos evolutivos [16]. un error máximo de 20 mm y de rotación de 20 °, de 16
El objetivo de este trabajo es proponer y validar un método mm en [21], etc). Sin embargo, estas asunciones no son
asistido por ordenador para realizar la superposición de un adecuadas para CR. Por supuesto, hay algunas excepciones
modelo 3D de cualquier hueso o cavidad PM y una radiografı́a como Feldman et al. [23] que propuso un método IR 3D-2D
AM segmentada. El método sigue una metodologı́a de RI 3D- basado en la silueta que no depende de las inicializaciones
2D basada en la silueta del hueso o cavidad. Para validar se pero es solo aplicable en el caso calibrado (considerando solo
han utilizado dos tipos de huesos (clavı́culas y rótulas) y uno 6 DoF). No existe ningún enfoque de RI 3D-2D basado en la
de cavidad (senos frontales). silueta que considere 7 grados de libertad sin depender de una
Este artı́culo se organiza de la siguiente manera. En la inicialización cercana.
sección II se hace una revisión del estado del arte de RI.
La sección III describe nuestra propuesta. La sección IV III. R EGISTRADO DE IM ÁGENES PARA COMPARACI ÓN DE
presenta los experimentos realizados junto con sus resultados. RADIOGRAF ÍAS
Por último en la sección V se presentan las conclusiones de No hay un estándar universal para diseñar un método de RI.
este trabajo. No obstante, los métodos de RI suelen tener los siguientes 5
componentes (en la Figura 1 se puede verse un esquema de la
II. A NTECEDENTES Y JUSTIFICACI ÓN
propuesta de RI 3D-2D para CR): (1) el modelo 3D (modelo
RI [17], [18] es el proceso de poner dos imágenes en 3D del hueso PM) y una imagen fija (radiografı́a AM);
un mismo sistema de coordenadas, donde una imagen se (2) la transformación proyectiva responsable de generar una
mantiene fija y la otra es transformada. En el escenario 3D- proyección 2D del modelo 3D; (3) el conocimiento experto
2D, la imagen transformada es siempre la 3D y la 2D se que delimita la transformación proyectiva; (4) una métrica de
mantiene fija. Los métodos de RI 3D-2D son clasificados similitud que mide las similitudes entre la proyección y la
según guı́en el proceso de optimización utilizando intensidades imagen fija; y (5) un optimizador que busca los parámetros de
o caracterı́sticas de las imágenes. la transformación proyectiva según la métrica de similitud.
En imagen médica, los métodos basados en intensidades son
los más extendidos debido a que no requieren segmentaciones, Evaluación de la Proyección de
las cuales introducen subjetividad y errores. Estos han sido Superposición perspectiva
utilizados satisfactoriamente en problemas de registrado de Región de oclusión
Tomografı́as Computarizadas, TACs, (3D) y radiografı́as (2D) Comparación de las

siluetas considerando
oclusiones
[19]. Sin embargo en el problema que nos ocupa (CR), los )
ID
niveles de intensidad han podido cambiar desde el momento r
(S
to
de la adquisición de la radiografı́a y el TAC. Esto se debe a que R
e
c
e
p
r
la densidad de los huesos puede cambiar por muchos motivos Optimización E
m
is
o
provocando un cambio en las intensidades capturadas (p. ej. ta

n
c
ia
Parámetros: tx, ty, tz, rz, ry, rz, SID is

edad, osteoporosis, tiempo transcurrido desde el fallecimiento, D
Cámara /
etc). Otro motivo importante es el hecho de que muchos Contexto y conocimiento experto Generador rayos X
laboratorios forenses hacen uso en la actualidad de escáneres

de luz estructurada [20] debido a su gran disponibilidad y bajo Fig. 1: Esquema de la propuesta de RI 3D-2D para CR.
coste, mientras que solo unos pocos de ellos tienen TACs.
Estas limitaciones descartan los métodos basados en inten-
A. Datos AM y PM
sidades, dejando únicamente los basados en caracterı́sticas.
Los antropólogos forenses consideran que la morfologı́a ósea Las imágenes a registrar son las siguientes:
(silueta) es un aspecto fiable para realizar la identificación • La imagen 2D: la radiografı́a AM.
basada en CR. Por otro lado, no es posible utilizar otras • El modelo 3D: un modelo 3D de la superficie del hueso
caracterı́sticas como puntos homólogos por la imposibilidad de o cavidad. Obtenido mediante el uso de un escáner
713
de luz estructurada del ”hueso limpio” o mediante la del centro de la silueta en la imagen 2D, 3 rotaciones y 1
segmentación del hueso en un TAC. escala que representa el porcentaje de pı́xeles de la imágenes
En esta propuesta, el proceso de RI se guı́a por la silueta ocupados por el bounding box (el cuadrado delimitador) de la
del hueso o cavidad por lo que es necesario su segmentación silueta en la imagen.
en ambas imágenes. En la radiografı́a AM, la silueta puede C. Parámetros y su delimitación con conocimiento experto
estar ocluida por otras estructuras. Por ello aparte de la
silueta es necesario segmentar una región de oclusión donde Los parámetros están solo delimitados por el protocolo de
el experto tiene dudas (véase la Figura 2). En el caso 3D adquisición de radiografı́as [26]. Las radiografı́as son tomadas
hay dos escenarios posibles en función de si se parte de con el cuerpo en una posición conocida (posterioranterior o
un modelo 3D de superficie obtenido con un escáner de luz lateral) y la rotación por tanto pude ser delimitada para ambas
estructurada o de un TAC. En el primer escenario no es transformaciones con un margen de error (p. ej. ±10° o ±20°
necesario ningún preprocesamiento. Por otro lado, en el TAC en ángulos de Euler). En la transformación de perspectiva,
los huesos se segmentan fácilmente mediante el uso de las el protocolo de adquisición también sirve para delimitar la
unidades Hounsfield 1 . trasladación, la SID y también para conocer las dimensiones
del receptor y su resolución (pı́xeles por mm). La trasladación
en los ejes x e y es delimitada por el ancho y alto del receptor,
mientras que la SID del protocolo sirve para delimitar la SID
con un rango de error y también la trasladación en el eje z ya
que el cuerpo se suele colocar pegado al receptor, mientras que
en la transformación ortográfica la trasladación es delimitada
por los lı́mites de la imagen en coordenadas normalizadas
(de -1 a 1) y la escala por el porcentaje de pı́xeles que se
espera que ocupe la silueta en la radiografı́a (desde el 5% al
80%), no requiriendo conocimiento experto. Por último, en
el ortográfico no es necesario conocer las dimensiones del
Fig. 2: Radiografı́a del cráneo: sin segmentar (izquierda), con la segmentación receptor ni su resolución.
de los senos frontales en negro y la región de oclusión en blanco.
D. Métrica de similitud
Para medir las similitudes entre dos siluetas la métrica más
B. Transformación proyectiva utilizada en la literatura es la métrica DICE [27]. En este
Una transformación proyectiva es una transformación entre trabajo, la métrica DICE ha sido adaptada creando una nueva
el mundo 3D y una imagen 2D. Las funciones proyectivas son métrica, Masked DICE (véase la Eq. 1), mediante la inclusión
de dos tipos: proyecciones de perspectiva y ortográficas [24]. de la región de oclusión. La región de oclusión define un área
La transformación que origina una radiografı́a la modelamos que es ignorada por la métrica permitiendo ası́ solapamientos
mediante una transformación de perspectiva simple utilizando parciales y obviando regiones dubitativas (incertidumbre en
solo 7 parámetros: 6 parámetros extrı́nsecos (3 trasladaciones la segmentación). En los casos en los que no haya región de
y 3 rotaciones de la cámara) y 1 intrı́nseco (la distancia oclusión el valor de la métrica Masked DICE será igual al de
entre el emisor y el receptor, SID, por sus siglas en inglés, DICE. En el caso particular donde la proyección del hueso
source image distance) [25] (véase la Figura 1). La mayorı́a esté fuera del campo de visión, el valor de la métrica es fijado
de trabajos en imagen médica consideran solo 6 parámetros a 1.5.
dado que asumen que en un escenario controlado el parámetro 2 · |(IA \ M ) ∩ (IB \ M )|
SID es conocido [21], [22]. Pero en CR, cómo ya se ha Masked DICE = (1)
|IA \ M | + |IB \ M |
comentado en las secciones anteriores, es necesario considerar
los 7 parámetros. donde IA son los pı́xeles de la silueta del objeto A (el
Por otro lado, la transformación ortográfica es un caso hueso segmentado AM), IB son los pı́xeles del objeto B (la
particular de la transformación de perspectiva donde la cámara proyección de hueso PM), y M es la región de oclusión.
está situada en el “infinito” y por tanto no modela distorsiones E. Optimizador
de perspectiva. La mayorı́a de las radiografı́as tienen distor-
El problema de optimización es complejo dado que no se
siones de perspectiva (a excepción de aquellas con una SID
puede hacer uso de las intensidades o de una inicialización
elevada como las imágenes cefalométricas con una SID de 4
cercana, como ya se comentó en las secciones anteriores.
metros). No obstante, el estudio del modelo ortográfico merece
Además se asume una alta multimodalidad del espacio de
la pena debido a que matemáticamente es más sencillo y podrı́a
búsqueda. Para abordar el problema se ha estudiado el uso
ser suficiente para identificar. Esta transformación tiene solo
de dos optimizadores diferentes. El primero está basado en un
6 parámetros: 2 trasladaciones que representan la posición
método de optimización numérica llamado BOBYQA [28],
1 Es una escala cuantitativa utilizada en los estudios de TACs para describir que ya ha sido aplicado a problemas de RI. El segundo está
los diferentes niveles de radiodensidad de los tejidos humanos. basado en Differential Evolution (DE) [29], metaheuristica que
714
ha mostrado un gran comportamiento en los problemas de Todos los experimentos se han realizado en un servidor con
optimización global [30]. 12 nodos, cada uno con un Intel Core i7 4930k 3.4 GHz con
1) EG-BOBYQA el sistema operativo Ubuntu 16.04.
Varios métodos de optimización numérica (tanto de A. Generación del dataset
búsqueda lineal tales como Nelder-Mead, BFGS y LBFGS,
Para medir la capacidad de RI 3D-2D de las propuestas
cómo de región de confianza tales como Levenberg-Marquardt
se han utilizado casos sintéticos, cada uno compuesto por un
y BOBYQA) han sido probados para afrontar este problema de
modelo de superficie 3D y una proyección de perspectiva (2D)
RI utilizando la librerı́a DLIB [31]. El que mejores resultados
aleatoria (dentro del rango de los parámetros). Esto permite
obtuvo en los experimentos preliminares fue BOBYQA.
evaluar objetivamente la calidad de una superimposición in-
Sin embargo, pese a ser el mejor, sus resultados en la experi-
cluso en escenarios con oclusiones debido a que la proyección
mentación preliminar fueron insuficientes debido a que mostró
sin oclusiones también es conocida.
una gran dependencia de la inicialización, especialmente con
En este experimento se han utilizado datos sintéticos de
los parámetros relacionados con la rotación. Para afrontar este
clavı́culas, rótulas y senos frontales. En concreto, se han es-
problema, se ha propuesto EG-BOBYQA (estimation grid-
caneado 10 clavı́culas y 10 rótulas (procedentes del laboratorio
BOBYQA). Este método consiste en realizar diferentes ejecu-
de antropologı́a fı́sica de la Universidad de Granada) con un
ciones de BOBYQA con diferentes inicializaciones mediante
escáner Artec SpiderT M 3D, y 10 senos frontales han sido
el uso de un grid en los tres parámetros de la rotación
segmentados manualmente de TACs (procedentes del Hospital
(limitando el número de evaluaciones de BOBYQA para
de Castilla la Mancha) usando 3D Slicer 4.5.0-1 (véase la
que sea computacionalmente abordable). Además para cada
sección III.A). Para cada uno de los 30 modelos 3D se han
configuración del grid, los parámetros de la trasladación y la
generado 5 proyecciones de perspectiva aleatorias dentro de
escala son estimados en la transformación ortográfica. Hay
los rangos de la Tabla I. Además, el tamaño del receptor
que buscar un compromiso entre la granularidad del grid y el
para senos frontales y rótulas es de 240 mm × 300 mm y
tiempo de ejecución, ya que por ejemplo un grid con pasos de
la SID es de 1000 mm, y en clavı́culas de 430 mm × 350
un grado en los tres ejes de rotación es computacionalmente
mm y 1800 mm (resultado en imágenes de 750 × 900 pı́xeles
inabordable incluso para el menor de los rangos de rotación
y de 1290 × 1050, respectivamente). Para cada una de las
considerados (de 20° en cada eje). Este problema se resuelve
150 imágenes simuladas, dos imágenes adicionales han sido
utilizando varios grid de forma iterativa reduciendo el rango
generadas añadiendo oclusiones en la silueta del 15% y 30%
de rotación y el tamaño del paso hasta alcanzar un paso menor
con sus respectivas zonas de incertidumbre. En total se han
a un grado. El paso inicial ha sido establecido de manera
generado 450 casos positivos de CR con sus respectivos GTs.
experimental en un cuarto del rango de rotación y en cada
iteración es dividido entre cuatro, mientras que el rango de TABLE I: Rango de los parámetros para la transformación de perspectiva
rotación es reducido de la siguiente forma [mejor rotación - delimitados según los protocolos de adquisición [26]
paso paso
2 , mejor rotación + 2 ]. Finalmente la mejor solución
Hueso/Cavidad
Parámetro
Senos frontales Rótulas Clavı́culas
del último grid es mejorada de nuevo utilizando BOBYQA tx (mm) [-125, 125] [-125, 125] [-210, 210]
sin establecer un número lı́mite de evaluaciones. ty (mm) [-150, 150] [-175, 175]
Este optimizador es solo aplicable a la transformación or- tz (mm) [700, 1100] [700, 1900]
rx , ry , y rz (grados) [-10°, 10°], [-20°, 20°]
tográfica dado que la estimación de la escala y la trasladación SID (mm) [9000, 1100] [1600, 1900]
no puede realizarse en la transformación perspectiva dado que
dependen tanto de la trasladación en eje z como de la SID. B. Diseño experimental
2) Differential Evolution
Los parámetros de los optimizadores se han fijado en
DE es una metaheurı́stica propuesta por Storn y Price
base a una experimentación preliminar, siendo sus mejores
[29]. Se ha aplicado con éxito a problemas de optimización
configuraciones las siguientes. En BOBYQA la región de
multimodales debido a su gran robustez, rápida convergencia
confianza inicial se fija en 0.05. En DE 100 individuos, 50000
y al reducido número de parámetros a fijar [32]. Además
evaluaciones, una probabilidad de cruce Pc de 0.5, y un F de
también se ha utilizado en problemas de RI 3D-3D [33]. Los
0.5. Con DE, se han realizado 16 ejecuciones independientes
parámetros a fijar de DE son los siguientes: F (controla la
de cada experimento, dado que DE se basa en un proceso
tasa de mutación), Pc (controla la tasa de recombinación), n
estocástico, para poder estudiar tanto su precisión como ro-
(tamaño de la población) y m (número de generaciones).
bustez. La inicialización de cada ejecución es aleatoria en todo
el rango de los parámetros. Para ambos, se ha establecido un
IV. E XPERIMENTOS
criterio de parada cuando el error de solapamiento es inferior
Los experimentos realizados están dedicados al estudio de al 0.01% de los pı́xeles.
la precisión y robustez de los dos optimizadores en problemas En total se han llevado a cabo 2700 experimentos que se
sintéticos de CR con dos tipos de huesos, clavı́culas y rótulas, desglosan de la siguiente manera:
y un tipo de cavidad, senos frontales, en casos positivos, es 1) Transformación ortográfica: 2 optimizadores (EG-
decir, el caso AM y el PM pertenecen a la misma persona. BOBYQA y DE), 2 rangos de rotación (±10°y ±20°),
715
con los 450 casos simulados (véase que todos los casos Ortografico Ortografico Ortografico Ortografico Perspectiva Perspectiva
fueron generados con la transformación de perspectiva). EG−BOBYQA EG−BOBYQA DE DE DE DE
Un total de 1800 experimentos. [−10, 10] [−20, 20] [−10, 10] [−20, 20] [−10, 10] [−20, 20]
2) Transformación perspectiva: 1 optimizador (DE), 2 ran-

40
Clavicula
gos de rotación (±10°y ±20°), con los 450 casos
20
simulados. Un total de 1800 experimentos. Con esta
transformación no se ha podido probar EG-BOBYQA 0
por los motivos vistos en la sección III.E. 60
mRPD
Rotula
40
C. Resultados 20
Los resultados obtenidos se muestran en la Tabla II para las 0

12.5
Senos Frontales
métricas Masked DICE y mRPD (error medio de la distancia 10.0
7.5
de retroproyección, para más información véase [34]). Las 5.0
métricas Masked DICE y mRPD están correlacionadas según 2.5
el test de correlación de Pearson [35] (obteniendo un coefi- 0.0
30 15 0 30 15 0 30 15 0 30 15 0 30 15 0 30 15 0
ciente de 0.780), lo cual indica que Masked DICE es una buena Porcentaje de oclusion
métrica para guiar el proceso de optimización en CR. También Fig. 3: Boxplots del error mı́nimo obtenido según el hueso o cavidad,
se ve que la transformación de perspectiva obtiene siempre transformación y optimizador bajo la métrica mRPD.
mejores resultados que la ortográfica, lo cual se confirma con
el test de Wilcoxon [36] y el del signo [37] obteniendo unos
valores p de 2.2 · 10−16 y 8.6 · 10−203 , respectivamente. Esta El principal punto débil de esta propuesta es el alto tiempo
diferencia puede explicarse ya que solo la transformación de de ejecución necesario para obtener los resultados (30 minutos
perspectiva puede reproducir las distorsiones de perspectiva de media), haciendo difı́cil volver a ejecutar DE cuando éste
presentes en los casos. Por último, DE obtiene siempre mejores obtiene una mala superimposición. Esto se debe al alto número
resultados tanto en media como en desviación estándar (sd) de evaluaciones que necesita realizar el optimizador.
que EG-BOBYQA, lo cual se confirma también con el test En resumen, DE obtiene buenas superposiciones con ambas
de Wilcoxon y el de signo obteniendo unos valores p de transformaciones, los dos rangos de rotación y los diferentes
2.2 · 10−16 y de 9.2 · 10−110 . niveles de oclusión, pero solo siendo robusto con los senos
frontales debido a la singularidad de su silueta.
TABLE II: Resumen de los resultados bajo las métricas DICE y mRPD según
hueso o cavidad, transformación y optimizador.
Masked DICE mRPD (mm)
V. C ONCLUSIONES
Hueso Optimizador Transf. media sd media sd
Orto. 0.015 0.011 12.128 14.442 La contribución de este trabajo ha sido abordar el problema
DE
Clavı́cula Persp. 0.001 0.003 0.055 0.088 del RI 3D-2D para CR basándose únicamente en la silueta
EG-BOBYQA Orto. 0.044 0.025 12.714 14.373
Orto. 0.014 0.016 11.981 16.270 del hueso o cavidad. Se han considerado dos optimizadores
DE
Rótula Persp. 0.005 0.008 0.761 1.544 (EG-BOBYQA y DE) y dos transformaciones proyectivas
EG-BOBYQA Orto. 0.035 0.020 12.148 16.892
Orto. 0.014 0.055 8.471 3.571 (ortográfica y perspectiva). Se han obtenido resultados prom-
Senos DE
frontales
Persp. 0.001 0.003 0.028 0.067 etedores con un error de solapamiento inferior al 2% de los
EG-BOBYQA Orto. 0.029 0.034 8.285 3.399
pı́xeles entre la silueta AM y la proyección del modelo 3D PM
encontrada por el optimizador. A nivel general, DE ha ganado
La robustez de ambos optimizadores es mejorable dado que a EG-BOBYQA en todos los sentidos tanto en precisión como
tienen algunas ejecuciones con errores muy altos (un 40%2 en robustez. Además la transformación de perspectiva también
con Masked DICE y 60 mm con mRPD). Sin embargo, el ha sido mejor que la ortográfica mostrando la importancia de
error mı́nimo del DE (es decir, el mejor resultado de las 16 poder reproducir las distorsiones de perspectiva. Estos resulta-
ejecuciones) es siempre inferior a 0.5% con Masked DICE y de dos varı́an significativamente según el hueso o la cavidad. Los
0.1 mm con mRPD con las tres estructuras anatómicas para la peores resultados han sido obtenidos con las rótulas presum-
transformación de perspectiva. Mientras que para el ortográfico iblemente por su baja singularidad con un error promedio de
es de 3% y 1 mm, respectivamente. Además ni la oclusión ni el 0.761 mm y 1.5 % de pı́xeles mal superpuestos de acuerdo
rango de rotación han mostrado una influencia significativa en con las métricas mRPD y Masked DICE, respectivamente.
la precisión, afectando ligeramente a la robustez. Por último, Con clavı́culas por otro lado se han logrado errores promedio
también puede verse que existe una gran diferencia según de 0.055 mm y 0.2 %, respectivamente. Mientras que los
la estructura anatómica, siendo los senos frontales los que mejores resultados han sido obtenidos con los senos frontales
obtienen mejoren resultados seguidos de las clavı́culas, y por con un error promedio de 0,028 mm y 0,2 % de pı́xeles mal
último de las rótulas. superpuestos, respectivamente, debido a su singularidad. Estos
2 La métrica DICE multiplicada por 100 es equivalente al porcentaje de resultados concuerdan con el uso que las rótulas y clavı́culas
pı́xeles no coincidentes entre dos siluetas. tienen en identificación limitado principalmente al filtrado de
716
casos [9], [12], mientras que los senos frontales han sido [15] C. N. Stephan, B. Amidan, H. Trease, P. Guyomarc’h, T. Pulsipher,
utilizados directamente para identificación [8]. J. E. Byrd, Morphometric comparison of clavicle outlines from 3d bone
scans and 2d chest radiographs: a shortlisting tool to assist radiographic
En conclusión, se ha logrado automatizar el proceso de identification of human skeletons, Journal of Forensic Sciences 59 (2)
RI necesario para una aplicación adecuada de la técnica CR (2014) 306–313.
con reproducibilidad, objetividad y alta precisión. El principal [16] S. Damas, O. Cordón, J. Santamarı́a, Medical image registration using
evolutionary computation: An experimental survey, IEEE Computational
inconveniente de esta propuesta es el tiempo de cálculo Intelligence Magazine 6 (4) (2011) 26–42.
requerido para obtener las superposiciones (30 minutos en [17] P. Markelj, D. Tomaževič, B. Likar, F. Pernuš, A review of 3D/2D
promedio por superposición). El primer trabajo futuro es la registration methods for image-guided interventions, Medical Image
Analysis 16 (3) (2012) 642–661.
realización de un escenario n contra n con casos positivos y [18] F. P. Oliveira, J. M. R. Tavares, Medical image registration: a review,
negativos que permitirá comprobar si los errores obtenidos Computer Methods in Biomechanics and Biomedical Engineering 17 (2)
son suficientes para identificación. Además de realizar un (2014) 73–93.
[19] P. Markelj, D. Tomazevic, F. Pernus, B. Likar, Robust gradient-based
estudio comparativo de diferentes metaheurı́sticas de rápida 3-D/2-D registration of CT and MR to x-ray images, IEEE Transactions
convergencia [38] para reducir el tiempo de ejecución de la on Medical Imaging 27 (12) (2008) 1704–1714.
propuesta. [20] S. Damas, O. Cordón, O. Ibáñez, J. Santamarı́a, I. Alemán, M. Botella,
F. Navarro, Forensic identification by computer-aided craniofacial su-
AGRADECIMIENTOS perimposition: a survey, ACM Computing Surveys 43 (4) (2011) 27.
[21] D. B. Russakoff, T. Rohlfing, K. Mori, D. Rueckert, A. Ho, J. R. Adler,
Esta investigación ha sido subvencionada por el Ministerio C. R. Maurer, Fast generation of digitally reconstructed radiographs
de Economı́a y Competividad de España bajo el proyecto using attenuation fields with application to 2D-3D image registration,
IEEE Transactions on Medical Imaging 24 (11) (2005) 1441–1454.
NEWSOCO [TIN2015-67661-P], y por el departamento an- [22] J. Jomier, E. Bullitt, M. Van Horn, C. Pathak, S. R. Aylward, 3D/2D
daluz de Innovación, Ciencia y Empresa [TIC2011-7745], model-to-image registration applied to TIPS surgery, in: International
que incluye fondos europeo para el desarrollo de la región. Conference on Medical Image Computing and Computer-Assisted In-
tervention, Springer, 2006, pp. 662–669.
El trabajo del Sr. Gómez ha sido financiado por el MECD [23] J. Feldmar, N. Ayache, F. Betting, 3D-2D projective registration of free-
mediante una beca FPU [FPU14/02380]. El trabajo del Dr. form curves and surfaces, in: Computer Vision, 1995. Proceedings., Fifth
Ibáñez ha sido financiado por el MINECO mediante una beca International Conference on, IEEE, 1995, pp. 549–556.
[24] R. Hartley, A. Zisserman, Multiple view geometry in computer vision,
Juan de la Cierva-Incorporación [JCI-2014-22433]. Cambridge University Press, 2003.
[25] D. Mery, X-ray Testing, Springer International Publishing, Cham, 2015,
B IBLIOGRAF ÍA pp. 1–33.
[1] M. J. Thali, B. Brogdon, M. D. Viner, Forensic radiology, CRC Press, [26] K. L. Bontrager, J. Lampignano, Textbook of radiographic positioning
2002. and related anatomy, Elsevier Health Sciences, 2013.
[2] M. Page, J. Taylor, M. Blenkin, Uniqueness in the forensic identification [27] T. Sørensen, A method of establishing groups of equal amplitude in plant
sciences–fact or fiction?, Forensic Science International 206 (1) (2011) sociology based on similarity of species and its application to analyses of
12–18. the vegetation on danish commons, Kongelige Danske Videnskabernes
[3] M. I. Huete, O. Ibáñez, C. Wilkinson, T. Kahana, Past, present, and Selskab 5 (1948) 1–34.
future of craniofacial superimposition: Literature and international sur- [28] M. J. Powell, The BOBYQA algorithm for bound constrained optimiza-
veys, Legal Medicine 17 (4) (2015) 267 – 278. tion without derivatives, Cambridge NA Report NA2009/06, University
[4] C. Wilkinson, Forensic facial reconstruction, Cambridge University of Cambridge, Cambridge, UK, 2009.
Press, 2004. [29] R. Storn, K. Price, Differential evolution–a simple and efficient heuristic
[5] Interpol, Disaster victim identification guide, Available at: for global optimization over continuous spaces, Journal of Global
https://www.interpol.int/Media/ Files/INTERPOL-Expertise/DVI/DVI- Optimization 11 (4) (1997) 341–359.
Guide-20082. [30] A. K. Qin, X. Li, Differential evolution on the CEC-2013 single-
[6] T. Kahana, J. Hiss, Identification of human remains: forensic radiology, objective continuous optimization testbed, in: 2013 IEEE Congress on
Journal of Clinical Forensic Medicine 4 (1) (1997) 7 – 15. Evolutionary Computation, 2013, pp. 1099–1106.
[7] I. Pretty, A look at forensic dentistry - part 1: The role of teeth in the [31] D. King, Dlib c++ library, Available at: http://dlib.net.
determination of human identity, British Dental Journal 190 (7) (2001) [32] U. Chakraborty, Advances in differential evolution, Vol. 143, Springer,
359–366. 2008.
[8] G. Quatrehomme, P. Fronty, M. Sapanet, G. Grévin, P. Bailet, A. Ollier, [33] J. Santamarı́a, S. Damas, J. M. Garcı́a-Torres, O. Cordón, Self-adaptive
Identification by frontal sinus pattern in forensic anthropology, Forensic evolutionary image registration using differential evolution and artificial
Science International 83 (2) (1996) 147–153. immune systems, Pattern Recognition Letters 33 (16) (2012) 2065–2070.
[9] C. Stephan, A. Winburn, A. Christensen, A. Tyrrell, Skeletal identifica- [34] E. B. van de Kraats, G. P. Penney, D. Tomazevic, T. Van Walsum, W. J.
tion by radiographic comparison: Blind tests of a morphoscopic method Niessen, Standardized evaluation methodology for 2-D-3-D registration,
using antemortem chest radiographs, Journal of Forensic Sciences 56 (2) IEEE Transactions on Medical Imaging 24 (9) (2005) 1177–1189.
(2011) 320–332. [35] K. Pearson, Note on regression and inheritance in the case of two
[10] T. Kahana, L. Goldin, J. Hiss, Personal identification based on radio- parents, Proceedings of the Royal Society of London 58 (1895) 240–242.
graphic vertebral features, The American Journal of Forensic Medicine [36] E. A. Gehan, A generalized wilcoxon test for comparing arbitrarily
and Pathology 23 (1) (2002) 36–41. singly-censored samples, Biometrika 52 (1-2) (1965) 203–223.
[11] M. G. Koot, N. J. Sauer, T. W. Fenton, Radiographic human identifi- [37] W. J. Dixon, A. M. Mood, The statistical sign test, Journal of the
cation using bones of the hand: A validation study, Journal of Forensic American Statistical Association 41 (236) (1946) 557–566.
Sciences 50 (2) (2005) 263–268. [38] Q. Chen, B. Liu, Q. Zhang, J. Liang, P. Suganthan, B. Qu, Problem
[12] E. Niespodziewanski, C. N. Stephan, P. Guyomarc’h, T. W. Fenton, definition and evaluation criteria for CEC 2015 special session and
Human identification via lateral patella radiographs: A validation study, competition on bound constrained single-objective computationally ex-
Journal of Forensic Sciences 61 (1) (2016) 134–140. pensive numerical optimization, Computational Intelligence Laboratory,
[13] A. M. Christensen, Testing the reliability of frontal sinuses in positive Zhengzhou University, China and Nanyang Technological University,
identification, Journal of Forensic Sciences 50 (1) (2005) 18–22. Singapore.
[14] A. B. Maxwell, A. H. Ross, A radiographic study on the utility of cranial
vault outlines for positive identifications, Journal of Forensic Sciences
59 (2) (2014) 314–318.
717
1
Ajuste de un modelo de crecimiento de tumores de

vejiga mediante PSO y predicción con
incertidumbre
Clara Burgos-Simón∗ , Juan-Carlos Cortés∗ , José-Ignacio Hidalgo† , David Martı́nez-Rodrı́guez∗ , Rafael-J.
Villanueva∗
∗ Instituto Universitario de Matemática Multidisciplinar,
Universitat Politècnica de Valéncia, Valencia, Spain

Email: [email protected], [email protected], [email protected], [email protected]
† Departamento de Arquitectura de Computadores y Automática
Universidad Complutense de Madrid, Madrid, Spain

Resumen—El cáncer de vejiga es uno de los cánceres más En este trabajo proponemos un modelo matemático para
comunes en el sistema urinario, siendo una neoplasia altamente estudiar la evolución del cáncer y la respuesta inmune desde el
agresiva. Generalmente, el pronóstico no es bueno y es muy momento en el que se diagnostica. En este modelo considera-
difı́cil determinar la evolución para un paciente determinado.
En este trabajo proponemos un modelo matemático dinámico remos el protocolo terapéutico de tratamiento y lo adaptaremos
que describe el crecimiento del tumor de vejiga y la evolución a los datos disponibles que suelen utilizar los médicos para
de la respuesta inmune. Este modelo está personalizado para un conocer el estado de la enfermedad y procurar un tratamiento
solo paciente, y se determinan los valores de los parámetros del adecuado y un seguimiento apropiado a cada paciente.
modelo a través de una calibración que utiliza el algoritmo de Una vez establecido el modelo, realizaremos un calibrado
optimización Particle Swarm Optimization. Debido a la incer-
tidumbre de la evolución del tumor, utilizando los parámetros para determinar los parámetros del modelo que replican la
del modelo calibrado podemos predecir el tamaño del tumor evolución de un paciente particular. Para la calibración, utili-
y la evolución de la respuesta inmune en los próximos meses zaremos una versión del algoritmo de optimización PSO.
asumiendo tres escenarios diferentes: favorable, desfavorable y Una vez calibrado el modelo, utilizaremos los parámetros
neutro.
para hacer una predicción a corto plazo de la evolución del
Keywords: Cáncer de vejiga, Modelo dinámico, Cuantifi- tamaño del cáncer y de la respuesta inmune del paciente. Esta
cación de la incertidumbre, Calibración del modelo, Particle predicción, debido a la escasez de datos, se realizará teniendo
Swarm Optimization. en cuenta 3 posibles escenarios: favorable, neutro y desfavo-
rable.
Aunque es natural en el contexto matemático-computacional
I. I NTRODUCCI ÓN
realizar predicciones una vez obtenida la calibración, en el
El cáncer de vejiga es uno de los cánceres más comunes contexto médico resulta muy innovador debido al poco cono-
del sistema urinario y es una neoplasia altamente agresiva [1], cimiento que se tiene sobre la evolución de esta enfermedad
[2]. El 80 % de los pacientes diagnosticados con este cáncer en cada paciente.
presenta un carcinoma no invasivo que puede ser extirpado
mediante una Resección Trans Uretral (RTU), que es un
II. DATOS DISPONIBLES Y CONSTRUCCI ÓN DEL MODELO
procedimiento endoscópico para eliminar el tumor de la parte
interna de la vejiga [3]. El cáncer de vejiga se caracteriza Habitualmente, un paciente va a urgencias hospitalarias o
por su recurrencia en más de la mitad de los pacientes, pues al médico de cabecera cuando orina sangre (hematuria). El
el tumor reaparece después de un tiempo y puede progresar paciente es derivado al servicio de urologı́a donde, mediante
a cáncer músculo-invasivo. Es en este estadio es cuando los ecografı́a o citoscopia, se confirma si hay un tumor. En
tratamientos se vuelven más agresivos, y pueden incluir la caso de haberlo, empieza el seguimiento y el tratamiento.
extirpación de la vejiga para evitar la diseminación del cáncer Este trabajo se ha realizado conjuntamente con doctores del
a otras partes del cuerpo [4]. Hospital Universitario y Politécnico La Fe de Valencia [6].
El pronóstico del cáncer de vejiga generalmente no es bueno Los médicos han recolectado tejidos biológicos de pacientes
y, después de la RTU, el tratamiento habitual es la instilación que sufren cáncer de vejiga pT1G3, uno de los tipos llamados
de bacilos Calmette-Guérin (BCG) dentro de la vejiga con la superficiales. El protocolo dicta la realización de una RTU
idea de que la BCG se fije a las células tumorales residuales, para extirpar el tumor o tumores, y posteriormente administrar
estimulando la respuesta inmune del paciente contra estas instilaciones de BCG, repitiendo el ciclo hasta que el paciente
células infectadas para eliminarlas completamente [5]. sane completamente (no hay más recurrencias) o reaparezca el
718
2
cáncer aumentando su tamaño y penetrando en el músculo de del tumor en milı́metros, Ti (t) es el diámetro del tumor de
la vejiga de forma que haya que aplicar otros tratamientos más células infectadas por la BCG, B(t) los mililitros de BCG en
agresivos, entre los que puede caber incluso la extirpación de la vejiga y b(t) los mililitros de BCG instilados en una o varias
la vejiga. dosis, en el instante temporal t.
Con la idea de investigar el posible interés de esta técnica El parámetro k describe la tasa de crecimiento del tumor,
para pronóstico y seguimiento de pacientes, hemos selecciona- α la tasa de crecimiento de las células inflamatorias, µ1 es
do de la base de datos del hospital los datos correspondientes la tasa de mortalidad natural de la BCG y µ2 es la tasa de
a un paciente, que llamaremos paciente X, y que se resumen mortalidad natural de las células inflamatorias.
en la tabla I. Los parámetros que describen la interacción entre los
distintos tipos de células son: p1 es la tasa de muerte de
Fecha Procedimiento Tamaño Células
(mm) inflamatorias/campo BCG debido a las células inflamatorias; p2 es la tasa de
01/Mar/2012 Ecografı́a 3-5 - infección de las células tumorales por la BCG; p3 es la tasa de
14/Jun/2012 RTU 25 260 mortalidad de células tumorales infectadas, debido a la BCG;
15/Feb/2015 Citoscopia 1-2 -
28/Apr/2015 RTU 5 515 p4 es el crecimiento de células tumorales por la acción de
30/Jan/2017 Citoscopia 20 - la BCG; p5 es la tasa de mortalidad de células inflamatorias
14/Mar/2017 RTU 30-35 508 por su interacción con células tumorales no infectadas; y p6
Tabla I
DATOS DEL PACIENTE X, QUE TUVO LOS PRIMEROS S ÍNTOMAS EN MARZO representa la tasa de mortalidad de las células tumorales por
DE 2012. D ESDE ENTONCES , SE LE HAN PRACTICADO AL PACIENTE X las células inflamatorias.
TRES RTU.
III. C ALIBRACI ÓN

Además de los procedimientos relacionados en la tabla Para encontrar los parámetros del modelo que hagan que las
I, al paciente X se le han administrado 3 tratamientos de salidas del modelo estén lo más cerca posible a los datos de la
instilaciones de BCG que empezaron los dı́as 10/Ago/2012, tabla I en los instantes de tiempo correspondientes, definimos
26/May/2015 y 27/Abr/2017. La dosis de las instilaciones que la siguiente función de ajuste F :
se administran en la vejiga consisten en 81 ml de colonias Input. Valor de los parámetros a sustituir en el modelo
(k, α, µ1 , µ2 , p1 , p2 , p3 , p4 , p5 , p6 ).
de BCG, instiladas cada semana durante un periodo de seis
Paso1. Sustituir los valores de los parámetros en el modelo (1)-(4).
semanas. Paso2. Ejecutar el modelo y extraer los valores devueltos por el
Hemos adaptado el modelo introducido en [7] a los datos modelo para el tamaño del tumor y para el número de
disponibles y a la práctica clı́nica y protocolos del Hospital La células inflamatorias por campo en los mismos instantes
Fe. En una primera etapa, el tumor crece y no se administra temporales en los que tenemos datos en la tabla I.
ningún tratamiento hasta que se realiza la RTU. En esta etapa, Paso3. Calcular el error cuadrático medio entre las salidas del
sólo hay interacción entre las células tumorales y las inflama- modelo del Paso 2 y los datos de la tabla I.
torias, que constituyen la respuesta del sistema inmune global La calibración del modelo se ha hecho en etapas porque el
contra el tumor. Después de que en la RTU se reseccionen protocolo no es un proceso continuo debido a la extracción
los tumores de la vejiga, al cabo de unas semanas empieza la brusca del tumor mediante la RTU. Además, no todos los
administración del tratamiento de BCG. Desafortunadamente, parámetros se consideran constantes en el tiempo. La respuesta
la limpieza completa de células tumorales durante la RTU es inmune relacionada con la tasa de crecimiento p4 y la tasa de
imposible debido a la teorı́a de la siembra [8], por lo que las eficacia p6 , se va a considerar variable en el tiempo.
células tumorales residuales siguen creciendo. Sin embargo, La primera etapa será desde 01/Mar/2012 hasta la primera
con la administración de la BCG se pretende eliminar estas RTU. La segunda etapa es hasta la segunda RTU y la tercera
células residuales debido a que el sistema inmune genera una hasta la tercera RTU.
respuesta especı́fica más agresiva y efectiva contra las células Vamos a minimizar la función F en cada etapa, determi-
tumorales infectadas por la BCG. nando los valores de los parámetros del modelo utilizado el
La evolución de estas interacciones se modela mediante el algoritmo rPSO [9]. Se trata de un algoritmo bio-inspirado
siguiente sistema de ecuaciones en diferencias: basado en el intercambio de información entre las diferentes
partı́culas que forman el enjambre. La función objetivo (en
nuestro caso, la función a minimizar) es evaluada para cada
E(t + 1) = E(t) − µ2 E(t) + αTu (t) + p4 E(t)B(t) partı́cula, donde las partı́culas son vectores formados por los
− p5 E(t)Tu (t), (1) valores de los parámetros del modelo. En cada iteración,
Tu (t + 1) = Tu (t) − p2 B(t)Tu (t) − p6 E(t)Tu (t) actualizamos los valores de la posición de las partı́culas dentro
del espacio de parámetros mediante las siguientes expresiones:
+ kTu (t), (2)
Ti (t + 1) = Ti (t) − p3 E(t)Ti (t) + p2 B(t)Tu (t), (3) posi+1 = posi + veli , (5)
B(t + 1) = B(t) − µ1 B(t) − p1 E(t)B(t)
− p2 B(t)Tu (t) + b(t), (4)
veli+1 = U (0, 1) ∗ w ∗ veli + U (0, 1) ∗ c1 ∗ (pi,mejor − posi )
donde E(t) es el número medio de células inflamatorias + U (0, 1) ∗ c2 ∗ (gmejor − posi ).
por campo de visión del microscopio, Tu (t) es el diámetro (6)
719
3
donde:
800
U(0,1) es una muestra de una distribución uniforme entre
Immune Response
700
los valores [0, 1]. Este valor es muestreado de forma
(Cells/Field)
600
independiente para cada meta-parámetro dentro de la
500
función, para cada partı́cula dentro del enjambre y para
400
cada iteración dentro del proceso.
300
pi,mejor es la posición de la mejor evaluación de la fun-
ción para cada partı́cula individual del enjambre (mejor
30
local).
25
gmejor es la posición de la mejor evaluación de la función
Tumor Size
20
(mm)
realizada por cualquiera de las partı́culas que forman el 15
enjambre durante todo el proceso (mejor global). 10
Junto con las ecuaciones descritas, al proceso se le añade 5
una componente de mutación para evitar que las partı́culas 0

0 500 1000 1500
converjan en un mı́nimo local en lugar del global. Este proceso Time (days)
se realiza de la siguiente manera:
una partı́cula se rechaza y se genera una completamente Figura 1. Gráficas con la evolución de la respuesta inmune (arriba) y del
nueva con un 10 % de probabilidad; tamaño del tumor (abajo) con los parámetros obtenidos en la calibración del
modelo. t = 0 corresponde al 01/Mar/2012.
si la partı́cula no ha sido rechazada, con un 10 % de
probabilidad se le aplica una mutación.
Se han realizado diversas pruebas con números diferentes
de partı́culas, siendo el número que mejores resultados nos ha consiste en la misma respuesta del sistema inmune como en
dado el de 60 partı́culas. También se han realizado diversas la tercera etapa, es decir, la respuesta del sistema inmunitario
pruebas con el valor de los meta-parámetros w, c1 y cy , siendo permanece constante. El escenario desfavorable se basa en el
los valores finalmente utilizados w=0.73, c1 =1.5 y c2 =1.5. hecho de que la respuesta del sistema inmunitario disminuye
en la misma proporción que disminuyó desde la segunda a la
tercera fase.
IV. R ESULTADOS
En las figuras 2, 3, 4, se muestran los diferentes escenarios.
Los parámetros del modelo obtenidos en la calibración son
La predicción empieza desde la la lı́nea negra vertical.
los que se muestran en la tabla II.
En el escenario favorable, el tratamiento con BCG tiene un
Parámetro Valor Parámetro Valor resultado positivo y el tumor ya no crece más. En el escenario
k 0.01563 Tu (RT U1 ) 0,02
α 0.005 p4 (RT U1 ) 1e-4
neutral, se estima que ocurrirá una recurrencia del cáncer con
µ1 0.8 p6 (RT U1 ) 1.62e-5 un tumor del tamaño de 5 mm que se prevé para el 15 de
µ2 0.0005 agosto de 2018. En el escenario desfavorable, la recurrencia
p1 8e-5 Tu (RT U2 ) 0.02
p2 1e-3 p4 (RT U2 ) 5.6e-4
del cáncer de vejiga con un tumor del tamaño de 5 mm se
p3 1e-4 p6 (RT U2 ) 6.3e-6 prevé para el 25 de mayo de 2018.
p4 0.0
p5 0.0
p6 0.0
Tu (0) 5.0 800
E(0) 260
Immune Response
Tabla II 700
(Cells/Field)
VALORES DE LOS PAR ÁMETROS DEL MODELO CALIBRADOS PARA EL 600

PACIENTE X. N ÓTESE QUE LOS PAR ÁMETROS p4 Y p6 CAMBIAN CON EN
500
CADA ETAPA . L OS VALORES QUE ACOMPA ÑAN A RT U1 Y RT U2
CORRESPONDEN A PAR ÁMETROS VARIABLES TRAS LAS RT U1 Y RT U2 , 400
RESPECTIVAMENTE .
300
30
En la figura 1, se puede ver el resultado de la calibración,
25
en la de arriba la respuesta inmune y en la de abajo el tamaño
Tumor Size
20
(mm)
del tumor. Las subidas bruscas en forma de dientes de sierra 15

en la gráfica de la respuesta inmune son debidas a las dosis 10
semanales de instilaciones de BCG. Las caı́das en la gráfica 5
del tamaño del tumor, corresponden a cada RTU. 0
0 500 1000 1500 2000
Debido a la incertidumbre en la evolución futura, con el Time (days)
fin de predecir la dinámica del cáncer de vejiga, se han
considerado tres escenarios diferentes: favorable, neutral y
Figura 2. Escenario favorable. La BCG acaba con el tumor.
desfavorable. En el escenario favorable la respuesta del sistema
inmune es mayor que la segunda etapa. El escenario neutral
720
4
Immune Response
800
del tumor.
700
(Cells/Field)
600
VI. AGRADECIMIENTOS
500 Este trabajo ha sido parcialmente financiado por el proyecto
400
del Ministerio de Economı́a y Competitividad MTM2017-
300
89664-P y GenObIA-CM con referencia (S2017/BMD-3773)
financiado por la Comunidad de Madrid y cofinanciado
30 con Fondos Estructurales de la Unión Europea y Ministerio
25 de Economı́a y Competitividad TIN2014-54806-R (HERA-
Tumor Size
20 CLES).
(mm)
15
10 R EFERENCIAS
5
[1] Official Site for Spanish Medic Oncology Society, https://www.seom.org,
0
0 500 1000 1500 2000 accessed: 08/05/2018.
Time (days) [2] R. T. Greenlee, M. B. Hill-Harmon, T. Murray, M. Thun, Cancer statistics,
2001, CA: A Cancer Journal for Clinicians 51 (1) (2001) 15–36. doi:
10.3322/canjclin.51.1.15.
Figura 3. Escenario neutro. Se espera un tumor de 5mm para el 15 de agosto URL https://doi.org/10.3322/canjclin.51.1.15
de 2018. [3] R. Devere White, E. Stapp, Predicting prognosis in patients with
superficial bladder cancer, ONCOLOGY 12 (12) (1998) 1717–1723.
URL https://www.scopus.com/inward/record.uri?
800 eid=2-s2.0-0005479569&partnerID=40&md5=
a865e77b1a2c890bf2985b1517d7e3b6
Immune Response
700
[4] S. Holmang, H. Hedelin, C. Anderstrom, S. L. Johansson, The relations-
(Cells/Field)
600 hip among multiple recurrences, progression and prognosis of patients

500
with stages TA and t1 transitional cell cancer of the bladder followed
for at least 20 years, The Journal of Urology 153 (6) (1995) 1823–1827.
400 doi:10.1016/s0022-5347(01)67321-x.
300
URL https://doi.org/10.1016/s0022-5347(01)67321-x
[5] G. Redelman-Sidi, M. S. Glickman, B. H. Bochner, The mechanism of
action of BCG therapy for bladder cancer—a current perspective, Nature
30 Reviews Urology 11 (3) (2014) 153–162. doi:10.1038/nrurol.
25 2014.15.
Tumor Size
20
URL https://doi.org/10.1038/nrurol.2014.15
(mm)
[6] Official Site for Hospital Universitari i Politècnic La Fe, Valencia, Spain,
15
http://www.hospital-lafe.com, accessed: 07/05/2018.
10 [7] S. Bunimovich-Mendrazitsky, E. Shochat, L. Stone, Mathematical model
5 of BCG immunotherapy in˜superficial bladder cancer, Bulletin of Mathe-
0
matical Biology 69 (6) (2007) 1847–1870. doi:10.1007/s11538-
0 500 1000 1500 2000 007-9195-z.
Time (days) URL https://doi.org/10.1007/s11538-007-9195-z
[8] A. Wein, L. Kavoussi, A. Novick, A. Partin, C. Peters, Campbell-Walsh
Urology, Campbell-Walsh Urology, Elsevier Health Sciences, 2011.
Figura 4. Escenario desfavorable. Se espera un tumor de 5mm para el 25 de URL https://books.google.es/books?id=W1aeyJD46kIC
mayo de 2018. [9] C. Jacob, N. Khemka, Particle swarm optimization in Mathematica.
an exploration kit for evolutionary optimization, IMS’04, Proc. Sixth
International Mathematica Symposium, Banff, Canada.
V. C ONCLUSIONES
En este trabajo presentamos un modelo dinámico para
describir la evolución de un tumor de la vejiga en un paciente.
El modelo se ha calibrado en varias etapas y los parámetros
obtenidos nos permiten dar un pronóstico sobre el crecimiento
del tumor en los próximos meses en tres escenarios: favorable,
desfavorable y neutro. Que nosotros sepamos, éste es el primer
acercamiento de este tipo. Los resultados parecen prometedo-
res y ha creado expectación en el equipo médico con el que
colaboramos debido al desconocimiento de la evolución de
este tipo de cáncer en cada paciente.
Cuando tengamos más datos disponibles, seremos capa-
ces de verificar la validez de nuestro enfoque, de realizar
predicciones personalizadas a cada paciente más precisas y
mejores, dando herramientas a los médicos para administrar
tratamientos, para programar las revisiones de seguimiento y,
en el futuro, para determinar mejores estrategias para mejorar
la salud del paciente, su calidad de vida y evitar las recidivas
721
On the Use of Fitness Sharing in Studying the

Genetic Code Optimality
José Santos Ángel Monteagudo
Department of Computer Science, Department of Computer Science,
University of A Coruña, A Coruña, Spain University of A Coruña, A Coruña, Spain
Email: [email protected] Email: [email protected]
Abstract—Since the canonical genetic code is not universal quality of those codes [1]. The results of the works in this
several theories arose to explain the evolution to its present form. alternative tend to indicate that the CGC is quite better
Different computational methods were applied to analyze the optimized with respect to random codes.
optimality level of the canonical code organization, including our
previous works using evolutionary computing in the problem. We 2. The engineering approach, which compares the CGC
discuss here the possibilities that the use of the classical fitness against the average random codes and with respect to better
sharing technique provides for obtaining knowledge about the codes (typically obtained with local search algorithms) [2].
fitness landscape involved in the optimization of the genetic code. This alternative shows that the CGC has a certain level of
optimization, but is still far from optimal.
In these alternatives, the “quality” of a hypothetical code is
I. I NTRODUCTION
defined taking into account the consequences of all possible
The canonical genetic code (CGC), present in most superior mutations in the codons. A mutation in a codon base can
organisms, establishes the association between codons and change the amino acid codified, which can take a serious
amino acids. In the canonical code there are 64 codons of three consequence on the resultant protein. Usually, it is considered
bases that encode 20 amino acids. Thus, the genetic code is a property (or group of properties) of the codified amino acid,
redundant, since several codons codify the same amino acid. like the polar requirement (hydrophobicity), since it is the
However, the canonical code is not universal, since there are most important one in defining the folding of the protein. The
other different associations between codons and amino acids. quality is defined as the Mean Square (MS) of the difference
Mitochondrial DNA is an exception example. The exceptions of the property values of the corresponding amino acids before
show that the code could evolve in its origin, and it is an open and after the mutation. This is averaged for all base mutations
question how the code evolved to the present form (the CGC). of all codons. The best code would be the one that minimizes
Since other codes could appear, several models of hypothet- MS, that is, the consequences of the mutations (with the lowest
ical genetic codes were considered, with different associations consequence on the phenotype, i.e., the proteins).
between codons and amino acids. Considering only the present We introduced the possibility of evolutionary computation
form of a genetic code with codons of three bases, if the codon to discover better genetic codes [3], with a classical genetic
set of the CGC is maintained, allowing only swaps of amino algorithm (GA) (with ad hoc operators depending on the
acids between the 20 codon sets, the possible codes are 20! genetic code model of alternative codes), studying the level
(2.43 · 1018 ). Without that restriction, in the sense that every of optimality reached by the CGC in the huge landscapes
codon can codify every amino acid, the number of alternative considered, and taking into account aspects like the different
codes is really huge, larger than 1.51 · 1084 . mutation probability of transversion and transition mutations
In this research there are basically three theories about the in the codon bases, or the biases in mutation probability in
reasons regarding the evolution of the genetic code: i) The the three codon bases. In [4] we extended the analysis using
stereochemical theory stablishes that codon assignments are a model of possible genetic codes that considers the known
dictated by physicochemical affinity between amino acids and codon reassignments. Depending on the genetic code model
the cognate codons, ii) the co-evolution theory states that a and those commented aspects, the optimization level of the
set of precursor amino acids passed part or all of their codon CGC varies, but in all cases is far from optimal, and in
domain to the biosynthetically produced amino acids, and iii) agreement with the engineering approach.
the physicochemical or error minimization theory states that Since there is a discussion about whether the CGC is located
the main factor in the code’s evolution was the minimization in a local minimum (or close to a minimum) in the quality
of the adverse effects of mutations. landscape and whether the landscape has a multimodal nature,
In this last error minimization theory there are two different in a recent work [5] (which is summarized here) we introduced
alternatives to assess the level of optimization of the CGC: the use of the classical Fitness Sharing (FS) technique [6] in
1. The statistical approach considers random alternative the evolutionary algorithm to inspect that possible multimodal
codes and compares the CGC against the average optimization nature. FS allows the division of the population into different
722
in 3 cases: (a) without FS, (b) FS with σshare = 0.01 and (c)
FS with σshare = 0.1. The figures at the right correspond to
the histograms of interdistances between the encoded codes
at that final generation. The distance dij between two codes i
and j is measured taking into account the difference in polar
requirement between the amino acids encoded in the same
positions by both population codes, normalized in [0,1].
The distances of the population (1000 individuals) to the
canonical code vary in a range between 0.3 and 0.6. Many of
the evolved codes are better adapted than the canonical code
(the dashed line represents the MS value of the CGC), showing
that these better codes are far from the CGC. There is not any
clustering of individuals, independently of the value of σshare ,
which indicates that there are not deep local minima and that
the CGC is not located in an area of a deep local minimum.
Moreover, the CGC was introduced in the initial population
in the 3 cases. In all runs the CGC disappears from the
population in few generations (as shown in [5]), even with
the use of fitness sharing, which is another evidence that the
CGC is not located in an area corresponding to a deep local
minimum. The interdistances (Figure 1, right part) show that,
without FS, the individuals are close to the best solution,
whereas the solutions are more spread in the search landscape
with larger values of σshare when FS is used. Since there are
Fig. 1. Left: MS value of the hypothetical codes of the final genetic population not interdistance values close to 0 in the histogram (i.e., no
vs. their distances to the canonical code and using restrictive codes. Right:
Histograms of interdistances of final evolved codes. clusters), both graphs (with FS) indicate that the landscape
does not present clear localized areas of deep local peaks, as
subgroups according to the similarity of the individuals, groups well as that the CGC is not located in one of such areas.
that perform a simultaneous search in the best found promising III. C ONCLUSION
areas (global or local minima) of the search landscape. The main conclusion to be drawn from the results is that the
The use of fitness sharing serves for two purposes: i) to have fitness landscape, although is clearly rugged, does not have a
an indirect view of the huge search landscape and to locate multimodal nature with deep localized areas of low MS values
the CGC in relation to the best possible codes that could be and separated by barriers of high MS values. Therefore, the
obtained. ii) Given the nature of the landscape obtained in i), fitness landscape considered in the error minimization theory
to determine the difficulty of evolution of hypothetical genetic does not explain how the canonical code ended its evolution
codes in such a landscape. in an area that does not correspond to a deep local minimum.
II. R ESULTS WITH A RESTRICTIVE CODE MODEL ACKNOWLEDGMENT
An example of a run of the evolutionary algorithm is This work was funded by Xunta de Galicia (project GPC
presented here. All the details about the GA implementation ED431B 2016/035), Xunta de Galicia (“Centro singular de in-
(genetic operators, encoding of hypothetical genetic codes) are vestigación de Galicia” accreditation 2016-2019 ED431G/01)
in [5]. We present results of an example run with and without and the European Regional Development Fund (ERDF).
the use of fitness sharing and with a restrictive model of
R EFERENCES
hypothetical codes. In this model, the pattern of synonymous
[1] S. Freeland, R. Knight, and L. Landweber, “Measuring adaptation within
coding found with the CGC is maintained, that is, the 21 CGC the genetic code,” Trends in Biochemical Sci., vol. 25(2), pp. 44–45, 2000.
non-overlapping sets of codons are fixed (20 sets correspond [2] M. Di Giulio, “The origin of the genetic code,” Trends in Biochemical
to the amino acids and one set to the 3 stop codons). The 20 Sciences, vol. 25(2), p. 44, 2000.
[3] J. Santos and A. Monteagudo, “Study of the genetic code adaptability
amino acids are randomly assigned to one of the 20 sets while by means of a genetic algorithm,” Journal of Theoretical Biology, vol.
the same 3 stop codons are fixed as in the CGC. 264(3), pp. 854–865, 2010.
Figure 1 corresponds to a run of the GA without FS and [4] J. Santos and A. Monteagudo, “Simulated evolution applied to study the
genetic code optimality using a model of codon reassignments,” BMC
with FS with two values of the parameter “sharing radius” Bioinformatics, vol. 12:56, 2011.
(σshare = 0.01 and σshare = 0.1), which controls the extent [5] J. Santos and A. Monteagudo, “Inclusion of the fitness sharing technique
of sharing [6]. In Figure 1, subfigures at the left, the x-axis in an evolutionary algorithm to analyze the fitness landscape of the genetic
code adaptability,” BMC Bioinformatics, vol. 18:195, 2017.
corresponds to the distance of each encoded code to the CGC [6] D. Goldberg and J. Richarson, “Genetic algorithms with sharing for multi-
whereas the y-axis corresponds to the code MS value. These modal function optimization,” Proceedings 2nd International Conference
graphs correspond to the final populations at generation 100 on Genetic Algorithms, pp. 41–49, 1987.
723
Bioinspirados
(XIII MAEB)
MAEB 10:
COMPUTACIÓN E VOLUTIVA:
FUNDAMENTOS Y M ODELOS I
Toolkit for the Automatic Comparison of

Optimizers (TACO): Herramienta online avanzada
para comparar metaheurísticas
1st Daniel Molina 2nd Antonio LaTorre
Departmento de Ciencias de la Computación e I.A. DATSI, ETSIINF
Universidad de Granada Centro de Simulación Computacional
Granada, España Universidad Politécnica de Madrid
[email protected] Madrid, España
[email protected]
Resumen—El campo de las metaheurísticas es un campo la propuesta con los otros algoritmos publicados, simplificando
en continua innovación, en donde los investigadores proponen el proceso. Sin embargo, realizar una correcta experimentación
frecuentemente nuevas propuestas, propuestas que tienen que ser sigue siendo una tarea muy laboriosa y costosa en tiempo.
adecuadamente comparadas con el estado-del-arte para probar
su efectividad. El uso de benchmarks estándar permite comparar El investigador no sólo tiene que recopilar los resultados de
directamente los resultados de los algoritmos entre sí, pero su propuesta, sino también los de los algoritmos con los
incluso esas comparaciones suponen un proceso laborioso y que se va a comparar. Y la recopilación de datos es sólo el
repetitivo que consume gran parte del proceso de investigación primer paso: los datos deben normalizarse (obtener la mismas
en metaheurísticas. En este trabajo proponemos Toolkit for the medidas y con la misma frecuencia), agruparse (en funciones
Automatic Comparison of Optimizers, TACO, una herramienta
online avanzada para comparar metaheurísticas, que además de similares para su análisis), organizarse (en tablas), y analizarse
almacenar los resultados de distintos algoritmos competitivos (mediante una o varias medidas estadísticas o visualizaciones).
para distintos benchmarks (para usarlos como algoritmos de Y, por cada cambio en alguno de los algoritmos (mejora
referencia), es capaz de realizar de forma automática una de la propuesta, por ejemplo), estos pasos deben repetirse,
variedad de comparaciones. De hecho, permite comparar no incrementando el tiempo dedicado a las comparativas.
sólo los algoritmos previamente almacenados, sino también los
resultados de nuevos algoritmos sin necesidad de registrarse, e En este trabajo proponemos Toolkit for the Automatic Com-
incluso para funciones específicas (no limitado a un benchmark parison of Optimizers, TACO, accesible en https://tacolab.org
concreto). Consideramos que es una herramienta muy útil para (con código disponible), una herramienta online avanzada que
todo tipo de investigaciones en metaheurísticas. Como prueba
de su conveniencia, ofrecemos una instancia de demostración de
combina un repositorio públicamente accesible de resultados
sus características, sobre la que se han realizado las distintas para distintos benchmarks con una herramienta de análisis
comparaciones que incluimos en este trabajo. modular que permite comparar fácilmente los resultados de
Index Terms—Comparativa de algoritmos, Herramienta web, distintos algoritmos, tanto para la fase de desarrollo del
Optimización Global de Alta Dimensionalidad. algoritmo como para la obtención de tablas y gráficas finales
para la publicación del trabajo. Entre sus características más
I. I NTRODUCTION
interesantes están:
El uso de metaheurísticas es muy común en problemas de
optimización de diversa índole, ya que son algoritmos capaces Suporte para distintos benchmarks, cada uno con sus
de obtener muy buenos resultados en un tiempo limitado [1]. propias propiedades: funciones asociadas y grupos de
Este interés conduce a que se presenten un número continuo funciones, tamaño del problema (dimensión), hitos, etc.
de propuestas cada año en la literatura científica. Un paso Diseño modular: La aplicación permite analizar según
necesario para que la comunidad científica pueda considerar una serie de informes, que pueden ser generales, o ser
una propuesta es el de realizar una adecuada validación experi- específicos para un determinado benchmark.
mental en la que, para un conjunto de problemas (benchmark), Repositorio de resultados de distintos algoritmos: La base
se compare la propuesta presentada con distintos algoritmos, de datos no sólo almacena estadísticas comunes (como
especialmente algoritmos del estado-del-arte. media, mínimo, ...) que puedan recogerse de colecciones,
Habitualmente, la comparativa implica realizar una misma sino que pueden almacenar todos los resultados para
experimentación tanto con la propuesta como con los algorit- realizar comparaciones estadísticas que lo requieran.
mos de referencia (usados para comparar). Afortunadamente, Definición flexible de informes: La aplicación ofrece una
cada vez está más consolidado el uso de benchmarks específi- capa de abstracción de gráficas (líneas, barras, etc.) para
cos en los que se fijan a priori las condiciones experimentales, permitir incorporar nuevos informes
por lo que el problema se reduce a comparar los resultados de Exportación de datos. Para poder usarse en publicaciones
727
tanto las gráficas como las tablas se pueden guardar lo- los visualiza usando JavaScript. Para ello, usa las siguientes
calmente para usarlas en distintos formatos. Las gráficas tecnologías webs:
se pueden guardar en los formatos bitmap PNG y JPEG, HTML5, CSS3 y Javascript (Vue.js3 framework) en el
en informes PDF, o formato vectorial SVG. Las tablas frontend.
en formato tanto Excel (para posterior análisis) como El entorno Python Flask4 y SQL Alchemy5 como back-
Latex (para incluirlo directamente en publicaciones). En end.
las tablas se puede elegir el número de cifras decimales Intercambio de datos entre ambos mediante peticiones
que se desean obtener (aunque en Excel no es importante, AJAX y mensajes JSON.
en Latex sí lo es para poder insertarlo directamente en El framework Vue.js es usado para dar una imagen dinámica
las publicaciones). de la web, pidiendo por AJAX toda la información (bench-
TACO está inspirada en una herramienta previa [2] pero marks, dimensionalidad, algoritmos, informes, etc.) al backend
resuelve muchas de sus limitaciones. (con almacenamiento local para incrementar el rendimiento).
No requiere que el usuario almacene previamente los Este diseño permite incorporar fácilmente la herramienta en
resultados para comparar. Cualquier usuario (sin regis- otra aplicación web, desde páginas estáticas a sistemas CMS
trarse) puede ejecutar su análisis simplemente subiendo como Wordpress o similares.
los resultados en un formato soportado, y comparar entre
III. M ODOS DE TRABAJO
sí tanto los de la base de datos como los indicados por
fichero. Existen dos formas de trabajar, se pueden comparan usando
TACO permite que los usuarios identificados posean los resultados de un benchmark estándar del sistema, o usando
repositorios propios, con un catálogo de resultados de un conjunto de funciones (es muy útil para comparar para
carácter privado. Los usuarios pueden solicitar hacerlos funciones distintas, o un subconjunto de funciones).
públicos cuando el paper esté publicado. III-A. Comparando con un benchmark propio
Una tecnología y diseño mucho más flexible y modular,
Este es el caso más sencillo, en el que se desea únicamente
para ir incorporando mejoras.
comparar entre sí distintos resultados que posee el usuario.
Existen otras herramientas de análisis, discutidas en [3], En este caso, el usuario debe ofrecer sus datos por medio
como jMetal1 o MOEA framework2 . Sin embargo, en esos de un fichero de entrada aceptado con los distintos resultados
casos el proceso de análisis suele estar asociado con el de cada algoritmo para un número de funciones. Un ejemplo
propio entorno (framework) de optimización, limitando su uso. sería un Excel con tantas columnas como funciones, con los
TACO se centra en comparar resultados ya obtenidos, sin resultados de cada algoritmo en su propia hoja del Excel.
interferir en la forma de programar/ejecutar el código. Adicionalmente se puede establecer una columna milestone
Otro aspecto muy importante de la herramienta es que no só- para guardar resultados intermedios. Una vez subido el fichero,
lo está pensada como herramienta de soporte a investigadores el usuario selecciona el tipo de comparación de entre las
para comparar su propuesta con otros algoritmos, sino que disponibles de forma genérica (descritos en la sección V) y
también está ideada para organizadores de competiciones (de procede al análisis.
hecho, surgió a partir de esa necesidad). Gracias a su diseño
modular, es bastante directo incorporar una nueva sesión III-B. Comparando con un benchmark estándar
especial o competición de manera sencilla. Además, se puede Una sesión típica empieza seleccionando el benchmark
usar también para que los propios participantes comparen sus sobre el que se quiere comparar. Luego, el usuario decide
propuestas con los algoritmos de referencia de la competición. el tamaño del problema (si hay más de uno), y selecciona
Una vez que la competición haya tenido lugar, se pueden hacer de una lista de algoritmos cuáles quiere comparar. Además, el
publicos los resultados de todos los algoritmos participantes. usuario puede subir un fichero con datos de algoritmos propios
Este trabajo está organizado de la siguiente manera: La para incorporaros a la comparativa. Una vez elegidos todos los
sección II describe brevemente la arquitectura de la aplicación. datos, el usuario selecciona el tipo de comparación de entre las
En la sección III se muestra el esquema de funcionamiento. disponibles (descritas en la sección V) y procede al análisis.
En la sección IV resumimos algunas opciones disponibles y El modelo de datos está diseñado en torno al concepto
mostramos unas capturas relevantes. La sección V repasa el de benchmark. Cada benchmark está asociado con una tabla
diseño modular de informes, con ejemplos concretos. Final- diferente en donde se almacenan los resultados de los algorit-
mente, en la sección VI resumimos las principales conclu- mos. Esto permite que distintos benchmarks puedan tener un
siones obtenidas. distinto número de funciones de forma sencilla. Agrupada en
torno a los benchmarks, se almacena la siguiente información:
II. A RQUITECTURA
Dimensión: algunos benchmarks poseen un mismo
La aplicación web está construida como una página estática tamaño del problema, y otros plantean para las mismas
que mediante llamadas Ajax pide los datos dinámicos y
3 https://vuejs.org/
1 https://jmetal.github.io/jMetal/ 4 http://flask.pocoo.org/
2 http://moeaframework.org/ 5 https://www.sqlalchemy.org/
728
funciones/problemas distintos valores, para medir la es- distintos algoritmos, que serán comparados entre sí y con el
cabilidad del algoritmo. resto de algoritmos seleccionados. En este punto, el usuario
Hitos: un benchmark puede almacenar los resultados escogerá el tipo de informe de entre los disponibles que, como
finales o en distintos momentos de la ejecución del ya se indicó, dependerá del tipo de benchmark elegido.
algoritmo. El sistema guarda información de cada hito.
Grupos o categorías de funciones: Los benchmarks
pueden tener problemas/funciones con distintas carac-
terísticas, y eso permite analizar los resultados por grupos
de funciones (como comparar separadamente compor-
tamiento en problemas unimodales y multimodales).
Informes: Aparte de los informes disponibles para todos
los benchmark, un benchmark puede tener asociado al-
guno específico (en particular, en las competiciones de
alta dimensionalidad se usa un ranking específico, de la
F1). Se muestra, para cada benchmark, el conjunto de
posibles informes asociados.
IV. F RONTEND
Las Figuras 1, 2 y 3 resumen el flujo de trabajo más
completo de la aplicación. La primera información cuando
un usuario se conecta es un texto explicativo, donde se le Figura 2: Selección de los algoritmos. El usuario puede elegir
pide que seleccione el benchmark de su interés de una lista de la lista y/o subir un fichero con los suyos.
desplegable (Figura 1), obtenida de forma dinámica. Una vez
seleccionado el benchmark, la aplicación consulta al servidor
los valores de dimensión para que el usuario elija de forma
similar (si hubiese más de uno; si no, como en la Figura 1, se
selecciona automáticamente y se va al paso siguiente).
Figura 1: Selección del benchmark para la comparación. La

lista despleglable es dinámica.
Figura 3: Selección del informe de la comparación. La lista
Luego, se listan los algoritmos almacenados en la base de de informes disponibles depende del benchmark elegido.
datos asociados a ese benchmark (públicos o de ese usuario,
si está identificado), y para esa dimensión (ver Figura 2) y Por último, para lanzar el análisis basta con pulsar en el
los muestra con un checkbox para seleccionarlos. El usuario botón Compare. En las siguientes secciones detallamos los
puede seleccionar de la lista los que desea, y, opcionalmente, distintos tipos de informes soportados (hasta el momento), y
subir un fichero con la información de sus propios algoritmos ejemplos del tipo de análisis que la aplicación permite.
(TACO admite ficheros tanto en formato csv como xls) y
un nombre. Como cada benchmark podría tener un formato V. T IPOS DE INFORMES
diferente, encima del formulario para subir el fichero se El modelo de informes de TACO ha sido particularmente
muestra un enlace con un fichero Excel de ejemplo para el diseñado para ser flexible. Existen informes asociados a cada
benchmark seleccionado y se puede consultar una plantilla benchmark que pueden dividirse en las siguientes categorías:
para rellenar. Aunque el usuario puede indicar el nombre del Informes de propósito general, accesibles para todos lo
algoritmo en el formulario, también puede indicarlo en el benchmarks. Ejemplos de éstos serían tablas comparati-
fichero de entrada en su propia columna (o en varias hojas), vas de estadísticas comunes (media, ranking), gráficas de
lo cual permite enviar en un único fichero los resultados de convergencia, o algunas comparativas estadísticas.
729
Específicos para un benchmark, ya que algunos pueden

necesitar informes específicos (con medidas particulares).
Un ejemplo de esto, ya incluido, es el informe usado
en las competiciones de alta dimensionalidad (LSGO
competitions at IEEE CEC), que asigna a cada algoritmo
un número de puntos en función de su ranking, y se
suman para valorar la bondad de cada algoritmo. Este
informe es muy específico de esa comunidad de usuarios,
y tiene poco sentido que esté disponible para otros
benchmarks.
Esta primera versión de TACO incluye:
Tres informes de tipo general: Comparación de medias,
ranking medios, y gráficas de convergencia. Actualmente
se están desarrollando comparativas estadísticas que es-
peramos estén disponibles en el momento del congreso.
Un informe específico: El ya descrito usando el criterio
de la F1 para el CEC’2013 de alta dimensionalidad.
A continuación los describimos muy brevemente, mostrando
ejemplos reales usando las competiciones de optimización real
del CEC’2017 [4], y la competición de alta dimensionalidad
del CEC’2013 [5].
V-A. Informe comparativo de medias

Es el más sencillo. Computa la media de cada función y
algoritmo, y muestra las medias para cada hito en una tabla,
destacando la menor media, como se puede observar en la
Figura 4. Además de remarcar la mejor media, incluye una
línea resumen al final. Como toda tabla, los botones permiten
exportar los datos en Excel y en Latex. Adicionalmente, este Figura 4: Ejemplo de informe comparativo de medias para
informe genera un resumen de los distintos valores, en una CEC’2013.
tabla final como la reflejada en la Figura 5.
V-B. Informe de ranking

A veces los valores medios interesan menos que la posición
relativa de cada algoritmo. En este informe se orden para
cada función los algoritmos por su posición (1 al mejor, 2
al siguiente, y así sucesivamente), destacando el mejor, como
se puede observar en la Figura 6. Además de remarcar la mejor
media, incluye en la línea final el ranking medio por algoritmo,
y una tabla final con los ranking medios para cada hito.
V-C. Informe de gráficas de convergencia

En este informe se muestra la evolución del error medio Figura 5: Ejemplo de informe comparativo final de medias
para cada función y algoritmo en cada hito. La curva puede para CEC’2013.
ser más o menos suave, dependiendo del número de hitos
asociados al benchmark. La Figura 7 muestra un ejemplo
para el CEC’2013, donde sólo hay registrados tres hitos, y V-D. Informe F1 del benchmark CEC’2013
es más abrupta que en el caso de la Figura 8, correspondiente
al CEC’2017, con más hitos y, por tanto, más suave. En la Este informe es específico para el benchmark CEC’2013
Figura 8, se muestra claramente que LSHDE_SPACMA ofrece de alta dimensionalidad, y es un buen ejemplo de la flex-
una mejora suave pero continua, mientras que otros algoritmos ibilidad del framework. En esta competición, se ordena a
como RB-IPOP-CMA-ES convergen más rápidamente pero se los participantes según el sistema de puntos de la F1, en
estancan antes, confirmando lo indicado en la tabla de medias. el que cada corredor recibe un número de puntos según su
730
Function: 08
1.00e+3
1.00e+2
Mean Error
1.00e+1
1.00e+0
1.00e-1
1% 5% 10% 20% 30% 40% 50% 60% 70% 80% 90% 10…
Evaluations (%)
DYYPO LSHADE_SPACMA MM_OED

MOS PPSO RB-IPOP-CMA-ES
TLBO-FL jSO
Highcharts.com
Figura 8: Ejemplo de gráfica de convergencia para la función

8 del benchmark CEC’2017
gráfica por cada hito del benchmark. A su vez, la Figura 10

presenta una comparativa global (sumando los puntos de cada
hito). El color de cada componente de la figura representa el
subgrupo de funciones, de acuerdo a las características antes
mencionadas y, al pasar el ratón por cada componente, se
indica el valor exacto de puntos y el nombre de esa categoría.
De ambas figuras destaca que MOS [8] obtiene los mejores
resultados a partir de un número de evaluaciones, y práctica-
mente en todas las categorías.
Figura 6: Ejemplo de informe comparativo de rankings para
CEC’2013.
V-E. Inclusión de nuevos informes
Para permitir una mayor flexibilidad, cada informe es una
Function: 04 clase, que define un API de funciones que deben implemen-
1.00e+12
tarse. Estas funciones devolverán, por medio de una librería,
las tablas y figuras que se incorporarán al análisis. Por cada
1.00e+11 elemento (ya sea una tabla o una figura) el informe necesita
devolver una estructura con la siguiente información: el objeto
Mean Error
1.00e+10 a devolver; el tipo del objeto (tabla o figura); y el orden del

elemento, para permitir combinar tanto tablas como figuras de
1.00e+9
forma alternada dentro de un mismo informe.
Para generar las tablas, la aplicación utiliza dataframes de la
1.00e+8
librería pandas, considerada el estándar para cálculo científico.
1.20e+5 6.00e+5 3.00e+6 Para crear figuras, se ofrecen unas funciones propias que sirven
Evaluations
como capa de abstracción para generar fácilmente distintos
CC-CMA-ES DEEPSO MOS VMODE
Highcharts.com tipos de gráficas, tales como diagramas de barras, de líneas,
etc. El motivo de esta abstracción es simplificar el proceso,
Figura 7: Ejemplo de gráfica de convergencia para la función
y permitir a los informes ser independientes de las librerías
4 del benchmark CEC’2013
de visualización que hay por debajo, para poder cambiarlas,
llegado el caso, sin modificar los informes existentes.
Actualmente, se da soporte tanto a la librería Holoviews6 ,
posición final: 25 puntos para el ganador, 18 para el segundo, (librería de software libre para web, que presenta limitaciones
etc. Análogamente, el informe asigna a cada algoritmo los de funcionalidad y es lenta), como a la librería Highcharts7
puntos correspondientes a su posición para cada función. Los (más rápida y con mayor funcionalidad, pero que es comercial,
resultados son luego sumados para cada grupo de funciones aunque permite el uso gratuito si se usa sin fines comerciales).
(unimodales vs. multimodales, separables vs. no-separables,
etc.) o globalmente. La Figura 9 muestra los datos desglosados 6 http://holoviews.org
de acuerdo a la separabilidad de las funciones, con una 7 https://www.highcharts.com
731
Accuracy: 1.200e+05 Accuracy: 6.000e+05 Accuracy: 3.000e+06
30 30 30
25 25 25
20 20 20
Values
Values
Values
15 15 15
10 10 10
5 5 5
0 0 0
CC-CMA-ES DECC-G MOS VMODE CC-CMA-ES DECC-G MOS VMODE CC-CMA-ES DECC-G MOS VMODE
Algorithm Algorithm Algorithm
Highcharts.com Highcharts.com Highcharts.com
(a) 1.2E+5 FEs (b) 3.0E+5 FEs (c) 3.0E+6 FEs

Figura 9: Resultados para el criterio de la F1 para funciones no separables.
Accuracy: 1.200e+05 Accuracy: 6.000e+05 Accuracy: 3.000e+06

400 400 400
300 300 300

Values
Values
Values
200 200 200
100 100 100
0 0 0
CC-CMA-ES DECC-G MOS VMODE CC-CMA-ES DECC-G MOS VMODE CC-CMA-ES DECC-G MOS VMODE
Algorithm Algorithm Algorithm
Highcharts.com Highcharts.com Highcharts.com
(a) 1.2E+5 FEs (b) 3.0E+5 FEs (c) 3.0E+6 FEs

Figura 10: Resultados para el criterio de la F1 para todas las funciones.
En un futuro se plantea incorporar la librería Altair8 , muy AGRADECIMIENTOS

prometedora y que está actualmente en desarrollo. Este trabajo ha sido financiado, en parte, por ayudas del
Ministerio de Ciencia, Innovación y Universidades (TIN2014-
VI. C ONCLUSIONES 57481-C2-2-R, TIN2016-8113-R, TIN2017-83132-C2-2-R y
TIN2017-89517-P) y de la Junta de Andalucía (P12-TIC-
En este trabajo hemos presentado TACO, Toolkit for the 2958).
Automatic Comparison of Optimizers, una herramienta online
avanzada para la comparación de algoritmos. Como se ha dis- R EFERENCIAS
cutido, actualmente es capaz de manejar múltiples benchmarks [1] F. Glover and G. A. Kochenberger, Handbook of metaheuristics.
y su información asociada (número de funciones, distinto Springer, 2003.
[2] A. LaTorre, S. Muelas, and J. M. Peña, “A Comprehensive Comparison
número de dimensiones, hitos requeridos, grupos de funciones, of Large Scale Global Optimizers,” Information Sciences, vol. 316, pp.
etc). Además, para cada benchmark se pueden realizar, de 517–549, 2015.
forma automática, distintos tipos de análisis. La aplicación [3] J. A. Parejo, A. Ruiz-Cortés, S. Lozano, and P. Fernandez, “Metaheuristic
optimization frameworks: a survey and benchmarking,” Soft Computing,
fue concebida como soporte para competiciones, pero es de vol. 16, no. 3, pp. 527–561, 2012.
utilidad para todos los investigadores que necesiten comparar [4] N. H. Awad, M. Z. Ali, J. J. Liang, B. Y. Qu, and P. N. Suganthan,
sus propuestas, ya que los resultados son exportables para “Problem Definitions and Evaluation Criteria for the CEC 2017 Special
Session and Competition on Single Objective Real-Parameter Numerical
incluirlos en sus artículos y no requiere registro previo. Optimization,” Tech. Rep., Oct. 2016.
Aunque está suficientemente maduro y listo para ser usado [5] J. Liang, B.-Y. Qu, P. Suganthan, and A. Hernández-Díaz, “Problem
definitions and evaluation criteria for the cec 2013 special session and
en producción, existen planes para seguir extendiendo y mejo- competition on real-parameter optimization,” Computational Intelligence
rando TACO, que incluyen el aumento de la base de datos con Laboratory, Zhengzhou University, Zhengzhou China and Technical Re-
más benchmarks y algoritmos, la inclusión de más información port, Nanyang Technological University, Singapore, Tech. Rep., 2013.
[6] R. Biedrzycki, “A version of ipop-cma-es algorithm with midpoint for
sobre los algoritmos, nuevos tipos de informes, especialmente cec 2017 single objective bound constrained problems,” in 2017 IEEE
con tests estadísticos, la exportación global de todas las tablas Congress on Evolutionary Computation (CEC), June 2017, pp. 1489–
y figuras (actualmente, se deben exportar una a una), etc. 1494.
[7] N. Awad, M. Ali, and P. Suganthan, “Ensemble sinusoidal differential
Como puede verse, TACO es una herramiente potente y flex- covariance matrix adaptation with euclidean neighborhood for solving
ible para comparar distintos algoritmos. Es más, aunque está cec2017 benchmark problems,” in 2017 IEEE Congress on Evolutionary
enfocado a las metaheurísticas, puede usarse para comparar Computation (CEC), June 2017, pp. 372–379.
[8] A. LaTorre and J. M. Peña, “A comparison of three large-scale global
algoritmos de diferentes dominios (Machine Learning, etc.). optimizers on the cec 2017 single objective real parameter numerical
optimization benchmark,” in 2017 IEEE Congress on Evolutionary Com-
8 https://altair-viz.github.io putation (CEC), June 2017, pp. 1063–1070.
732
Creating Difficult Instances of

the Linear Ordering Problem
Aritz Pérez∗ and Josu Ceberio†
∗ Basque Center for Applied Mathematics (BCAM), 48009 Bilbao, Spain
† Faculty of Computer Science, 20018 Donostia, Spain
University of the Basque Country UPV/EHU

email: [email protected], [email protected]
Abstract—Generating random instances of a given problem In [6], the authors focused on the random generation of
is a task that is addressed very frequently in combinatorial artificial instances of combinatorial optimization problems.
optimization. Some times this task is motivated by the lack of Particularly, they stated that most of the algorithms take only
challenging instances, some other times practitioners have few
instances and need to generate large benchmarks to evaluate into account the ordering of the solutions (better, worse...)
their algorithms. Be that as it may, creating instances that are during the optimization and, therefore, any instance can be
challenging enough for the algorithm at hand is not trivial, seen as a ranking of all the solutions in the search space.
and implies other considerations such as defining the concept In this context, the authors discovered that there exist classes
of difficulty. of equivalence of the mentioned rankings according to their
In this paper, we address the problem of randomly generating
difficult instances of the linear ordering problem for local search difficulty (in terms of number of local optima). Not limited to
algorithms. Based on the joint analysis of the problem and a that, conducted experiments demonstrated that when sampling
neighborhood structure, we conclude that one way to create independently and identically distributed (i.i.d.) parameters ac-
difficult instances is to organize its parameters in the way that cording to a uniform distribution, the majority of the instances
the variance of the fitness in the neighborhood is very low. induce rankings that belong to ”easy” classes of equivalence
To this end, we propose a simple procedure that generates the
parameters matrix in such a way that for any row and column, (have one or two local optima).
the sum of the parameters is constant. The experimental study On that research line, in [7] the authors tried to go deeper
shows that the proposed method generates instances of higher in the difficulty of instances for best improvement local search
difficulty than the standard method, setting the parameters algorithms when sampling the parameters u.a.r. Despite their
independently and identically distributed according to a uniform simplicity, local search algorithms permit easily tracking the
distribution.
optimization process and, thus, it is possible to carry out an
exact study of the difficulty of the instance on the basis of
I. I NTRODUCTION
fitness landscape analysis [8]. The work in [7] focused on
In the field of evolutionary computation, it is common to three problems and four neighborhood structures, and tried to
use benchmarks of instances of a given problem in order to answer the following question: are the artificially generated
evaluate the performance of existing and newly developed instances uniform in terms of difficulty? The experimental
algorithms. When the final goal is to solve a specific real-world study revealed that (1) by sampling the parameters uniformly
problem, real instances are used to carry out such comparisons, at random the obtained instances are non-uniform in terms of
and, thus, we are not interested in an extensive performance difficulty, (2) the distribution of the difficulty strongly depends
evaluation. However, when the objective of the research is on the pair problem-neighborhood considered, and (3) given
to contribute with methodological developments, then large a problem, the distribution of the difficulty seems to depend
benchmarks of instances are needed in order analyze the on the landscape induced by the neighborhood structure and
behavior of the proposed algorithm under different scenarios. its size.
In this sense, real-world benchmarks are usually limited in However, what creates the difficulty for a specific algorithm
size and variety of instances. in each problem is unique and it is not clear. In this work, we
At this point, it is a usual practice, based on the knowl- take as case of study the Linear Ordering Problem (LOP) [9],
edge of the problem (limited in most cases), to create new [10] and best improvement local search algorithm (BI) under
“challenging” instances artificially [1], [2], [3], [4], [5]. In this the insert neighborhood. In that context, we approach the
sense, a recurrent option is to generate instances by sampling problem of creating difficult instances.
their parameters uniformly at random (u.a.r) in some ranges. Firstly, we defined the difficulty of an instance as 1 minus
The underlying assumption states that sampling u.a.r in the the probability of reaching the global optimum solution after
space of parameters is equivalent to sampling u.a.r in the performing a BI starting from a random solution. Secondly,
space of instances and, thus, uniform in terms of difficulty. based on the joint study of the LOP and insert neighborhood,
Nonetheless, recent works on this line [6], [7] have shown we considered that one way to create difficult artificial in-
that such statement is not necessarily true. stances can be to sample a set of parameters that induces low
733
fitness variations in the neighborhood of a solution. for i, j = 1, ..., n are the parameters of the problem and,
On that line, we propose a procedure for generating artificial generally, bi,i = 0 for i = 1, ..., n. A particular assignment
instances by defining a parameters matrix of the instance in of values to these parameters constitutes an instance. Fig. 1
which every row and column sum a constant value. This type introduces an illustrative example of an LOP instance in its
of parameters matrix tends to induce low fitness differences triangulation form. Gray background parameters are the only
of the solutions in the insert neighborhoods.
In the experimental section, we generate thousands of 1 2 3 4 5
instances of the LOP for different sizes of the problem. The 1 0 16 11 15 7

instances have been generated by using i) the classical uniform
procedure, and ii) the proposed procedure. Then, we estimate 2 21 0 14 15 9
the difficulty of each instance generated for BI under the insert 3 26 23 0 26 12

neighborhood and we analyze the evolution of the difficulty of
the generated instances with respect to the size of the problem, 4 22 22 11 0 13
n. The results point out that the proposed procedure obtain 5 30 28 25 24 0

more difficult instances than the classical option.
The remainder of the paper is organized as follows: in
Section II the necessary background on combinatorial opti- Fig. 1: LOP instance of size n = 5.
mization, LOP, local search and difficulty is introduced. In
Section III, the main contribution of the paper, a method ones considered in the computation of the fitness function. The
to create difficult instances of the LOP for BI is proposed. search space of solutions Ω consist of all permutations of size
Afterwards, the experimental study is presented in Section IV. n, so its size is |Ω| = n!.
Finally, conclusions and research lines for future work are B. Local search on the LOP
summarized in Section V.
Local Search algorithms (LS) optimize based on a neigh-
II. BACKGROUND borhood system, a function that relates a set of solutions to
A combinatorial optimization problem (COP), denoted as each solution x ∈ Ω. Formally a neighborhood is defined as
P = (Ω, f ), consists of a finite (or infinite countable) domain N: Ω → 2|Ω|
of solutions Ω, also known as search space, and an objective
x 7→ N (x)
function f which is formalized as
where 2|Ω| represents the power set of the domain Ω.
f : Ω→R
LS is a sequential optimization heuristic that progresses
x 7→ f (x) by moving from a solution to a neighboring solution. Conse-
quently, the behavior of a particular LS is determined by the
We call to the value f (x) the fitness of x. The definition of a
neighborhood defined, and the criteria used to select a solution
problem includes certain inputs that are known as parameters.
from the neighborhood. Two of the most used strategies are
The collection of parameters that describe a particular case of
the best improvement (BI) and the first improvement selection
the problem is called the instance.
criteria. BI progresses by selecting, among the neighboring
The aim in a COP is to, given an instance, find x ∈ Ω such
solutions the solution with the best fitness, while the first im-
that f is maximized (or minimized). As the computation of
provement progresses by selecting a neighboring solution with
f (x) is closely tied to the instance, in the remainder of the
a better f (σ) value. Both algorithms are said to converge to
paper, we say that f is an instance or an objective function
a (local) optimum solution when all the neighboring solutions
indistinctly. The LOP is an example of a COP. In the following,
have equal or worse f (σ) value.
a brief introduction to it is presented.
In local search optimization, a wide range of neighborhood
A. The Linear Ordering Problem structures have been proposed in order to deal with combinato-
Given a matrix B = [bi,j ]n×n of numerical entries, the rial problems. Depending on the characteristics of the problem,
LOP [9], [10] consists of finding a simultaneous permutation some neighborhoods show better performance than others [11].
σ of the rows and columns of B, such that the sum of the According to [7], the insert neighborhood is the structure that
entries above the main diagonal is maximized (or equivalently, most favorable landscapes generates for the LOP. From our
the sum of the entries below the main diagonal is minimized). perspective, this is probably motivated by its considerable
The equation below formalizes the objective function: size and the few number of parameters exchanged between
neighboring solutions.
X
n−1 X
n
Let us now consider a permutation σ of size n. The insert
f (σ) = bσi ,σj (1) neighborhood considers as neighbors all the solutions that can
i=1 j=i+1
be obtained by moving any item from a position i to any
where σi denotes the index of the row (and column) ranked position j. The items between positions i and j are shifted.
at position i in the solution σ. The numerical entries bi,j As a result, the size of the neighborhood is (n − 1)2 .
734
Fig. 2 presents an example of an LOP instance for two decision to move to this solution by the BI tends to increase
different solutions: e and σ. The second solution is obtained the chance to reach to the global optimum. In this scenario,
by performing an insert movement of item 2 to position 3. we say that the decision is supported with strong evidence and
In both cases, the pairs of parameters associated to item 2 the neighborhood becomes more informative. In this sense, in
are circled. As can be seen in the figure, due to the insert the next section, we propose a method to generate artificial
instances in which the solutions in the neighborhood have
small differences in the fitness.
1 2 3 4 5 1 3 2 4 5
0 16 11 15 7 0 11 16 15 7
1 1
III. C REATING D IFFICULT I NSTANCES OF THE LOP
2 21 0 14 15 9 3 26 0 23 26 12
Usually, in the literature, in order to generate artificial
3 26 23 0 26 12 2 21 14 0 15 9 instances of LOP the parameters are sampled according to
4 22 22 11 0 13 4 22 11 22 0 13
a uniform distribution [7]. Using this procedure it is possible
to generate an instance B with unbalanced sums by rows and
5 30 28 25 24 0 5 30 25 28 24 0
by columns which can be easily exploited by heuristic opti-
mization algorithms, such as BI under the insert neighborhood.
(a) e = (1, 2, 3, 4, 5), f (e) = 138. (b) σ = (1, 3, 2, 4, 5), f (σ) = 147. Nonethelss, if we generate instances in which the independent
sum of rows and columns are equally weighted, then the insert
Fig. 2: Two different solutions for an instance of n = 5. neighborhood tends to provide similar fitness variations in the
Circled values denote the parameters associated to item 2. neighborhood of a solution, and it becomes less informative
(see Figure 3).
movement, a pair of parameters, (14, 23) is swapped from In this work, with the aim of generating more difficult
side, and thus, f (σ) increases from 138 to 147. Note that instances than the uniform approach, we propose a method
the rest of the parameters, despite they are reallocated, they that produces a matrix B for which the sum of each row
remain in the same side with respect to the main diagonal. In and each column sum 1. Specifically, the scheme proceeds
general, if we insert the i-th element in the j-th position we as follows. First, two matrices R and C are created. In R,
swap |i − j| parameters [7]. The general effect of an insert the rows of parameters are obtained by sampling a Dirichlet
operation is illustrated in Figure 3. distribution. Similarly, in C, the sampled vectors correspond to
columns in the matrix. Next, once R and C are obtained, the
randomly generated instance is given as B = 1/2 · (R + C).
Finally, following the next iterative normalization procedure
we obtain a matrix B for which any row or column sum one.
The procedure works as follows, first, the parameters of every
row are normalized independently in order to sum 1. Next, the
same normalization process is applied to the columns. Both
steps are subsequently repeated until result converges to the
matrix with the characteristics above.
Note that in LOP, bi,i = 0 for i = 1, .., n. Thus the diagonal
of R and C have to be zero and, thus, we sample a Dirichlet
Fig. 3: The parameters swapped by insert i-th element in posi- distribution with n − 1 parameters for each row and column of
tion j. Green lines and red lines represent the parameters that R and C, respectively. In this work, the parameters are equal
are added and subtracted to the objective function, respectively to one, that is α = αi = for i = 1, ..., n − 1.
IV. E XPERIMENTAL S TUDY

C. Measuring the Difficulty In this section, we artificially generate LOP instances fol-
As proposed in [7], we consider the difficulty of an instance lowing two different schemes, and, we analyze the generated
of the LOP as 1 minus the probability of reaching the global instances in terms of the distribution of the difficulty.
optimum solution by using BI and by picking a solution of Ω For this purpose, we have artificially generated 104 in-
at random. In other words, the difficulty is 1 minus the size stances of the LOP for each problem size n = 8, ..., 20. The
of the basin of attraction of the global optimum divided by parameters of the instances have been sampled by using i)
the size of the search space, n!. In this work, we estimate the the classic uniform procedure in the [0, 1] interval and ii) the
difficulty of an instance by running 100 times BI initialized proposed Dirichlet procedure with α = 1. Next, we have
with a random solution. The difficulty is estimated as 1 minus obtained the global optimum of each instance by solving it
the percentage that BI have reached the global optimum. using the branch and bound algorithm proposed by Charon et
It is our intuition that if exists a solution in the neighbor- al. [12]. Finally, for each instance generated we have run a
hood whose fitness is quantitatively larger than the rest, then BI under the insert neighborhood 100 times, and estimated its
735
Fig. 4: The evolution of the average difficulty (together with the first and third quartiles) for the uniform and the Dirichlet
with respect to the size of the problem n = 6, ..., 20.
difficulty by counting the percentage of times it reaches the However, there are a number of questions still pending. For
global optimum. instance, results in Fig. 5 show small peaks in the distribution
We have analyzed the evolution of the distribution of the of the difficulty, that are consistently repeated for the two
difficulty with respect to the size of the LOP, n. The results are instance generation methods across the different n values. The
summarized in Figs. 4 and 5. The first illustrates the evolution answer should be in the definition of the problem and the
of the average difficulty (and the first and third quartiles) for structure of the neighborhood.
the compared schemes for the different n values. Figure 5 In addition, we aim to study the effect of the α parameters
provides a more detailed view of the results showing the of the Dirichlet procedure in the distribution of the difficulty.
distribution of the difficulty. It is our intuition that α parameter could be used in order to
Results reveal that, as n increases, instances tend to be further increase the difficulty of the generated instances.
more difficult using both procedures. In addition, we see Finally, we find interesting to extend this work to
that the instances generated by the Dirichlet procedure are other problem-neighborhood pairs. For instance, for the pair
more difficult. The dispersion of the generated difficulties Quadratic Assignment Problem (QAP) and interchange neigh-
using the Dirichlet procedure is smaller than the obtained by borhood [11], [13], it is very probable that the same prin-
the uniform procedure, especially for the largest instances. ciple of low variance fitness neighbors will produce difficult
Moreover, as n increases the third quartile of the difficulty instances. Nevertheless, the manner in which the instances are
for the Dirichlet procedure is higher than the fist quartile of generated for QAP is apparently much more complex as it
the uniform procedure. doubles the number of parameters of the LOP. Not limiting
V. C ONCLUSION & F UTURE W ORK to the domain of local search algorithms, it is possible to
extend the work to other algorithms, as the principle of low
In this work, we have addressed the problem of generating variance fitness instances may produce difficult scenarios for
difficult instances of the linear ordering problem for the population-based algorithms as well.
best improvement local search under the insert neighborhood.
Based on the joint analysis of the LOP instances and the insert
neighborhood structure, we concluded that a possible manner ACKNOWLEDGMENT
is to organize its parameters in such a way that the variance
of the fitness in the neighborhood is very low. To this end, This work has been partially supported by the Re-
we propose a procedure for generating artificial instances as search Groups 2013-2018 (IT-609-13), BERC 2014-2017, and
a matrix of parameters in which the sum of each row and ELKARTEK programs (Basque Government), the projects
each column is constant. Conducted experiments show that TIN2016-78365-R and TIN2017-82626-R (Spanish Ministry
the proposed method tends to generate instances of higher of Economy, Industry and Competitiveness) and Severo Ochoa
difficulty than other standard methods such as setting the Program SEV-2013-0323 (Spanish Ministry of Economy, In-
parameters i.i.d. according to a uniform distribution. dustry and Competitiveness).
736
Fig. 5: The distribution of the difficulty of the instances generated by using the uniform and Dirichlet procedures for different
problem sizes, n = 8, 11, 14, 17, 20. The x axis is the difficulty and the y axis the frequency in which instances of a given
difficulty are generated. Each point corresponds to a difficulty and its area is proportional to the number of instances generated
with this difficulty.
737
R EFERENCES [8] M. Tayarani-N. and A. Prgel-Bennett, “On the landscape of combi-

natorial optimization problems,” IEEE Transactions on Evolutionary
[1] I. P. Gent and T. Walsh, “The TSP phase transition,” Artificial Intelli- Computation, vol. 18, no. 3, pp. 420–434, June 2014.
gence, vol. 88, no. 1–2, pp. 349 – 358, 1996.
[2] E. Taillard, “Benchmarks for basic scheduling problems,” European [9] R. Martı́ and G. Reinelt, The linear ordering problem: exact and
Journal of Operational Research, vol. 64, no. 2, 1993. heuristic methods in combinatorial optimization. Springer, 2011, vol.
[3] Z. Drezner, P. Hahn, and É. Taillard, “Recent advances for the quadratic 175.
assignment problem with special emphasis on instances that are difficult [10] J. Ceberio, A. Mendiburu, and J. A. Lozano, “The Linear Ordering
for meta-heuristic methods,” Annals of Operations Research, vol. 139, Problem Revisited,” European Journal of Operational Research, vol.
no. 1, pp. 65–94, 2005. 241, no. 3, pp. 686–696, 2014.
[4] T. Schiavinotto and T. Stützle, “The linear ordering problem: Instances, [11] J. Ceberio, E. Irurozki, A. Mendiburu, and J. A. Lozano, “A review
search space analysis and algorithms,” Journal of Mathematical Mod- of distances for the mallows and generalized mallows estimation of
elling and Algorithms, vol. 3, no. 4, pp. 367–402, 2005. distribution algorithms,” Computational Optimization and Applications,
[5] A. Duarte, M. Laguna, and R. Martı́, “Tabu search for the linear vol. 62, no. 2, pp. 545–564, 2015.
ordering problem with cumulative costs,” Computational Optimization
and Applications, vol. 48, no. 3, pp. 697–715, 2011. [12] I. Charon and O. Hudry, “A branch-and-bound algorithm to solve the
[6] J. Ceberio, A. Mendiburu, and J. A. Lozano, “Are we generating in- linear ordering problem for weighted tournaments,” Discrete Applied
stances uniformly at random?” in 2017 IEEE Congress on Evolutionary Mathematics, vol. 154, no. 15, pp. 2097 – 2116, 2006.
Computation (CEC). IEEE, 2017, pp. 1645–1651. [13] J. Ceberio, A. Mendiburu, and J. A. Lozano, “Kernels of mallows
[7] A. Perez, J. Ceberio, , and J. A. Lozano, “Are the artificially generated models for solving permutation-based problems,” in Proceedings of the
instances uniform in terms of difficulty?” in 2018 IEEE Congress on 2015 Annual Conference on Genetic and Evolutionary Computation, ser.
Evolutionary Computation (CEC). IEEE, 2018. GECCO ’15. ACM, 2015, pp. 505–512.
738
Anatomy of the Attraction Basins:

Breaking with the Intuition
Leticia Hernando∗ , Alexander Mendiburu† , Jose A. Lozano∗‡
∗ Intelligent Systems Group, Department of Computer Science and Artificial Intelligence
University of the Basque Country UPV/EHU, 20018 San Sebastián, Spain
[email protected]
† Intelligent Systems Group, Department of Computer Architecture and Technology
University of the Basque Country UPV/EHU, 20018 San Sebastián, Spain

[email protected]
‡ Basque Center for Applied Mathematics (BCAM)
48009 Bilbao, Spain

[email protected]
Abstract—This is a summary of the motivations, contributions, following options: (i) be a strict local optimum, (ii) belong to a
experiments and conclusions of the article titled Anatomy of the local optimal plateau, or (iii) belong to an open plateau. Thus,
Attraction Basins: Breaking with the Intuition that has been we show the number of strict local optima, the number of
accepted for publication in Evolutionary Computation journal
(doi: 10.1162/EVCO a 00227) [1]. local optimal plateaus and the number of open plateaus that
appear in the instances chosen for the analysis. In general,
I. I NTRODUCTION for the three analyzed problems, the presence of plateaus is
Solving combinatorial optimization problems efficiently re- remarkable. One of the main conclusions derived from this
quires the development of algorithms that consider the spe- study is that, usually, the algorithm gets trapped inside the
cific properties of the problems. In this sense, local search plateaus. That is, although we find instances with plateaus
algorithms are designed over a neighborhood structure that composed by just two solutions, this algorithm is not designed
partially accounts for these properties. Considering a neighbor- to detect and escape from them.
hood, the space is usually interpreted as a natural landscape,
with valleys and mountains. Under this perception, it is com- B. Roundness of the attraction basins
monly believed that, if maximizing, the solutions located in
An attraction basin is considered to be round if all the
the slopes of the same mountain belong to the same attraction
solutions at distance 1, 2, ... until a certain distance r from the
basin, with the peaks of the mountains being the local optima.
local optimum or the plateau are within the attraction basin.
Unfortunately, this is a widespread erroneous visualization of a
We record, for the smaller instances, for each local optimum,
combinatorial landscape. Thus, our aim is to clarify this aspect,
the proportion of solutions belonging to its attraction basin
providing a detailed analysis of, first, the existence of plateaus
that are at different distances from it. On average, the local
where the local optima are involved, and second, the properties
optima are located in the frontier of the attraction basins, as
that define the topology of the attraction basins, picturing a
they have a number of neighboring solutions belonging to a
reliable visualization of the landscapes. Some of the features
different attraction basin. However, on average, we also find
explored in this paper have never been examined before.
solutions at the longest distances from them that do belong to
Hence, new findings about the structure of the attraction basins
their attraction basins. This structure clearly differs from the
are shown. The study is focused on instances of permutation-
concept of roundness.
based combinatorial optimization problems considering the 2-
exchange and the insert neighborhoods. Particularly, we work
C. Centrality of the local optima
with the permutation flowshop scheduling problem (PFSP), the
linear ordering problem (LOP) and the quadratic assignment We aim to study the position of the local optima within the
problem (QAP). As a consequence of this work, we break attraction basins. We focus on the centrality of the local optima
away from the extended belief about the anatomy of attraction inside the attraction basins. The local optima (or the plateaus)
basins. are considered to be centered if they minimize the average
distance to the rest of the solutions in the attraction basin.
II. A NALYSIS OF THE TOPOLOGY OF THE ATTRACTION
We observe that, in general, the local optima of the instances
BASINS
have a lower average distance than the rest of the solutions
A. Local optima and local optimal plateaus of the attraction basins. We conclude that the local optima are
A best-improvement local search algorithm returns a local located close to the barycenter of the attraction basins, as they
optimum that necessarily match one, and only one, of the three have the minimal (or almost the minimal) average distances to
739
the rest of the solutions: in general, they are almost centered ●●

● ● ● ● ●
●
●
within the attraction basins.

● ●
● ●●
●
● ●
● ●
● ● ●
●
●● ● ● ● ●
● ● ●● ● ● ●
● ● ● ●● ● ●● ● ●● ● ●
● ● ●● ●
● ●
●● ● ● ●
D. Interior and frontier of the attraction basins ● ●
●
● ●●
●
●●
●
●
●● ● ●
● ●
●
●●
●
●●●
● ●● ●●●●●●● ●● ● ●●
●● ●● ●● ● ● ●
●
●
There is a really low number of solutions in the interior ●
●●
●
●
●●
● ●
●
●●
● ● ●
●
● ●
●●
● ●
● ● ● ● ●● ●
●
●
● ●
●
●●
●
●●
●
● ● ●● ● ● ● ● ● ●
● ●● ● ●
of the attraction basins. Surprisingly, the average number ●
●
● ●
●
●
●
●
●
●
● ● ●
● ● ●
● ● ●
●
● ●●●●●
●
● ●●
● ● ●●
●● ● ●
● ●● ● ●
●
● ●●
● ●● ● ●
●
●
●
●●
●●
●
●
●
● ● ● ● ● ●● ● ● ●
of neighboring attraction basins is really high (close to the ●
●
●●
●●
●
●
●
● ●
●
●●
●● ●
●● ● ● ●
● ●
● ●● ● ● ●●
●● ● ● ● ●●● ● ● ●
total number of local optima). Basically, almost all of the

●
●●● ● ●
●● ● ●
●● ●● ●
●● ●● ● ● ●● ●
●● ●
● ● ● ●● ● ● ● ●
●
● ●● ● ● ● ● ● ● ●
attraction basins are neighboring attraction basins. Moreover,

●
● ● ● ●
●● ● ● ● ●
● ● ● ● ● ● ●
●● ●
● ● ●
●
● ●● ● ● ●● ● ● ● ● ● ● ● ●
●
● ● ●● ● ● ●
● ●
those solutions that are close to the local optimum have a ●● ● ●

● ● ●
● ●
● ●
●
●
●● ●
●
● ● ●
● ●
large proportion of their neighbors inside the same attraction

● ●
● ● ● ●
● ● ●
basin. The solutions that are far from the local optimum have
●
a small number of neighbors in the same attraction basin, (a)

while the number of different neighboring attraction basins ●
● ●
●
●●● ●
is large. If we take all the solutions of an attraction basin, the ●

●●
●●●
●●●●
● ●
●
●
●
●
●●●●
●
● ● ●●●
connectivities with other different attraction basins are higher ●●● ●

●
●
●● ●
● ●
● ●
●
● ●● ●
● ●
●● ● ● ●
●●
●●●●
●
●
● ●●
● ● ● ●● ●
for those solutions at long distances from the local optima. ●
●
●●
●● ●
● ●
● ●●
●
●●
●
●
●
●
●●
●
●
●●
●●
●
●●
●
● ●
●●
●
●●
●
●
●
●●●
●●
● ●● ●
●
●●
● ●
●●● ● ●
●
●
●●
●● ●●
●●
● ●
●
● ●
●
●
●●●
The attraction basins are intertwined in the search space: the ●
● ●
●
●● ● ●● ●
●
●
● ● ●
●●●
●
● ● ●
● ● ●
●●
●
●
●
● ●
●●●●
●● ● ●
●● ● ●●
paths drawn by the local search algorithm are interconnected ●
● ●●
● ●●
● ●
●
●●●●● ● ●●●●
●●
●●
●
●
●
●
●
●
●
● ●
●●●
●●
●
●
● ●● ●●●●●
●● ● ●
●
●●●
● ●● ●
● ●
●
●●●
●●●
● ●
●●●
● ● ● ●●● ● ●
● ●
●●●
●
with each other or, at least, they are close to each other. ●
●
● ●
●●
● ●●
●
●● ●
●●
●
●
● ●●●
●●
●●
●
●●●
●
●●
●
●●●●
●●●
●
●●
●
●
●
●
● ●
●●●
●
● ●●
● ●●
●
● ● ● ● ● ●
III. V ISUALIZATION OF THE ATTRACTION BASINS ●

●
●
●●
● ●
●●
●
●
We give a representation of a specific attraction basin by ●
means of a network showing all the paths encountered until the

local optimum is reached. Each node of the graph represents ●
one solution belonging to the attraction basin. Edges between (b)

nodes indicate that the node at the end of the edge is the
Fig. 1. Visualization of an attraction basin of a local optimal plateau found
best neighbor of the node at the start of the edge. The color an instance of the PFSP with the 2-exchange neighborhood, considering only
of the nodes changes with the distance to the local optimum. the steps of the algorithm (a) and taking into account, as far as possible, the
Particularly, red, yellow, green, light blue, dark blue and purple distances between all the solutions (b).
are used to represent the solutions at distances 0 (the local
optima), 1, 2, 3, 4 and 5, respectively. The size of the nodes the same objective function value, forming a plateau. The
and the width of the edges also decrease as the distance to the local optima or the plateaus composed by local optima are
local optimum increases. centered in the attraction basin. Nevertheless, we should be
Figure 1 presents two different graphs illustrating the same cautious with this perception, because by understanding the
attraction basin of a local optimal plateau of a PFSP instance combinatorial optimization landscapes as if we were in a
when using the 2-exchange neighborhood. Figure 1(a) repre- 3D natural landscape, we could be misunderstanding the real
sents this attraction basin considering the steps that the algo- anatomy. The understanding of the landscapes in combinatorial
rithm takes until it reaches the local optimal plateau (and not optimization has been one of the main challenges when
the distances between the solutions). In an attempt to visualize developing and improving algorithms. This work not only
this attraction basin in a more realistic way, we force the graph breaks with an erroneous extended belief about the attraction
to take into account the distances between all the solutions that basin shapes, but also provides valuable information for the
belong to the attraction basin (Figure 1(b)). The real structure design of new algorithms based on local search.
of the attraction basins is more complex than one could try
ACKNOWLEDGMENT
to imagine. More visualizations can be found at the website:
http://www.sc.ehu.es/ccwbayes/members/leticia/AnatomyOfAB/visualization/ This work has been partially supported by the Research
visualizeOneAB.html. Groups 2013-2018 (IT-609-13) programs (Basque Govern-
ment) and TIN2016-78365R (Spanish Ministry of Economy,
IV. C ONCLUSION Industry and Competitiveness). Jose A. Lozano is also sup-
The attraction basins can be understood as long intertwined ported by BERC 2014-2017 and Elkartek programs (Basque
rivers, that flow into the different local optima, instead of government) and Severo Ochoa Program SEV-2013-0323
being mountains in a landscape. In fact, each attraction basin (Spanish Ministry of Economy and Competitiveness).
is composed of several of those rivers ending at the same R EFERENCES
local optimum, while at the same time, each of them could [1] L. Hernando, A. Mendiburu and J.A. Lozano. Anatomy of the Attraction
have different tributaries. Moreover, the end of those rivers Basins: Breaking with the Intuition. Evolutionary Computation, 1-32.
can be made up of more than one local optimum that have 2018. In Press.
740
SHADE con Búsqueda Local Iterativa para

Optimización Global de Alta Dimensionalidad
1o Daniel Molina 2o Antonio LaTorre 3o Francisco Herrera
DaSCI Instituto Andaluz en Data Science DATSI, ETSIINF DaSCI Instituto Andaluz en Data Science
and Computational Intelligence Centro de Simulación Computacional and Computational Intelligence
Universidad de Granada Universidad Politécnica de Madrid Universidad de Granada
Granada, España Madrid, España Granada, España
Resumen—La optimización global es un campo de investi- estar por encima del millar de variables. En este contexto,
gación de gran interés dado el gran número de problemas de la eficiencia de las técnicas de búsqueda es crucial, debido al
la ciencia y la ingeniería que pueden formularse en dichos enorme espacio de búsqueda que debe cubrirse. En los últimos
términos. Uno de los grandes retos en este tipo de problemas
es el incremento de la dimensionalidad, ya que supone un años, se han organizado varias sesiones especiales en LSGO
aumento en la complejidad de los mismos. Este hecho hace donde se han propuesto varios algoritmos específicamente
de la optimización global de alta dimensionalidad un campo diseñados para este tipo de problemas. Una de las estrategias
especialmente atractivo en nuestros días. En esta contribución que está recibiendo más atención consiste en particionar el
proponemos un nuevo algoritmo híbrido especialmente diseñado problema en subproblemas de menor tamaño. Un ejemplo
para tratar con este tipo de problemas. La propuesta combina,
de manera iterativa, una reciente variante del algoritmo de de esto son las diferentes estrategias de agrupamiento de
Evolución Diferencial con una búsqueda local que se escoge de variables propuestas por algunos autores [4], [5]. No obstante,
entre varias estrategias disponibles. Dicha selección es dinámica la actual referencia, y ganador de las competiciones de alta
y se lleva a cabo teniendo en cuenta la contribución de cada dimensionalidad desde 2013, Multiple Offspring Sampling,
una de ellas en las anteriores fases de intensificación, de tal MOS [6], [7], sigue una aproximación diferente: combina
modo que se use la más apropiada en cada una de las fases de
búsqueda del algoritmo. La experimentación se ha llevado a cabo dinámicamente múltiples técnicas de búsqueda que se usan
usando el benchmark de alta dimensionalidad del CEC’2013 y los de manera simultánea y cuya participación en el proceso de
resultados demuestran que la sinergia existente entre las distintas búsqueda se ajusta de acuerdo a su rendimiento.
componentes del algoritmo permite obtener unos resultados que En esta contribución proponemos un nuevo algoritmo,
mejoran los del actual ganador de las últimas competiciones de SHADE con una búsqueda local iterativa, SHADE-ILS, que
optimización global de alta dimensionalidad, Multiple Offsrping
Sampling, MOS, con mejoras especialmente reseñables en los combina la capacidad exploratoria de una reciente variante de
problemas de mayor complejidad. la ED con la potencia de intensificación de varias Búsquedas
Index Terms—Optimización Global de Alta Dimensionalidad, Locales, BL. En cada iteración del algoritmo, la ED se aplica
Evolución Diferencial, Computación Memética, Hibridación. para evolucionar la población de soluciones candidatas y la
BL se usa para mejorar la mejor solución encontrada hasta ese
I. I NTRODUCCIÓN momento. Las técnicas de BL se seleccionan en cada iteración
La optimización continua es un campo de investigación de acuerdo al rendimiento relativo obtenido previamente.
muy relevante ya que muchos problemas de diversas áreas Este algoritmo se basa en el que se propuso en [8], IHDELS,
de conocimiento pueden formularse en estos términos. En pero con un importante número de diferencias: la selección
este tipo de problemas, la solución puede modelarse como de la BL a aplicar en cada generación se ha mejorado.
un vector de una determinada longitud de variables continuas Además, se ha introducido un mecanismo de reinicio capaz
en un dominio de búsqueda. Los Algoritmos Evolutivos, AEs, de detectar el estancamiento. Por último, en esta propuesta
tales como la Evolución Diferencial, ED [1], [2], son muy se ha reemplazado la ED utilizada anteriormente, SaDE [9],
útiles en la resolución de este tipo de problemas, ya que por otra más potente, Success-History based Adaptive DE,
son capaces de encontrar soluciones precisas a problemas SHADE [10].
complejos sin ninguna información acerca de estos, lo cual es Los resultados de este nuevo método se han comparado con
de gran utilidad en problemas reales [3]. Sin embargo, este tipo los de IHDELS, mejorando los que éste obtenía. Además,
de algoritmos suele ser muy sensible al tamaño del problema, SHADE-ILS mejora los resultados del ganador de las ante-
dado que el dominio de búsqueda aumenta exponencialmente riores competiciones de alta dimensionalidad, MOS [6], [7]
con el número de dimensiones. que, no había sido mejorado desde su publicación, lo cual
La Optimización Global de Alta Dimensionalidad, LSGO lo convertía en el actual estado del arte. De esta manera, el
por sus siglas en inglés, es una variante concreta de este algoritmo propuesto, SHADE-ILS, puede ser considerado el
tipo de problemas en la que el tamaño del mismo suele nuevo estado del arte en optimización continua.
741
El resto del documento está organizado del siguiente modo: aproximación del gradiente para mejorar la búsqueda.
en la sección II, el algoritmo SHADE-ILS se describe en Ambos métodos son complementarios: MTS LS-1 es
detalle, resaltando las principales diferencias con respecto muy rápido y apropiado para problemas separables, pero
a IHDELS. En la sección III, analizamos los resultados muy sensible a rotaciones. Por otro lado, L-BFGS-B es
obtenidos por nuestro algoritmo y los comparamos con los menos potente pero también menos sensible a estas.
de MOS. Por último, la sección IV presenta las principales Este framework, presentado en el algoritmo 1, es común a la
conclusiones y líneas futuras del trabajo. anterior propuesta [8]. Sin embargo, como mencionamos antes,
II. P ROPUESTA existen tres diferencias principales entre ambas propuestas: el
algoritmo de ED utilizado (SHADE en lugar de SaDE) (línea
En esta sección vamos a describir en detalle el algoritmo
6), la selección de la BL (líneas 9 y 11) y el mecanismo
propuesto, SHADE-ILS, resaltando los cambios realizados con
de reinicio (líneas 15-17). En los párrafos siguientes vamos a
respecto a IHDELS. Una descripción detallada de este último
detallar las principales características de la nueva propuesta.
puede ser consultada en [8].
II-A. Algoritmo exploratorio: SHADE
Algoritmo 1 SHADE-ILS
En este trabajo, aplicamos SHADE como el componente
1: population ← random(dim, popsize) exploratorio. Este algoritmo presenta las siguientes ventajas:
2: solucion_inicial ← (upper + lower)/2 Tiene un mecanismo de auto-ajuste de los parámetros de
3: actual_mejor ← BL(solucion_inicial) la ED, CR (parámetro del cruce) y F (parámetro de la
4: mejor_solucion ← actual_mejor mutación), sofisticado, que permite un ajuste óptimo a
5: while totalevals < maxevals do
cada problema. El único parámetro que hay que fijar es
6: previo ← actual_mejor.f itness el tamaño de población.
7: actual_mejor ← SHADE(population, actual_mejor) El operador de mutación tiene en cuenta soluciones
8: improvement ← previo − actual_mejor.f itness. anteriores almacenadas en un archivo, lo cual incrementa
9: Escoge el método de BL a aplicar en esta iteración. la diversidad de las nuevas soluciones.
10: actual_mejor ← BL(population, actual_mejor) El operador de mutación está sesgado para no seleccionar
11: Actualiza probabilidad de aplicar BL. siempre la mejor solución. En su lugar, selecciona aleato-
12: if mejor(actual_mejor, mejor_solucion) then riamente de entre las p mejores soluciones.
13: actual_mejor ← mejor_solucion.
Una descripción más detallada del algoritmo SHADE se
14: end if
puede encontrar en [10].
15: if Debe reiniciar then
En algunas versiones más recientes de SHADE, algunos
16: Reinicia y actualiza actual_mejor.
autores incorporan una reducción lineal del tamaño de la
17: end if
población al considerar que es demasiado exploratorio [11],
18: end while
[14]. Sin embargo, en nuestro caso, es ésta precisamente la
característica que más nos interesa, ya que disponemos de
El algoritmo 1 muestra el esquema general de la propuesta.
otros métodos de intensificación, por lo que no necesitamos
Como se puede observar, el algoritmo aplica, iterativamente,
aplicar la reducción del tamaño de la población. Es más,
los métodos de ED y BL, explorando todas las variables al
habiendo probado ambas versiones, los mejores resultados los
mismo tiempo (una diferencia importante con respecto a otros
hemos obtenidos con SHADE.
algoritmos que agrupan variables). Otra característica relevante
es que el algoritmo mantiene la misma población entre fases II-B. Selección de la BL
de aplicación de la ED. Además, los parámetros del método de En IHDELS, la selección de la BL en cada iteración se
BL también son persistentes entre llamadas sucesivas sobre la llevaba a cabo con una determinada probabilidad (línea 9)
misma solución (exceptuando tras los reinicios). Por lo tanto, P . Este valor se inicializaba como P
LS = |LS| , donde
1
LS
el flujo del algoritmo podría resumirse en dos pasos:
|LS| es el número de métodos de BL (2 en nuestro caso)
Inicialmente, se usa una técnica exploratoria para ex- disponibles. Además, en cada iteración (línea 11) la mejora
plorar el espacio de búsqueda. En nuestro caso, hemos de cada método de BL se calculaba como:
seleccionado SHADE [10] por su simplicidad y porque
auto-ajusta sus parámetros. Existe una versión que reduce
f itness(Bef oreLS ) − f itness(Af terLS )
el tamaño de la población, L-SHADE [11], muy popular ILS = (1)
en el campo de la optimización continua. Sin embargo, en Bef oreLS
este caso, el ajuste del tamaño de la población reduciría A continuación, la probabilidad de seleccionar cada BL
demasiado rápidamente sus capacidades de exploración. se ajustaba según el valor media de ILS obtenido por cada
Al final de cada iteración, se escoge una BL, de entre dos método de BL.
métodos, para la fase de intensificación. Una de ellas es el En SHADE-ILS, la mejora de cada método de BL se calcula
algoritmo MTS LS-1 [12], específicamente diseñado para del mismo modo (ecuación 1). Sin embargo, en lugar de usar
LSGO. La otra es el clásico L-BFGS-B [13], que usa una el ILS medio para cada BL, selecciona la BL con mayor ILS
742
durante la última aplicación. Este criterio es más simple y, separables a completamente no-separables. La descripción
en nuestros experimentos, más eficiente que el anterior. No detallada del benchmark puede encontrarse en [15].
sólo eso: cuando el rendimiento de un método de BL decrece La implementación del algoritmo se ha realizado en Python,
rápidamente, el uso del ILS medio requiere de más tiempo y está libremente disponible1 . Cada algoritmo se ha eje-
para detectar este cambio, mientras que el uso del ILS de la cutado 51 veces, y cada ejecución finaliza cuando se al-
anterior ejecución proporciona una adaptación más rápida. canza un número máximo de evaluaciones de fitness, FEs
por sus siglas en inglés, que se fija en 3 · 106 . Además,
II-C. Mecanismo de reinicio se registra el mejor fitness en distintos puntos de control
En ocasiones, un proceso de optimización puede estancarse. (en términos de FEs, que son, en este caso, los siguientes:
En esas situaciones, una solución muy común consiste en {1,2, 3,0, 6,0, 9,0, 12, 15, 18, 21, 24, 27, 30}·105 . Sin embargo,
incluir un mecanismo que detecte cuándo la mejor solución como en anteriores competiciones sólo se tenían en cuenta tres
no puede ser mejorada y se encargue de reiniciar la población. puntos de control (1,2·105 , 6,0·105 , 3,0·106 ), usaremos éstos
En IHDELS, el criterio de reinicio (línea 16) sólo se para las comparativas con algoritmos del estado del arte.
cumplía cuando no se conseguía mejorar durante una iteración La Tabla I recoge la configuración de parámetros usados
completa. Sin embargo, en optimización continua es bastante en esta experimentación. En dicha tabla se puede comprobar
frecuente que se siga mejorando ligeramente la mejor solución cómo se ha establecido un número de evaluaciones de 50000
en el entorno de un atractor. Esto hacía que el mecanismo de para cada iteración (25000 de las cuales son usadas por la
reinicio inicialmente propuesto sólo se aplicase unas pocas ED y las otras 15000 por la BL). El resto de parámetros,
veces, y en esos casos, con poco éxito. compartidos entre IHDELS y SHADE-ILS, se mantienen sin
En este trabajo, proponemos un mecanismo de reinicio que cambios.
se aplica cuando, durante tres iteraciones consecutivas, el ratio Tabla I: Configuración de parámetros
de mejora (teniendo en cuenta tanto la ED como la BD) es
menor del 5 %. En esos casos, el mecanismo de reinicio se Algoritmo Parámetro Descripción valor
aplica de la siguiente manera: ED popsize Tamaño de población 100
Se selecciona, aleatoriamente, una solución sol. Parámetros F EED FEs para la ED 25000
Compartidos F EBL FEs para la BL 25000
Se aplica una perturbación a sol que siga una distribución M T SIstep Paso inicial para MTS-LS1 20
normal de media 0 y desviación típica un 10 % del
IHDELS FreqBL Frec. actualización de prob. 10
dominio de búsqueda: currentbest = sol + randi ·
SHADE-ILS RestartN Iteraciones sin mejora 3
0,1 · (b − a), donde randi devuelve un número aleatorio IHDELS T hreshold Ratio de mejora mínimo 5%
randi ∈ [0, 1] y [a, b] es el dominio de búsqueda.
La población del algoritmo se reinicia aleatoriamente.
Los parámetros adaptativos de los métodos de BL se Los resultados de nuestra propuesta quedan recogidos en la
reinician a sus valores por defecto. Tabla II. Las siguientes secciones de esta contribución discuten
acerca de estos resultados. En primer lugar, analizamos la
Normalmente, las poblaciones se suelen reiniciar de manera
contribución de las distintas componentes de nuestra propu-
aleatoria (o a partir de perturbaciones sobre la mejor solución
esta, con especial interés en el mecanismo de reinicio. A
encontrada hasta ese momento). Lo que nosotros proponemos
continuación, comparamos los resultados con los del algoritmo
es seleccionar una solución aleatoriamente de la población de
IHDELS, en el que se basa esta propuesta. Por último,
la ED con el objetivo de que sea una solución razonablemente
compararemos los resultados con los del actual ganador de
buena pero que no haya sido mejorada todavía por la BL.
las últimas competiciones de LSGO, MOS.
Sobre ésta, realizamos una pequeña perturbación para evitar
que la siguiente población sea muy parecida a la actual. III-A. Influencia de las distintas componentes
Por otro lado, cuando la BL no es capaz de mejorar la mejor
En esta sección analizamos la contribución de cada una de
solución, también se reinician sus parámetros.
las subcomponentes de SHADE-ILS a los resultados globales.
Permitir tres iteraciones completas antes de reiniciar com-
En primer lugar, vamos a estudiar la contribución del nuevo
pletamente la población sigue la lógica de permitir al algoritmo
mecanismo de reinicio y a compararlo con el método anterior
que aplique ambas búsquedas locales y que éstas pueden, a su
a través del análisis de varias funciones representativas (Figura
vez, reiniciar sus parámetros. Si no se producen mejoras signi-
1). Hay algunas funciones, como F4 , donde el nuevo mecanis-
ficativas después de estas tres iteraciones, se aplica el reinicio
mo de reinicio mejora al anterior pero que presentan curvas de
de la población tal y como se describió con anterioridad.
convergencia con una tendencia similar. En otros casos, como
III. E XPERIMENTACIÓN en F5 , el nuevo mecanismo de reinicio permite al algoritmo
una exploración completa de la zona del óptimo, lo cual
Para la experimentación hemos seguido las directrices de la facilita una mejora rápida y continuada de la mejor solución.
competición de LSGO del CEC 2013 [15]. Este benchmark Por último, hemos observado, para varias funciones (como
se compone de 15 funciones de 1000 dimensiones y vari-
os niveles de separabilidad, desde funciones completamente 1 https://github.com/dmolina/shadeils
743
Tabla II: Resultados de SHADE-ILS en el benchmark del CEC 2013
Punto de Control Estadístico f1 f2 f3 f4 f5 f6 f7 f8
Mejor 1.55e+04 2.25e+03 2.01e+01 1.53e+10 1.53e+06 1.04e+06 1.75e+08 3.22e+13
Mediana 6.07e+04 2.57e+03 2.01e+01 2.60e+10 2.50e+06 1.05e+06 3.61e+08 1.62e+14
1.20e+05 Peor 1.42e+05 3.07e+03 2.12e+01 7.50e+10 3.28e+06 1.06e+06 9.46e+08 1.06e+15
Media 6.10e+04 2.65e+03 2.03e+01 3.13e+10 2.50e+06 1.05e+06 3.95e+08 2.12e+14
Desv. Típica 3.03e+04 2.17e+02 3.92e-01 1.43e+10 3.85e+05 6.68e+03 1.54e+08 2.04e+14
Mejor 0.00e+00 1.43e+03 2.00e+01 7.60e+08 1.29e+06 1.02e+06 4.72e+05 8.82e+11
Mediana 5.07e-25 1.74e+03 2.01e+01 1.26e+09 2.28e+06 1.04e+06 7.66e+05 6.17e+12
6.00e+05 Peor 2.27e-22 2.44e+03 2.01e+01 4.26e+09 3.08e+06 1.05e+06 2.70e+06 1.94e+13
Media 3.71e-23 1.80e+03 2.01e+01 1.54e+09 2.29e+06 1.04e+06 9.25e+05 6.93e+12
Desv. Típica 6.42e-23 2.93e+02 2.24e-02 8.22e+08 3.67e+05 8.35e+03 4.73e+05 4.28e+12
Mejor 0.00e+00 8.53e+02 2.00e+01 5.95e+07 1.09e+06 1.00e+06 7.65e+00 1.81e+10
Mediana 0.00e+00 9.88e+02 2.01e+01 1.15e+08 1.41e+06 1.02e+06 5.46e+01 2.78e+11
3.00e+06 Peor 6.73e-23 1.21e+03 2.01e+01 3.86e+08 1.86e+06 1.04e+06 1.99e+02 1.33e+12
Media 2.69e-24 1.00e+03 2.01e+01 1.48e+08 1.39e+06 1.02e+06 7.41e+01 3.17e+11
Desv. Típica 1.35e-23 8.90e+01 1.12e-02 8.72e+07 2.03e+05 1.19e+04 5.46e+01 3.06e+11
Punto de Control Estadístico f9 f10 f11 f12 f13 f14 f15
Mejor 2.15e+08 9.32e+07 1.98e+09 2.09e+03 4.74e+09 5.15e+10 6.12e+07
Mediana 2.88e+08 9.43e+07 4.23e+09 2.57e+03 1.30e+10 1.14e+11 8.11e+07
1.20e+05 Peor 3.52e+08 9.50e+07 3.46e+10 4.08e+03 2.57e+10 5.12e+11 1.58e+08
Media 2.88e+08 9.43e+07 6.55e+09 2.67e+03 1.29e+10 1.62e+11 9.12e+07
Desv. Típica 3.48e+07 4.90e+05 7.26e+09 4.86e+02 5.97e+09 1.08e+11 2.57e+07
Mejor 1.93e+08 9.08e+07 7.85e+07 5.97e+02 1.72e+07 4.62e+07 5.76e+06
Mediana 2.51e+08 9.30e+07 1.24e+08 1.33e+03 4.10e+07 6.42e+07 1.29e+07
6.00e+05 Peor 3.07e+08 9.39e+07 2.73e+08 1.89e+03 3.84e+08 1.24e+08 3.10e+07
Media 2.50e+08 9.29e+07 1.37e+08 1.28e+03 5.68e+07 6.97e+07 1.22e+07
Mejor 1.30e+08 9.06e+07 3.10e+05 8.53e-20 3.52e+04 4.93e+06 3.91e+05
Mediana 1.63e+08 9.20e+07 4.50e+05 3.99e+00 8.28e+04 5.75e+06 6.09e+05
3.00e+06 Peor 1.94e+08 9.31e+07 1.43e+06 2.99e+02 3.31e+05 6.39e+06 1.56e+06
Media 1.64e+08 9.18e+07 5.11e+05 6.18e+01 1.00e+05 5.76e+06 6.25e+05
F9 o F12 ) que el nuevo mecanismo de reinicio es capaz de Tabla III: Resultados para las diferentes combinaciones de las
incrementar significativamente la velocidad de convergencia. componentes del algoritmo tras 3 · 106 FEs
A continuación, vamos a comparar la influencia de cada Func. IHDELS-SR IHDELS-R IHDELS-S IHDELS original
una de las subcomponentes de manera individual. La Tabla (SHADE-ILS)
III presenta los resultados partiendo del algoritmo IHDELS y F1 2.69e-24 1.21e-24 1.76e-28 4.80e-29
aplicando los distintos cambios descritos en la Sección II: F2 1.00e+03 1.26e+03 1.40e+03 1.27e+03
IHDELS: Versión original de IHDELS propuesta en 2015 F3 2.01e+01 2.01e+01 2.01e+01 2.00e+01
[8], que usa SaDE y el mecanismo de reinicio original. F4 1.48e+08 1.58e+08 2.99e+08 3.09e+08
F5 1.39e+06 3.07e+06 1.76e+06 9.68e+06
IHDELS-S: Algoritmo que reemplaza SaDE por SHADE F6 1.02e+06 1.03e+06 1.03e+06 1.03e+06
pero manteniendo el mismo mecanismo de reinicio. F7 7.41e+01 8.35e+01 2.44e+02 3.18e+04
IHDELS-R: Algoritmo con el nuevo mecanismo de reini- F8 3.17e+11 3.59e+11 8.55e+11 1.36e+12
cio pero manteniendo SaDE en lugar de SHADE. F9 1.64e+08 2.48e+08 2.09e+08 7.12e+08
IHDELS-SR: Propuesta final, usando SHADE en lugar F10 9.18e+07 9.19e+07 9.25e+07 9.19e+07
F11 5.11e+05 4.76e+05 5.20e+05 9.87e+06
de SaDE y el nuevo mecanismo de reinicio.
F12 6.18e+01 1.10e+02 3.42e+02 5.16e+02
En el análisis anterior no incluimos el nuevo mecanismo de F13 1.00e+05 1.34e+05 9.61e+05 4.02e+06
selección de la BL porque las diferencias no eran evidentes. F14 5.76e+06 6.14e+06 7.40e+06 1.48e+07
No obstante, decidimos mantener dicho cambio ya que reduce F15 6.25e+05 8.69e+05 1.01e+06 3.13e+06
la complejidad del algoritmo al eliminar el parámetro F reqBL
Mejor 12 1 0 2
sin deterioro de la calidad de las soluciones.
Analizando los resultados de la Tabla III se pueden extraer
las siguientes conclusiones:
El cambio en el mecanismo de reemplazo tiene un efecto La combinación de SHADE y el nuevo mecanismo de
mayor que el de la componente de ED. reinicio es significativamente mejor que cualquiera de
El uso de SHADE en lugar de SaDE mejora los resulta- las otras combinaciones, lo cual pone de manifiesto que
dos significativamente, independientemente del mecanis- existe una interacción positiva entre ambas mejoras.
mo de reinicio utilizado, especialmente en el caso de las El algoritmo propuesto obtiene los mejores resultados
funciones no-separables y con solapamiento. en 12 de las 15 funciones del benchmark, siendo las
744
Figura 1: Comparativa del error medio para el mecanismo de reinicio original y el nuevo
Function: 04 Function: 05
1.00e+11 2.75e+6
2.50e+6
2.25e+6
1.00e+10
2.00e+6
Values
Values
1.75e+6
1.00e+9
1.50e+6
1.00e+8 1.25e+6
1.20e+5 6.00e+5 3.00e+6 1.20e+5 6.00e+5 3.00e+6
Evaluations Evaluations
New Restart Old Restart New Restart Old Restart

Highcharts.com Highcharts.com
Function: 09 Function: 12
3.00e+8 4.00e+3
2.75e+8
2.00e+3
2.50e+8
1.00e+3
2.25e+8
Values
Values
4.00e+2
2.00e+8
2.00e+2
1.75e+8
1.00e+2
1.50e+8 4.00e+1
1.20e+5 6.00e+5 3.00e+6 1.20e+5 6.00e+5 3.00e+6
Evaluations Evaluations
New Restart Old Restart New Restart Old Restart

Highcharts.com Highcharts.com
diferencias muy pequeñas en las otras 3. ahora, por lo que se puede considerar el actual estado-del-arte
En resumen, las diferentes componentes de SHADE-ILS, y, por tanto, la referencia clara que aspiramos a superar.
especialmente el nuevo mecanismo de reinicio y el uso de En la Tabla IV se presentan los resultados de SHADE-ILS
SHADE en lugar de SaDE, son capaces de mejorar claramente y MOS para los distintos puntos de control (1,2 · 105 , 6 · 105 , y
los resultados de IHDELS. Es más, la combinación de todos 3·106 ), de los que podemos extraer las siguientes conclusiones:
estos nuevos componentes obtiene los mejores resultados, MOS obtiene los mejores resultados tras 1,2 · 105 FEs,
que son significativamente mejores que los de cualquier otra éstos se igualan tras 6 · 105 FEs y, para el máximo
combinación posible. número de FEs, 3 · 106 , SHADE-ILS obtiene los mejores
resultados en 10 de las 15 funciones.
III-B. Comparación de SHADE-ILS e IHDELS MOS sigue obteniendo los mejores resultados en las fun-
En la Tabla III se puede observar que SHADE-ILS es ciones separables (f1 -f3 ), mientras que SHADE-ILS es
mejor que IHDELS en 13 de las 15 funciones del benchmark mejor en funciones más complejas: con la excepción de
(con diferencias mínimas en las otras dos). No sólo eso: las las funciones f6 y f10 , SHADE-ILS es significativamente
mejoras de SHADE-ILS son especialmente importantes en las mejor en el resto de las funciones.
funciones más complejas, donde obtiene un error al menos un SHADE-ILS es muy competitivo en un número mayor
orden de magnitud más pequeño en muchas de ellas (por ejem- de funciones, especialmente en las solapadas y no-
plo, en las funciones F5 , F7 , F8 , F11 , F12 , F13 , F14 , o F15 ). separables. No sólo mejora los resultados de MOS en
Como acabamos de discutir, las mejoras son debidas a la muchos casos, sino que sus resultados son, a menudo, al
combinación de ambas componentes. Por último, el cambio en menos un orden de magnitud más pequeños.
el mecanismo de selección de la BL elimina un parámetro del
algoritmo (F eqLS ) y lo hace, por tanto, más sencillo, mientras IV. C ONCLUSIONES
sigue manteniendo un comportamiento robusto. En este artículo hemos propuesto un nuevo algoritmo de
optimización especialmente diseñado para Optimización Glo-
III-C. Comparación de SHADE-ILS y MOS bal de Alta Dimensionalidad, SHADE-ILS, que combina la
En esta sección vamos a comparar SHADE-ILS con MOS, capacidad exploratoria de una ED adaptativa con la capacidad
el algoritmo de referencia en LSGO y, desde 2013, el ganador de intensificación de dos métodos de BL. En cada iteración
de todas las competiciones en alta dimensionalidad. Ningún del algoritmo, éste evoluciona una población con SHADE y,
otro algoritmo ha sido capaz de mejorar sus resultados hasta a continuación, selecciona la BL con el mejor rendimiento
745
Tabla IV: Resultados obtenidos por SHADE-ILS y MOS para los distintos puntos de control: FEs=1,2 · 105 , FEs=5,0 · 105 y
FEs=3,0 · 106 .
1.20e+05 6.00e+05 3.00e+06
Función SHADE-ILS MOS SHADE-ILS MOS SHADE-ILS MOS
F1 6.10e+04 2.71e+07 3.71e-23 3.48e+00 2.69e-24 0.00e+00
F2 2.65e+03 2.64e+03 1.80e+03 1.78e+03 1.00e+03 8.32e+02
F3 2.03e+01 7.85e+00 2.01e+01 1.33e-10 2.01e+01 9.17e-13
F4 3.13e+10 3.47e+10 1.54e+09 2.56e+09 1.48e+08 1.74e+08
F5 2.50e+06 6.96e+06 2.29e+06 6.95e+06 1.39e+06 6.94e+06
F6 1.05e+06 3.11e+05 1.04e+06 1.48e+05 1.02e+06 1.48e+05
F7 3.95e+08 3.46e+08 9.25e+05 8.19e+06 7.41e+01 1.62e+04
F8 2.12e+14 3.72e+14 6.93e+12 8.41e+13 3.17e+11 8.00e+12
F9 2.88e+08 4.29e+08 2.50e+08 3.84e+08 1.64e+08 3.83e+08
F10 9.43e+07 1.16e+06 9.29e+07 9.03e+05 9.18e+07 9.02e+05
F11 6.55e+09 3.13e+09 1.37e+08 8.05e+08 5.11e+05 5.22e+07
F12 2.67e+03 1.16e+04 1.28e+03 2.20e+03 6.18e+01 2.47e+02
F13 1.29e+10 8.37e+09 5.68e+07 8.10e+08 1.00e+05 3.40e+06
F14 1.62e+11 4.61e+10 6.97e+07 2.03e+08 5.76e+06 2.56e+07
F15 9.12e+07 1.45e+07 1.22e+07 6.26e+06 6.25e+05 2.35e+06
relativo durante la última fase de activación para que mejora [3] N. Xiong, D. Molina, M. L. Ortiz, and F. Herrera, “A walk into meta-
la mejor solución encontrada por el algoritmo poblacional. heuristics for engineering optimization: principles, methods and recent
trends,” International Journal of Computational Intelligence Systems,
Además, se ha incorporado un mecanismo de reinicio que 2015, vol. 8, no. 4, pp. 606–636, June 2015.
permite al algoritmo explorar otras regiones del espacio de [4] M. N. Omidvar, X. Li, and X. Yao, “Cooperative Co-evolution with
búsqueda cuando ésta se queda estancada (cuando la mejora delta grouping for large scale non-separable function optimization,” in
2010 IEEE Congress on Evolutionary Computation (CEC 2010). IEEE,
relativa es pequeña durante varias iteraciones consecutivas). 2010, pp. 1762–1769.
En la sección de experimentación, hemos puesto a prueba [5] M. N. Omidvar, X. Li, Y. Mei, and X. Yao, “Cooperative co-evolution
SHADE-ILS usando el benchmark propuesto para la com- with differential grouping for large scale optimization,” IEEE Transac-
tions on Evolutionary Computation, vol. 18, no. 3, pp. 378–393, June
petición de alta dimensionalidad del CEC 2013. En primer 2014.
lugar, hemos comprobado que cada una de las modificaciones [6] A. LaTorre, S. Muelas, and J. M. Peña, “Large Scale Global Opti-
llevadas a cabo sobre IHDELS contribuye significativamente mization: Experimental Results with MOS-based Hybrid Algorithms,”
in 2013 IEEE Congress on Evolutionary Computation (CEC 2013),
a la mejora de los resultados. A continuación, hemos com- Cancún, Mexico, 2013, pp. 2742–2749.
parado la propuesta con el algoritmo de referencia en alta [7] A. LaTorre, S. Muelas, and J. Peña, “A Comprehensive Comparison
dimensionalidad, MOS. En esta comparación, SHADE-ILS of Large Scale Global Optimizers,” Information Sciences, vol. 316, pp.
517–549, 2014.
consigue los mejores resultados, batiendo a MOS por primera [8] D. Molina and F. Herrera, “Iterative hybridization of DE with local
vez desde 2013. Esta comparación revela que SHADE-ILS search for the CEC’2015 special session on large scale global opti-
es especialmente competitivo en las funciones más complejas, mization,” in 2015 IEEE Congress on Evolutionary Computation (CEC
2015). IEEE, 2015, pp. 1974–1978.
con componentes solapadas y no separables, donde no sólo [9] A. Qin, V. Huang, and P. Suganthan, “Differential Evolution Algorithm
obtiene el error más pequeño en la mayoría de las funciones, With Strategy Adaptation for Global Numerical Optimization,” IEEE
sino que también consigue reducir el error en al menos un Transactions on Evolutionary Computation, vol. 13, no. 2, pp. 398–417,
Apr. 2009.
orden de magnitud en muchas de ellas. [10] R. Tanabe and A. Fukunaga, “Evaluating the performance of shade on
Como trabajo futuro, vamos a probar otras técnicas para cec 2013 benchmark problems,” in 2013 IEEE Congress on Evolutionary
acelerar la convergencia del algoritmo y obtener mejores Computation, June 2013, pp. 1952–1959.
[11] R. Poláková, J. Tvrdík, and P. Bujok, “L-shade with competing strategies
resultados en más funciones no-separables. applied to cec2015 learning-based test suite,” in 2016 IEEE Congress
on Evolutionary Computation (CEC), 2016, pp. 4790–4796.
AGRADECIMIENTOS [12] L. Y. Tseng and C. Chen, “Multiple Trajectory Search for Large
Scale Global Optimization,” in 2008 IEEE Congress on Evolutionary
Este trabajo ha sido financiado por ayudas del Ministerio Computation (CEC 2008). IEEE Press, Jun. 2008, pp. 3052–3059.
de Ciencia, Innovación y Universidades (TIN2014-57481-C2- [13] J. L. Morales and J. Nocedal, “Remark on algorithm 778: L-bfgs-
2-R, TIN2016-8113-R, TIN2017-83132-C2-2-R y TIN2017- b: Fortran subroutines for large-scale bound constrained optimization,”
ACM Trans. Math. Softw., vol. 38, no. 1, pp. 7:1–7:4, Dec. 2011.
89517-P) y de la Junta de Andalucía (P12-TIC-2958). [14] J.Brest and B. M.Sepesy Mac̆ec, “iL-SHADE: Improved L-SHADE
Algorithm for Single Objective Real-Parameter OptimizationTesting
R EFERENCIAS United Multi-operator Evolutionary Algorithms-II on Single Objective,”
in 2016 IEEE Congress on Evolutionary Computation (CEC), 2016, pp.
[1] K. V. Price, R. M. Rainer, and J. A. Lampinen, Differential Evolution: 1188–1195.
A Practical Approach to Global Optimization. Springer-Verlag, 2005. [15] X. Li, K. Tang, M. N. Omidvar, Z. Yang, and K. Quin, “Benchmark
[2] S. Dasa, S. Maity, B.-Y. Qu, and P. Suganthan, “Real-parameter evolu- functions for the CEC’2013 special session and competition on large
tionary multimodal optimization-a survey of the state-of-the-art,” Swarm scale global optimization,” RMIT University, Tech. Rep., 2013.
and Evolutionary Computation, vol. 1, no. 2, pp. 71–78, 2011.
746
An insight into evolutionary algorithms for

continuous optimization: Learning by competitions
1o Daniel Molina 2o Antonio LaTorre 3o Francisco Herrera
Department of Computer Science DATSI, ETSIINF Department of Computer Science
University of Granada Center for Computational Simulation University of Granada
Granada, Spain Universidad Politécnica de Madrid Granada, Spain
[email protected] Madrid, Spain [email protected]
[email protected]
Abstract—During the recent years, continuous optimization has one and briefly describing for each year the winners, obtaining
significantly evolved to become a mature research field, in which several conclusions of the evolution of the competition. Also,
evolutionary and bio-inspired algorithms have an important role we discussed several issues that we consider interesting about
thanks to their good results with limited resources. Through
the last ten years, there have been a number of competitions the research topic, the influence of winning algorithms over
associated to special sessions in this area. In this study, we the years, and the evolution of real-parameter optimization. In
summarize, for different real-parameter competitions, the results, this work, we summarize the main conclusions obtained in that
highlighting the most relevant algorithms and techniques, pre- paper. Due to the space limit, we have removed the references
senting the trajectory they have followed and how some of these to the algorithms in this short summary. We refer the readers
works have deeply influenced the top performing algorithms of
today. The aim is to be both a useful reference for researchers to the aforementioned full paper [4] for details.
new to this interesting research topic and a useful guide for
current researchers in the field. II. S EVERAL OPTIMIZATION COMPETITIONS
Index Terms—Continuous optimization, global optimization, In our paper [4], we present the different global optimization
real-parameter optimization, large-scale global optimization. competitions held at multiple international conferences and
briefly describe the main algorithms (winner and runner-ups)
I. I NTRODUCTION for each year, according to the conclusions of the organizers.
Global optimization, also referred to as continuous or real- This review covers real-parameter, constraints, multi-modal
parameter optimization, is a growing research topic for its and large-scale competitions.
wide number of real-world applications. This optimization As previously mentioned, space limits do not allow us to
implies to optimize an objective function (we can consider go into details in this paper. Instead, we preferred to focus on
minimize without loss of generality): to obtain x∗ where the main conclusions derived from our study. For the details
f (x∗ ) ≤ f (x), ∀x ∈ [a, b], where a, b ∈ RN and f : RN → R. on the results of each competition, we refer the readers to [4].
Due to the immense domain search of some problems, it
is usually not possible to perform an exhaustive search in III. C URRENT TRENDS AFTER A DECADE OF
the entire domain, so meta-heuristic algorithms [1], [2] or COMPETITIONS
evolutionary algorithms [3] are usually applied. The recent and In this section, we use the historical information after a
growing interest on this type of optimization has fostered the decade of competitions in real-optimization to study which
development of a huge number of optimization algorithms that are the most influential algorithms, and the most successful
deal with this type of optimization (and many more proposals components of those algorithms that have been, since their
arise each year). Unfortunately, the great number of proposals proposal, incorporated to other methods.
makes following the evolution of this field difficult, and there
is no clear criterion to select the most adequate algorithms. A. Competitions winners and most influential algorithms
In order to give more visibility to the field, many special ses- In any research field, a good indication of its evolution is
sions have been proposed in international conferences. These to what extent some algorithms have influenced others over
special sessions have, frequently, an associated real-parameter the years, reusing ideas from previous successful proposals.
optimization competition, in which multiple algorithms are In this particular case, we concluded that there are three very
evaluated on a specific benchmark to allow fair comparisons influential algorithms: CMA-ES, L-SHADE and MVMO. Not
among them. Taking into consideration the results obtained in only they have inspired an important number of variants, but
these competitions, the evolution of this research topic can be they are also the roots of the majority of winners.
analyzed, and many interesting conclusions can be drawn. Since 2005, the most influential algorithm has been CMA-
In a recent work [4], we described the different real-coding ES. Algorithms based on this approach, such as BIPOP-CMA-
optimization competitions, noting the benchmark used for each ES or Ni-BIPOP-aCMA, were the winners of the CEC’2005,
747
BBOB’2009 and CEC’2013 competitions, respectively. Fur-

• Most of the proposals are memetic algorithms. The local
thermore, there are many algorithms inspired by CMA-ES that
search method used relies on many different types of
have won several editions of the BBOB competition. It has
methods, from more general to specific approaches, such
been used as a local search method (see DRMA-LSCh-CMA)
as the ones used in MTS and other LSGO algorithms.
or as a component in a hybrid algorithm such as, for example,
• In order to increase the selective pressure in the pop-
in iCMAES-ILS, the winner of the CEC’2013 competition.
ulations, one approach popularized by L-SHADE and
A second algorithm with an increasing influence is L-
adopted by other algorithms is to decrease the population
SHADE, the winner in 2014. Its good results have favored an
size during the run. In conjunction with a memory
interesting list of winners using it in CEC’2015 (two of the
of solutions, it increases the exploitation ability of the
three best algorithms), CEC’2016 and CEC’2017 (the three
algorithm, maintaining certain diversity in the search.
winners, and also other algorithms).
• Traditionally, in most of the best-performing methods
A third algorithm with good results was the MVMO scheme
only the best solutions were considered to guide the
algorithm, which proves that being a scheme is not only
search. This means that a lot of information was being
good for global optimization, but also when the number of
wasted in each generation. In more recent algorithms, bad
allowed fitness evaluations is very scarce (as shown by its
solutions are also used to guide the search. Similarly, in
good behavior in the expensive benchmark). In this case,
the MVMO family of algorithms, not only is the best
the different proposals came from the same authors, maybe
solution is considered, but also the average of a group of
because this method is still not as popular as the DE scheme.
good solutions.
Obviously, the algorithms with the best results in the com-
petitions are the most influential. However, sometimes, such as IV. C ONCLUSIONS
with the SHADE or VMO algorithms, their first versions were
The use of Bio-inspired and Evolutionary Algorithms for
not among the winners, but they were evolved and, over the
real-parameter optimization is of great interest today, and
next few years, other methods based on them performed better
thus many approaches based on this type of optimization are
achieving winning positions. Furthermore, it is remarkable that
proposed each year. This large number of proposals makes it
the metaheuristics with the best results in these competitions
difficult for researchers to follow the evolution of the field. In
are far from being bio-inspired algorithms. In this sense, these
this paper, we have presented some conclusions after a decade
results remind us that the novelty of new metaheuristics is very
of competitions on this type of real-parameter optimization
important but also subordinated to their performance in solving
problems. We have observed that there are several algorithms,
optimization problems.
such as CMA-ES, L-SHADE, MVMO and MOS, that have
B. Techniques/components for winner algorithms exercised a strong influence over other algorithms. We have
One of the most interesting issues when studying successful also suggested several techniques that are being widely adopt-
algorithms is the identification of the different components ed among the winning proposals, and which could be used for
that each algorithm uses, as they can be further used by other more competitive algorithms.
methods to boost their performance. In the following, we The objective of this review and analysis of the evolution
highlight several popular techniques/components that seem to of the competitions is to offer a useful reference to new
provide good results: researchers in this research topic, and to help them to continue
improving the field.
• A frequent problem with many algorithms is the selection
of appropriate values for their parameters. There are ACKNOWLEDGMENTS
two alternatives: to be carefully chosen or an automatic This work was supported by grants from the Span-
parameter tuning tool. Another option, very popular in ish Ministry of Science and the European Fund (FED-
competitive algorithms, is to use self-adaptive criteria to ER) under projects (TIN2014-57481-C2-2-R, TIN2016-8113-
adjust them, using an adaptive probability or a memory R, TIN2017-83132-C2-2-R, TIN2017-89517-P) and Regional
to enforce good parameter values. Government (P12-TIC-2958).
• Several algorithms not only self-adapt their parameters,
but also their components, having several components R EFERENCES
that provide the same functionality and then selecting one [1] F. Glover and G. A. Kochenberger, Handbook of metaheuristics.
of them according to their performance. Springer, 2003.
• When the self-adaptive component is not a part of an
[2] N. Xiong, D. Molina, M. L. Ortiz, and F. Herrera, “A walk into meta-
heuristics for engineering optimization: principles, methods and recent
optimization algorithm but of a complete algorithm, the trends,” International Journal of Computational Intelligence Systems,
proposal can be considered as a framework of algorithm- 2015, vol. 8, no. 4, pp. 606–636, June 2015.
s. One proposal can be designed to have a particular [3] T. Bäck, D. B. Fogel, and Z. Michalewicz, Eds., Handbook of Evolution-
ary Computation. Bristol, UK: IOP Publishing Ltd., 1997.
combination, such as in the case of iCMAES-ILS, or [4] D. Molina, A. LaTorre, and F. Herrera, “An insight into bio-inspired and
allow a more open selection of optimization methods, as evolutionary algorithms for global optimization: Review, analysis, and
in MOS, the state-of-art algorithm in large-scale global lessons learnt over a decade of competitions,” Cognitive Computation,
Apr 2018. [Online]. Available: https://doi.org/10.1007/s12559-018-9554-
optimization for more than six years. 0
748
Bioinspirados
(XIII MAEB)
MAEB 11:
COMPUTACIÓN E VOLUTIVA:
FUNDAMENTOS Y M ODELOS II
Un estudio sobre la influencia de la función

objetivo en evolución gramatical para
regresión simbólica
J. Manuel Colmenar J. Ignacio Hidalgo
Universidad Rey Juan Carlos Universidad Complutense de Madrid
C/. Tulipán s/n, 28933, Móstoles, Spain C/. Prof. José Garcı́a Santesmases 9, 28040, Madrid, Spain
Email: [email protected] Email: [email protected]
Resumen—La evolución gramatical es una variante gramática para construir los árboles que representan
de la programación genética, que permite, entre otras una solución. Esto permite introducir conocimiento del
caracterı́sticas, introducir conocimiento del problema en problema en el proceso de búsqueda y controlar el
el proceso de búsqueda. Una de las aplicaciones más
importantes de esta técnica, al igual que de la progra- tamaño de los árboles que representan a las soluciones.
mación genética tradicional, es la regresión simbólica. Una de las aplicaciones más relevantes de esta
La regresión simbólica consiste en obtener expresiones técnica, al igual que de la programación genética
matemáticas que modelen un conjunto de datos. Como tradicional, es la regresión simbólica. La regresión
todo algoritmo evolutivo, la búsqueda tiene que estar simbólica consiste en obtener expresiones matemáticas
guiada por una función objetivo. Esta función objetivo,
en el caso de la regresión simbólica, debe medir la que representen un conjunto de datos. Sus aplicaciones
proximidad de la función matemática reportada por el en la actualidad son innumerables ya que es un técnica
algoritmo a los datos objeto del problema. Por lo tanto, fundamental en el análisis de datos y modelado de
lo más habitual es utilizar el error cuadrático medio, el sistemas a partir de registros de información [3, 4].
valor de R2 , o alguna otra variante de la diferencia entre Como todo algoritmo evolutivo, la búsqueda tiene que
los puntos. En este artı́culo investigamos la influencia de
la utilización del error cuadrático medio y de R2 en el estar guiada por una función objetivo. Esta función ob-
proceso de búsqueda y en la calidad de las soluciones jetivo, en el caso de la regresión simbólica, debe medir
obtenidas con evolución gramatical en problemas de la proximidad de la función matemática reportada por
regresión simbólica. el algoritmo a los datos objeto del problema. Por lo
tanto, lo más habitual es utilizar el error cuadrático
I. I NTRODUCCI ÓN medio, el valor de R2 , o alguna otra variante de la
Uno de los paradigmas más importantes en cuanto diferencia entre los puntos. Sin embargo, aunque el
a las aplicaciones de la inteligencia artificial es la objetivo buscado sea el mismo, al utilización de una
computación evolutiva y dentro de ella es de funda- u otra función puede tener consecuencias importantes
mental importancia la programación genética (PG, o en el resultado final del proceso de búsqueda.
GP, de sus siglas en inglés: Genetic Programming) En este artı́culo se analiza la influencia de la uti-
[6]. La PG es una metodologı́a que permite obtener lización del error cuadrático medio y de R2 tanto
de una forma automática programas que representen en el proceso de búsqueda com en la calidad de
soluciones a problemas o que realicen una determinada las soluciones obtenidas con evolución gramatical en
función. Utiliza una representación de las soluciones problemas de regresión simbólica. Como se verá en
en forma de árboles, lo que hace que en ocasiones la discusión del trabajo, a partir de las expresiones de
el tamaño de memoria necesario para representar las las funciones objetivo, intuitivamente se puede pensar
soluciones de la población sea excesivo. Por ello se que cuando se utiliza el valor de R2 los resultados
han desarrollado alternativas que funcionen bajo los de la búsqueda deben reportar expresiones que tengan
mismos principios pero que permitan reducir tanto el una alta correlación con los datos, pese a que no
espacio ocupado en memoria, como el tiempo efectivo estemos obteniendo una función que represente exac-
de búsqueda de soluciones. La evolución gramatical, tamente todos los datos. Sin embargo, al utilizar el
también conocida como gramáticas evolutivas (de una error cuadrático medio (RMSE, del inglés Root Mean
mala traducción del inglés, Grammatical Evolution) Square Error) se esperarı́a que las buenas soluciones
[7], es una variante de la programación genética en representen los datos de manera más fiel. Para realizar
la que se utilizan una serie de reglas recogidas en una el estudio se han utilizado varios problemas clásicos de
751
regresión simbólica, y se han comparado los resultados # Rule to create the main structure of the
utilizando gramáticas iguales con funciones objetivo produced expression
<expr> ::= (<expr> + <expr>) / (<expr> + <
diferentes. Los resultados muestran la diferencia en- expr>)
tre los modelos y soluciones obtenidas ası́ como la | <expr> + <expr> | <expr> - <expr
>
influencia de la función objetivo en estos resultados. | <expr> * <expr> | <expr> / <expr>
El resto del artı́culo está organizado como sigue. | <c> | <c>.<c> | <c><c>.<c><c> | <
var> | <var>
En la sección II se describe brevemente la técnica de | <expr> <op> <expr> | <c>ˆ<var>
la evolución gramatical. En la sección III se revisa el | exp(abs(<c> <op> <var>)) | log(abs
(<c> <op> <var>))
diferente enfoque de las funciones objetivo bajo estudo.
La exposición de los resultados y su análisis se realiza # Digits
<c> ::= 0|1|2|3|4|5|6|7|8|9
en la sección IV y la sección V resume las principales
conclusiones de este trabajo. # Arithmetic operands
<op> ::= +|-|*|/
# Input variables
II. E VOLUCI ÓN G RAMATICAL <var> ::= X1 | X2
La evolución gramatical es un paradigma evolutivo Figura 1: Gramática diseñada para abordar los expe-
que deriva de la programación genética. En resumen, rimentos. El ejemplo corresponde a Vladislavleva-F8,
la aportación de la evolución gramatical consiste en que trata 2 variables de entrada.
modificar la representación de los individuos utilizando
cromosomas en lugar de árboles. Este cambio permite
que se puedan utilizar operadores clásicos de algorit-
mos genéticos como el cruce, mutación o selección, 
P
2
cuya implementación es más sencilla y eficiente al ((E i − E)(O i − O))
R 2 =  qP i 
ejecutar sobre cromosomas que sobre árboles. Además, 2
P 2
i (Ei − E) i (Oi − O)
para realizar la decodificación del cromosoma se utiliza
una gramática, que incluye reglas de producción que
s
1 X
permiten generar las expresiones que corresponden al RM SE = (Oi − Ei )2
N i
fenotipo del individuo.
Pese a ser una técnica reciente, durante los últimos R2 no es sólo una medida de la bondad de ajuste,
años se ha utilizado de forma extensa en problemas sino también una medida de hasta qué punto el modelo
de modelado. Para mayor información sobre evolución (el conjunto de variables independientes que se selec-
gramatical se puede recurrir a los trabajos mencionados cionó) explica el comportamiento (o la varianza) de su
en la introducción y también acudir a [2] ó [5] para variable dependiente. Por lo tanto, si un modelo tiene
ver el detalle del proceso de decodificación. una R2 de 0,6, esto explica el 60 % del comportamiento
Como ejemplo de gramática, la Figura 1 muestra la de su variable dependiente. Ahora, si se se usa el
que se ha utilizado en los experimentos de este artı́culo. R2 Ajustado que esencialmente penaliza el R2 por
En particular, esta gramática corresponde al conjunto el número de variables que usa el modelo, se puede
de datos de referencia Vladislavleva-F8 porque con- obtener una idea bastante buena de cuándo hay que
sidera dos variables de entrada, como se indica en la dejar de agregar variables al modelo (y eventualmente
última regla. Para el resto de las pruebas de referencia, simplemente obtener un modelo que se ajuste). Si el R2
esta regla será la única modificada, adaptada al número Ajustado de los modelos obtenidos con un conjunto de
de variables de entrada. variables es 0,8, y al añadir una variable sólo aumenta
en 0,01, lo más indicado es que no sea necesario añadir
esa variable. Realmente, si el algoritmo de evolución
III. F UNCIONES OBJETIVO EN PROBLEMAS DE
gramatical está bien diseñado, esto no debe suceder
REGRESI ÓN SIMB ÓLICA
ya que de inicio se habrán seleccionado las variables
A continuación, se planteará la formulación de que intervienen y el propio algoritmo proporcionará un
la funciones objetivo bajo estudio en este artı́culo. modelo que implı́citamente indica qué variables son
Siendo O el vector de valores observados (aquellos las más importantes, ya que son las que aparecen en
provinientes de la optimización) y E el vector de el modelo.
valores esperados (formado por la variable objetivo), En el caso de RMSE, éste devuelve una estimación
y O y E los valores promedio de cada uno de ellos, de la desviación estándar de los residuales1 [1]. Por
las expresiones para las funciones objetivo son las 1 La diferencia entre los valores reales y los estimados es el
siguientes: residual.
752
tanto, a mayor RMSE, mayor desviación estimada en sensible, que controla el tamaño de los fenotipos de
los errores del modelo. los individuos de la generación inicial evitando que
En principio, por tanto, R2 mide el ajuste de un sean excesivamente grandes. De cada experimento se
modelo sobre un conjunto concreto de datos, mientras han realizado diez ejecuciones diferentes utilizando
que RMSE mide la dispersión de los errores. A priori, los mismos parámetros de entrada para el algoritmo de
podrı́a parecer que estas medidas indican ambas la GE, que se muestran en la Tabla I. Los experimentos
calidad de un modelo, por lo que podrı́an ser inter- se ejecutaron en un ordenador equipado con un
cambiables. Sin embargo, como se verá en la sección procesador Intel Core i7 a 2.9 GHz con 16 GB de
de resultados, valores altos de una de las métricas no RAM sobre sistema operativo Mac OSX 10.13.5.
implican valores altos de la otra.
IV. R ESULTADOS EXPERIMENTALES Parámetro Valor
Los experimentos de este artı́culo se han realizado Población 300 individuos
sobre un conjunto de tres problemas de regresión Generaciones 1700
Selección Torneo (2 indiv.)
estándar, que se denominarán benchmarks a partir de Prob. Cruce 80 %
este punto, haciendo uso de la expresión comunmente Prob. Mutación 2%
utilizada en inglés. Estos problemas se han seleccio- Función objetivo R2 ó RM SE
Inicialización random, sensible
nado como parte de los problemas recomendados para Longitude del Cromosoma 256
PG en [10], y son los siguientes: Tower, Vladislavleva- Número máximo de wraps 5
F8 y Spatial co-evolution. A continuación se detallan
Tabla I: Valores de los parámetros utilizados en los
algunas de las caracterı́sticas de estos problemas:
experimentos.
En el conjunto de datos Spatial co-evolution [8],
la variable objetivo se define de la siguiente
manera: El primer aspecto a analizar es la evolución
1 1 de las ejecuciones a través del análisis del mejor
F (x, y) = + individuo. Para ello, se tomó el valor de la función
1 + x−4 1 + y −4
objetivo cada 100 generaciones, en cada una de las
En el conjunto de entrenamiento original existen ejecuciones. Dado que se lanzaron 10 ejecuciones
676 registros en los cuales los valores para las para cada experimento, los datos que se muestran
variables x e y se muestrean desde -5 a +5 en se corresponden con el promedio de las 10 ejecuciones.
intervalos de 0.4. En el conjunto de test hay 1000
registros en los que las variables x e y se mues-
En primer lugar, las figuras 2 y 3 muestran la
trean en el intervalo [−5, . . . , +5] aleatoriamente.
evolución para el caso de la inicialización con una
En conjunto, forman un total de 1676 datos, y se
población aleatoria (random), utilizando como función
han utilizado como serie de regresión al completo.
objetivo R2 y RM SE respectivamente. Dado que
El conjunto de datos Tower [9] proviene de un
el algoritmo trata de minimizar, el valor que se
problema industrial sobre medidas de cromato-
presenta en el caso de R2 es en realidad 1 − R2 ,
grafı́a de gases en una torre de destilación. El
y ası́ será para el resto de experimentos. Como se
conjunto de datos contiene 5000 registros y 25
puede apreciar, el problema más difı́cil de resolver
variables de entrada potenciales. La variable de
es Tower. Por otro lado, la evolución tiene una
respuesta es la concentración de propileno en la
tendencia hacia abajo menos pronunciada a partir de
parte superior de la torre de destilación. Los datos
la generación 500 aproximadamente en ambas gráficas.
de Tower se pueden descargar en http://www.
symbolicregression.com/?q=towerProblem.
El conjunto de datos Vladislavleva-F8, denotado Las figuras 4 y 5 muestran la convergencia para
como VF8 a partir de este momento, define las el caso de la inicialización sensible, utilizando como
variables de salida como funciones de x1 y x2 , función objetivo 1 − R2 y RM SE respectivamente.
de la siguiente manera: De nuevo, el comportamiento es similar en ambos
casos, siendo Tower el problema más difı́cil. En el
caso de la comparativa entre los diferentes tipos de
(x1 − 3)4 + (x2 − 3)3 − (x2 − 3)
F8 (x1 , x2 ) = inicialización, se puede ver que entre las figuras 2 y
(x2 − 2)4 + 10 4, que utilizan la misma función objetivo, 1 − R2 ,
Para todos los benchmarks se han estudiado las dos y diferente inicialización, la inicialización sensible
funciones objetivo, R2 y RM SE, con dos tipos de alcanza mejores valores promedio a lo largo de toda
inicialización para la primera población del algoritmo: la ejecución del algoritmo en los tres benchmarks.
inicialización aleatoria (random) e inicialización
753
Figura 2: Valores promedio de la función objetivo: 1 − Figura 4: Valores promedio de la función objetivo: 1 −
R2 . Inicialización random. R2 . Inicialización sensible.
Figura 3: Valores promedio de la función objetivo: Figura 5: Valores promedio de la función objetivo:
RM SE. Inicialización random. RM SE. Inicialización sensible.
En el caso de la optimización con RM SE, la como R2-Random; optimización a través de R2 e

inicialización sensible no aporta valores mejores en la inicialización sensible como R2-Sensible y, de manera
evolución. A pesar de que la escala no permite ver análoga, para RM SE y las dos inicializaciones
las diferencias gráficamente en las figuras 3 y 5, sı́ estudiadas como RMSE-Random y RMSE-Sensible.
que se aprecia que al principio los valores promedio
son mejores, pero según avanza la evolución, los En la Figura 6 se puede apreciar cómo los valores
experimentos con inicialización aleatoria obtienen de R2-Random y R2-Sensible son mayores que en la
mejores valores promedio. optimización con RM SE. En el caso, por ejemplo,
de Tower, la diferencia es muy significativa, llegando
Independientemente de las funciones objetivo a estar por encima del 30 %. Los valores concretos
utilizadas, se han calculado los valores de R2 de R2 se muestran en la Tabla III. Se puede apreciar
y RM SE para todas las soluciones obtenidas también que la inicialización sensible mejora los
en los experimentos. La figuras 6 y 7 muestran, resultados hasta en un 2 % para los experimentos
respectivamente, los valores promedio de R2 y donde la función objetivo es 1 − R2 .
RM SE para cada uno de los benchmarks en los
diferentes casos. Se denota el experimento con La Figura 7 muestra los valores de RM SE para
optimización a través de R2 e inicialización aleatoria las mismas soluciones que se han utilizado en la
754
spatial tower VF8

R2-Random 15,58366595 348,2669206 1,942964282
R2-Sensible 10,67370612 365,2646472 3,94804835
RMSE-Random 0,272769052 58,39444643 0,787039727
RMSE-Sensible 0,298058917 59,40281873 1,035522363
Tabla III: Valores promedio de RM SE.
en los valores de la función objetivo. Sin embargo,

también demuestran que las funciones objetivo bajo
estudio no son equivalentes.
Por un lado, la función objetivo R2 muestra la

correlación entre dos series de valores. Una elevada
Figura 6: Valores promedio de R2 para los diferentes correlación indica que la tendencia de las dos series
experimentos. Mejor cuanto más alto. es similar, independientemente del valor concreto del
error entre el valor observado y el valor esperado.
Un modelo con elevado valor de R2 puede conseguir
buenas predicciones sobre valores no conocidos.
Por otro lado, la función objetivo RM SE muestra

el error o diferencia entre una serie de predicciones
y los datos esperados correspondientes. Al minimizar
RM SE se reduce el error, por lo que la serie
de predicciones se acerca a la serie esperada. La
consecuencia es que se obtienen modelos cuya
precisión es alta, pero cuya capacidad de predicción
puede ser mala, debido al efecto de sobreajuste,
también llamado overfitting.
Figura 7: Valores promedio de RM SE normalizados Con objeto de evaluar la calidad de las soluciones
para los diferentes experimentos. Mejor cuanto más obtenidas a través de una métrica diferente, se propone
bajo. en este artı́culo la utilización de la métrica conocida
como similitud del coseno. Esta medida interpreta
spatial tower VF8
R2-Random 0,901794689 0,80986102 0,960807366 ambas series de datos, observada y esperada, como
R2-Sensible 0,920002539 0,821656958 0,969546579 vectores O y E respectivamente. De esta manera,
RMSE-Random 0,672605164 0,56536177 0,910126819 se calcula el coseno del ángulo que forman ambos
RMSE-Sensible 0,627583903 0,547273778 0,840721671
vectores utilizando la siguiente expresión:
Tabla II: Valores promedio de R2 . P
O i Ei
Coseno(θ) = pP i 2 pP 2
i Oi i Ei
Figura 6. En este caso, dado que los valores presentan Si el valor del coseno es cercano a 1, entonces
diferentes órdenes de magnitud, se han normalizado el ángulo que forman los vectores es cercano a 0o ,
respecto a la décima parte del valor máximo. Los por lo que se tratará de series similares. Si el valor
valores concretos de RM SE se presentan en la Tabla es cercano a -1, entonces el ángulo es cercano a
III. Como se puede apreciar, los valores de RM SE 180o , lo que significa que las series tienen tendencia
son mucho mejores en el caso de los algoritmos que similar, pero en sentido opuesto. En caso de que el
utilizan esta métrica como función objetivo, llegando valor del coseno esté cerca de 0, se trata de series
a obtener un orden de magnitud de diferencia. Resulta perpendiculares, lo que se considera como la menor
significativo señalar que la inicialización sensible no similitud posible. Sobre las soluciones obtenidas en los
mejora los resultados en este caso. Al contrario, se experimentos se ha calculado la similitud de coseno.
llega a peores resultados en los tres problemas bajo La Tabla IV muestra los valores obtenidos para los
estudio. experimentos donde la inicialización es aleatoria.
Para cada benchmark se muestran los valores de
Estos resultados son coherentes con lo que se espera las optimizaciones donde la función objetivo es
de algoritmo de optimización, que consigue la mejora 1 − R2 (R2) y también los valores donde la función
755
de coste ha sido RM SE. Los valores presentados AGRADECIMIENTOS

corresponden a las 10 ejecuciones realizadas. Como Este trabajo ha sido financiado por el Ministerio
se aprecia en la tabla, los valores para RM SE son de Economı́a y Competitividad de España a través
más altos y más consistentes, tal y como indican los de los proyectos con referencias TIN2014-54806-R y
valores promedio que se muestra en la última fila. TIN2015-65460-C2.
En el caso de R2 , existen valores altos, cercanos al
1, pero también existen valores negativos y alguno R EFERENCIAS
cercano al 0, 5. [1] D. L. J. Alexander, A. Tropsha, and David A.
Winkler. Beware of r2 : Simple, unambiguous
spatial tower VF8
assessment of the prediction accuracy of qsar and
Run R2 RSME R2 RSME R2 RSME qspr models. Journal of chemical information and
1 0,9393 0,9931 0,9514 0,9881 0,9255 0,9758 modeling, 55.7:1316–1322, 2015.
2 0,9931 0,9666 0,96 0,9857 0,9865 0,9732
3 0,9807 0,9877 0,9541 0,9856 0,9782 0,9534 [2] J. M. Colmenar and J. I.. Hidalgo. Análisis de
4 -0,7232 0,9962 0,9846 0,9886 0,9634 0,9736 algoritmos de evolución gramatical en problemas
5 0,9643 0,9897 0,9754 0,9838 0,8801 0,9434
6 0,5044 0,9698 -0,9682 0,9844 0,6949 0,9871 de regresión simbólica. In XII Metaheurı́sticas,
7 0,9608 0,9902 0,9655 0,9874 0,905 0,961 Algoritmos Evolutivos y Bioinspirados (MAEB
8 0,946 0,9723 -0,9826 0,9871 -0,9157 0,9535
9 0,9622 0,9905 0,9784 0,9874 0,9879 0,9487 2017), pages 901–910, Barcelona, Spain, 2017.
10 0,9588 0,9914 0,9721 0,985 0,9824 0,9265 Universitat Pompeu Fabra.
Avg. 0,7486 0,9847 0,5791 0,9863 0,7388 0,9596
[3] Ian Dempsey, Michael O’Neill, and Anthony Bra-
Tabla IV: Similitud de coseno para los experimentos bazon. Live trading with grammatical evolution.
con inicialización random. La última fila muestra el In GECCO 2004 Workshop Proceedings, Seattle,
valor promedio. Washington, USA, 26-30 June 2004.
[4] J. Ignacio Hidalgo, J. Manuel Colmenar, José L.
La Tabla V muestra las mismas estadı́sticas, pero Risco-Martin, Alfredo Cuesta-Infante, Esther Ma-
para los experimentos donde la inicialización es queda, Marta Botella, and José Antonio Ru-
sensible. De nuevo, la tendencia es la misma, aunque bio. Modeling glycemia in humans by means of
los resultados para los experimentos donde la función grammatical evolution. Applied Soft Computing,
de coste es 1 − R2 son peores en este caso. Es (20):40–53, 2014.
destacable el conjunto de resultados de spatial, que [5] José Ignacio Hidalgo, J. Manuel Colmenar,
obtuvo el mejor promedio de R2 para la optimización José Luis Risco-Martı́n, Alfredo Cuesta-Infante,
R2-Sensible (ver Tabla II), mientras que los valores Esther Maqueda, Marta Botella, and José Antonio
de similitud de coseno de ese mismo experimento son Rubio. Modeling glycemia in humans by means
los peores, con dos valores por debajo de 0, 29. of grammatical evolution. Appl. Soft Comput.,
20:40–53, 2014.
spatial tower VF8
[6] J. R. Koza. Genetic Programming. The MIT
Run R2 RSME R2 RSME R2 RSME Press, Cambridge, Massachusetts, 1992.
1 0,9966 0,9886 0,9391 0,9866 0,8819 0,9733 [7] Michael O’Neill and Conor Ryan. Grammatical
2 0,9705 0,9911 -0,965 0,9862 -0,9872 0,9673
3 0,9708 0,9914 0,9793 0,9844 -0,9889 0,9456 evolution. IEEE Trans. Evolutionary Compu-
4 0,2871 0,982 -0,9777 0,987 0,9486 0,8021 tation, 5(4):349–358, 2001.
5 0,9883 0,9743 0,9576 0,9863 0,6819 0,9566
6 0,9519 0,9762 0,9868 0,9856 0,9682 0,845 [8] Ludo Pagie and Paulien Hogeweg. Evolutionary
7 0,9112 0,9897 0,9611 0,9853 0,9178 0,8424 consequences of coevolving targets. Evolutionary
8 0,9634 0,9725 0,9687 0,9863 0,9484 0,953
9 0,957 0,9739 -0,9472 0,9863 0,9791 0,9485 Computation, 5:401–418, 1998.
10 0,1608 0,991 0,9707 0,9844 0,9199 0,9714 [9] E. J. Vladislavleva, G. F. Smits, and D. den Her-
Avg. 0,8158 0,9831 0,3873 0,9858 0,527 0,9205
tog. Order of nonlinearity as a complexity mea-
Tabla V: Similitud de coseno para los experimentos sure for models generated by symbolic regression
con inicialización sensible. via pareto genetic programming. IEEE Transac-
tions on Evolutionary Computation, 13(2):333–
349, April 2009.
V. C ONCLUSIONES Y TRABAJO FUTURO [10] David R. White, James McDermott, Mauro Cas-
A la vista de los experimentos realizados en este telli, Luca Manzoni, Brian W. Goldman, Ga-
artı́culo, se puede afirmar que R2 y RM SE no son briel Kronberger, Wojciech Jaśkowski, Una-May
funciones que lleven a soluciones equivalentes en todos O’Reilly, and Sean Luke. Better GP benchmarks:
los casos. Muy al contrario, pueden obtener resultados community survey results and proposals. Genetic
realmente diversos. Sin embargo, este es un estudio Programming and Evolvable Machines, 14(1):3–
muy preliminar que se deberá extender en el futuro. 29, Mar 2013.
756
Un análisis preliminar de nuevos modelos de

mutación dirigida en algoritmos genéticos.
B. Rodrı́guez-Puerta, Francisco Dı́az-Barrancas, F. Chávez, F. Fernández de Vega
Dpto. de Ingenierı́a en Sistemas Informáticos y Telemáticos
Universidad de Extremadura
06800 Mérida, España.
Email: {brpuerta, frdiaz, fchavez, fcofdez}@unex.es
Resumen—En este artı́culo se presenta un análisis los AGs son ampliamente utilizados por la comunidad
preliminar de un modelo de operador de mutación cientı́fica.
dirigida para problemas con codificación binaria y sin Un AG tı́pico se compone de los siguientes ele-
epistasis. Esta versión del operador permite asociar una
probabilidad de mutación a cada gen de cada individuo, mentos:
proporcional a la influencia que ha tenido dicho gen Un individuo: es la representación de una posi-
sobre la calidad del individuo durante el proceso evo- ble solución al problema.
lutivo. Estos valores de probabilidad, permiten a cada Una población: compuesta por un conjunto de
individuo realizar mutaciones de manera dirigida, con
el objetivo de reducir el tiempo de convergencia del
individuos.
algoritmo. Una función de fitness: que permite evaluar la
El conjunto de experimentos realizado con el nuevo calidad de un individuo.
operador de mutación demuestra que el algoritmo Operadores genéticos: que permiten generar una
genético converge a soluciones en etapas más tempranas nueva población a partir de la anterior (operador
del proceso evolutivo, en comparación con la mutación
cruce, operador mutación y operador selección).
clásica. Se han llevado a cabo una serie de experimentos
con un problema clásico de test, donde aplicando el Parámetros de control: que permiten controlar
nuevo operador de mutación dirigida, se consiguen la ejecución del algoritmo.
buenos resultados. Aunque estos resultados son aún muy Para maximizar la eficiencia de los AGs es posi-
preliminares, esperamos poder continuar el estudio en ble modificar los parámetros y operadores genéticos
problemas más complejos en el futuro, y mostrar ası́
la utilidad de esta versión de la mutación dirigida en anteriormente mencionados.
otros contextos. Entre los componentes del algoritmo, hay tres
parámetros fácilmente ajustables que permiten mo-
I. INTRODUCTION dificar el proceso de búsqueda de soluciones: pro-
babilidad de mutación (Pm ), probabilidad de cruce
Los algoritmos evolutivos [5] (AEs), son un con- (Pc ) y tamaño de la población (T ). Son numerosos
junto de técnicas de optimización y búsqueda de los estudios existentes que se centran en proponer
soluciones basados en la teorı́a de la evolución de heurı́sticas para optimizar dichos parámetros con la
Charles Darwin. Inspirados en esta teorı́a, utilizan finalidad de obtener mejores resultados.
una población de individuos, soluciones candidatas En este artı́culo se presenta una alternativa a uno
al problema que pretende resolverse, que tratan de de los operadores utilizados en el proceso de un AG,
adaptarse mediante evolución al entorno para resolver el operador de mutación. Está demostrado que este
el problema en cuestión. operador es necesario para garantizar la convergencia
Dentro de la familia de los AEs se encuentran los del algoritmo evolutivo. Su objetivo es la modifica-
algoritmos genéticos [6] (AGs). Estos nos ofrecen ción del valor de un gen determinado, previamente
técnicas robustas de búsqueda y optimización para seleccionado al azar, perteneciente un individuo. Este
la obtención de resultados en una gran variedad de operador está contralado por el parámetro conoci-
problemas. Por ejemplo, son ampliamente utilizados do como probabilidad de mutación, que determina
en los problemas conocidos como “NP completos”, cuándo se aplica dicha mutación.
donde ofrecen la posibilidad de encontrar soluciones La importancia del operador mutación ha sido
satisfactorias en tiempos razonables. En la actualidad estudiada ampliamente en la literatura, y ha quedado
757
demostrado que sin él no se garantiza la convergencia su acción hacia zonas especı́ficas del cromosoma que
del algoritmo [9]. A pesar de todo, el proceso de puedan ser de mayor interés.
convergencia puede ser lento, dependiendo de la difi- Una de las primeras mejoras para el operador
cultad del problema. Frecuentemente, esta dificultad mutación que se propusieron fue dotar al AG de la
implica el uso de cromosomas de tamaño grande, capacidad de adaptar la probabilidad de mutación es-
y el tamaño del cromosoma afecta a la eficacia tablecida [1], esta técnica es conocida como mutación
del operador de mutación clásico, que selecciona al adaptativa. La idea es simple pero efectiva. Depen-
azar una posición a mutar: cuanto más largo es el diendo del valor de fitness obtenido por los individuos
cromosoma, más tiempo será necesario para poder de la población en las diferentes generaciones, la
mutar alguna posición concreta del mismo. probabilidad se adapta para permitir más o menos
En este artı́culo se presenta una nueva imple- mutaciones, de esta manera cuando el fitness global
mentación para el operador genético mutación, para de la población es malo, cuando el proceso de conver-
problemas en los cuales no existe epistasis entre los gencia se estanca, el AG aumentará la probabilidad de
genes que conforman el cromosoma de un individuo. mutación, con la esperanza de que estas mutaciones
Existe epistasis entre los genes de un individuo mejoren a los individuos, y viceversa, disminuirá la
cuando la expresión de uno o más genes depende de probabilidad de mutación cuando el fitness de los
la expresión de otro gen del mismo individuo. Esta individuos sea buena para no degradar la calidad
interacción sucede cuando la modificación de un gen de la solución. Esta idea también ha sido aplicada
influye de manera directa sobre el valor en uno o con la probabilidad de cruce. Existen propuestas
varios genes diferentes del mismo individuo. más avanzadas dentro de la mutación adaptativa,
La nueva propuesta que se introduce en este traba- por ejemplo en [2] se propone un operador que
jo, que como veremos más adelante es una variación modifica la probabilidad de mutación en función del
de algunos modelos de mutación existente, pretende fitness de los individuos de la población, utilizando
asociar una probabilidad de mutación a cada gen den- para ello el algoritmos k-means. Otro enfoque muy
tro del cromosoma del individuo. Esta probabilidad utilizado dentro de la mutación adaptativa ha sido la
se debe ir actualizado con cada mutación sufrida y va modificación del AG para que en lugar de disponer de
a depender de la influencia que dicha mutación pueda una probabilidad de mutación global, cada individuo
tener sobre el valor del fitness global del individuo. cuente con una propia. Esta idea se ha codificado
Los resultados presentados en este trabajo demues- tradicionalmente con un gen más al principio del
tran que es posible alcanzar mejores soluciones en cromosoma y su cálculo se obtiene al generar un
un tiempo menor de cómputo, ası́ como utilizando número aleatorio dentro de una distribución normal
menores generaciones en el proceso evolutivo. [3]. A lo largo de los años se han utilizado otro
El resto del artı́culo se divide de la siguiente tipo de distribuciones de probabilidad, por ejemplo
forma: en la Sección II se detalla un estado del arte una distribución Levy [4], pero manteniendo la idea
de trabajos anteriores donde se aborda el problema anteriormente descrita.
de mutación dirigida, la Sección III se describe la Entre las técnicas utilizadas para mejorar el ope-
metodologı́a utilizada, los resultados de este trabajo rador genético de mutación se encuentra la que se
se presentan en la Sección IV. Finalmente las con- conoce como mutación dirigida. Ésta, a diferencia
clusiones del mismo se abordan en la Sección V. de la mutación adaptativa, basa su funcionamiento
en guiar al AG hacia mutaciones más beneficio-
II. E STADO DEL ARTE sas, entendiendo como mutaciones más beneficiosas
aquellas que hacen que el valor del fitness de un
La modificación de los diferentes operadores de individuo mejore. En el artı́culo presentado por Di-
un AG es un campo ampliamente estudiado por la nabandhu Bhandari et al [7] se propone un operador
comunidad cientı́fica. Desde el inicio, los investiga- de mutación que, dependiendo del valor de fitnees
dores no han dejado de proponer mejoras para los obtenido en la generaciones anteriores, calcula un
operadores genéticos con la finalidad de obtener AGs punto de mutación para los individuos que integran
que converjan a una solución de forma más rápida. En la población actual.
esta sección nos centraremos en el estudio de posibles En el trabajo presentado por Bäck et al.[8] propone
mejoras del operador de mutación, fijándonos en par- una idea novedosa dentro de la mutación adaptativa.
ticular en versiones del operador que permitan dirigir Se asocia una probabilidad de mutación a cada uno
758
de los genes del cromosoma del individuo. Esta

probabilidad es un valor aleatorio dentro de un rango.
Utilizando esta idea como punto de partida, en este
artı́culo exploramos otras posibilidades, haciendo una
primera implementación de una idea similar.
La mutación dirigida que presentamos más ade-
lante, asocia una probabilidad de mutación a cada
uno de los genes que componen el cromosoma, en
función a la influencia histórica que cada gen ha
tenido sobre la mejora de la calidad del individuo, a lo Figura 1. Ejemplo de codificación del VPM
largo del proceso evolutivo. A diferencia del trabajo
propuesto en [8], esta propuesta tiene en cuenta cómo
del cromosoma (PMG). La suma de todas las proba-
ha evolucionado cada individuo de la población, para
bilidades contenidas en el VPM debe ser siempre 1,
tratar de guiarlo hacia mutaciones más beneficiosas.
ver figura 1, no pudiendo superar ni disminuir este
El operador que se propone dirige las mutaciones
valor en ningún momento del ciclo evolutivo del AG.
a genes concretos del cromosoma, que mejoraran
la calidad del individuo, pero en ningún momento X
T
modifica el valor de probabilidad de mutación del P M Gi = 1 (1)
AG. i=1
donde T es el número de genes del cromosoma

III. P ROPUESTA DEL NUEVO OPERADOR
(Tamaño) y P M Gi es la probabilidad de mutación
MUTACI ÓN
del gen i-ésimo.
En esta sección se describe en detalle el nuevo La actualización del VPM es realizada cada vez
operador genético de mutación propuesto, al cual que un individuo de la población sufre una mutación.
denominamos mutación dirigida, y que se considera Antes de comenzar a explicar en detalle cómo fun-
en el contexto de problemas de codificación binaria ciona el nuevo operador es importante indicar como
sin epistasis. El objetivo es asociar un valor de pro- se inicializan las PMG del VPM para cada individuo
babilidad de mutación a cada gen del cromosoma, y en el proceso de generación de la población inicial.
utilizar estos valores de probabilidad en el proceso de Al generar la población inicial, aún no se tienen
mutación. Este nuevo modelo conlleva la utilización datos del histórico de evolución de la fitness, de ahı́
de un nuevo vector de probabilidades asociado a cada que todas las posiciones del vector VPM de cada
cromosoma, lo que implicará cambios en el operador individuo comienzan con la misma probabilidad, esta
de cruce. Estos cambios serán mı́nimos y solo se es calculada según la expresión 2
utilizan para mantener esta información actualizada
en el proceso de cruce. 1
PMG = (2)
El nuevo operador de mutación dirigida asigna T
diferentes probabilidades de mutación a cada uno de donde T es el tamaño del cromosoma
los genes de cada individuo de la población, valores
que dependerán de la influencia histórica que cada III-A. Mutación
gen ha tenido en la mejora de ese individuo a lo largo Con el vector de probabilidad de mutación inicia-
del proceso evolutivo. lizado, los pasos a realizar por el nuevo operador
Para conocer en cada momento la influencia que de mutación, cada vez que queremos aplicar una
cierto gen ha tenido sobre la calidad del individuo mutación a un individuo, son los siguientes:
que lo contiene, es necesario disponer en la codifi- 1. Comprobar si el individuo debe mutar, esta
cación del individuo de una nueva estructura capaz acción viene determinada por el parámetro pro-
de almacenar dicha información. En nuestro caso se babilidad de mutación (Pm ), presente en la
ha optado por utilizar un vector, denominado vector implementación clásica de cualquier AG.
de probabilidad de mutación (VPM). La Figura 1 2. Haciendo uso del método de selección conoci-
muestra un ejemplo gráfico del nuevo cromosoma. do como ruleta sobre el VPM del individuo,
El vector de probabilidades se encarga de almace- se selecciona el gen que sufrirá la mutación.
nar la probabilidad de mutación asociada a cada gen Esta técnica posibilita que cualquier gen pueda
759
ser seleccionado para sufrir una mutación, fa- Para poder comparar ambos operadores de mu-
voreciendo la selección de aquellos genes con tación se ha utilizado un problema bien conocido
un mayor ı́ndice de probabilidad -PMG- en el dentro de la literatura. El problema escogido ha
VPM. sido el clásico max-one. Se trata de un problema
3. Cálculo de la fitness del individuo antes de de codificación binaria el cual ha sido ejecutado
sufrir la mutación. Hay que recordar, que el utilizando el operador clásico de mutación y el nuevo
proceso de mutación se aplica después del enfoque propuesto en este trabajo. La Tabla IV mues-
cruce, por lo que los individuos recién cruzados tra los resultados de los diferentes experimentos que
no disponen aún de valor de fitness. se han realizado. Como puede observarse, estamos
4. Realizar la mutación del gen seleccionado en particularmente interesados en conocer la utilidad del
el paso anterior y cálculo del nuevo fitness del operador en problemas de tamaño grande: cuando el
individuo. cromosoma del individuo tiene una longitud tal que
5. Actualizar el VPM según el valor resultante, al son necesarias muchas generaciones para encontrar la
comparar el fitness del individuo antes de sufrir solución. Ası́, hemos probado el operador en tamaños
la mutación y después. Para realizar esta ope- que van de 20 hasta 80 bits.
ración se aumentará o disminuirá, una cantidad Para seleccionar un valor alpha adecuado para los
alpha (dependiendo de si la mutación mejoró experimentos, se ha realizado un estudio previo. Con
o no al individuo) la probabilidad asociada a la un tamaño de cromosoma igual a 20 bits se han
posición del gen mutado, y proporcionalmente, realizado 150 ejecuciones para cada uno de lo valores
se disminuirán o aumentará el resto de valores del parámetro alpha que hemos querido probar. De
correspondientes al resto de los genes. La suma esta manera hemos podido determinar el valor alpha
total de los valores del vector debe seguir que menos generaciones necesitaba para converger
siendo uno. Este valor alpha será a partir de a la solución. Como se aprecia en Figura 2, que
ahora un nuevo parámetro del algoritmo. muestra los promedios para 150 ejecuciones de cada
configuración, el valor de alpha que obtiene mejores
III-B. Cruce resultados es 0.1.
El operador genético de cruce también sufre una
modificación con respecto a su implementación clási-
ca, debido a la necesidad de manejar correctamente
los vectores de probabilidad de los individuos.
En el operador cruce clásico one-point crossover
se genera una posición aleatoria del cromosoma que
se utiliza para cruzar los dos padres intercambiando
material genético en los hijos.
El nuevo operador cruce realiza la misma ope-
ración sobre los cromosomas, y además, repite ese
mismo proceso con los PMGs de cada padre; pero
dado que la suma de los PMGs resultantes de los Figura 2. Resultado estudio valor,Alpha, cromosoma tamaño 20
nuevos individuos no tiene porqué ser 1, al finalizar el bits
cruce es necesario realizar una normalización de estos
valores -escalado para que la suma sea 1- para que Una vez seleccionado el valor alpha adecuado, he-
la suma del nuevo VPM resultante de cada individuo mos procedido con los experimentos que se muestran
hijo sea 1. en Tabla IV, de nuevo con 150 ejecuciones de cada
configuración. La Figura 3 muestra la generación me-
IV. E XPERIMENTOS Y RESULTADOS dia que ha tardado el AG en converger a la solución
para cada una de las combinaciones mostradas. Como
En esta sección se describen los experimentos que se puede observar el operador de mutación dirigida
se han realizado para comparar el nuevo operador toma menos generaciones en alcanzar la solución,
genético de mutación que se propone en este trabajo, son necesarias menos generaciones para obtener el
con el operador clásico de mutación en problemas sin mismo resultado que con el operador clásico. Como
epistasis entre los genes de los individuos. se aprecia en la gráfica la ventaja obtenida por
760
Experimento AG Tam. Población. Tam. Cromosoma Num. Generaciones Prob. Mutación Alpha
Ex1 C 10 20 20.000 0.01 -
Ex2 I 10 20 20.000 0.01 0.1
Ex3 C 10 40 20.000 0.01 -
Ex4 I 10 40 20.000 0.01 0.1
Ex5 C 10 60 20.000 0.01 -
Ex6 I 10 60 20.000 0.01 0.1
Ex7 C 10 80 20.000 0.01 -
Ex7 I 10 80 20.000 0.01 0.1
Cuadro I
E XPERIMENTOS REALIZADOS
el nuevo operador respecto al clásico en cuanto al ayudar en la mejora de la calidad del individuo tras
número de generaciones necesarias para obtener una una mutación.
solución aumenta con el tamaño del cromosoma de El nuevo operador asocia una probabilidad de
los individuos de la población. Cuanto el tamaño del mutación a cada gen del individuo, posición dentro
individuo es mayor -la dificultad del problema es del cromosoma, que es proporcional a la influencia
mayor- la diferencia entre la generación media ne- histórica que ha tenido esa posición sobre la mejora
cesaria para alcanzar solución es mayor entre ambas de la calidad del individuo a lo largo del proceso
implementaciones, aportando un mejor rendimiento evolutivo. Ası́, se utiliza un vector de probabilidades
el operador de mutación dirigida. VPM, con una posición por cada gen que existe
La Figura 4 muestra el tiempo medio para alcanzar en el cromosoma PMG, para realizar mutaciones
una solución por ambas implementaciones de los dirigidas sobre genes concretos que probablemente
algoritmos. Al igual que sucede con las generaciones, beneficiarán la calidad del individuo. Este vector de
el tiempo medio necesario para obtener la solución probabilidades es actualizado en cada proceso de
por el operador mutación dirigida es menor que la mutación, con un valor que depende de la mejora
clásica, siendo la diferencia mayor cuanto mayor es (o empeoramiento) que la mutación produce en el
el cromosoma del individuo. nuevo individuo cuando se compara con el individuo
Para tamaño de cromosomas superiores a 80 bits sin mutación.
ambas implementaciones no siempre convergen a la Utilizando el clásico problema max-one, de codi-
solución. Aun ası́, el operador de mutación dirigida ficación binaria y sin epistasis entre los genes del
converge a la solución un número mayor de veces que individuo, hemos comparado el AG clásico con la
el operador clásico (en las 150 ejecuciones realiza- nueva propuesta que utiliza mutación dirigida, con
das). Para un tamaño de cromosoma igual a 120 bits diferentes configuraciones del problema, variando el
el operador clásico ha convergido a la solución en 51 tamaño de las poblaciones, el tamaño de los indivi-
ocasiones mientras que el nuevo operador propuesto duos y la probabilidad de mutación del AG. En todos
lo ha hecho 134. los casos la mutación dirigida ha permitido encontrar
Como decı́amos anteriormente, lo aquı́ mostrado soluciones en menor número de generaciones, con
es un análisis preliminar de una variación del ope- una influencia que crece cuando lo hace el tamaño
rador de mutación dirigida. En próximos trabajos del cromosoma.
pretendemos hacer una comparativa con alguno de los Esperamos poder extender este trabajo, con una
métodos de mutación más cercanos al aquı́ propuesto, comparativa más completa con otros operadores de
y realizar una selección más adecuada de problemas mutación similares, y con un mayor número de
de test, para estudiar con mayor detalle la potenciali- problemas, tanto de codificación binaria como real,
dad del nuevo operador. No obstante, estos resultados para entender mejor el impacto del nuevo operador
preliminares muestran el camino a seguir. de mutación propuesto.
V. C ONCLUSIONES
AGRADECIMIENTOS
Este artı́culo presenta un análisis preliminar de una
nueva versión del operador de mutación adaptado a Agradecemos el apoyo del Ministerio de Eco-
problemas en los que no existe epistasis. El objetivo nomı́a y Competitividad proyecto TIN2017-85727-
de la propuesta es ayudar a determinar en cada mo- C4-{2,4}-P, Junta de Extremadura, Consejerı́a de
mento las posiciones del cromosoma que más pueden Comercio y Economı́a, proyecto IB16035 a través del
761
Figura 3. Resultados al comparar las dos implementaciones por número medio de generaciones necesarias para obtener una solución
Figura 4. Resultados obtenidos al comparar las dos implementaciones por el tiempo medio necesario para obtener una solución.
Fondo Europeo de Desarrollo Regional, “Una manera [5] Back, T. “Evolutionary algorithms in theory and practice:
de hacer Europa”. evolution strategies, evolutionary programming, genetic algo-
rithms,” Oxford university press. 1996
R EFERENCIAS [6] Goldberg, D. E., Holland, J. H. “Genetic algorithms and
machine learning. Machine learning,” 3(2), 95-99, 1988.
[1] Srinivas, M., Patnaik, L. M. “Adaptive probabilities of cros- [7] Bhandari, D., Pal, N. R., Pal, S. K. ”Directed mutation in
sover and mutation in genetic algorithms,” IEEE Transactions genetic algorithms,” Information Sciences, 79(3-4), 251-270.
on Systems, Man, and Cybernetics, 24(4), 656-667, 1994. 1994
[2] Zhang, J., Chung, H. S. H., Lo, W. L. “Clustering-based [8] Bäck, T. “Self-adaptation in genetic algorithms,” In Procee-
adaptive crossover and mutation probabilities for genetic dings of the first european conference on artificial life, 263-
algorithms,” IEEE Transactions on Evolutionary Computation, 271, MIT Press. 1992
11(3), 326-335, 2007 [9] Michalewicz, Z. “Evolution strategies and other methods.,” In
[3] Fogel, D. B., Atmar, J. W. “Comparing genetic operators with Genetic algorithms+ data structures= evolution programs (pp.
Gaussian mutations in simulated evolutionary processes using 159-177). Springer, Berlin, Heidelberg. 2016
linear systems,” Biological Cybernetics, 63(2), 111-114, 1990.
[4] Lee, C. Y., Yao, X. “Evolutionary programming using mu-
tations based on the Lévy probability distribution,” IEEE
Transactions on Evolutionary Computation, 8(1), 1-13, 2004
762
Choosing population sizes to enhance Brain Storm

Optimization algorithms
Ricardo Garcı́a-Ródenas, Luis Jiménez Linares, and Julio Alberto López-Gómez
{Ricardo.Garcia, Luis.Jimenez, JulioAlberto.Lopez}@uclm.es
Abstract—Nature-inspired algorithms (NIA) are a very po- algorithm when it is applied to hybrid functions. On the other
werful tool to solve plenty of complex science and engineering hand, it studies whether is better to use the whole population in
problems. In the last ten years, a new kind of NIA algorithms, the algorithm or only a sample of it, in terms of computational
so-called human-inspired algorithms, has arisen in optimization
tasks obtaining promising results. In this paper, the effect of cost and quality of solutions.
population size in Brain Storm Optimization algorithm (BSO) The rest of the document is structured as follows: section 2
is studied with the purpose of choosing good enough population studies the related work in BSO algorithm. Section 3 describes
sizes which improve its performance. Moreover, it is also analyzed BSO algorithm and ADMBSO algorithm, which is the version
the possibility of using population samples instead of the whole used in the experiments of this paper. Later, section 4 defines
population, studying its performance in terms of time and
computational cost. To do that, hybrid functions of IEEE CEC the experiments carried out and studies the results obtained
competitions have been used as benchmark problems. The results and finally, section 5 introduces the conclusions about this
show that twenty five individuals is a good enough population work and some future works.
size in BSO algorithms while population sampling improves the
performance of the algorithm.
II. R ELATED W ORK
Index Terms—Nature-inspired algorithms, Human-inspired al-
gorithms, Brain storm optimization, Population size, Population
To the best of our knowledge, there are 75 papers, 8 theses
sampling and 5 patents in total on the development and application of
the BSO algorithm. The current research in BSO is concerned
with three main research lines which are the following:
I. I NTRODUCTION
• Study and analysis of the algorithm. In this line, all
Traditionally, complex optimization problems have required studies about new brainstorming operators [10], modifi-
effective and sophisticated methods to deal with them. In this cations [11], clustering methods [12], parameters adjust-
context, Nature-Inspired Algorithms (NIA) appeared in the ment [13], hybridizations [14], etc are grouped.
1960s. One of the main features of NIA algorithms is they • Algorithm’s variants. New variants of brain storm algo-
take their knowledge, contents and procedures departing from rithms are required to solve successfully different com-
nature. Thus, algorithms like Particle Swarm Optimization plex optimization problems like multimodal [15], hybrid
(PSO) [1], Genetic Algorithm (GA) [2] or Ant Colony Op- or multiobjective problems [16], among others.
timization (ACO) [3] among others, have been widely applied • BSO applications. There is a lack of BSO applications to
in operational research. real world problems, although there are many applications
During the last ten years, there has been a change in the source in fields like wireless sensor networks [17], multiple UAV
of inspiration to build NIA algorithms. Nowadays there is a formation flights [18], stock index forecasting [19] and
trend which tries to model the behaviour of humans in problem economic dispatch [20].
solving. Along this line, a new kind of NIA algorithms has
appeared which is called Human-Inspired Algorithms (HIA). III. B RAIN S TORM O PTIMIZATION A LGORITHMS
There are currently six HIA algorithms which are the follow-
Brain Storm Optimization (BSO) algorithm is a human-
ing: Seeker Optimization Algorithm (SOA) [4], Imperialist
inspired algorithm which was born in 2011 and developed by
Competitive Algorithm (ICA) [5] , Social Emotional Opti-
Shi [9]. This NIA algorithm is inspired by the human brain-
mization Algorithm (SEOA) [6], Teaching Learning-Based
storming process. In it, a group of people or brainstorming
Optimization (TLBO) [7], Team Effectiveness Based Opti-
group proposes different ideas to solve a problem. Then, new
mization (TEBO) [8] and Brain Storm Optimization algorithm
ideas are generated from the existing ones in order to reach
(BSO) [9] which is the algorithm used in this paper.
the optimum idea. The brainstorming process ends when an
This paper has two targets: On the one hand, it tries to choose
optimum idea has been achieved.
good enough population sizes in Brain Storm Optimization
This way, brainstorming departs from a set of random ini-
Ricardo Garcı́a-Ródenas, Department of Mathematics at University of tial solutions. After initialization, new ideas are generated
Castilla la Mancha, Spain departing from the existing ones through convergence and
Luis Jiménez Linares, Department of Technology and Information Systems divergence operations. Convergence operation is focused on
of University of Castilla la Mancha, Spain
Julio Alberto López Gómez, Department of Technology and Information searching new solutions in a set of search areas where good
Systems at University of Castilla la Mancha, Spain. solutions are found. Formally, these areas corresponds with
763
local minima in the objective function. To carry out conver- Algorithm 1 Advanced Discussion Mechanism based on BSO
gence operation, cluster analysis techniques have been widely algorithm
applied, using mainly the k−means algorithm. Moreover, 1: P OPULATION I NITIALIZATION : Initialize n random solu-
divergence operation is in charge of building new solutions. In tions in population pop.
brainstorming, new solutions can be generated departing from 2: while Termination Condition is not satisfied do
one or more existing solutions. For simplicity, BSO algorithm 3: Pintra = Plow + Phigh NNmax cur gen
gen
considers only two possibilities: generating a new solution 4: Pinter = 1 − Pintra
departing from one existing solution or two. The first option 5: /* Update ǫ */ max
iter −n
corresponds with local search in an optimization algorithm and 6: ǫ(t) = logsig 2 iter
∗ random(t)
k
the second is related to exploration. The kind of generation 7: P OPULATION E VOLUTION : Generate n new ideas de-
will be made using a set of probabilities. After BSO, different parting from the current population
variants of the algorithm have appeared with the purpose of 8: BEGIN Converging Operation
improving BSO capabilities and guaranteeing a good tradeoff 9: Group pop in m clusters
between exploration and exploitation. In this paper, Advanced 10: END Converging Operation
Discussion Mechanism based on Brain Storm Optimization 11: for i = 1 to card(pop) do
Algoritm (ADMBSO) [11] is used instead of the original 12: BEGIN Diverging Operation
BSO. ADMBSO has been used since it is the most recent 13: if rand() < Pintra then
and standard version of BSO algorithm. In it, exploration 14: /* Generate individuals from one cluster*/
is encouraged in the first iterations and exploitation in the 15: if rand() < pceni then
last iterations. Moreover, ADMBSO adds different rules to 16: /* Add noise to center of the cluster */
generate new ideas in each epoch in intra and inter cluster 17: cinew = ciold + ǫ(t) ∗ random(t)
generation. On the one hand, inter cluster generation will 18: else if rand() < pindi then
be possible in this algorithm building a new idea from two 19: /*Combine two ideas from this cluster and add
ideas in the same cluster. Briefly, this algorithm is shown in noise */
Algorithm 1. 20: Select xold1 and xold2
21: xinew = (xiold1 − xiold2 ) ∗ random(t)
22: else
IV. E XPERIMENTS 23: /*Add noise to a random idea*/
In this section, the two experiments carried out to choose 24: xinew = xiold + ǫ(t) ∗ random(t)
good enough population sizes in Advanced BSO algorithm 25: end if
(ADMBSO) are described in detail. 26: else
27: /*Generate individuals from two clusters*/
A. Experiment 1: Choosing population size in BSO 28: if rand() < pcenii then
29: /*Select two centroids cold1 , cold2 , combine
The problem of choosing a good enough population size for
them and add noise/*
a NIA algorithm is difficult to address. The reason is because
30: xiold = w1 ∗ ciold1 + w2 ∗ ciold2
it is generally problem-dependent and in general, the settings
31: xinew = (ciold1 − ciold2 ) ∗ random(t)
of one algorithmic parameter could be related to the settings
32: else if rand() < pindii then
of other algorithmic parameters, in terms of optimization
33: /*Generate randomly an idea depart from two
performance. Besides, it depends on the particular version of
individuals of two clusters/*
BSO used, the dimensionality problem and the complexity of
34: Select xold1 and xold2
the search space. That is why, in this experiment, different
35: xiold = w1 ∗ xiold1 + w2 ∗ xiold2
population sizes widely applied in other algorithms have been
36: xinew = (xiold1 − xiold2 ) ∗ random(t)
tested over ADMBSO algorithm and over a set of concrete
37: else
benchmark functions, in this case, hybrid functions from IEEE
38: /* Generate randomly a new idea */
CEC conference competition.
39: end if
In order to recommend good population sizes for BSO algo-
40: end if
rithms, the definition of robustness analysis proposed in [21]
41: END Diverging Operation
is taken. According to that, an optimization algorithm is robust
42: R EPLACE M ECHANISM : If the new solution built is
if inequality
better than the current one, substitute it, otherwise,
|f (x∗alg ) − f (x∗ )| < ǫrel · |f (x∗ )| + ǫabs (1) maintain the current solution
43: /* Update Solution */
holds, where x∗alg is the best value reached by the algorithm, 44: if f (xnew ) < f (xold ) then
x∗ is a global minimum of the objective function f (it is 45: xold = xnew
assumed, given) and ǫrel , ǫabs are two parameters which 46: end if
control the accuracy of the algorithm. 47: end for
Thus, different population sizes can be proposed and tested 48: end while
with different values of ǫabs in order to detect if different
764
population sizes are capable of reaching determined levels

of accuracy. Moreover, the convergence speeds of the same
algorithm with different population sizes can also be compared
using the expression proposed in [21] and shown in equation
2:
N F Epop1
s= (2)
N F Epop2
where s is the convergence speed ratio, N F Epop1 is the
number of functions evaluations which the algorithm with
the population size pop1 needs to satisfy inequality (1) and
N F Epop2 is the same using pop2. To do that, three ǫabs
values have been proposed in order to test the performance
and robustness of different population sizes while ǫrel Fig. 1. Temporal Cost for different population sizes
has been fixed to 10e−4 like in [21]. These values are
ǫabs1 = 10e−1 , ǫabs2 = 10e−3 , ǫabs3 = 10e−5
Moreover, four population sizes have been tried in this convergence speed of different population sizes in comparison
experiment. Firstly, one hundred ideas has been taken as with the population of one hundred individuals (used in [11]
a reference value, since it is used in most of the articles and considered as reference). Note that problems 3 and 4
published in BSO and cited here. After that, and following do not appear in this table because they did not achieve any
the fact that lower values are efficient in other metaheuristics robustness threshold. In this manner, when s values are less
like in PSO, other population sizes have been proposed. Thus, than 1, it means that the proposed configuration is better
pop25 has twenty five ideas or individuals, pop50 has fifty than pop100 taken as reference. If it is greater than 1, the
ideas, pop75 has seventy five individuals and pop100 has one performance of pop100 is better. The best rates are typed in
hundred ideas. The sample of benchmark functions consists bold. It is possible to conclude that all the sizes tested in
of eight objective functions with thirty dimensions taken from this paper are better than p100 used in the most of articles
IEEE CEC conference competitions. They are well-known published about BSO.
optimization problems. In this paper, we have focused on
hybrid functions, which are the most complex benchmarks
TABLE II
in CEC competition. They are the following: rotated hybrid A NALYSIS OF CONVERGENCE SPEED IN ADMBSO ALGORITHM
composition function 1, rotated hybrid composition function
1 with noise in fitness, rotated hybrid composition 2, rotated s1 s2 s3
P1 25 0,86 - -
hybrid composition 2 with a narrow basin for the global P1 50 0,90 - -
optimum, rotated hybrid composition 3, rotated hybrid P1 75 0,93 - -
composition 3 with high condition number matrix, rotated P2 25 - - -
P2 50 0,96 - -
hybrid composition function 4 and rotated hybrid composition P2 75 0,98 - -
function 4 without bounds. These problems are named as P5 25 0,56 - -
P1,P2,...,P8. P5 50 0,75 - -
P5 75 0,99 - -
Then, ADMBSO algorithm has been executed for each
P6 25 0,59 - -
population size using the parameters employed in [11]. The P6 50 1,04 - -
configuration is the following: m = 5, Pcen = 0.7, Pind = P6 75 0,77 - -
0.2, Prnd = 0.1, Pcens = 0.7, Plow = 0.2, Phigh = 0.7. P7 25 0,72 0,95
P7 50 0,82 1,01 1,01
The total number of function evaluations computed in each P7 75 1,09 0,89 0,90
execution is 100000. Ten trials have been run for each P8 25 1,05 1,19 1,17
population size in order to minimize the random effect in the P8 50 0,92 0,64 0,63
P8 75 1,01 0,96 0,94
experiment.
Average values of mean, maximum, minimum, variance and
standard deviation have been obtained for each population B. Experiment 2: Population sampling in BSO
size. The total time spent in all executions is reported too. One solution to improve the quality of population could be
These results are shown in table I. The minimum values for to choose a sample of the population in the search process.
each measure are typed in bold. Thus, it is possible to see It would imply a better initial population but include the
that pop25 needs less time than the rest of populations to problematic of choosing a good sample which combines
achieve its results and it is the population which reaches the good fitness values in the individuals chosen and good ideas
minimum values regarding the rest of population sizes in diversity. Besides, the sampling process adds computational
more test functions. Moreover, figure 1 shows the temporal cost to the algorithm.
cost of each population size for each problem. This way, it is To do that, a multinomial probability distribution can be
possible to see that pop25 provides the best results regarding established according to the fitness values. This way, it will
quality of solution and temporal cost. determine the probability of choosing an individual in the po-
Furthermore, regarding robustness analysis, table II shows the pulation according the fitness values of the whole population.
765
TABLE I
ADMBSO STATISTICAL RESULTS FOR H YBRID CEC BENCHMARK FUNCTIONS
Mean Best Worst Variance Std Time

P1 25 2,93E+02 2,08E+02 1,55E+03 1,79E+04 1,33E+02 1,82E+05
P1 50 2,96E+02 2,21E+02 1,10E+03 1,28E+04 1,13E+02 2,44E+05
P1 75 3,57E+02 1,66E+02 1,06E+03 3,86E+04 1,96E+02 3,68E+05
P1 100 3,38E+02 2,21E+02 1,123E+03 1,54E+04 1,24E+02 7,50E+05
P2 25 3,94E+02 2,81E+02 1,54E+03 3,87E+04 1,96E+02 1,84E+05
P2 50 3,74E+02 2,40E+02 1,21E+03 3,68E+04 1,91E+02 2,46E+05
P2 75 3,76E+02 2,38E+02 1,54E+03 2,93E+04 1,71E+02 3,72E+05
P2 100 3,58E+02 2,21E+02 1,39E+03 2,68E+04 1,64E+02 7,59E+05
P3 25 9,01E+02 9,00E+02 1,45E+03 3,17E+02 1,7E+01 1,84E+05
P3 50 9,00E+02 9,00E+02 1,02E+03 5,70E+01 7,59E+00 2,46E+05
P3 75 8,74E+02 8,57E+02 1,41E+03 1,98E+03 4,45E+01 3,93E+05
P3 100 8,68E+02 8,53E+02 9,06E+02 3,21E+01 1,79E+01 8,17E+05
P4 25 9,00E+02 9,00E+02 9,18E+02 5,39E+00 2,32E+00 1,84E+05
P4 50 8,78E+02 8,66E+02 1,17E+03 2,73E+02 1,65E+01 2,46E+05
P4 75 8,63E+02 8,47E+02 1,39E+03 2,39E+02 4,89E+01 3,74E+05
P4 100 8,82E+02 8,66E+02 1,43E+03 8,33E+02 2,88E+01 7,63E+05
P5 25 7,11E+02 5,15E+02 1,48E+03 7,75E+ 04 2,78E+02 2,33E+05
P5 50 7,43E+02 5,03E+02 1,54E+03 8,17E+04 2,85E+02 3,12E+05
P5 75 8,91E+02 5,99E+02 1,44E+03 8,48E+04 2,91E+02 4,70E+05
P5 100 7,93E+02 5,33E+02 1,48E+03 6,72E+04 2,59E+02 8,99E+05
P6 25 6,64E+02 5,38E+02 2,48E+03 6,65E+04 2,57E+02 2,29E+05
P6 50 8,14E+02 6,69E+02 2,08E+03 5,42E+04 2,32E+02 3.07E+05
P6 75 7,54E+02 5,83E+02 1,91E+03 6,97E+04 2,64E+02 4,60E+05
P6 100 7,93E+02 6,07E+02 1,87E+03 6,90E+04 2,62E+02 9,42E+05
P7 25 4,20E+02 2,29E+02 1,57E+03 1,37E+05 3,70E+02 1,97E+05
P7 50 4,52E+02 2,40E+02 1,53E+03 1,57E+05 3,96E+02 2,64E+05
P7 75 5,25E+02 2,39E+02 1,52E+03 1,97E+05 4,44E+02 3,99E+05
P7 100 4,90E+02 2,39E+02 1,52E+03 1,72E+05 4,15E+02 8,17E+05
P8 25 4,12E+02 2,31E+02 1,65E+03 1,22E+05 3,49E+02 1,98E+05
P8 50 4,03E+02 2,30E+02 1,48E+02 1,31E+05 3,62E+02 2,66E+05
P8 75 4,17E+02 2,37E+02 1,51E+03 1,15E+05 3,40E+02 4,00E+05
P8 100 4,35E+02 2,44E+02 1,525E+03 1,28E+05 3,58E+02 8,15E+05
Thus, the probability of choosing an individual i is computed the population sizes made in experiment 1 in comparison with
through equation. the temporal cost of population sampling.
1
f (i)
P (i) = Pn 1 (3)
j=1 f (j) +ǫ
where n is the population size, f (i) is the fitness value for

individual i and ǫ is a value near to zero to avoid to divide
between 0. In previous experiment pop25 has been chosen as
the best option in terms of population size. Now, ADMBSO
algorithm has been executed using a population of one hundred
individuals, but in this case, only twenty five individuals are
selected to execute the algorithm. The selection mechanism is
based on the multinomial probability distribution.
Now, ADMBSO algorithm with a sampled population of
twenty five individuals have been executed under the same
conditions as Experiment 1. Mean values of mean, minimum, Fig. 2. Temporal Cost with original population sizes and sampling
maximum, variance and standard deviation as well as total
Regarding robustness analysis, table IV shows the conver-
time (in seconds) have been computed. These results are shown
gence speed (s) of sampling population with respect to pop100
in table III. The results which improve the original results of
which was considered as reference. Once again, values which
pop25 are typed in bold.
are equals or better than pop25 convergence speeds are typed
With regard to the results, it can be noted this way of
in bold. The results show that sampling population increase
sampling population improves the original results of pop25 .
the convergence speed of the algorithm in comparison with
Concretely, the major improvements are made in the last two
the original version.
problems which corresponds with the most difficult in CEC
competitions (where pop25 did not improve the results of the
rest of population sizes) and it is now the best configuration. V. C ONCLUSIONS AND FURTHER WORKS
Furthermore, it can be seen that the time is not improved in In this article the problem of choosing good enough popu-
this case. To show that, figure 2 shows the temporal cost of lation sizes in BSO algorithms, has been carried out. To do
766
TABLE III
S TATISTICAL RESULST OF POPULATION SAMPLING
Mean Best Worst Variance Std Time

P1 25 Sam 2,91E+02 2,27E+02 9,11E+02 1,42E+04 1,19E+02 9,49E+05
P2 25 Sam 3,63E+02 2,81E+02 1,12E+02 1,46E+04 1,20E+02 9,68E+05
P3 25 Sam 9,00E+02 9,00E+02 1,29E+03 2,44E+02 1,56E+01 9,97E+05
P4 25 Sam 9,00E+02 9,00E+02 9,84E+01 7,51E+00 2,74E+00 1,29E+06
P5 25 Sam 7,14E+02 5,28E+02 1,56E+02 7,897E+04 2,81E+02 1,14E+06
P6 25 Sam 8,17E+02 6,78E+02 1,76E+03 4,51E+02 2,12E+02 1,21E+06
P7 25 Sam 3,76E+02 2,26E+01 1,64E+03 9,26E+04 3,04E+02 1,07E+06
P8 25 Sam 3,82E+02 2,63E+01 1,604E+02 9,84E+04 3,13E+02 1,24E+05
TABLE IV [3] M. Dorigo, V. Maniezzo, and A. Colorni, “The ant system: Optimiza-
C ONVERGENCE S PEED OF SAMPLING POPULATION tion by a colony of cooperating agents,” IEEE TRANSACTIONS ON
SYSTEMS, MAN, AND CYBERNETICS-PART B, vol. 26, no. 1, pp. 29–
s1 s2 s3 41, 1996.
P1 Sam 0,55 0,88 0,86 [4] C. Dai, Y. Zhu, and W. Chen, “Seeker optimization algorithm,” in
P2 Sam 0 - - Computational Intelligence and Security, Y. Wang, Y.-m. Cheung, and
P3 Sam 0,87 - - H. Liu, Eds. Berlin, Heidelberg: Springer Berlin Heidelberg, 2007, pp.
P4 Sam - - - 167–176.
P7 Sam 0,53 - - [5] E. Atashpaz-Gargari and C. Lucas, “Imperialist competitive algorithm:
P8 Sam 0,95 - - An algorithm for optimization inspired by imperialistic competition,”
P9 Sam 0,70 0,66 0,66 2007 IEEE Congress on Evolutionary Computation, pp. 4661–4667,
P10 Sam 0,85 0,66 0,65 2007.
[6] Z. Cui, Z. Shi, and J. Zeng, “Using social emotional optimization
algorithm to direct orbits of chaotic systems,” in Swarm, Evolutionary,
that, different population sizes have been defined in order to and Memetic Computing, B. K. Panigrahi, S. Das, P. N. Suganthan, and
S. S. Dash, Eds. Berlin, Heidelberg: Springer Berlin Heidelberg, 2010,
study the solutions achieved and the time spent for each size. pp. 389–395.
After that, the best population size has been chosen and an [7] R. Rao, V. Savsani, and D. Vakharia, “Teaching–learning-based opti-
strategy of sampling population has been carried out in order mization: A novel method for constrained mechanical design optimiza-
tion problems,” Computer-Aided Design, vol. 43, no. 3, pp. 303 – 315,
to study if this strategy improves the results of the original 2011.
algorithm. The main conclusions reached are the following: [8] X. Feng, M. Ji, Z. Li, X. Qu, and B. Liu, “Team effectiveness based
optimization,” in 2017 IEEE Congress on Evolutionary Computation
• Despite the fact that one hundred individuals have been
(CEC), June 2017, pp. 2248–2257.
widely used in the majority of articles published about [9] Y. Shi, “Brain storm optimization algorithm,” in Advances in Swarm
BSO algorithms, it has been demonstrated that less in- Intelligence, Y. Tan, Y. Shi, Y. Chai, and G. Wang, Eds. Berlin,
dividuals guarantee better results in terms of quality of Heidelberg: Springer Berlin Heidelberg, 2011, pp. 303–309.
[10] D. Zhou, Y. Shi, and S. Cheng, “Brain storm optimization algorithm with
solution in hybrid functions. modified step-size and individual generation,” in Advances in Swarm
• Sampling population is a good solution to enhance the Intelligence, Y. Tan, Y. Shi, and Z. Ji, Eds. Berlin, Heidelberg: Springer
results of the original algorithm in terms of solutions Berlin Heidelberg, 2012, pp. 243–252.
[11] Y. Yang, Y. Shi, and S. Xia, “Advanced discussion mechanism-based
achieved in the case of hybrid functions. brain storm optimization algorithm,” vol. 19, 10 2015.
• Sampling population strategy speeds up the convergence [12] J. Chen, Y. Xie, and J. Ni, “Brain storm optimization model based
speed of ADMBSO algorithm when it is applied over on uncertainty information,” in 2014 Tenth International Conference on
Computational Intelligence and Security, Nov 2014, pp. 99–103.
hybrid functions.
[13] Z. Zhan, W. Chen, Y. Lin, Y. Gong, Y. Li, and J. Zhang, “Parameter
As future works, these experiments can be applied over investigation in brain storm optimization,” in 2013 IEEE Symposium on
different benchmark functions and new sampling strategies Swarm Intelligence (SIS), April 2013, pp. 103–110.
[14] R. Garcı́a-Ródenas, L. J. Linares, and J. A. López-Gómez, “A cooper-
can be studied in order to reduce the temporal cost of the ative brain storm optimization algorithm,” in 2017 IEEE Congress on
algorithm, as well as speeding up NIA algorithms through Evolutionary Computation (CEC), June 2017, pp. 838–845.
local search procedures in order to guarantee better robustness [15] X. Guo, Y. Wu, and L. Xie, “Modified brain storm optimization algo-
rithm for multimodal optimization,” in Advances in Swarm Intelligence,
thresholds. Y. Tan, Y. Shi, and C. A. C. Coello, Eds. Cham: Springer International
Publishing, 2014, pp. 340–351.
ACKNOWLEDGMENT [16] X. Guo, Y. Wu, L. Xie, S. Cheng, and J. Xin, “An adaptive brain
storm optimization algorithm for multiobjective optimization problems,”
This research was supported by Ministerio de Economı́a, in Advances in Swarm and Computational Intelligence, Y. Tan, Y. Shi,
Industria y Competitividad-FEDER EU grants with number F. Buarque, A. Gelbukh, S. Das, and A. Engelbrecht, Eds. Cham:
Springer International Publishing, 2015, pp. 365–372.
TRA2016-76914-C3-2-P [17] R. Ramadan and A. Khedr, “Brain storming algorithm for coverage and
connectivity problem in wireless sensor network,” 04 2016.
R EFERENCES [18] H. Qiu, H. Duan, and Y. Shi, “A decoupling receding horizon search
approach to agent routing and optical sensor tasking based on brain
[1] Y. Shi and R. C. Eberhart, “A Modified Particle Swarm Optimizer,” storm optimization,” Optik - International Journal for Light and Electron
in Proceedings of IEEE International Conference on Evolutionary Optics, vol. 126, no. 7, pp. 690 – 696, 2015.
Computation. IEEE Computer Society, May 1998, pp. 69–73. [19] J. Wang, R. Hou, C. Wang, and L. Shen, “Improved v -support vector
[2] D. E. Goldberg, Genetic Algorithms in Search, Optimization and Ma- regression model based on variable selection and brain storm optimiza-
chine Learning, 1st ed. Boston, MA, USA: Addison-Wesley Longman tion for stock price forecasting,” Applied Soft Computing, vol. 49, pp.
Publishing Co., Inc., 1989. 164 – 178, 2016.
767
[20] K. R. Ramanand, K. R. Krishnanand, B. K. Panigrahi, and M. K.

Mallick, “Brain storming incorporated teaching–learning–based algo-
rithm with application to electric power dispatch,” in Swarm, Evolution-
ary, and Memetic Computing, B. K. Panigrahi, S. Das, P. N. Suganthan,
and P. K. Nanda, Eds. Berlin, Heidelberg: Springer Berlin Heidelberg,
2012, pp. 476–483.
[21] F. Kang, J. Li, and Z. Ma, “Rosenbrock artificial bee colony algorithm
for accurate global optimization of numerical functions,” Information
Sciences, vol. 181, no. 16, pp. 3508 – 3531, 2011.
768
Distance-based Exponential Probability Models for

Constrained Combinatorial Problems*
Josu Ceberio, Alexander Mendiburu Jose A. Lozano

University of the Basque Country UPV/EHU University of the Basque Country UPV/EHU
Donostia, Spain Basque Center for Applied Mathematics (BCAM)
[email protected] Bilbao, Spain
Abstract—Estimation of Distribution Algorithms (EDAs) have

already demonstrated their utility when solving a broad range of
combinatorial problems. However, there is still room for method-
ological improvement when approaching problems with con-
straints. The great majority of works in the literature implement
repairing or penalty schemes, or use ad-hoc sampling methods in
order to guarantee the feasibility of solutions. In any of the pre-
vious cases, the behavior of the EDA is somehow denaturalized,
since the sampled set does not follow the probability distribution
estimated at that step. In this work, we present a general method
to approach constrained combinatorial optimization problems
by means of EDAs. This consists of developing distance-based
exponential probability models defined exclusively on the set of
feasible solutions. In order to illustrate this procedure, we take
the 2-partition balanced Graph Partitioning Problem as a case
of study, and design efficient learning and sampling methods to
use distance-based exponential probability models in EDAs.
Index Terms—Constraint, estimation of distribution algorithm,
distance-based exponential model, Graph Partitioning Problem
769

XIII Congreso Español de Metaheuristicas

Uploaded by

Copyright:

Available Formats

XIII Congreso Español de Metaheuristicas

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

XIII Congreso Español de Metaheuristicas

Uploaded by

Copyright:

Available Formats

XIII Congreso Español

Evolving Geographically-embedded Complex

electrical cables in the power grid or trophic relationships in

consists of mutating an element of a coral with another

20 15 V. E XPERIMENTS AND R ESULTS

differences of individuals. Perturbations are introduced by 150

parameter on a random basis, where x′ corresponds to 50 50

the output larva, xt are the considered parents (chosen

uniformly among the population), and F determines the -50 -100

evolution factor weighting the perturbation amplitude. -100

• Harmony Search-based operator (HS): Harmony -200

improvisation of a music orchestra while its composing a (a) (b)

just 500 generations, showing a fast and robust behaviour in 50 10

(a) (b) 15 0.3

25 0.6 (c) (d)

Fig. 5. Example of geographically-embedded complex network with N =

-50 -50 “Catastrophic cascade of failures in interdependent networks,” Nature,

Metaheurı́sticas para calibración de modelos

Emails: [email protected], [email protected], [email protected], [email protected]

( cedimiento de búsqueda local implementa una estrategia tipo

IV. E XPERIMENTACI ÓN

Figura 2: Comparación entre la salida del modelo calibrado y

(a) Dataset 1 (b) Dataset 2

(c) Dataset 3 (d) Dataset 4

(a) Dataset 1 (b) Dataset 2

(c) Dataset 3 (d) Dataset 4

An empirical validation of a new memetic CRO

Antonio M. Durán-Rosal Pedro A. Gutiérrez

Sancho Salcedo-Sanz César Hervás-Martı́nez

Abstract—The exponential increase of available temporal data

Modelling Mandible Articulation for Skull-Face

I. I NTRODUCTION by relatives, the missing person usually appears in relaxed

in real identification scenarios. The availability of new AM

Propuestas de mejora para la evaluación del

I. R ESUMEN diferentes variaciones de los algoritmos evolutivos

IV-B. Sobre los artistas. Este tipo de competiciones, permiten avanzar en

New York, y cuyas obras finalistas serı́an expuestas AGRADECIMIENTOS

An Evolutionary Approach to Metroidvania

rules and, finally, levels in agreement with those mechanics

(a) (b) (c) (d)

• Characters: these are agents controlled by the computer

behaviors are defined by game mechanics.

Refgood Refbad Evolved Refgood Refbad Refgood Refbad Evolved

(a) (b) (c)

Once this is done for each pair of solutions, the resulting

(a) (b) (c)

GRASP with Path Relinking for the Constrained

I. I NTRODUCTION II. M ATHEMATICAL P ROGRAMING M ODEL

The goal in the Incremental Graph Drawing Problem

xtij + xtji =1, ∀ i, j ∈ V t : 1 ≤ i < j ≤ mt (1)

These preliminary experimentation is devoted to fine tune

This section describes the experimental analysis to study the TABLE I

results as CPLEX with lower CPU time. Note that GRASP +

Detección de puntos débiles en redes utilizando

En este trabajo se considerará únicamente la variante First

[2] P. Crucitti, V. Latora, and M. Marchiori, “Model for cascading failures

Where facility centers should be located?

A.G. Hernández-Dı́az M. Laguna

II. L OCATION P ROBLEM D EFINITION

dij ≥ 0 be the distance between a candidate location i ∈ I and