Proceedings EAMC2023
Proceedings EAMC2023
14 a 17 de fevereiro de 2023.
Proceedings do evento
XVI Encontro Acadêmico de Modelagem Computacional
Laboratório Nacional de Computação Cientíca - LNCC/MCTI
14 a 17 de fevereiro de 2023. Petrópolis - RJ.
Comitê Organizador
Ana Luiza Martins Karl - LNCC Mateus da Silva Melo - UFF
Douglas Terra Machado - UFRJ Matheus Müller Pereira da Silva - LNCC
Lucas Menezes Silva - LNCC Victor de Paula Dornellas Ribeiro - LNCC
Luis Alonso Mansilla Alvarez - LNCC
Comitê Cientíco
Caio César Graciani Rodrigues - SSM Napoli Lucas dos Anjos - USP
Claudio Daniel Tenório de Barros - LNCC Lucas dos Santos Fernandez - USP
Felipe Figueredo Rocha - EPFL Luis Alonso Mansilla Alvarez - LNCC
Gregório Kappaun Rocha - IFF Mariza Ferro - UFF
Guilherme Guilhermino Neto - IFES Otávio José Bernardes Burstolini - UFV
Gustavo Barbosa Libotte - UFRJ Pedro Carlos da Silva Lara - CEFET - RJ
Karina Baptista dos Santos - LNCC Wesley da Silva Pereira - CU Denver
Apoio
Laboratório Nacional de Computação Cientíca - LNCC
Ministério da Ciência, Tecnología e Inovação - MCTI
Fundação de Amparo à Pesquisa do Estado do Rio de Janeiro - FAPERJ
XVI Encontro Acadêmico de Modelagem Computacional
Laboratório Nacional de Computação Cientíca - LNCC/MCTI
14 a 17 de fevereiro de 2023. Petrópolis - RJ.
Criado em 2007, o EAMC tem como principal objetivo proporcionar um ambiente que
promova a divulgação cientíca, estimule a cooperação entre os prossionais da área, além
de fomentar a multidisciplinaridade na formação de novos prossionais. O EAMC abrange
diferentes áreas do conhecimento, tais como Computação Cientíca, Controle e Filtragem de
Sistemas Dinâmicos, Modelagem de Biossistemas e Bioinformática, Modelagem de Circulação e
Transporte, Modelagem de Equilíbrio e Otimização e, mais recentemente, Ciência de Dados e
áreas correlatas, como Inteligência Articial.
3
Trabalhos completos
Página
Algoritmo adaptativo para o cálculo numérico da derivada
Callebe R. Reis, Sandro D. P. Vitenti e Mariana Penna-Lima 6
Modelagem de jornadas de pacientes como um grafo multiaspecto
Caroline de Oliveira Costa Souza Rosa, Márcia Ito, Alex Borges Vieira, Klaus Wehmuth
e Antônio Tadeu Azevedo Gomes 15
Predição in silico de compostos bioativos contra SARS-COV-2
Elcio Ferreira Santana e Adriano Carlos Soares 27
Ataque Zumbi: a humanidade irá sobreviver?
Gabriel Vilela Sousa, Ulisses Ferreira Kaneko e Paulo Freitas Gomes 41
Estudo e Construção de Modelo Digital de Elevação (MDE) nas Regiões de
Habitat de Peixes Ameaçados de Extinção, no Noroeste Fluminense
Igor Martins Zanata, Vicente de Paulo Santos de Oliveira e Wagner Rambaldi Telles 53
Modelos epidemiológicos baseados em redes: Uma revisão preliminar de escopo
Jesuliana Nascimento Ulysses e Antônio Tadeu Azevedo Gomes 66
Multiscale Hybrid-Hybrid-Mixed Method
Franklin da Conceição de Barros, Alexandre Loureiro Madureira e Frédéric Gerard
Christian Valentin 78
Uso do Critério de Informação de Akaike para Estimativa das Ordens de
Trajetórias de Ratos Reais e Virtuais no Labirinto em Cruz Elevado
Leonardo Rocha de Freitas Dias, Renato Tinós e Ariadne de Andrade Costa 88
Modelagem da Dinâmica de uma Válvula Solenoide para Composição de Máquina
Virtual (MV) em Funções de Blowout Preventer (BOP)
Lucas Constantino Mendonça, Yasmin Nunes Alves, Luiz Antônio de Oliveira Chaves,
Iara Tammela, Rodolfo Cardoso e Danilo Colombo 100
Discrepância de Modelo: Estudo Inicial com Regressão por Processo Gaussiano
Lucas de Oliveira Sá, Leonardo Tavares Stutz e Daniel Alves Castello 112
Técnicas de Processamento de Linguagem Natural Para Detecção de Discurso
de Ódio
Cássia Claudiane Silva da Rosa e Renato Porrio Ishii 123
4
Consensus docking to ensemble-docking using multiple programs: exemple with
Drosophila melanogaster dopamine transporter.
Fabiani Fernanda Triches, Francieli Triches e Cilene Lino de Oliveira 125
A molecular dynamics approach to spermine and spermidine SI-PPCs interactions
with heparin and DNA
Frederico Henrique do C. Ferreira e Luiz Antônio S. Costa 126
Segmentação de pragas e doenças em folhas de café utilizando redes convolucionais
Humberto da Silva Neto, Shirley Peroni Neves Cani e Mariana Rampinelli Fernandes 127
A container-based environment for theparametric simulation of job schedulers
João Pedro Macleure Nunes dos Santos e Antônio Tadeu Azevedo Gomes 128
Serviços de Atualização no Gateway BioinfoPortal: Suporte ao Bancos de
dados de Proveniência
Marco Cabral, Marcelo Galheigo, Antônio Gomes e Kary Ocaña 130
Modelagem computacional de drenagem urbana: Estudo para sub-bacia do
Jandiá em Macapá-AP
Mauricio Dias Da Conceição Neto e Luana Oliveira de Sá 132
Identicação de transientes astrofísicos utilizando redes neurais convolucionais
Phelipe Darc e Clécio R. Bom 134
Uso de Modelagem Hidrológica visando a Mitigação dos Efeitos de Desastres
Naturais
Renata Nalim Basilio Tissi, Wagner Rambaldi Telles e Antônio Silva Neto 135
FLASH Radiotherapy RNA-Seq Data Mining
Samella Salles e Kary Ocaña 136
Um dispositivo de Biometria para a segurança residencial
Vicente Soares e Aline Lunkes 137
Human Skin Color Diversity with CUDAMCML
Victor Porto Gontijo de Lima e Lilian Tan Moriyama 138
5
Trabalhos completos
6
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
Métodos de derivação numérica são aplicados nos mais variados campos de conhecimento. Entre-
tanto, apesar da grande versatilidade do cálculo numérico da derivada, há sempre um erro numérico
associado a cada algoritmo. Muitas vezes, este erro é difı́cil de ser mitigado. Portanto, existe a demanda
por algoritmos mais precisos, e, ao mesmo tempo, mais eficientes para a avaliação de derivadas numeri-
camente. Neste trabalho, exploramos um método de derivação numérica cuja precisão é um parâmetro
do algoritmo. Para isto, utilizamos matrizes de Vandermonde para uma aproximação da derivada com
métodos de derivação numérica clássicos. Em particular, aplicamos o algoritmo para o método de de-
rivação numérica com diferenças finitas progressivas. Com o novo algoritmo, obtemos aproximações com
precisão arbitrária. Realizamos testes em uma máquina de precisão finita, onde conseguimos demonstrar
a precisão do algoritmo através da comparação com resultados analı́ticos, a menos da precisão da máquina
utilizada.
1 Introdução
A derivação numérica apresenta um dos grandes pilares da computação cientı́fica mo-
derna, visto que, muitos algoritmos dependem do cálculo da derivada, desde algoritmos
para resolução de equações diferenciais ao cálculo de matrizes de Fisher e problemas de
otimização. Portanto, é necessário que o cálculo da derivada seja realizado de forma
eficiente e precisa.
Resultados presentes na literatura propõem a utilização da matriz de Vandermonde
para o cálculo da derivada, em [9] um método é proposto utilizando a inversão da matriz
7
DERIVADA NUMÉRICA REIS et al.
f (x + h) − f (x)
f ′ (x) = lim . (1)
h→0 h
Apesar da grande utilidade e aplicação da definição de derivada, é comum que o cálculo
da derivada necessite de ser realizado várias vezes, e para diversas funções diferentes, man-
tendo uma precisão satisfatória para a resolução de um dado problema. Nesses casos, é
muito comum que a derivada necessite ser computada através de um computador. Entre-
tanto, no cálculo realizado por uma máquina de precisão finita, como por um computador,
a avaliação deste limite se torna problemática: como definir um limite que pode levar a
uma indeterminação em um máquina de precisão finita? E como maximizar a precisão
deste cálculo?
1 1
f (x + h) = f (x) + f ′ (x)h + f ′′ (x)h2 + f ′′′ (x)h3 + O(h4 ), (2)
2 6
onde a notação O(h4 ) representa a ordem da aproximação em relação ao parâmetro h,
quanto maior o expoente de O(hn ) melhor a aproximação.
Para obter a derivada através da expressão acima, isolamos o termo f ′ (x) que contém
a derivada da função. Somando −f (x) à equação (2) e dividindo por h de ambos os lados
da equação, obtemos a expressão abaixo:
f (x + h) − f (x) 1 1
= f ′ (x) + f ′′ (x)h + f ′′′ (x)h2 + O(h3 ), (3)
h 2 6
f (x + h) − f (x)
fh′ (x) := + O(h). (4)
h
A equação (4) descreve um método clássico de aproximação para a derivada conhecido
como Método de Diferenças Finitas à Direita (FDM Foward Derivative Method ) .
Note que, a expressão obtida não possui nenhum limite em sua descrição. Além disso,
considerando a parte O(h) como o erro na aproximação, a expressão acima torna explı́cito
como o erro depende de uma escolha para o parâmetro h, quanto menor o h, melhor é a
aproximação, conforme o que era esperado devido ao limite que aparece na equação (1).
8
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
O método FDM descrito na equação (4) é fácil de ser implementado e possui rápida
execução. No entanto, devido a precisão ser de ordem O(h), muitas vezes é necessário
um valor muito pequeno de h para se obter uma aproximação da derivada de forma
satisfatória, e em máquinas de precisão finita, a precisão do método pode ficar bastante
limitada devido ao erro de arredondamento da máquina.
Queremos escrever uma combinação linear de forma a zerar o termos das equações
(5) que envolvem termos de ordem O(h), obtendo assim, uma aproximação que depende
apenas de ordem O(h2 ). Para isto, multiplicamos a primeira equação por uma constante
a0 e a outra por uma outra constante a1 e somamos as duas:
′ ′ ′ 1 ′′ a0 a1
f (x) = a0 fh/g (x) + a1 fh/g (x) − f (x)h + + O(h2 ). (6)
0 1
2 g0 g1
′ ′
Gostarı́amos que a soma das duas aproximações a0 fh/g 0
(x)+a1 fh/g1
(x) fosse também uma
′
aproximação para f (x) e que essa fosse uma aproximação melhor para a derivada, ou seja,
que dependa de O(h2 ) ou ordens superiores.
Impondo estas restrições, observamos que precisamos que as equações a0 + a1 = 1 e
a0 /g0 + a1 /g1 = 0 sejam satisfeitas, para isto, montamos o sistema de equações (7).
a0 + a1 =1
a0 a1 (7)
+ =0
2g0 2g1
1 1
Resolvendo (8) para a0 e a a1 , obtemos a0 = e a1 = .
1 − g1 /g0 1 − g0 /g1
A matriz dos coeficientes em (8) é chamada matriz de Vandermonde de ordem 2 (veja
o apêndice A para mais detalhes sobre a matriz de Vandermonde).
9
DERIVADA NUMÉRICA REIS et al.
A solução (12) representa os coeficientes da combinação linear que aproxima uma derivada
de uma função num ponto com um erro de ordem O(hn ):
n−1
X
f ′ (x) = ′
ai fh/gi
(x) + O(hn ). (13)
i=0
Os valores para os coeficientes gi podem ser obtidos através de uma função arbitrária,
ou ainda, podem representar diferentes frequências de amostragem da função f , o que
faz com que a aplicabilidade do novo método para avaliação da derivada seja estendida a
casos onde não possuı́mos informações analı́ticas sobre a função f , apenas um conjunto
finito de pontos onde a função foi avaliada.
10
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
2 Algoritmo Adaptativo
Utilizando o método descrito na Seção 1.2, construı́mos um algoritmo para o cálculo da
derivada que leva em consideração o erro de arredondamento da máquina utilizada e o
erro gerado pela aproximação por termos finitos.
Devido à forma como as soluções para as matrizes de Vandermonde são dadas, é
possı́vel obter soluções para matrizes de ordem n + 1 através da solução de matrizes de
ordem n, sendo necessário apenas multiplicar em cada uma das n coordenadas um termo
da forma 1/(1−gn /gi ), onde i é a coordenada, e acrescentar uma (n+1)-ésima coordenada
com Πi̸=n 1/(1 − gi /gn ). Verificando a cada iteração do algoritmo, se o erro relativo está
abaixo de um dado limite, e se o erro de arredondamento da máquina não está desviando a
solução da convergência. O fluxograma presente na Fig. 1 ilustra o algoritmo de derivação
adaptativo. Vale ressaltar que a etapa “Repete 3x” é realizada para garantir que o valor
é de fato menor que o limiar imposto, ou seja, que o erro obtido no passo subsequente é
de fato menor que o anterior.
Este algoritmo está implementado na biblioteca Numerical Cosmology (NumCosmo) [2].
Além disso, implementamos também uma técnica mais robusta para controlar o erro pre-
sente na avaliação da derivada numérica. Essa técnica está sendo descrita pelos autores
em um segundo trabalho.
3 Resultados
Implementamos o algoritmo descrito na Seção 1.2.1 na linguagem de programação Python.
Utilizamos a precisão padrão da linguagem de 18 casas decimais, e como tolerância para
11
DERIVADA NUMÉRICA REIS et al.
√
Tabela 2: Derivadas para função f (x) = exp( x).
Observamos que utilizando o FMD com o menor passo possı́vel 10−8 (utilizando passos
menores o erro de arredondamento da máquina faz o resultado divergir, devido a presença
de exponenciais e potências na equação), obtemos um erro de ordem 2.10−11 , para √ a
derivada da função f (x) = exp (−x2 ) avaliada em x = 3. Para a função g(x) = exp ( x)
avaliada em x = 0.1, obtemos um erro de ordem 1.10−7 . Ambos os resultados são inferiores
aos obtidos utilizando o novo método com 8 iterações, passo inicial de 0.1 e um passo
mı́nimo de 0.1 2−8 . Vale ressaltar ainda que a cada nova iteração do novo método, são
necessárias apenas uma operação de avaliação de função, n multiplicações por escalares e
n somas, onde n é o número de iterações.
Observamos que a diferença entre o valor esperado, que foi calculado analiticamente,
e o valor obtido através do algoritmo decresceu conforme o esperado, ou seja, decresceu
como uma potência do valor do passo com o número de iterações.
4 Conclusão
O método apresentado neste projeto é capaz de melhorar a precisão do algoritmo de
diferenciação numérica por diferenças finitas, dentro da precisão numérica possı́vel em um
computador de memória finita, e, além disso, gerar resultados mais precisos que métodos
tradicionais utilizando passos maiores.
12
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
A Matriz de Vandermonde
A matriz quadrada da forma
1 1 1 ... 1
a1 a2 a3 ... an
a21 a22 a23 ... a2n
A= (14)
.. .. .. ... ..
. . . .
an−1
1 a2n−1 an−1
3 . . . ann−1
equivalentemente
1
Q
j̸=1 (1 − a1 /aj )
1
Q
(1 − a /a )
x = j̸=2 2 j . (17)
..
.
1
Q
j̸=n (1 − an /aj )
Esta solução pode ser facilmente encontrada fazendo uso da regra de Cramer, uma vez
que o determinante e os determinantes das matrizes adjuntas são dados pela expressão
(15).
13
DERIVADA NUMÉRICA REIS et al.
Uma propriedade bastante útil das matrizes de Vandermonde é que a solução de uma
matriz de ordem n é parcialmente a solução de uma matriz de Vandermonde de ordem
n + 1.
Referências
[1] Gerrnund Dahlquist, Ake Bjorck, and N Anderson. Numerical methods prentice-hall.
Inc., Englewood Cliffs, NJ, 1974.
[2] Sandro Dias Pinto Vitenti and Mariana Penna-Lima. NumCosmo: Numerical Cosmo-
logy. Astrophysics Source Code Library, record ascl:1408.013, August 2014.
[3] Roger A Horn, Roger A Horn, and Charles R Johnson. Topics in matrix analysis.
Cambridge university press, 1994.
[4] Donald E Knuth. The art of computer programming. volume 1: Fundamental algo-
rithms. volume 2: Seminumerical algorithms. Bull. Amer. Math. Soc, 1997.
[5] Jianping Li. General explicit difference formulas for numerical differentiation. Journal
of Computational and Applied Mathematics, 183(1):29–52, 2005.
[6] Elon Lages Lima. Análise real, volume 1. Impa Rio de Janeiro, 2004.
[7] JN Lyness and CB Moler. Van der monde systems and numerical differentiation.
Numerische Mathematik, 8(5):458–464, 1966.
[8] William H Press, Saul A Teukolsky, William T Vetterling, and Brian P Flannery.
Numerical recipes in c++. The art of scientific computing, 2:1002, 2007.
[9] Yijie Zhang, Jinghuai Gao, Jigen Peng, and Weimin Han. A robust method of com-
puting finite difference coefficients based on vandermonde matrix. Journal of Applied
Geophysics, 152:110–117, 2018.
14
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Resumo
A jornada do paciente é o registro dos atendimentos, intervenções e tratamentos a que o paciente foi
submetido ao longo de sua vida. O estudo das jornadas de um conjunto de pacientes traz informações
sobre a eficiência de abordagens terapêuticas, permite avaliar a aderência a elas e também revela o uso
de recursos (p.ex. unidades de saúde) para prover os atendimentos necessários. No entanto, modelos
de representação de jornadas são necessários para que estes tipos de análise sejam feitos. Diferentes
modelos são reportados na literatura, porém poucos se adéquam às caracterı́sticas de jornadas longas
ou que consideram diferentes perspectivas. Neste artigo, avalia-se a viabilidade de se utilizar um grafo
multiaspecto para expressar as jornadas de pacientes. Um estudo de caso com gestantes no municı́pio
de São Paulo indica que o modelo é adequado para representar visualmente as jornadas e é flexı́vel para
permitir diferentes tipos de análise da estrutura e distribuição da rede de saúde.
1 Introdução
O estudo do histórico de encontros de um conjunto de pacientes com o sistema de saúde
permite a realização de inferências sobre a evolução de doenças (Prodel et al., 2018), o
cumprimento de protocolos de tratamento (Rinner et al., 2018) e a eficiência de diferentes
unidades de saúde (Leonardi et al., 2018; Sato et al., 2020). Esta sequência de eventos
relacionados ao tratamento de saúde do paciente é chamada de trajetória ou jornada do
paciente.
Para o contexto deste estudo, uma atividade/intervenção é um tipo de episódio bem
definido na jornada de um paciente, como uma consulta ou um exame. Um evento cor-
responde à ocorrência de uma atividade/intervenção, para um paciente especı́fico em
15
MODELAGEM DE JORNADAS DE PACIENTES COMO UM GRAFO MULTIASPECTO ROSA et al.
16
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
2 Trabalhos Relacionados
A área de pesquisa que trata da modelagem e mineração de jornadas de pacientes é
relativamente nova e tem crescido sobretudo nos últimos anos (Rosa et al., 2022).
A representação de cada jornada como uma sequência de eventos (Antonelli et al., 2012;
Aspland et al., 2021; Egho et al., 2015) é uma alternativa frequente e direta. Contudo,
ela se restringe à apresentação de sucessões consecutivas entre os eventos ocorridos e, se
houver muitas jornadas distintas, a listagem delas será extensa, dificultado a interpretação
dos especialistas.
A adoção de um grafo direcionado como modelo de jornadas (Najjar et al., 2018) tende
a gerar uma representação mais concisa, já que ao invés de uma listagem de padrões, tem-
se uma representação unificada das jornadas. Entretanto, quando as jornadas possuem
repetição de atividades, o grafo resultante terá ciclos que podem dificultar a identificação
da ordenação temporal dos eventos seguidos. Como alternativa, alguns autores propõem
o uso de grafos direcionados acı́clicos (Chiudinelli et al., 2020), também conhecidos como
grafos tipo árvore, que permitem a existência de múltiplos vértices com mesmo rótulo de
forma a prevenir a formação de ciclos. Se por um lado este modelo favorece a leitura da
evolução temporal dos eventos das jornadas, por outro tem-se um modelo que pode se
tornar muito grande e difı́cil de interpretar, como no caso das sequências.
Alguns autores buscaram propor novos modelos combinando caracterı́sticas dos grafos
cı́clicos e acı́clicos. Duma e Aringhieri (2020), por exemplo, propõem o modelo “Hybrid
Activity Tree”, que é semelhante a um grafo acı́clico, mas cujos ramos infrequentes são
convertidos em grafos cı́clicos. Outro exemplo é o “Time Grid Process Model” proposto
por De Oliveira et al. (2020). Os autores utilizam camadas temporais que indicam em que
posição da jornada cada evento ocorreu e cada atividade pode aparecer uma vez em cada
camada. Desse modo, a ordenação dos eventos previne a formação de ciclos, enquanto
que a limitação de no máximo uma ocorrência de atividade por camada ajuda a limitar
o crescimento do modelo, favorecendo sua interpretação.
Outra alternativa para representar as jornadas de pacientes é o uso de álgebras de
processo que buscam revelar as dependências entre atividades das jornadas (Rebuge e Fer-
reira, 2012; Kempa-Liehr et al., 2020), como pontos em que há escolha de sub-caminhos
a serem seguidos, ocorrência de padrões paralelos e dependências em longo prazo entre
atividades. A expressividade desses modelos favorece sua aplicação para modelar jornadas
de pacientes com foco em identificação de protocolos clı́nicos ou processos organizacio-
nais. No entanto, sua utilização em estudos de caso com jornadas muito longas ou com
variabilidade alta resulta frequentemente em modelos complexos e difı́ceis de serem lidos
(modelos “spaghetti”) (Günther e van der Aalst, 2007).
Além da ordenação e dos intervalos temporais dos eventos, a conservação e apre-
sentação de diferentes perspectivas relacionadas a esses eventos pode ser relevante. Por
exemplo, no caso de internações hospitalares (Egho et al., 2015), um procedimento é
17
MODELAGEM DE JORNADAS DE PACIENTES COMO UM GRAFO MULTIASPECTO ROSA et al.
3 Metodologia
3.1 Seleção dos Dados
Os dados usados foram obtidos junto à Prefeitura Municipal de São Paulo (Jasmim et al.,
2017). Eles se referem ao Sistema Integrado de Gestão de Assistência à Saúde (SIGA-
SAÚDE) e contêm informações sobre agendamentos e atendimentos ambulatoriais presta-
dos pela Secretaria Municipal da Saúde de São Paulo durante os anos de 2014 e 2015. Este
intervalo correspondia, à época do acordo de cessão de dados, ao perı́odo mais recente
que pôde ser fornecido. Os dados revelam, por exemplo, a data em que um paciente se
submeteu a um procedimento ou recebeu um diagnóstico, em que unidade de saúde isso
ocorreu e qual a categoria (tipo) desta unidade. Este estudo foi aprovado pelo Comitê de
Ética em Pesquisa (CEP) da UNIFESP e da Secretaria Municipal de Saúde de São Paulo
sob CAAE 51038515.6.3001.0086.
Para este estudo decidiu-se analisar as jornadas de gestantes. Assim, da base de
dados original, extraiu-se apenas os atendimentos deste grupo de pacientes. Para isso,
listou-se códigos de diagnósticos2 e de procedimentos3 associados direta e exclusivamente
à gestação. Em seguida, obteve-se a listagem de pacientes com algum registro desses
procedimentos ou diagnósticos. Apenas pacientes cujas jornadas envolviam ao menos três
eventos foram consideradas.
No entanto, como algumas dessas pacientes podem ter iniciado sua gestação antes de
janeiro de 2014 (inı́cio do perı́odo da base de dados) ou terminado após dezembro de
2015 (fim do perı́odo da base de dados), foi adotada uma estratégia de seleção visando
pacientes com maior probabilidade de “gestação completa” contida no intervalo de tempo
disponı́vel. A Figura 1 apresenta um esquema visual da estratégia de filtragem adotada.
Foi considerado que uma gestação de 9 meses iniciada em janeiro de 2014 faria com que
a gestante tivesse atendimentos até outubro de 2014, logo, uma paciente cujo último
registro relacionado à gestação ocorreu antes de outubro, possivelmente engravidou antes
de janeiro de 2014, e portanto, parte da gestação não estaria incluı́da na base de dados.
Similarmente, uma gestante cujo parto ocorreu em dezembro de 2015 teria o inı́cio de
sua jornada gestacional por volta de março de 2015, portanto uma paciente cujo primeiro
registro gestacional que ocorreu após março pode ter finalizado sua gestação em 2016, ou
seja, fora do perı́odo coberto pela base de dados. Optou-se, então, por selecionar apenas
pacientes que tinham ao menos um registro relacionado à gestação entre outubro de 2014
e março de 2015.
Destaca-se que esta estratégia está sujeita a recusar algumas pacientes com todo o
perı́odo de gestação entre 2014 e 2015, como as que engravidaram antes de março de 2015
2
De acordo com a Classificação Internacional de Doença (CID-10)
3
De acordo com o Sistema de Gerenciamento da Tabela de Procedimentos, Medicamentos e OPM do
SUS (SIGTAP)
18
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Cada sequência de quadrados representa a jornada de uma paciente durante a gestação, em que cada quadrado
corresponde a um mês (foi considerado que cada paciente tem 9 meses de gestação). As jornadas em verde são as
mantidas para análise, enquanto as em vermelho são as descartadas. Os perı́odos assinalados com um ‘x’ são aqueles que
fazem parte da gestação da paciente, mas que não estão contemplados na base de dados.
mas só iniciaram o acompanhamento pré-natal após o segundo mês de gestação, ou as que
tiveram perı́odo gestacional inferior a 9 meses. Também é possı́vel que algumas gestações
não completamente cobertas no perı́odo entre 2014 e 2015 sejam consideradas, como as de
duração levemente maior do que nove meses, ou as de pacientes que engravidaram duas
vezes nesse perı́odo (uma gestação estaria completa na base, enquanto a outra não).
19
MODELAGEM DE JORNADAS DE PACIENTES COMO UM GRAFO MULTIASPECTO ROSA et al.
Isto é, entre um mesmo par de vértices, múltiplas arestas podem existir. No entanto, o
modelo pode ser facilmente convertido em um dı́grafo multiaspecto.4 Para isso, as arestas
passariam a ter como atributo uma lista de pares (paciente, intervalo).
Na área de ciência de redes, métricas de centralidade são usadas para medir a im-
portância dos vértices da rede (grafo). Uma dessas métricas é o grau, que indica quão
conectado um vértice é. No caso de redes direcionadas, tem-se o grau de entrada (in
degree) que indica o número de arestas que chegam até o vértice, e o grau de saı́da (out
degree) que mede quantas arestas partem dele.
Para o MAG proposto como modelo de jornadas de pacientes, quando a sua versão mul-
tigrafo é usada, o grau do vértice indicará quantos pacientes chegam/saem dele. Já quando
a versão dı́grafo é considerada, o grau mede quantos vértices diferentes enviam/recebem
arestas do vértice em questão. Outro ponto importante é que na versão multigrafo o grau
de chegada é igual ao grau de saı́da para todos os vértices, com exceção do vértice de inı́cio
e de fim de cada jornada. Isso ocorre pois cada aresta está associada a um único paci-
ente, e todos os pacientes iniciam sua jornada no vértice virtual “Inı́cio” e a terminam no
vértice virtual “Fim”; os pacientes “chegam” e “saem” de todos os eventos intermediários.
No caso do dı́grafo, os graus de chegada e de saı́da não são necessariamente iguais, pois
indicam quantos vértices distintos se conectam ao vértice em questão.
Além da flexibilidade de poder ser convertido em multigrafo ou dı́grafo dependendo
do objetivo buscado, o modelo proposto também pode ser subdeterminado para viabili-
zar diferentes tipos de análise. O processo de subdeterminação (Wehmuth et al., 2016)
consiste em converter o MAG original em uma versão baseada em um subconjunto de
seus aspectos. No caso das jornadas de pacientes, por exemplo, seria possı́vel desprezar os
atendimentos realizados e considerar apenas a evolução temporal de unidades visitadas.
Ao acompanhar o tratamento de pacientes e suas visitas a diferentes estabelecimentos
de saúde, identificar as unidades e os procedimentos mais utilizados pode amparar análises
e tomadas de decisão relacionadas com o serviço de saúde prestado. Torna-se possı́vel, por
exemplo, verificar se há predomı́nio de uma unidade especı́fica para algum procedimento.
4
Um dı́grafo é um grafo direcionado no qual cada par de vértice é ligado por no máximo uma aresta.
20
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Se houver, isso pode implicar que o não funcionamento daquela unidade para aquele
procedimento (p.ex. falha em um equipamento de exame) atingirá uma parcela maior de
pacientes, resultando no cancelamento da execução do procedimento, pois a realocação
não é imediata. O paciente pode ser ou não comunicado com antecedência e neste caso
terá que providenciar novo agendamento, dependendo do municı́pio que este paciente se
encontra. No SUS nem sempre a realocação de atendimento é feita de modo automático
por conta da complexidade que é fazer isto. Compreender a estrutura da rede nesse
sentido pode auxiliar a tomada de decisão na alocação de recursos, atuação preventiva e
até em ter unidades de saúde de retaguarda para procedimentos crı́ticos.
4 Resultados
A avaliação do modelo proposto se deu em três etapas. Na primeira, foram considerados os
três aspectos em conjunto; em seguida, o modelo foi subdeterminado e os aspectos Aten-
dimento e Unidade foram usados; por fim, avaliou-se o modelo no aspecto Unidade. As
análises foram feitas em python utilizando o módulo MAG desenvolvido por Mascarenhas
(2019) e o pacote NetworkX (Hagberg et al., 2008).
21
MODELAGEM DE JORNADAS DE PACIENTES COMO UM GRAFO MULTIASPECTO ROSA et al.
22
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
taram grau alto duas unidades provendo consultas pré-natais, o atendimento domiciliar
de uma UBS, e uma unidade que realiza ultrassonografias obstétricas.
Fig. 5: Vértices com maiores graus de chegada (in degree) no multigrafo multispecto,
subdeterminado para manter os aspectos Atendimento e Unidade.
23
MODELAGEM DE JORNADAS DE PACIENTES COMO UM GRAFO MULTIASPECTO ROSA et al.
Fig. 6: Diagrama de dispersão com o grau de chegada (in degree) e de saı́da (out degree) dos
vértices do dı́grafo multiaspecto obtido pela subdeterminação que mantém apenas o aspecto U .
o gestor possa investigar melhor estas ocorrências. Com este tipo de análise é possı́vel
encontrar as discrepâncias que necessitam de uma análise mais aprofundada.
5 Conclusões
O uso do MAG com os aspectos Atendimento, Unidade e Sequência para modelar jor-
nadas de gestantes foi avaliado tanto como modelo visual de representação das jornadas,
quanto como ferramenta para revelar a estrutura da rede de saúde que dá suporte a essas
pacientes.
Visualmente, o MAG foi capaz de apresentar jornadas com repetição de atividades
sem prejuı́zo na interpretação sequencial dos eventos ocorridos. Além disso, possibilitou
avaliar as jornadas não considerando apenas os procedimentos realizados, mas também
os tipos de unidade visitados. No entanto, a visualização se restringiu a um conjunto
pequeno de gestantes.
Ao adotar o recurso das subdeterminações, foi possı́vel identificar que uma pequena
parcela dos pares de atendimento e unidade de saúde são significativamente mais fre-
quentes que os demais. Dentre os pares de maior frequência, destacam-se procedimentos
e unidades relacionados à atenção especializada, aos atendimentos de urgência e à rea-
lização de exames.
Considerando outro tipo de subdeterminação, para manter apenas o aspecto Unidade,
foi possı́vel comparar os graus de chegada e de saı́da de diferentes unidades de saúde para
avaliar de/para quantos estabelecimentos distintos cada unidade recebe/envia pacientes.
Observou-se que, em geral, as unidades possuem graus de chegada e saı́da parecidos. Nas
próximas etapas da pesquisa, pretende-se investigar a causa da semelhança dos graus;
uma hipótese é que o alto compartilhamento de pacientes entre as unidades ocorre porque
há especialidades (profissionais de saúde) ou procedimentos que se complementam entre
as unidades (uma tem e a outra não tem) o que faz com que seja necessário esta troca.
Em se comprovando isto, o estudo de distribuição de recursos pode ser necessário para
verificar se é saudável este tipo de compartilhamento ou não.
O modelo de jornadas proposto neste trabalho mostrou a flexibilidade que o mo-
delo traz para analisar os dados de jornadas de pacientes sob diferentes perspectivas,
trabalhando-os de diferentes formas. Além disso, este estudo foi feito sem a necessidade
de utilizar registros clı́nicos de pacientes, que são dados de maior sensibilidade.
24
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
6 Agradecimentos
Agradecemos à CAPES, FAPERJ, CNPq, e ao INCT-MACC2 pelo apoio financeiro.
Referências
Antonelli, D., Baralis, E., Bruno, G., Chiusano, S., Mahoto, N. A., e Petrigni, C. (2012).
“Analysis of diagnostic pathways for colon cancer”. Flexible Services and Manufacturing
Journal, 24(4):379–399.
Aspland, E., Harper, P. R., Gartner, D., Webb, P., e Barrett-Lee, P. (2021). “Modified
Needleman–Wunsch algorithm for clinical pathway clustering”. Journal of Biomedical
Informatics, 115.
Chiudinelli, L., Dagliati, A., Tibollo, V., Albasini, S., Geifman, N., Peek, N., Holmes,
J. H., Corsi, F., Bellazzi, R., e Sacchi, L. (2020). “Mining post-surgical care processes
in breast cancer patients”. Artificial Intelligence in Medicine, 105.
De Oliveira, H., Augusto, V., Jouaneton, B., Lamarsalle, L., Prodel, M., e Xie, X. (2020).
“Optimal process mining of timed event logs”. Information Sciences, 528:58–78.
Duma, D. e Aringhieri, R. (2020). “An ad hoc process mining approach to discover
patient paths of an Emergency Department”. Flexible Services and Manufacturing
Journal, 32(1):6–34.
Egho, E., Raı̈ssi, C., Calders, T., Jay, N., e Napoli, A. (2015). “On measuring similarity
for sequences of itemsets”. Data Mining and Knowledge Discovery, 29(3):732–764.
Günther, C. W. e van der Aalst, W. M. P. (2007). “Fuzzy mining – adaptive process
simplification based on multi-perspective metrics”. In: Alonso, G., Dadam, P., e Ro-
semann, M., editors, Business Process Management, Springer Berlin Heidelberg, págs.
328–343.
Hagberg, A. A., Schult, D. A., e Swart, P. J. (2008). “Exploring network structure,
dynamics, and function using networkx”. In: Varoquaux, G., Vaught, T., e Millman,
J., editors, Proceedings of the 7th Python in Science Conference, págs. 11–15.
Jasmim, L., Ziviani, A., Ito, M., e Paiva, P. (2017). “Caracterização de atendimentos em
uma rede de atenção à saúde”. In: Anais do XVII Workshop de Informática Médica,
SBC, págs. 2044–2047.
25
MODELAGEM DE JORNADAS DE PACIENTES COMO UM GRAFO MULTIASPECTO ROSA et al.
Kempa-Liehr, A. W., Lin, C. Y. C., Britten, R., Armstrong, D., Wallace, J., Mordaunt,
D., e O’Sullivan, M. (2020). “Healthcare pathway discovery and probabilistic machine
learning”. International Journal of Medical Informatics, 137.
Leonardi, G., Striani, M., Quaglini, S., Cavallini, A., e Montani, S. (2018). “Levera-
ging semantic labels for multi-level abstraction in medical process mining and trace
comparison”. Journal of Biomedical Informatics, 83:10–24.
Mascarenhas, J. Z. G., Ziviani, A., Wehmuth, K., e Vieira, A. B. (2020). “On the
transaction dynamics of the Ethereum-based cryptocurrency”. Journal of Complex
Networks, 8(4). cnaa042.
Najjar, A., Reinharz, D., Girouard, C., e Gagné, C. (2018). “A two-step approach for
mining patient treatment pathways in administrative healthcare databases”. Artificial
Intelligence in Medicine, 87:34–48.
Prodel, M., Augusto, V., Jouaneton, B., Lamarsalle, L., e Xie, X. (2018). “Optimal
Process Mining for Large and Complex Event Logs”. IEEE Transactions on Automation
Science and Engineering, 15(3):1309–1325.
Rinner, C., Helm, E., Dunkl, R., Kittler, H., e Rinderle-Ma, S. (2018). “Process mining
and conformance checking of long running processes in the context of melanoma sur-
veillance”. International Journal of Environmental Research and Public Health, 15(12).
Rosa, C. d. O. C. S., Ito, M., Vieira, A. B., e Gomes, A. T. A. (2022). “Modelling and
mining of patient pathways: A scoping review”. arXiv.
Sato, D. M., Mantovani, L. K., Safanelli, J., Guesser, V., Nagel, V., Moro, C. H., Cabral,
N. L., Scalabrin, E. E., Moro, C., e Santos, E. A. (2020). “Ischemic stroke: Process pers-
pective, clinical and profile characteristics, and external factors”. Journal of Biomedical
Informatics, 111(1):103582.
Wehmuth, K., Costa, B., Bechara, J. V., e Ziviani, A. (2018). “A multilayer and time-
varying structural analysis of the brazilian air transportation network”. In: Ziviani,
A., Hara, C. S., Ogasawara, E. S., de Macêdo, J. A. F., e Valduriez, P., editors, Proce-
edings of the Latin America Data Science Workshop co-located with 44th International
Conference on Very Large Data Bases (VLDB 2018), Rio de Janeiro, Brazil, Aug 27,
2018, CEUR-WS.org, págs. 57–64.
Wehmuth, K., Fleury, É., e Ziviani, A. (2016). “On MultiAspect graphs”. Theoretical
Computer Science, 651:50–61.
26
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Científica, 14 a 17 de Fevereiro de 2023.
Resumo
A pandemia do novo coronavírus se mostrou contagiosa e letal na população humana nos
últimos anos, a variante ômicron ou B.1.1.529 demonstrou algumas mutações na proteína
spike (pico ou S), em seu domínio de ligação ao receptor na unidade S1 que apresentou
maior afinidade a Enzima Conversora de Angiotensina 2 (ECA2). Este estudo demonstrou
a análise de proteínas e ligantes presentes em seus domínios para serem extraídos e
analisados a partir do docking molecular para possível terapêutica, dentre as 22
proteínas, que apresentaram em seu domínio ligantes semelhantes ao da estrutura 7ZXU
(obtida no Protein Data Bank). Na análise do índice de instabilidade, ponto isoelétrico e
meia vida e Grand Average of Hydropathicity (GRAVY), no software suíço ProtParam
foram refinados 5 compostos e seus ligantes; pela acetilação refinados 2 compostos e
depois 1 deles apresentou ligante e sua estrutura foi validada e preparada. Seus ligantes
foram extraídos no banco de dados Protein Data Bank, os resultados do docking por
AutoDock demonstraram energia livre favorável aos aminoácidos e o DockThor mostrou
uma energia diferente justificada pelo grupo químico ligado. Os resultados mostraram
ligações aos aminoácidos inibidores o que sustentou a hipótese que um composto
molecular obtido a partir das proteínas pesquisadas (alinhadas a partir do composto “2-
acetamido-2-deoxy-beta-D-glucopyranose” da proteína 7JMP) (PDB DOI:
10.2210/pdb7JMP/pdb) pode ser um potencial inibidor da proteína spike.
27
1 INTRODUÇÃO
Com isso, a variante ômicron surgiu em 2021 como uma das mais preocupantes devido a
sua alta taxa de contaminação. Esse fator levou a ondas de casos confirmados no mundo;
em seu domínio de ligação ao receptor foi observado 15 mutações fundamentais para
infecção, essas mutações dificultam o tratamento e a produção de vacinas para o combate;
Alkhatib et al [2022]. Seu domínio de ligação ao receptor da proteína de membrana spike
(pico) pode ser representado por uma sequência de 202 aminoácidos que em uma de suas
pontas apresenta 25 aminoácidos responsáveis pela sua interação com a ECA2 para
realizar a infeção e os resíduos 452 e 486 também participam da interação como potentes
inibidores; Tuekprakhon et al [2022]; He et al [2021]. A ômicron infelizmente ainda não
possui uma vacina ou medicamento que combata o vírus diretamente, os avanços da
tecnologia demostram que a alta taxa de mutações na variante dificulta esse processo que
ainda pode levar tempo o que preocupa muito os cientistas; Khan et al [2020].
28
estruturados e propriedades químicas dos compostos estudados; Sanos; Ferreira e
Caffarena [2019]. Logo, o objetivo deste estudo é a realização da predição in silico de
compostos bioativos candidatos a novos compostos bioativos contra a proteína spike
codificada pela variante ômicron do SARS-CoV-2 através do docking molecular.
2 METODOLOGIA
Se trata de um estudo descritivo com abordagem quantitativa, procura delinear softwares
que realizam cálculos de docking molecular para obtenção de afinidade da proteína spike
com compostos bioativos. Sendo também uma pesquisa de caráter qualitativa; Cathala e
Moorley [2018].
Para que seja feita uma análise de compostos contra o novo coronavírus é necessário a
busca pelo Receptor Binding Domain (que fornece o local exato da interação da spike) da
proteína spike da variante ômicron; Lan et al [2020]. No banco de dados do Protein Data
Bank (https://www.rcsb.org/) obtendo a proteína complexada com algum composto
neutralizante que será utilizado para estudo de novos ligantes, fornecendo informações
sobre o ligante da spike para a predição de novos compostos; Soares [2015].
Para obtenção de compostos semelhantes ao ligante foi feita a busca no banco de dados
Uniprot (Universal Protein), a busca por proteínas que apresentem domínios funcionais
com identidade favorável ao ligante, Morgat et al [2020].
Os cálculos de alinhamento foram feitos a partir do software BLAST (Basic Local Alignment
Search Tools) (Ferramenta Básica de Pesquisa de Alinhamento Local)
(https://www.uniprot.org/blast/) que fornece o alinhamento de proteínas semelhantes a
obtida anteriormente e que estejam depositadas no banco de dados do Swiss Prot
(Proteínas Suíças) (https://www.sib.swiss/swiss-prot) com estruturas validadas Soares
[2015]. Posteriormente será feito o alinhamento dos dados obtidos no software MEGA11
(Molecular Evolutionary Genetics Analysis) (Análise de Genética evolutiva molecular)
(https://www.megasoftware.net/) que possibilitará a retirada de peptídeo de sinal, caso
haja; Tamura, Stecher, Kumar, [2021].
29
entre as moléculas. Este visa prever interações em sítios de ligação e ativação das
moléculas para melhorar a interação proteína-ligante. Foram utilizados os servidores
NetAcet (N-terminal acetylation in eukaryotic proteins) (Acetilação N-terminal em
proteínas eucarióticas) e Phospholyration Sites Prediction (Previsão de Locais de
Fosforilação) (NetPhos, https://www.cbs.dtu.dk/service.php?NetPhos); Foroutan et al
[2021].
Esta etapa será importante para conseguir a predição das conformações de enovelamento
das moléculas com potencial bioativo e também da proteína alvo, então será possível
obter uma noção de sua estrutura nas etapas seguintes. Usando o servidor e o Secundary
Structure Prediction – NPS (SOPMA, https://npsa-prabi.ibcp.fr/cgi-
bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html) para prever e validar a estrutura
secundária. Servidores como o Protein Data Bank também oferecem uma estrutura
secundária da variante ômicron e do coronavírus, o que facilitará a análise de docking
molecular; Ghaffari et al [2021].
Após a predição de possíveis ligantes obtidos das proteínas até então preditas foi
realizado, o método de docagem (docking molecular) que visa a análise entre o ligante e a
molécula alvo, estimando a afinidade ligante-molécula alvo (pontuação, score). Esta etapa
utiliza a conformação e orientação do ligante (pose), analisando a complementariedade
molecular entre o ligante e o alvo. O software utilizado foi o AutoDock e o servidor
DockThor, ambos com ligante rígido, conseguindo prever a energia de ligação e afinidade,
respectivamente; Goodsell, Sanner, Olson, Forli, [2020]; Guedes et al [2021].
30
Campo de Força), sendo gerada uma grid box (caixa de grade) formada na região
tridimensional fornecida a partir das coordenadas inseridas e abrangendo o sítio alvo
desejado, é possível fazer todas as ligações não rotacionáveis a partir da verificação dos
ângulos de torção, os hidrogênios não polares são adicionados no próprio software e para
realização dos cálculos os comandos são efetuados no prompt de comando onde os
pacotes instalados “AD4.1_bound”, “Autodock4.exe” e “Autogrid4.exe”são fundamentais
para execução das tarefas de docking, tendo, logo após, os resultados avaliados no melhor
cluster na interface do software . Avaliando também a análise de campo de força (visando
todas as interações entre o complexo). Para validação final, foi utilizado as conformações
e orientação do ligante (pose) no complexo, observado as energias de afinidade, Entropia
e energia livre de ligação fornecidas no AutoDock e DockThor; Goodsell, Sanner, Olson,
Forli, [2020]; Guedes et al [2021].
3 RESULTADOS E DISCUSSÕES
3.1 Busca pelo alvo com seu ligante
O banco de dados utilizado para a busca do ligante foi o Protein Data Bank
(https://www.rcsb.org/), nele está depositado várias proteínas e assim foi procurado a
proteína spike da variante ômicron. Foi encontrado a proteína spike complexada com
anticorpo neutralizante com resolução de 1,78Å (PDB DOI: 10.2210/pdb7JMP/pdb) de
onde havia o ligante com a nomenclatura: “2-acetamido-2-deoxy-beta-D-glucopyranose”,
com fórmula molecular C8 H15 O16; Tuekprakhon et al [2022].
3.2 Alinhamento do ligante
31
proteína para que fossem removidos, logo após o software PyMOL
(https://www.schrodinger.com/products/pymol) permitiu a edição de cada proteína
para retirada dos mesmos. Posteriormente suas sequências de aminoácidos foram
alinhadas novamente, para isso o software MEGA11 alinhou os códons de todas elas. Em
teste estatístico de significância feita pelo software bioEstat 5.0
(https://bioestat.software.informer.com/) foi utilizado para o cálculo do p-value obtendo
o resultado p-value < 0,0001 o que demonstra confiabilidade na pesquisa; Soares [2015].
3.3 Análise filogenética
Nessa fase o software MEGA11 a partir do alinhamento de códons feito foi feita a análise e
construção da árvore; utilizou o método Construct/Test Neighbor-Joining Tree
demonstrando que mesmo a diferença entre as espécies a linhagem evolutiva está
conectada, apresentando ancestrais comuns (TAMURA, STECHER, KUMAR, 2021).
32
Q765P4 e Q8VCS0; Hoda, Tafaj, Sallaku [2021]. Logo após foram analisados os pontos
isoelétricos de cada proteína, visto que a solubilidade e repulsão elétrica são menores
nesse ponto, portanto apresentarão precipitação e agregação maior. Para isso foram
consideradas proteínas que não tivessem seu ponto isoelétrico entre 7 e 8 para evitar
assim problemas no pH fisiológico e os resultados demonstraram que as proteínas
consideráveis são: Q9VYX7 (pI= 6,58), O76537 (pI= 6,49), Q70PR8 (pI= 5,79), Q9VS97
(pI= 5,56) e Q8VCS0 (pI= 6,49). A meia-vida estimada destes compostos considerando sua
cadeia N-terminal a partir da metionina por testes in vivo parametrizados, os valores
encontrados foram respectivamente para as 5 proteínas descritas anteriormente: >20
horas (fermento, in vivo), > 10 horas (Escherichia coli, in vivo); >20 horas (fermento, in
vivo), > 10 horas (Escherichia coli, in vivo); >20 horas (fermento, in vivo), > 10 horas
(Escherichia coli, in vivo); >20 horas (fermento, in vivo), > 10 horas (Escherichia coli, in
vivo) e >20 horas (fermento, in vivo), > 10 horas (Escherichia coli, in vivo); Dutta, Banerjee,
Chakraborty [2018].
3.5 Predição de locais de acilação e fosforilação
33
Q9VS97 163S HRQVSATKS 0,549 PKG
Q9VS97 163S HRQVSATKS 0,531 PKC
Q9VS97 165T QVSATKSPG 0,548 cdc2
Q9VS97 167S SATKSPGEA 0,993 unsp
Q9VS97 167S SATKSPGEA 0,580 cdk5
Q9VS97 167S SATKSPGEA 0,504 GSK3
Q9VS97 173Y GEALYALIQ 0,587 unsp
Q8VCS0 24S GAASSLPLL 0,626 PKA
Q8VCS0 58S AWILSAKNS 0,632 unsp
Q8VCS0 58S AWILSAKNS 0,579 PKC
Q8VCS0 63S AKNSSTHNS 0,649 unsp
Q8VCS0 67S STHNSLHQR 0,557 PKA
Q8VCS0 81T PSHNTTEPD 0,867 unsp
Q8VCS0 88S PDPHSLSPE 0,813 unsp
Q8VCS0 90S PHSLSPELQ 0,986 unsp
Q8VCS0 98S QALISEVAQ 0,504 cdc2
Q8VCS0 121T PDGSTVAVK 0,884 PKC
Q8VCS0 139S LQAHSVANL 0,690 unsp
Q8VCS0 164T NIRATWPGL 0,523 PKC
Q8VCS0 177S PNASSPDVG 0,689 unsp
Q8VCS0 177S PNASSPDVG 0,528 cdc2
Q8VCS0 191S DKAKTPTTV 0,693 unsp
Q8VCS0 191S DKAKTPTTV 0,521 p38MAPK
Q8VCS0 194T KTPTTVDRL 0,770 unsp
Q8VCS0 194T KTPTTVDRL 0,558 PKC
Q8VCS0 215S FLHRSQTWS 0,639 unsp
Q8VCS0 215S FLHRSQTWS 0,555 DNAPK
Q8VCS0 215S FLHRSQTWS 0,551 ATM
Q8VCS0 217T HRSQTWSPP 0,926 unsp
Q8VCS0 217T HRSQTWSPP 0,710 PKC
Q8VCS0 219S SQTWSPPGL 0,658 cdk5
Q8VCS0 219S SQTWSPPGL 0,518 GSK3
Q8VCS0 239T PRVFTLLDP 0,771 unsp
Q8VCS0 239T PRVFTLLDP 0,563 cdc2
Q8VCS0 246S DPQASRLTM 0,501 CaM-II
Q8VCS0 267S GNHLSQIPR 0,660 ATM
Q8VCS0 307T GAALTSAPT 0,864 unsp
Q8VCS0 307T GAALTSAPT 0,605 PKC
Q8VCS0 337S LQNISQEQL 0,616 DNAPK
Q8VCS0 337S LQNISQEQL 0,547 ATM
34
Q8VCS0 378T RGHPTPLRL 0,769 unsp
Q8VCS0 378T RGHPTPLRL 0,565 p38MAPK
Q8VCS0 378T RGHPTPLRL 0,525 cdk5
Q8VCS0 378T RGHPTPLRL 0,508 GSK3
Q8VCS0 400T APPCTTFQS 0,508 GSK3
Q8VCS0 427Y DDIGYSFVV 0,573 unsp
Q8VCS0 427Y DDIGYSFVV 0,529 INSR
Q8VCS0 428S DIGYSFVVG 0,520 cdc2
Q8VCS0 433S FVVGSDGYL 0,617 PKA
Q8VCS0 436Y GSDGYLYQG 0,758 unsp
Q8VCS0 436Y GSDGYLYQG 0,536 EGFR
Q8VCS0 436Y GSDGYLYQG 0,504 INSR
Q8VCS0 450T VGAHTRGYN 0,647 PKC
Q8VCS0 455S RGYNSRGFG 0,937 unsp
Q8VCS0 469S NYTGSLPNE 0,636 PKA
Q8VCS0 469S NYTGSLPNE 0,589 DNAPK
Q8VCS0 469S NYTGSLPNE 0,519 cdc2
Q8VCS0 478T AALNTVRDA 0,932 unsp
Q8VCS0 478T AALNTVRDA 0,723 PKC
Q8VCS0 508T QLVLTHCPG 0,518 cdc2
Q8VCS0 521T NLLRTWPHF 0,652 PKC
Q8VCS0 526T WPHFTEVEN 0,896 unsp
Q8VCS0 526T WPHFTEVEN 0,618 CKII
35
as proteínas Q9VS97 e Q8VCS0 não são proteínas transmembrana. A localização celular
foi fornecida pelo banco de dados UniprotKB que ao digitar os códigos Q9VS97 e Q8VCS0
fornece informações sobre as proteínas, sendo então que na análise as proteínas se
demonstraram excretadas e se localizam fora da célula (extracelular); Foroutan et al
[2021].
3.7 Análise da estrutura secundária
Sendo assim, um ligante foi fornecido pela proteína 7nsz com o nome: 4-(2-hidroxiilo)-
1-piperazina ácido elfnônico, o docking molecular foi feito utilizando o software AutoDock
onde foram fornecidas a proteína spike (localizada na membrana do coronavírus) e o
ligante foi otimizado e fornecido ao software, utilizando o protocolo para docking
fornecido por (AutoDock (scripps.edu)), que foi interpretado e executado com êxito nas
36
posições dos aminoácidos 452 (Arginina) e 456 (Valina). O DockThor também foi utilizado
para docking e o ligante otimizado também foi fornecido, a proteína alvo foi preparada no
próprio servidor onde oferece recursos para o mesmo; foi obtido com êxito o docking nas
posições 452 e 486; Goodsell, Sanner, Olson, Forli [2020]; Guedes et al [2021].
3.10 Análise dos resultados
Os resultados do docking demonstraram que pelo AutoDock nas posições 452 e 486
apresentaram energia livre de ligação: -5.50 kcal/mol e -3.99 kcal/mol, respectivamente
(FIGURA 2).
37
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
38
4 CONCLUSÕES
As proteínas são grandes fontes de compostos complexados e podem fornecer bastantes
informações. Dentro do contexto do SARS-COV-2, a proteína spike da variante ômicron se
mostrou um importante alvo terapêutico, sendo ela bastante estudada em todo mundo.
Os dados de docking molecular forneceram pelo AutoDock energias de ligação favoráveis
que permite observar um potencial ligação nas posições 452 e 486 do domínio de ligação
ao receptor da proteína spike. O DockThor chegou a um valor maior devido a sua ligação
ser em uma região do ligante diferente pois a ligação do aminoácido Valina ao ligante se
dá em um carbono e é uma ligação carbon hidrogen bond (ligação carbono hidrogênio),
ao contrário do Autodock que se ligou a uma região nitrogenada no ligante formando uma
Conventional hidrogen bond (ligação de hidrogênio convencional). Portanto, é possível
concluir que esta pesquisa forneceu dados de extrema importância para um possível
inibidor da proteína spike da variante ômicron do SARS-COV-2 através do docking
molecular. Portanto, esses dados são muito importantes e estudos posteriores são
fundamentais para maiores confirmações.
5 AGRADECIMENTOS
Agradecimentos ao Programa Institucional de Bolsas de Iniciação Científica (PIBIC)
fornecido pelo Centro Universitário Vértice – Univértix pelo financiamento desta pesquisa e
ao Professor. Dr Adriano Carlos Soares pelas orientações durante o trabalho.
Referências
A. D. Ghaffari et al. Immunoinformatic analysis of immunogenic B-and T-cell epitopes of
MIC4 protein to designing a vaccine candidate against Toxoplasma gondii through an in-
silico approach. Clinical and Experimental Vaccine Research. 10(1):59-71, 2021.
A. Hoda, M. Tafaj, E. Sallaku. In silico Structural, Functional and Phylogenetic Analyses of
cellulase from Ruminococcus albus. Journal of Genetic Engineering & Biotechnology.
19(1):58-73, 2021.
A. Morgat et al. Bridge; Consórcio UniProt. Enzyme annotation in UniProtKB using Rhea.
Bioinformatics. 36(6):1896–1901, 2020.
A. Soares. (2015). Identificação de lipocalinas com domínio de ligação a histamina e
serotonina e validação de genes de referência em transcriptomas de glândula salivar,
intestino e ovário do carrapato Amblyomma sculptum. Tese de doutorado (tese em
Bioquímica Aplicada) - UFV, Departamento de Bioquímica e Biologia Molecular. Viçosa.
113p.
A. Tuekprakhon et al. Antibody escape of SARS-CoV-2 Omicron BA.4 and BA.5 from
vaccine and BA.1 serum. Cell. 185(14):2422-2433, 2022.
A. U. Haq et al. Annotation of Potential Vaccine Targets and Design of a Multi-Epitope
Subunit Vaccine against Yersinia pestis through Reverse Vaccinology and Validation
through an Agent-Based Modeling Approach. Vaccines. 9(11):1327-1346, 2021.
B. Dutta, A. Banerjee, P. Chakraborty, R. Bandopadhyay. In silico studies on bacterial
xylanase enzyme: Structural and functional insigh. Journal of Genetic Engineering &
Biotechnology. 16(2):749–756, 2018.
D. Goodsell, M. Sanner, A. Olson, S. Forli. A suíte AutoDock aos 30. Protein Science.
30(1):31-43, 2020.
39
E. Rouka, K. Gourgoulianis, S. Zarogiannis. In silico investigation ofWre the viroporin E as
a vaccine target against SARS-CoV-2. Americam Journal of Physiology Lung Cellular and
Molecular Physiology. 320(6):1057-1063, 2021.
F. Liberman. Análise dos fatores determinantes para a qualidade da anotação genômica
automática. Tese de Mestrado (Biotecnologia e Ciências genômicas) – Universidade Católica
de Brasil. Brasília, 2004.
F. Robson et al. Coronavirus RNA Proofreading: Molecular Basis and Therapeutic
Targeting. Molecular Cell. 79(5):710-727, 2020.
G. Heinzelmann e M. Gilson. Automation of absolute protein-ligand binding free energy
calculations for docking refinement and compound evaluation. Science Republic.
11(1):1116-1134, 2021.
I. A. Guedes et al. Novas funções de aprendizagem de máquina e pontuação baseada em
física para descoberta de drogas. Science Republic. 11(1):3198-3217, 2021.
I. A. Guedes et al. Design de drogas e redefinição com o servidor web DockThor-VS com
foco em alvos terapêuticos SARS-CoV-2 e suas variantes não-sinônimos. Science Republic.
11(1):5543-5563, 2021.
J. Kyte e F. Doolittle. A simple method for displaying the hydropathic character of a
protein. Molecular Biology. 157(1):105-132, 1982.
J. Lan et al. Structure of the SARS-CoV-2 spike receptor-binding domain bound to the ACE2
receptor. Nature. 581(7807):215-220, 2020.
K. Tamura, G. Stecher, S. Kumar. MEGA11: Molecular Evolutionary Genetics Analysis
Versão 11. Molecular Biology and Evololution. 38(7):3022-3027, 2021.
L. Motamedpour, A. Dalimi, M. Pirestani, Ghaffarifar. In silico analysis and expression of a
new chimeric antigen as a vaccine candidate against cutaneous leishmaniasis. Iranian
Journal of Basic Medical Sciences. 23(11):1409-1418, 2020.
L. Sanos, R. Ferreira, E. Caffarena. Integrating Molecular docking and Molecular Dynamics
Simulations. Metods Molecular Biology. 2053(1):13-34, 2019.
M. Alkhatib et al. Update on SARS-CoV-2 Omicron Variant of Concern and Its Peculiar
Mutational Profile. Microbiology Spectrum. 10(2):2732-2749, 2022.
M. Khan et al. COVID-19: A Global Challenge with Old History, Epidemiology and Progress
So Far. Molecules. 26(1):39-64, 2020.
M. Foroutan et al. Sabaghan. Bioinformatics analysis of calcium-dependent protein kinase
4 (CDPK4) as Toxoplasma gondii vaccine target. BMC research notes. 14(1):50-59, 2021.
N. C. Wu et al. Um modo de ligação alternativo de anticorpos IGHV3-53 ao domínio de
ligação do receptor SARS-CoV-2. Cell Reports. 33(3):108274-108307, 2020.
S. Ahmad, Y. Waheed, A. Abro, S. W. Abbasi. Ismail. Molecular screening of glycyrrhizin-
based inhibitors against ACE2 host receptor of SARS-CoV-2. Journal of Molecular
Modeling. 27(7):206-219, 2021.
T. Kaur, A. Madgulkar, M. Bhalekar, K. Asgaonkar. Molecular Docking in Formulation and
Development. Drug Discovery Technologies. 19(1):30-39, 2019.
X. Cathala e C. Moorley. How to appraise quantitative research. Evid Based Nurs. Evidence-
Based Nursing. 21(4):99-101, 2018.
X. He et al. SARS‐CoV‐2 Omicron variant: Characteristics and prevention. MedComm.
2(4):838-845, 2021
40
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
Neste trabalho estudamos a dinâmica de um apocalipse no qual parte da população se torna zumbis
temporariamente, podendo se tornar vivo novamente ou morrer. Descrevemos essa dinâmica utilizando
uma versão modificada do modelo epidêmico SIS (do inglês: susceptible-infected-susceptible). Os zumbis
podem morrer quando em contato com um indivı́duo vivo do tipo exterminador. Para definir quem
interage com quem utilizamos a rede aleatória Erdös-Rényi e calculamos como as fases absorvente e ativa
do modelo SIS original se altera em função do grau médio da rede. Além disso a densidade de mortos
atua como uma força dissipativa diminuindo a população efetiva.
Keywords:Modelo epidêmico SIS, Método de Monte Carlo, rede Erdös-Rényi, fase absorvente, transição
de fase
1 INTRODUÇÃO
Os chamados modelos epidêmicos referem-se a um conjunto de dinâmicas onde um in-
divı́duo saudável pode se tornar infectado quando em contato com outros indivı́duos
infectados. Além desses dois estados, há vários outros que podem ser incluı́dos no mo-
delo de forma a deixar a dinâmica mais sofisticada como: morto, recuperado, latente,
exposto, etc [Hethcote, 2000]. Modelos epidêmicos tem sido amplamente estudados em
diversas aplicações nas suas diversas variações, apresentando uma fase absorvente a partir
da qual o sistema não consegui sair, como também uma fase ativa onde as densidades
dos parâmetros de ordem não variam com o tempo [Barthélemy et al., 2022, da Silva and
Fernandes, 2015, Miranda et al., 2020, Reia and Fontanari, 2022].
O contexto de apocalipse zumbi é um tema atual tanto na indústria do entretenimento
quanto no meio acadêmico. Algumas abordagens encontradas envolvem a utilização de
41
EAMC ARTICLE SOUSA et al.
equações diferenciais [Miranda et al., 2020], método de Monte Carlo [Miranda et al., 2020],
rede quadrada [Alemi et al., 2015], equações de difusão [Smith?, 2014], questões de ensino
[Lofgren ET, 2016] dentre outras.
Neste trabalho utilizamos um modelo epidêmico SIS modificado para descrever a
dinâmica entre indivı́duos vivos e zumbis em um apocalipse zumbi. Além disso, incre-
mentamos o estado de morto e uma variante do estado vivo chamado exterminador. No
fim buscamos observar o comportamento durante a fase absorvente e ativa.
2 FUNDAMENTAÇÃO TEÓRICA
2.1 Modelo SIS
O modelo epidêmico SIS considera apenas dois estados para os indivı́duos: saudável
(susceptible) e infectado (infected). Um indivı́duo saudável pode se tornar infectado
quando em contato com outros indivı́duos infectados. Já um indivı́duo infectado pode se
tornar saudável com uma chance constante ao longo do tempo, sem a necessidade de ter
contato com indivı́duos vivos. Esse modelo descreve bem por exemplo uma gripe comum.
No nosso trabalho usaremos os estados vivo e zumbi no lugar de saudável e infectado,
tendo uma variação de exterminadores para indivı́duos vivos e incremento do estado
morto. Ao invés de colocarmos a clássica dinâmica ao qual vivos matam zumbis, optamos
em colocar exterminadores [Smith?, 2014]. A existência de exterminadores é concebı́vel
em um apocalipse zumbi, assim como somente uma pequena parcela da população está
apta a matar zumbis devido a questões de idade, habilidade e rigor fı́sico. Os extermina-
dores podem interferir na dinâmica para que a fase absorvente chegue mais rapidamente,
exterminando a população de zumbis. Logo, conforme a porcentagem de exterminadores
aumenta, mais tempo demora para a fase ativa começar.
Explorando o modelo SIS tradicional, seja N o número total de indivı́duos do sistema
dos quais V refere-se ao número de indivı́duos vivos e Z o número de zumbis. As respec-
tivas densidades serão v = V /N e z = Z/N . Neste trabalho iremos analisar o sistema no
chamado estado estacionário, no qual as densidades não se alteram mais com o tempo.
Este estado é obtido após um certo intervalo de tempo. A equação diferencial que descreve
o modelo SIS no estado estacionário é [Newman, 2010]:
dv dz
= cz − bvz, = bvz − cz, (1)
dt dt
onde b e c são as chances de conversões de vivo para zumbi e vice-versa. Estas equações
referem-se a aproximação de campo médio na qual cada indivı́duo interage com todos
os outros. Veja que se z = 0 os vivos continuam vivos, já os zumbis sempre se tornam
zumbis após algum tempo, independente da existência de indivı́duos vivos. Como temos
que v + z = 1.0, podemos combinar essas duas equações em uma:
dz
= (b − cb − bz)z. (2)
dt
A solução é:
De(b−c)t bz0
z(t) = (1 − c/b) , D= . (3)
1 + De(b−c)t b − c − bz0
42
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
A dinâmica é definida pelo modelo em questão: modelo epidêmico SIS neste trabalho.
Ela define o que acontece quando um indivı́duo interage com outro. Também é necessário
definir o padrão de comunicação entre os indivı́duos: quem interage com quem. Tradicio-
nalmente a rede quadrada (veja figura 1) tem sido utilizada em simulações numéricas de
Monte Carlo devido a sua fácil implementação computacional. Neste trabalho escolhemos
utilizar uma rede aleatória que permite alterar sua topologia: a chamada rede aleatória do
tipo Erdös-Rényi (RER) [Solomonoff and Rapoport, 1951, Erdös and Rényi, 1959, 1960,
1961]. Sua definição é: cada dupla de vértices tem uma chance p de possuir uma aresta
(ou seja, de ser conectada). Os parâmetros N e p são os chamados parâmetros de con-
trole da rede. Enquanto N é o número total de indivı́duos da rede durante as simulações,
o grau ki de um vértice i é o número de conexões (arestas) que ele tem com os outros
vértices. Dessa maneira, os vizinhos de i são todos os vértice que possuem conexão direta
com i por uma aresta. O grau médio da rede é a média de ki entre todos os vértices da
P
rede: µ = (1/N ) N i ki . No caso da RER temos que µ = p(N − 1) [Barabási, 2016], de
forma que podemos utilizar µ ao invés de p como o parâmetro de controle, por ter um
significado mais intuitivo. Uma vez definido µ, basta fazer p = µ/(N − 1) no algoritmo.
43
EAMC ARTICLE SOUSA et al.
3 METODOLOGIA
3.1 Modelo SIS com mortos e exterminadores
Nosso modelo é uma adaptação do modelo SIS e utilizamos os estados vivo e zumbi
no lugar dos estados saudável e infectado, tendo uma variação de exterminadores para
indivı́duos vivos e incrementamo do estado morto. A dinâmica entre esses estados é
exatamente a do modelo SIS descrita na seção 2.1. A seguir descrevemos os passos de
uma análise, na qual Γ é um número aleatório entre 0.0 e 1.0 gerado por distribuição
uniforme.
• Um indivı́duo i aleatório é selecionado: i = 1 + I(ΓN ), inde I(a) é a função inteiro,
que retorna a parte inteira de a.
• Se o indivı́duo selecionado é zumbi, ele pode se tornar vivo com uma chance c. Se
Γ < c, esse indivı́duo passa de zumbi para vivo.
44
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
• Se o indivı́duo i selecionado é vivo, ele pode se tornar um zumbi com chance bzi /ki ,
onde b é a taxa de infecção, zi é o número de vizinhos zumbi e ki é o número total
de vizinhos do indivı́duo i. Se Γ < bzi /ki , o indivı́duo passa de vivo para zumbi.
• Se Γ > bzi /ki e esse indivı́duo vivo também for exterminador, um vizinho zumbi
aleatório passa para o estado morto.
Os 3 passos anteriores constituem uma análise. Uma ilustração dessas conversões está
na figura 3. Se não houver zumbis no sistema, ou se o indivı́duo vivo selecionado para
a análise não tiver vizinhos zumbis, nada acontece na análise (mas ela é contabilizada).
Um passo de Monte Carlo é definido como N análises. Na média todos os indivı́duos
são analisados, mas em um dado passo pode haver indivı́duos não analisados e outros
analisados mais de uma vez. A termalização constitui de Q passos de Monte Carlo (uma
calibração é feita para se obter o valor adequado desse parâmetro).
4 RESULTADOS
Na figura 1 está uma ilustração de uma rede quadrada (RQ) na qual pode-se ver que cada
vértice está ligado com os seus 4 primeiros vizinhos. A RQ é uma rede dita conectada pois
há somente uma componente: Nc = 1. Assim o tamanho da maior (única) componente é
exatamente Sc = N . Já na figura 4(a) está uma instância aleatória da RER com µ = 1.0.
Repare que a maior componente tem Sc = 37 vértices (em vermelho) enquanto que há
Nc = 139 componentes no total (cada vértice isolado é uma componente de tamanho 1.0).
A medida que µ aumenta, a rede se torna mais conectada: Nc diminui e Sc aumenta.
Na figura 4(b) está uma instância da RER gerada com µ = 5.0, na qual a rede já está
45
EAMC ARTICLE SOUSA et al.
Fig. 4: Exemplos aleatórios (a) e (b) da topologia da rede Erdos-Renyi com N = 162 . As
maiores componentes ficam no centro enquanto os vértices isolados ficam na parte externa. Os
vértices da maior componente estão em vermelho para facilitar a visualização. (a) µ = 1.0,
Nc = 139 e Sc = 37. (b) µ = 5.0, Nc = 1 e Sc = N . (c) Número de componentes nc e tamanho
da maior componente sc (normalizados) em função do grau médio µ para a RER. O eixo
horizontal está em escala log. A linha vertical tracejada indica a transição de fase em µ = µc .
Fase não percolada: µ < µc . Fase percolada: µ > µc .
Para evidenciar o efeito do uso de uma rede arbitrária, apresentamos uma comparação
dos resultados utilizando aproximação de campo médio e Método de Monte Carlo na figura
5(a). Mesmo utilizando µ = N − 1 (rede totalmente conectada), o resultado da evolução
temporal não é idêntico ao do campo médio. Esta variação temporal também serve para
calibrar o tempo mı́nimo Q para se obter o estado estacionário. Já na figura 5(b) podemos
ver como a topologia da rede influencia na evolução temporal da densidade de zumbis.
46
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
O caso totalmente conectado refere-se a curva µ = 1023, que está bem próxima da curva
com µ = 50. Ou seja, para redes densamente conectadas há pouca variação na densidade.
Já para µ = 4 e valores menores há uma variação drástica até que em µ = 1 a densidade
não apresenta uma evolução significativa. Ou seja, neste caso, como cada indivı́duo só
tem um vizinho, o zumbi inicial único não foi suficiente para infectar outros zumbis, não
houve a formação de um apocalipse.
1.0 0.8
(b)
0.6
(a) zc
vm 0.4 µ=
1023
0.4
zm 50
4
0.2 3
0.2 2
1
0.0 0.0
0 5 10 15 20 0 10 20 30 40 50 60 70
Tempo t Tempo t
Fig. 5: Evolução temporal das densidades. Parâmetros: N = 322 = 1024, b = 0.9, c = 0.1,
S = 100. A condição inicial para esses resultados é z0 = z(0) = 1/N , ou seja, no instante
inicial havia apenas um zumbi no sistema. (a) Densidades de vivos v e zumbis z vs. tempo de
evolução. O sub-ı́ndice c indica aproximação de campo médio (Eq. 3) e o sub-ı́ndice m Método
de Monte Carlo com µ = N − 1, o que configura uma rede totalmente conectada. O estado
estacionário começa quando as densidades não variam mais com o tempo, neste gráfico, após
t = 15 aproximadamente. As densidades no estado estacionário dependem das taxas b e c,
sendo a linha tracejada o valor zc = (b − c)/b na aproximação de campo médio. (b) Densidade
de zumbis vs. tempo para diferentes graus médio µ na RER obtido com Método de Monte
Carlo.
47
EAMC ARTICLE SOUSA et al.
1.0
(a) 0.8 (b)
0.8
0.6
Densidades
Densidades
0.6 v
v
z
z 0.4
0.4 m
0.2 0.2
0.0 0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
Taxa de infecção b Taxa de infecção b
Vamos analisar em mais detalhes a influência da topologia da rede, na figura do seu grau
médio µ. Como foi observado na figura 5(b) que valores altos de µ não criam grandes
alterações, vamos focar agora em valores mais baixos. Da figura 7(a) podemos observar
que o grau médio µ não altera significativamente a transição de fase. Com exceção de
µ = 1.0, a transição ocorre para valores de b um pouco antes de 0.2. Lembrando que a
fase absorvente ocorre para z = 0. Já a densidade de mortos na figura 7(b) apresenta
um máximo para um µ maior e um pouco acima de b = 0.2. Na figura 7(c) podemos
observar que a densidade de vivos cai rapidamente na fase ativa a medida que aumenta a
taxa b. Na figura 7(d) está o diagrama de fases 2D no plano (b, µ). Observa-se que a fase
absorvente ocorre para b ou µ pequenos.
4.3 Domı́nios
Os domı́nios também trazem informações que contribuem para o entendimento das fases
do sistema. Os domı́nios são limitados pela topologia da rede e são definidos em última
instância pela dinâmica do modelo. Como as unidades são as mesmas, podemos fazer
uma comparação numérica entre os domı́nios e as densidades. Por exemplo: se o maior
domı́nio sd for igual a densidade de vivos (ou mortos ou zumbis), podemos concluir que
todos os vivos estão no maior domı́nio. Da mesma forma se por exemplo z > sd , podemos
concluir que esse maior domı́nio só contém zumbis.
A figura 8(a) apresenta as variações das densidades de indivı́duos e de domı́nios em
função de b para µ = 2.0. De imediato é possı́vel notar a grande variação dos domı́nios,
especialmente no intervalo 0.2 < b < 0.4. Na fase absorvente (b < 0.2) o maior domı́nio
é composto por vivos (v > sd ) mas sofre uma queda brusca na transição de fase b ∼ 0.2.
Até b = 0.6 não é possı́vel identificar o tipo de indivı́duo que compõe o maior domı́nio, já
que v e z são maiores que sd . A medida que o maior domı́nio cai o número de domı́nios nd
aumenta. Para b grande, maior que 0.6, o maior domı́nio fica ocupado todo por zumbis
48
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
µ=
0.8 1.0
(a)
2.0
0.4 (b)
Densidade de mortos m
3.0
Densidade de zumbis z
4.0
5.0
0.6 6.0
7.0
8.0
0.3
9.0
10.0
0.4 11.0
12.0 0.2
13.0
14.0
15.0
0.2 16.0
17.0 0.1
18.0
19.0
20.0
0.0 0.0
0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8
Taxa de infecção b Taxa de infecção b
1.0
Densidade de vivos v
0.8
0.6
0.4
(c)
0.2
Fig. 7: Densidades em função da taxa de infecção b para diferentes valores do grau médio µ.
Parâmetros: N = 322 = 1024, c = 0.1, f = 0.1, S1 = 100 e S2 = 20. (a) Densidade de zumbis
z. (b) Densidade de mortos m. (c) Densidade de vivos v. A legenda de cores da parte (a) vale
para as partes (b) e (c). (d) Gráfico 2D da densidade de zumbi z no plano b, µ. A fase
absorvente (z = 0.0) é a região preta. Parâmetros: N = 162 = 1024, c = 0.1, f = 0.1, S1 = 100
e S2 = 280. Os espaçamentos são ∆b = 0.004 no eixo horizontal e ∆µ = 0.1 no eixo vertical. Q
quantidade total de pontos é 201 × 101 = 20301.
49
EAMC ARTICLE SOUSA et al.
pois z > sd . Já na figura 8(b) temos as mesmas densidades mas para µ = 10.0. A primeira
diferença é que devido ao grau médio maior há um menor número de domı́nios nd . De
fato, aumentando a conectividade as componentes aumentam de tamanho possibilitando
os domı́nios aumentarem também. Na fase absorvente quase a totalidade dos vivos estão
no maior domı́nio: v um pouco maior que sd . Já na fase ativa a partir de b ∼ 0.4 todos
os zumbis estão na maior domı́nio: z = sd .
Na figura 8(c) está mostrado os mesmos parâmetros porém em função do grau médio
µ para b = 0.22. O interessante neste resultado é que o tamanho do maior domı́nio sd é
aproximadamente constante no intervalo 3 < µ < 20 apesar do número de domı́nios nd
diminuir consideravelmente. Isso significa que os domı́nios menores estão se juntando entre
si enquanto o maior domı́nio se mantém inalterado. Como v > sd podemos afirmar que o
maior domı́nio é formado inteiramente por indivı́duos vivos. Além disso a densidade de
mortos aumenta enquanto a de zumbis diminui. Isso nos permite concluir que os domı́nios
pequenos estão se juntando pois indivı́duos zumbis que separam esses domı́nios de mortos
estão se convertendo em mortos, o que agrega os domı́nios.
1.0 1.0
v µ = 2.0 (b) µ = 10.0
z
0.8 (a) m 0.8
nd
sd v
0.6 0.6 z
m
nd
0.4 0.4
sd
0.2 0.2
0.0 0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
Taxa de infecção b Taxa de infecção b
1.0
(c) b = 0.22 v
z
0.8 m
nd
sd
0.6
0.4
0.2
0.0
0.0 5 10 15 20
Grau médio µ
Fig. 8: Densidades vivos (v), zumbis (z), mortos (m), número de domı́nios (nd ) e maior
domı́nio (sd ). Parâmetros: N = 162 = 256, z0 = 1/2, Q = 500, c = 0.1, f = 0.1, S1 = 100 e
S2 = 50. (a) Em função de b com µ = 2.0. (b) Em função de b com µ = 10.0. (c) Em função de
µ com b = 0.22.
5 CONCLUSÕES
Neste trabalho aplicamos uma variação do modelo epidêmico SIS e observamos que um
baixo valor baixo do grau médio dificulta o sistema a atingir a fase ativa, favorecendo
o aumento da população dos indivı́duos vivos. Além disso há um máximo na densidade
50
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
de mortos para uma baixa taxa de infecção e alto valor de grau médio, já que assim a
chance de um exterminador matar um zumbi aumenta. Utilizamos também a distribuição
de domı́nios e componentes da rede para descrever em detalhes a população no estado
estacionário.
Apesar do trabalho ser um estudo sobre as propriedades de um modelo, é possı́vel a
adaptação para algumas aplicações. Em jogos é possı́vel usar o mesmo modelo variando
os parâmetros para assim diversificar cenários e dificuldades em jogos. No contexto de
ensino, pode ocorrer a adaptação e inserção de mais parâmetros, semelhante ao trabalho
de Lofgren ET [2016] para estudos de conceitos epidemiológicos, principalmente ligados
a topologia.
6 Agradecimentos
G. V. Sousa agradece o suporte financeiro de Rafael Grisotto e Souza e da Universidade
Federal de Jataı́. P. F. Gomes agradece o suporte financeiro da Fapeg (http://www.
fapeg.go.gov.br/). As simulações numéricas foram realizadas no LAMCAD / UFG
(https://lamcad.ufg.br/).
Referências
Alexander A. Alemi, Matthew Bierbaum, Christopher R. Myers, and James P. Sethna.
You can run, you can hide: The epidemiology and statistical mechanics of zombies.
Phys. Rev. E, 92:052801, Nov 2015. doi: 10.1103/PhysRevE.92.052801. URL https:
//link.aps.org/doi/10.1103/PhysRevE.92.052801.
A.-L. Barabási. Network Science. Cambridge University Press, Glasgow, 2016. URL
http://networksciencebook.com/.
M. Barthélemy, A. Barrat, R. Pastor-Satorras, and A. Vespignani. Dynamical patterns of
epidemic outbreaks in complex heterogeneous networks. Jour. of Theoretical Biology,
21:275–88, 2022. doi: 10.1016/j.jtbi.2005.01.011. URL https://doi.org/10.1016/j.
jtbi.2005.01.011.
Roberto da Silva and Henrique A Fernandes. A study of the influence of the mobility on the
phase transitions of the synchronous sir model. Journal of Statistical Mechanics: Theory
and Experiment, 2015(6):P06011, jun 2015. doi: 10.1088/1742-5468/2015/06/P06011.
URL https://dx.doi.org/10.1088/1742-5468/2015/06/P06011.
P. Erdös and A. Rényi. On random graphs. Publicationes Mathematicae, 6:290–297, 1959.
URL https://doi.org/10.1109/MCSE.2007.55.
P. Erdös and A. Rényi. On the evolution of random graphs. Publications of the Mathe-
matical Institute of the Hungarian Academy of Sciences, 5:17–61, 1960.
P. Erdös and A. Rényi. On the strength of connectedness of a random graph. Acta
Mathematica Scientia Hungary, 12:261–267, 1961.
P. F. Gomes, H. A. Fernandes, and A. A. Costa. Topological transition in a coupled
dynamics in random networks. Physica A, 597:127269, 2022. URL https://doi.org/
10.1016/j.physa.2022.127269.
51
EAMC ARTICLE SOUSA et al.
C. R. Harris and et al. Array programming with numpy. Nature, 585:357–362, 2020. URL
https://doi.org/10.1038/s41586-020-2649-2.
Smith TC Cartwright RA Lofgren ET, Collins KM. Equations of the end: Teaching
mathematical modeling using the zombie apocalypse. National Center for Biotechnology
Information, 17, março 2016. URL https://www.ncbi.nlm.nih.gov/pmc/articles/
PMC4798798/#b1-jmbe-17-134.
S. M. Reia and J. F. Fontanari. Long-term scientific impact revisited. Eur. Phys. J. Plus,
137:161, 2022. doi: 10.1140/epjp/s13360-022-02376-5. URL https://doi.org/10.
1140/epjp/s13360-022-02376-5.
52
Anais do XVI Encontro Acadêmico de Modelagem Computacional. Laboratório Nacional de Computação Científica, 14 a 17 de
Fevereiro de 2023.
Resumo
O trabalho proposto tem como abordagem o estudo do Modelo Digital de Elevação
(MDE) em um trecho do Rio Pomba e do Rio Paraíba do Sul, localizados no noroeste do
estado do Rio de Janeiro. Buscas dos MDE´s da região foram realizadas em sites
governamentais e gratuitos e observou-se a necessidade da construção manual de um
novo MDE da região, visto que os Modelos Digitais de Elevação disponibilizados não estão
coerentes com a região de estudo. O software utilizado para o auxílio no desenvolvimento
do MDE da região foi o QGIS, sendo gratuito e de código-fonte livre. Para as simulações
hidráulicas foi utilizado o software de modelagem computacional chamado Iber. Desta
forma, após o desenvolvimento manual do MDE, foram estudadas as características
topográficas e hidráulicas da região para implementação da simulação.
1 INTRODUÇÃO
Os Objetivos de Desenvolvimento Sustentável (ODS) são um apelo global à ação
para acabar com a pobreza, proteger o meio ambiente e o clima e garantir que as pessoas,
em todos os lugares, possam desfrutar de paz e de prosperidade. Os ODS são divididos em
17 tópicos, (figura 1), contendo ainda seus subtópicos, onde tem os objetivos para os quais
as Nações Unidas estão contribuindo a fim de que se possa atingir a Agenda 2030 no Brasil.
Este trabalho tem como referências os ODS números 6 (Água Potável e
Saneamento) e 14 (Vida na Água) que contribuem para melhorar a qualidade da água,
reduzir a poluição, proteger e restaurar ecossistemas contribuindo assim para a vida
aquática.
Igor Martins Zanata, [email protected]
Vicente de Paulo Santos de Oliveira, [email protected]
Wagner Rambaldi Telles, [email protected] 53
ESTUDO E CONSTRUÇÃO DE MODELO DIGITAL DE ELEVAÇÃO (MDE) ZANATA et al.
Os ODS buscam implementar planos de gestão com base científica, para restaurar
populações de peixes no menor tempo possível, pelo menos a níveis que possam produzir
rendimento máximo sustentável e legal para a conservação das espécies e de seus recursos
nos rios e nos oceanos, conforme registrado no parágrafo 158 do “Futuro Que Queremos”
assinalado no manual do ODS, tópico 14c.
No entanto, a distribuição espacial dos índices de adequação de habitat requer
dados hidráulicos mais detalhados para determinar a distribuição espacial de profundidade
e velocidade ao longo dos rios [Bovee et al., 2007]. Além disso, a geomorfologia do rio é
um fator muito importante para a produção de modelos hidrodinâmicos.
Além de estudar espécies de peixes nativas da região de atuação do Projeto
Piabanha, que é uma Organização Não Governamental que faz a reprodução de algumas
espécies ameaçadas da região, pode-se combinar índices de adequação de habitat com o
resultado do modelo hidráulico para avaliar a relação entre o fluxo do rio e a habitabilidade
dos peixes que serão estudados.
Estas informações são pilares recomendados para um rio com uma boa diversidade
de vida aquática, através de simulações, obtendo índice quali-quantitativo para cada
espécie que relaciona a vazão e a área de habitat utilizável.
O trabalho tem como objetivo localizar, simular e comparar os MDE´s disponíveis
em um trecho do Rio Pomba. Esta busca pelo MDE ideal é importante para realizar estudos
futuros sobre as espécies de peixes ameaçados de extinção que vivem na região e também
realizar estudos mais precisos sobre áreas de alagamentos em zona urbana em épocas de
enchentes.
E para iniciar o estudo mencionado no título deste trabalho, necessita-se de
estudos dos MDE´s da área em questão, onde são informadas as elevações sobre o terreno,
incluindo até mesmo a batimetria (profundidade) da calha dos rios da região de estudo,
para posteriormente realizar as simulações hidrológicas dos rios Pomba e Paraíba do Sul.
2 REVISÃO DA LITERATURA
Os MDEs são representações matemáticas da topografia, servindo de suporte para
o desenvolvimento de pesquisas e políticas, sobretudo os modelos que são gratuitos, como
o SRTM, ASTER GDEM, TOPODATA e ALOS [Farr et al., 2007; Tachikawa et al., 2011;
Valeriano & Rosseti, 2012]. Considerando a utilização de MDE´s, é possível reduzir custos,
entregar informações relevantes e aplicar decisões de melhoria para uma região, por
exemplo.
O sensor da missão SRTM (Shuttle Radar Topography Mission) da NASA (National
Aeronautics and Space Administration) é um dos mais conhecidos e confiáveis na
disponibilização e utilização de suas imagens para análises digitais. Foi o primeiro sensor,
lançado em 2000, a produzir o mais completo mapeamento da topografia terrestre 54 [Farr
et al, 2007].
Ao assumir que a topografia é um fenômeno dependente da escala [Florinsky,
2012], as imagens da missão SRTM disponíveis podem não ser suficientes para
caracterização de determinadas feições devido a resolução espacial máxima alcançada por
este tipo de imagem.
O MDE SRTM é distribuído na resolução de 30m para o território dos EUA e de 90m
para as demais áreas continentais. O Brasil possui estes dados na resolução de 30m
derivados de interpolação dos modelos de 90m [Valeriano & Rossetti, 2011], os quais
podem ser adquiridos na plataforma TOPODATA de dados geomorfométricos
disponibilizada pelo INPE (Instituto Nacional de Pesquisas Espacial), pelo site
http://www.dpi.inpe.br/topodata/data/grd/.
De acordo com Macêdo & Surya [2019] o sensor PALSAR do satélite ALOS
(Advanced Land Observing Satellite) foi lançado em 2006 pela missão da agência de
exploração aeroespacial japonesa (Japan Aerospace Exploration Agency - JAXA),
desenvolvido para contribuir nas áreas de mapeamento, observação precisa da cobertura
regional da terra, monitoramento de desastres e levantamento de recursos, utilizando-se
de um radar de abertura sintética que opera na Banda L, capaz de obter imagens diurnas
ou noturnas e em quaisquer condições atmosféricas.
Macêdo & Surya [2019] ressaltam que a coleta de dados do sensor PALSAR durou
até 2011 e foi projetado com mais dois instrumentos para contribuir no mapeamento da
topografia terrestre, precisão no monitoramento da cobertura vegetal e de desastres e no
levantamento de recursos naturais [ASF DAAC, 2018]. Os MDE´s ALOS PALSAR podem ser
adquiridos gratuitamente, já corrigidos e projetados no sistema UTM WGS84, nas
resoluções baixa e alta, de 30m e 12,5m, respectivamente, através do site
https://www.asf.alaska.edu/sar-data/palsar/about-palsar/.
Todas estas informações citadas anteriormente foram analisadas para a região de
estudo em questão, coletando informações sobre elevações e batimetrias na proximidade
do rio Pomba e do rio Paraíba do Sul, considerando a sobrevivência e reprodução de
algumas espécies de peixes da região que estão sob ameaça de extinção, como por
exemplo a Piabanha (Brycon insignis), que é uma espécie nativa e endêmica do rio Paraíba
do Sul, de acordo com Fowler [1950].
3 METODOLOGIA
A região escolhida para o desenvolvimento deste trabalho foi o trecho na
proximidade da foz do rio Pomba com o rio Paraíba do Sul, entre os municípios de Aperibé
e Itaocara, no noroeste do estado do Rio de Janeiro, conforme figura 2.
4 RESULTADOS E DISCUSSÃO
4.1 Coleta de informações no Topodata
Após selecionada a região de estudo, foram coletadas informações sobre MDE da
região. No primeiro momento foi verificado o MDE disponibilizado pelo Banco de Dados
Geomorfométricos do Brasil, também conhecido por Topodata.
A região de estudo possui uma vasta área territorial, que para fins didáticos e para
fins de validação observou-se um pequeno trecho do Rio Pomba, conforme figura 3.
Analisando a seção transversal S01 e S02 no rio Pomba, com o software Iber, pode-
se coletar informações gráficas sobre a cota naquele ponto em questão e verificar a causa
do transbordo.
Na seção transversal S01 observa-se a largura do rio em aproximadamente 60m
com uma fina lâmina d’água, variando de 27cm à 45cm de profundidade, conforme figura
6.
57
Fig. 6: Profundidade do rio na seção S01.
Fonte: Autores
Para uma percepção mais ampla da região de estudo, pode-se observar na figura 8
a região total simulada, com uma profundidade máxima de 10.51m em alguns pontos. Um
ponto importante para observação foi a região próxima à cidade de Itaocara, onde a calha
do rio Paraíba do Sul permaneceu em boa parte seca.
58
Fig. 8: Região simulada com MDE do Topodata.
Fonte: Autores
59
Fig. 10: Simulação utilizando MDE do Alos Palsar
Fonte: Autores
Pode-se observar que a figura 11, ilustra o tamanho do rio naquela posição de
leitura (seção transversal S02), contendo os mesmos 170m anteriormente medidos, de
uma borda à outra e com elevações dentro do rio, ou seja, com o uso deste MDE observa-
se que há elevações dentro da calha do rio, ultrapassando até mesmo a cota do rio, fato
que não é coerente com a realidade.
Observa-se que de um lado da borda do rio, a elevação está em aproximadamente
62,6m e vai aumentando de 63,8m até 65,8m. Chegando na outra borda do rio com
aproximadamente 63,4m, ou seja, acima dos 59,66m informados pela estação da ANA.
Para fins de comparação, é como se tivesse um morro/elevação dentro da calha do rio, e,
portanto, justificando o motivo de estar sem água naquela localidade.
Fig. 11: Plotagem do gráfico da topografia – MDE Alos Palsar – Cota x Largura do rio
Fonte: Autores
Nota-se na figura 13, uma visão mais ampla de toda a região simulada, a
profundidade em alguns pontos do rio chega a até 9,32m. Observa-se também que tanto
a simulação utilizando o MDE do Topodata quanto a simulação do Alos Palsar, ocorreram
erros similares. Porém observa-se que o MDE do Alos Palsar já se mostra mais definida,
ressaltando a calha do rio Paraíba do sul, mas ainda com os mesmos erros de incoerência
em relação ao MDE do Topodata, como alagamentos e transbordos em áreas urbanas.
61
Fig. 14: Criação do polígono no Qgis
Fonte: Autores
Na seção transversal S01, figura 16, pode-se observar a cota em relação à largura
do rio. Note também que ocorre o transbordo do rio Pomba nesta região. Observa-se ainda
que a linha em vermelho representa elevação do fundo do rio em relação ao nível do mar
(cota), onde segundo a ANA é de 57,62m, justificando o alagamento na região, pois trata-
se da própria calha do rio.
62
Fig. 16: Plotagem do gráfico da topografia – Novo MDE
Fonte: Autores
5 CONCLUSÕES
Após analisar os MDE´s disponibilizados originalmente pelo Topodata e pelo Alos
Palsar pode-se observar que ambos não condizem com a realidade da região de estudo do
rio Pomba e do rio Paraíba do Sul. Devido a isto, foi necessário o desenvolvimento de um
novo MDE, adaptado do Alos Palsar. Este novo MDE foi criado de forma manual e com o
auxílio dos recursos do software QGis.
As informações sobre a batimetria foram baseadas nas seções transversais
informadas pela ANA, com isso obteve-se o novo MDE com as informações mais próximas
da realidade sobre a região de estudo em questão.
Após analisadas as opções estudadas, conclui-se que o melhor MDE foi o MDE
adaptado do Alos Palsar (construído manualmente) incluindo o rebaixamento de 7m. Este
MDE trouxe maior coerência com a realização da simulação.
Para estudos futuros serão utilizados o módulo de Qualidade da Água (IberWQ),
que calcula a evolução espacial e temporal de várias informações, incluindo: Oxigênio
dissolvido, demanda bioquímica de oxigênio (DBO), nitrogênio, nitrito, 63 nitrato,
temperatura e salinidade, além do Iber Habitat, que analisa parâmetros de habitabilidade
das espécies de peixes na região de estudo.
6 Agradecimentos
Aos orientadores Vicente e Wagner pelo apoio incondicional na estruturação deste
trabalho, além de toda equipe do Doutorado em Modelagem e Tecnologia para Meio
Ambiente Aplicadas em Recursos Hídricos – Ambhidro do Instituto Federal Fluminense.
64
Referências
ASF DAAC. Alaska Satellite Facility Distributed Active Archive Center. Disponível em:
https://www.asf.alaska.edu/sar-data/palsar/about-palsar/. Acesso em: 08/08/2022.
Bovee, K.D. et al., Stream habitat analysis using the instream flow incremental
Buckup, P.A., Menezes, N.A., Ghazzi, M.S. (eds.) (2007) Catálogo das espécies de peixes de água doce do
Brasil. Rio de Janeiro, Museu Nacional. 195p. (Série Livros, 23) ISBN: 978-85-7427-018-0.
Fernandes, A.F.D. Instrumentação e Controle para Regulação de pH em Sistemas de Cultivo de Organismos
Aquáticos (Dissertação). Universidade do Algarve – Faculdade de Ciência e Tecnologia. 2012. 101p.
Farr, T.G., Rosen, P.A., Caro, E., Crippen, R., Duren, R., Hensley, S. Kobrick, M., Paller, M., Rodriguez, E., Roth,
L. 2007. The shuttle radar topography mission. Rev. Geophys, v. 45
Florinsky, I. V. Digital terrain analysis in soil science and geology. 1ª ed. Russia: Elsevier, 2012.
Fowler, H.W.(1950). Os peixes de água doce do Brasil. Arq. Zool., 6:333-340.
Laranjeira, R.B. Controlo remoto e autónomo de um sistema de aquacultura.
(Dissertação). Universidade de Aveiro. 2014. 99p.
Macêdo, R. J. A., & Surya, L. (2019). Comparação entre modelos digitais de elevação dos sensores srtm e
alos palsar para análise digital de terreno. Revista Contexto Geográfico, 3(6), 47–55.
https://doi.org/10.28998/contegeo.v3i6.6968
Nomura, H.(1984) Dicionário de Peixes do Brasil. Brasília: Editerra, 482p.
Pereira, R. (1986) Peixes de Nossa Terra. 2. ed: NOBEL, 129p.
Tachikawa, T., Kaku, M., Iwasaki, A., Gesch, D.B., Oimoen, M.J., Zhang, Z., Danielson, J.J., Krieger, T., Curtis,
B., Haase, J. 2017. Aster global digital elevation model version 2- summary of validation results. Tech. rep.
NASA. 2011.
Topodata. Banco de Dados Geomorfométricos do Brasil - TOPODATA. 2019. Disponível em: <
http://www.dsr.inpe.br/topodata/dados.php >. Acesso em: 08/08/2022.
Valeriano, M. M.; Rossetti, D. F. Topodata: Brazilian full coverage refinement of SRTM data. Applied
Geography (Sevenoaks), 32: 300-309. 2011
65
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
A COVID-19 afetou bilhões de pessoas e interferiu na economia mundial, forçando controles sociais
sem precedentes para mitigar a rápida propagação da doença. Esse cenário estimulou a realização de
pesquisas sobre modelos epidemiológicos visando entender e combater tal propagação. Inicialmente, os
principais modelos explorados foram os compartimentais, os quais não consideraram a evolução da po-
pulação nos compartimentos ao longo do espaço, apresentando limitações, uma delas é não levar em conta
a mobilidade humana. Nesse sentido, os modelos baseados em redes fornecem informações importantes
para entender o papel dos padrões de mobilidade na dinâmica da transmissão de doenças. Apresentamos
neste artigo uma revisão preliminar de escopo sobre modelos baseados em redes combinados com modelos
compartimentais. Tal revisão permitiu-nos identificar diferentes estratégias para a representação da mo-
bilidade nesses modelos combinados. Nossa contribuição com este artigo está na categorização inicial da
bibliografia encontrada segundo as estratégias identificadas, permitindo-nos observar que: (i) a inclusão
da mobilidade nos modelos epidemiológicos empregados no estudo da COVID-19 é de fato importante;
mas (ii) os modelos combinados consideram somente a origem e o destino de indivı́duos da população
no estabelecimento dos padrões de mobilidade, sem considerarem a interferência do percurso desses in-
divı́duos na propagação da doença. Entendemos que este levantamento preliminar abre uma perspectiva
para o desenvolvimento futuro de modelos com melhor capacidade analı́tica e preditiva.
1 Introdução
Em dezembro de 2019 a COVID-19, doença causada pelo coronavı́rus SARS-CoV-2, teve
seu primeiro caso registrado na China e se espalhou rapidamente por vários paı́ses. Em
11 de março de 2020, o surto de COVID-19 foi declarado como pandemia global pela
Organização Mundial da Saúde (OMS), tendo nesse dia afetado 126.702 pessoas em todo
66
MODELOS EPIDEMIOLÓGICOS BASEADOS EM REDES ULYSSES et al.
Em outras palavras, o constante movimento das pessoas pode atuar como um mecanismo
de potencialização da contaminação. De fato, muitos paı́ses durante o perı́odo crı́tico
da pandemia impuseram lockdown, forçando um distanciamento social e diminuindo a
circulação de pessoas, não somente a nı́vel local, mas também entre regiões. A adoção
de caracterı́sticas espaciais/geográficas que consigam capturar a dinâmica de mobilidade
humana nos modelos epidemiológicos que estudam a COVID-19 permite avaliar a eficácia
dessas medidas.
Neste contexto, os modelos baseados em rede fornecem informações importantes para
entender o papel dos padrões de mobilidade na dinâmica da transmissão de doenças infec-
ciosas. Esses modelos foram construı́dos considerando uma rede formada por nós repre-
sentando indivı́duos, cidades, paı́ses ou estados, e arestas responsáveis pela representação
da conexão entre esses nós.
Este artigo tem como objetivo apresentar uma revisão preliminar de escopo de
modelos desenvolvidos para o estudo da COVID-19 que incluem mobilidade, os quais utili-
1
The compartmental models, however, have several limitations based on simplifying assumptions that
do not correlate well to actual viral propagation. For instance, models assume that recovery and infection
rates are the same for all individuals in the population. Also, the models do not take population mobility
into account.
67
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
zam modelos baseados em rede combinados com modelos compartimentais. Até onde é de
nosso conhecimento, não há trabalhos na literatura que se propusessem a fazer esse tipo
de revisão, embora duas revisões sistemáticas existentes abordem aspectos semelhantes
de nosso trabalho. A revisão sistemática realizada por Zhang et al. (2022) buscou por
pesquisas que associassem mobilidade humana e COVID-19, organizando os resultados
em termos de dados e fonte de dados utilizados, modelos adotados, propostas de estudo
e principais conclusões. A partir dos resultados obtidos os autores propuseram pesquisas
futuras, observando as lacunas existentes relacionadas ao tema. Por sua vez, o levanta-
mento feito por Benita (2021) examinou publicações associadas às pesquisas relacionadas
à COVID-19 e ao comportamento da mobilidade humana, principalmente no tocante ao
uso do transporte urbano. Além disso, propôs um framework baseado em aprendizado
de máquina que pudesse fornecer um mapeamento dessas pesquisas. As revisões cita-
das visam pesquisas que tratem a interferência da mobilidade humana na propagação da
COVID-19, selecionando artigos que trouxessem esses dois assuntos associados, diferen-
temente do escopo de pesquisa do presente artigo, que objetiva estudos que envolvam o
desenvolvimento de um modelo baseado em rede combinado com modelos compartimen-
tais.
Como resultado dessa revisão, observamos o fato dos trabalhos estudados concluı́rem
que a diminuição da mobilidade, através de medidas restritivas impostas pelos governos,
está diretamente relacionada com a diminuição da disseminação da COVID-19. Contudo,
identificamos algumas potenciais lacunas de investigação que abrem uma perspectiva para
o desenvolvimento futuro de modelos com melhor capacidade analı́tica e preditiva. Em
particular, notamos que a influência da movimentação da população na disseminação da
COVID-19 é analisada nos trabalhos estudados considerando somente a origem e o destino
de indivı́duos da população no estabelecimento dos padrões de mobilidade, sem levar em
conta a interferência do percurso desses indivı́duos na propagação da doença. Também
observamos que, até o momento, a maioria dos modelos ainda considera a população
homogênea com relação às taxas de recuperação e infecção, sem explorar o potencial dos
modelos baseados em rede na representação da heterogeneidade.
O restante deste artigo está estruturado como se segue. A Seção 2 explica a metodo-
logia adotada na pesquisa para a seleção das publicações dentro do escopo pretendido. A
Seção 3 apresenta como os trabalhos na literatura analisada até o momento utilizam redes
para modelar e estudar a COVID-19. Por fim, a Seção 4 apresenta nossas considerações
finais.
2 Metodologia
Este estudo realizou uma pesquisa em 9 bases de dados – ACM Digital Library, IEEE Di-
gital Library, ISI Web of Science, PubMed, SIAM, Science@Direct, Scopus, Springer Link
e Wiley – visando coletar a produção cientı́fica existente que adotou modelos baseados
em rede no estudo da propagação e prevenção da COVID-19. Na realização da busca foi
utilizada a string:
68
MODELOS EPIDEMIOLÓGICOS BASEADOS EM REDES ULYSSES et al.
3 Resultados e Discussão
Modelos de rede têm sido usados para investigar o impacto da estrutura espacial na
transmissão de infecções. Uma rede (ou grafo) é formada por um conjunto de nós (ou
vértices) que são interligados através de arestas. Os nós em uma rede podem repre-
sentar qualquer objeto e conter informações relevantes ao problema representado. Neste
estudo, no conjunto de artigos selecionados, foi possı́vel identificar os nós representando
principalmente indivı́duos, grupos de indivı́duos, ou regiões geográficas. Por sua vez, as
arestas podem representar um provável caminho de transmissão da infecção. Logo, as
conexões entre a estrutura da rede, a dinâmica da doença e as técnicas matemáticas nos
permitem compreender e prever os resultados das epidemias. Portanto, visando analisar
como as diferentes formas de representação de nós e arestas influenciam nos modelos ba-
seados em rede, na Subseção 3.1 categorizamos os trabalhos estudados de acordo com o
tipo de objeto sendo representado por cada nó da rede.
Outra caracterı́stica que julgamos importante é o modelo compartimental utilizado,
uma vez que a COVID-19 tem caracterı́sticas epidemiológicas importantes tais como infec-
ciosidade de indivı́duos pré-sintomáticos e assintomáticos (Liu e Yamamoto, 2022; Wang
et al., 2021). Por isso, na Subseção 3.2 discorremos sobre os diferentes modelos comparti-
mentais usados em combinação com modelos baseados em redes nos trabalhos estudados.
69
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
pandemia (Caetano et al., 2021; Gozzi et al., 2021; Singh e Arquam, 2022; Tagliazucchi
et al., 2020; Thurner et al., 2020).
Thurner et al. (2020) propuseram um estudo para entender o crescimento quase linear
apresentado nas curvas de infecção da COVID-19 por um longo perı́odo nos casos confir-
mados. Os autores mostraram que para as taxas de transmissão existe um grau crı́tico
na rede de contatos abaixo do qual ocorrem curvas lineares de infecção e acima aparecem
as curvas clássicas em formato de “S” que são padrão nos modelos epidemiológicos.
Singh e Arquam (2022) desenvolveram um modelo simulando a rede social de contato
humana através da inclusão da informação do grau de um nó em cada estado do modelo
compartimental. Além disso, esses autores buscaram entender como a taxa de disse-
minação de indivı́duos assintomáticos e a taxa de indivı́duos testados afetam a população
total em um determinado compartimento no tempo t referente aos nós (indivı́duos) com
grau k.
Batlle et al. (2022) propuseram a construção de um modelo que possibilitasse a de-
tecção de um novo surto epidêmico precoce e a recuperação do máximo de informações
sobre a evolução da epidemia. Uma rede complexa de mundo pequeno foi construı́da para
simular a propagação da doença, sendo utilizado um modelo compartimental estocástico
para o estudo da transmissão da COVID-19.
70
MODELOS EPIDEMIOLÓGICOS BASEADOS EM REDES ULYSSES et al.
Gösgens et al. (2021) usaram os dados de mobilidade para analisar se a divisão das
regiões determinada por decisões governamentais reflete o movimento real de pessoas em
todo paı́s, examinando se essa divisão é a mais eficaz na mitigação da COVID-19. Assim,
o objetivo principal do artigo é criar regiões que permitam o máximo de mobilidade, mas
consigam restringir ao máximo as infecções. Para isto, um conjunto de áreas atômicas
foi utilizado para representar um paı́s e os indivı́duos movimentam-se entre essas áreas.
Um método de detecção da comunidade foi empregado para obter as divisões com base
na mobilidade e uma variação do modelo compartimental SEIR (Suscetı́vel, Exposto,
Infectado e Recuperado) é executado em cada região.
Wang et al. (2021) incorporaram mobilidade para verificar o impacto do fluxo da
população na disseminação da COVID-19. No modelo proposto a dinâmica de trans-
missão da doença em um determinado nó origina-se de duas fontes: local e migração. A
dinâmica de transmissão local é dada pelo modelo compartimental SaucIR (Suscetı́vel,
Assintomático, Infectado mas não confirmado, Infectado confirmado e Recuperado). Já a
migração descreve a dinâmica de mobilidade humana na rede.
Zhang e Li (2021) investigaram a relação da mobilidade com a disseminação da doença,
procurando prever as regiões que seriam as fontes principais de transmissão mais prováveis
no futuro. Esse conhecimento é importante para formular estratégias para mitigar a
disseminação da doença e alocar recursos de saúde publica eficientemente. O modelo
desenvolvido nesse estudo integrou um modelo de aprendizado de máquina baseado em
deep embedding 3 e um modelo compartimental.
A fim de observar a necessidade de medidas de mitigação da doença Kuzdeuov et al.
(2020) desenvolveram um simulador epidêmico estocástico baseado em rede. O simulador
pode ser usado para estimar a extensão e duração da epidemia ao longo do tempo e
modelar o impacto das medidas não farmacológicas. No modelo desenvolvido cada nó da
rede executa um modelo SEIR consistindo de 4 superestados, S S , E S , I S e RS , sendo que
esses contêm estados intermediários, e os indivı́duos transitam entre os estados baseados
em probabilidades de transição. Na rede, a transição de uma região para outra é dada
por uma matriz que combina dados de viagens diárias de diferentes meios de transporte
(aéreo, ferroviário e rodoviário).
Costa et al. (2020) adotaram a abordagem de meta-população para estudar a variabi-
lidade geográfica e o impacto de uma doença altamente contagiosa em escala continental,
quantificando o quão diversificada pode ser a pandemia considerando a extensão territorial
de um paı́s como o Brasil. Esse trabalho sugere que medidas uniformes de mitigação não
são eficientes para reduzir o impacto da doença. Também no contexto nacional, Grave
et al. (2022) apresentaram uma metodologia que incorpora uma estrutura de rede espa-
cial em um sistema de equações diferenciais parciais (vide Subseção 3.2) descrevendo a
propagação espaço-temporal da epidemia por meio de um modelo de reação e difusão.
Nós como grupos de indivı́duos. Nonato et al. (2022) desenvolveram uma plataforma
integrada de otimização computacional chamada Robot Dance. A plataforma avalia e
estima as consequências de intervenções a nı́vel regional quando há um surto e a influência
3
Um embedding em aprendizado de máquina é um mapeamento de uma variável categórica em um
espaço discreto de dimensionalidade alta em um vetor em um espaço contı́nuo de dimensionalidade
reduzida.
71
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Modelos hierárquicos. Por fim, alguns trabalhos (Chang et al., 2021; Goel et al.,
2021) adotaram modelos considerando a interação entre indivı́duos, grupos e regiões,
sendo cada um deles nós em grafos distintos dispostos em uma estrutura hierárquica.
No modelo desenvolvido por Goel et al. (2021) as regiões são distribuı́das em uma
rede em forma de malha quadriculada. Cada célula da rede é considerada uma região e os
indivı́duos dentro de uma região se conectam de acordo com uma entre duas estruturas
de rede possı́veis: fully mixed e rede complexa. Na versão fully mixed, os indivı́duos
em cada região estão todos conectados; já na versão rede complexa, os indivı́duos que
pertencem a uma dada região se conectam segundo uma rede complexa livre de escala
gerada sinteticamente.
Chang et al. (2021) apresentam um modelo que inclui três submodelos organizados
em nı́veis. O nı́vel I representa o modelo de rede de viagens entre cidades. Já o nı́vel II
representa o modelo de viagens entre comunidades e o movimento entre uma comunidade
e outra segue a caracterı́stica de redes livres de escala do tipo BA (Barabási e Albert,
1999). Por fim, o nı́vel III representa o modelo de rede de contato entre pessoas, construı́do
como uma rede complexa completa. Através dessa divisão os autores propõem um modelo
de transmissão adaptativo baseado em redes complexas com mobilidade populacional,
estrutura social e transmissão de doenças infecciosas. Os autores realizaram simulações
com esse modelo analisando o impacto das polı́ticas de restrição adotadas pelas cidades
na disseminação da COVID-19.
72
MODELOS EPIDEMIOLÓGICOS BASEADOS EM REDES ULYSSES et al.
indivı́duos se movem entre esses compartimentos. Por exemplo, no modelo SEIR a ordem
indica o movimento sucessivo entre os compartimentos Suscetı́vel, Exposto, Infectado e
Recuperado (Kuhl, 2021).
A maioria dos trabalhos analisados executa o modelo compartimental no nó da rede,
conforme exemplificado na Figura 1 para o caso do nó representar uma região ou um
grupo de indivı́duos. Desta forma cada nó tem seu estado epidêmico e adiciona ao mesmo
a contribuição de um modelo de mobilidade, tipicamente por meio de expressões algébricas
que descrevem a influência mútua desse nó e nós vizinhos a ele.
73
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
4 Conclusão
A Organização Mundial da Saúde continua considerando a COVID-19 uma emergência
global de saúde, sendo relatado até a presente data mais de 629 milhões de casos confir-
mados e mais de 6 milhões de mortes no mundo. Essa situação justifica o interesse dos
cientistas em continuar pesquisando sobre a doença e seus impactos socioeconômicos no
mundo.
Este artigo realizou uma revisão preliminar de estudos que combinaram modelos epi-
demiológicos compartimentais com modelos baseados em rede, categorizando-os segundo
o tipo de informação que o nó representa e mostrando de que forma se dá a incorporação
dos aspectos de mobilidade nos modelos compartimentais. Neste sentido, há trabalhos
que modelam a propagação de doenças na rede relacionando com a teoria de redes sociais.
Nesses trabalhos a dinâmica de propagação da doença na rede apresenta uma estrutura
de rede na qual os indivı́duos (nós) são conectados por contato e comunicação, e cada
nó está em um dos estados do modelo compartimental adotado na rede. Normalmente,
essas redes fazem o uso da rede de contatos para modelar o espalhamento da doença,
analisando a disseminação da doença localmente. Em outros estudos os nós representam
regiões ou grupos de indivı́duos (em vez de indivı́duos) e as arestas capturam o movimento
de um local para outro. Esses trabalhos, em sua maioria, estão interessados em analisar
qual a influência de um surto de uma região em outras regiões devido à movimentação de
indivı́duos.
Destacamos que o estudo de modelos baseados em rede tornou-se de fundamental im-
portância, principalmente no tocante à interferência da mobilidade no estudo da COVID-
19, fornecendo ferramentas para compreensão e prevenção de doenças infecciosas, além
de permitir analisar o resultado das medidas de restrição adotadas pelos governos para
mitigar a doença. Logo, este estudo coletou informações relevantes relacionadas a modelos
epidemiológicos baseados em rede combinados com modelos compartimentais e possibili-
74
MODELOS EPIDEMIOLÓGICOS BASEADOS EM REDES ULYSSES et al.
5 Agradecimentos
Agradecemos o apoio da Fundação de Amparo à Pesquisa do Estado do Rio de Janeiro -
FAPERJ na realização do presente trabalho.
Referências
Barabási, A.-L. e Albert, R. (1999). “Emergence of scaling in random networks”. science,
286(5439):509–512.
Batlle, P., Bruna, J., Fernandez-Granda, C., e Preciado, V. M. (2022). “Adaptive test al-
location for outbreak detection and tracking in social contact networks”. SIAM Journal
on Control and Optimization, 60:S274–S293.
Caetano, C., Morgado, M. L., Patrı́cio, P., Pereira, J. F., e Nunes, B. (2021). “Mathema-
tical modelling of the impact of non-pharmacological strategies to control the covid-19
epidemic in portugal”. Mathematics, 9(10):1084.
Chang, F., Wu, F., Chang, F., e Hou, H. (2021). “Research on adaptive transmission
and controls of covid-19 on the basis of a complex network”. Computers & Industrial
Engineering, 162:107749.
Costa, G. S., Cota, W., e Ferreira, S. C. (2020). “Outbreak diversity in epidemic waves
propagating through distinct geographical scales”. Physical Review Research, 2.
Ding, X., Huang, S., Leung, A., e Rabbany, R. (2021). “Incorporating dynamic flight
network in seir to model mobility between populations”. Applied Network Science, 6.
75
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Goel, R., Bonnetain, L., Sharma, R., e Furno, A. (2021). “Mobility-based sir model for
complex networks: with case study of covid-19”. Social Network Analysis and Mining,
11(1):1–18.
Gösgens, M., Hendriks, T., Boon, M., Steenbakkers, W., Heesterbeek, H., Van Der Hofs-
tad, R., e Litvak, N. (2021). “Trade-offs between mobility restrictions and transmission
of sars-cov-2”. Journal of the Royal Society Interface, 18(175):20200936.
Grave, M., Viguerie, A., Barros, G. F., Reali, A., Andrade, R. F., e Coutinho, A. L. (2022).
“Modeling nonlocal behavior in epidemics via a reaction-diffusion system incorporating
population movement along a network”. arXiv preprint arXiv:2205.04868.
Hall, P. G. e Pain, K. (2006). The polycentric metropolis: Learning from mega-city regions
in Europe. Routledge.
Kuzdeuov, A., Baimukashev, D., Karabay, A., Ibragimov, B., Mirzakhmetov, A., Nur-
peiissov, M., Lewis, M., e Varol, H. (2020). “A network-based stochastic epidemic
simulator: Controlling covid-19 with region-specific policies”. IEEE Journal of Biome-
dical and Health Informatics, 24:2743–2754.
Meijers, E. (2007). “From central place to network model: theory and evidence of a
paradigm change”. Tijdschrift voor economische en sociale geografie, 98(2):245–259.
Nonato, L. G., Peixoto, P., Pereira, T., Sagastizábal, C., e Silva, P. J. (2022). “Robot
dance: A mathematical optimization platform for intervention against covid-19 in a
complex network”. EURO Journal on Computational Optimization, 10:100025.
Scala, A., Flori, A., Spelta, A., Brugnoli, E., Cinelli, M., Quattrociocchi, W., e Pammolli,
F. (2020). “Time, space and social interactions: exit mechanisms for the covid-19
epidemics”. Scientific Reports, 10.
Shi, S., Pain, K., e Chen, X. (2022). “Looking into mobility in the covid-19 ‘eye of the
storm’: Simulating virus spread and urban resilience in the wuhan city region travel
flow network”. Cities, 126:103675.
76
MODELOS EPIDEMIOLÓGICOS BASEADOS EM REDES ULYSSES et al.
Tagliazucchi, E., Balenzuela, P., Travizano, M., Mindlin, G., e Mininni, P. D. (2020).
“Lessons from being challenged by covid-19”. Chaos, Solitons & Fractals, 137:109923.
Thurner, S., Klimek, P., e Hanel, R. (2020). “A network-based explanation of why most
covid-19 infection curves are linear”. Proceedings of the National Academy of Sciences
of the United States of America, 117:22684–22689.
Viguerie, A., Veneziani, A., Lorenzo, G., Baroli, D., Aretz-Nellesen, N., Patton, A.,
Yankeelov, T. E., Reali, A., Hughes, T. J., e Auricchio, F. (2020). “Diffusion–reaction
compartmental models formulated in a continuum mechanics framework: application
to covid-19, mathematical analysis, and numerical study”. Computational Mechanics,
66(5):1131–1152.
Wang, X., Yang, L., Zhang, H., Yang, Z., e Liu, C. (2021). “Forecasting confirmed cases
of the covid-19 pandemic with a migration-based epidemiological model”. Statistics
and its Interface, 14:59–71.
Zhang, M., Wang, S., Hu, T., Fu, X., Wang, X., Hu, Y., Halloran, B., Li, Z., Cui, Y., Liu,
H., et al. (2022). “Human mobility and covid-19 transmission: a systematic review and
future directions”. Annals of GIS, 28(4):501–514.
77
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Científica, 14 a 17 de Fevereiro de 2023.
Abstract
We propose a numerical method, the Multiscale Hybrid-Hybrid-Mixed method (MH2 M), to solve
elliptic partial diferential equations with multiscale coefficients. It is derived from the Three-Field Domain
Decomposition method and searchs a non-conforming solution and two conform Lagrange multipliers: the
trace and the flux. A series of static condensations transforms a saddle-point problem into an elliptic one,
posed on the interfaces. At the discrete level, this drastically reduces the size of the global system. The
matrix of the associated linear system is symmetric and positive definite, and can be solved by classical
iterative schemes such as the Conjugated Gradient method. We present the well-posedness of the method
and establish error estimates. We also perform numerical tests to confirm the theoretical predictions and
compare the method with the FEM, MsFEM and MHM schemes.
where A ∈ [L∞ (Ω)]d×d is a symmetric tensor and there exists positive constants amin and
amax such that
amin |v|2 ≤ A(x)v · v ≤ amax |v|2 , v ∈ Rd , a. e. x ∈ Ω (2)
78
EAMC ARTICLE DE BARROS et al.
We take a partition of domain Ω as follows: for H ∈]0, 1[, let TH be a regular mesh of
Ω composed of elements K ∈ TH and let EH be the mesh skeleton composed of edges. For
K ∈ TH , nK is the outward normal vector on ∂K and n is the outward normal vector on
∂Ω. Consider the broken spaces:
Y 1
H 1 (TH ) := v ∈ L2 (Ω); v|K ∈ H 1 (K), K ∈ TH , Λ := H − 2 (∂K), (3)
K∈TH
1/2
H0 (EH ) := v|EH ; v ∈ H01 (Ω) . (4)
1/2
For w, v ∈ L2 (Ω), ρ ∈ H0 (EH ) and µ ∈ Λ, let:
X Z X
(v, w)TH := wv dx, hµ, ρiEH = hµ, ρi∂K , (5)
K∈TH K K∈TH
where h·, ·i∂K is the dual product involving H −1/2 (∂K) and H 1/2 (∂K). Then, the equiv-
1/2
alent mixed-hybrid formulation of (1) consists of finding u ∈ H 1 (TH ), ρ ∈ H0 (EH ) and
λ ∈ Λ such that
(A∇u, ∇v)TH −hλ, viEH = (f, v)TH , ∀ v ∈ H 1 (TH );
−hµ, uiEH +hµ, ρiEH = 0, ∀ µ ∈ Λ; (6)
1/2
hλ, ξiEH = 0, ∀ ξ ∈ H0 (EH ).
This is the Three-field formulation Brezzi and Marini [1992] introduced to solve second
order linear elliptic problems and allows to apply domain decomposition methods. The
system (24) consists of a saddle-point problem posed on the interfaces, which is hard
to solve numerically. Moreover, the system becomes large for problems with multiscale
coefficients. To circumvent these difficulties, we decompose the function spaces to apply
static condensations.
First we show that (1) and (24) are equivalent problems. In fact, if u is the weak
solution of (1), then λ := A∇u · nK and γ := u|EH solve (24). Conversely, let u ∈
1/2
H 1 (TH ), ρ ∈ H0 (EH ) and λ ∈ Λ solve (24). It follows from the third equation and
[Gatica, 2014, Lemma 3.4] that λ|∂K = σ · nK , for σ ∈ H(div; Ω). The second equation
together with [Gatica, 2014, Theorem 3.1] imply u ∈ H01 (Ω). Finally, the first equation
of (24) and again [Gatica, 2014, Lemma 3.4] give us that u ∈ H01 (Ω) is the weak solution
of (1).
We decompose elements of H 1 (TH ) and Λ as "constant" plus "zero average", i.e.
79
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Científica, 14 a 17 de Fevereiro de 2023.
We also define the zero average functional space on the element boundary
Z
1/2 1/2
H̃ (∂K) := ξ ∈ H (∂K); ξ ds = 0 , (11)
∂K
hλ, φi∂K X
|λ|− 1 ,∂K := sup , |λ|2Λ := |λ|2− 1 ,∂K . (12)
2 1
φ∈H̃ 2 (∂K)
|φ| 1
,∂K K∈TH
2
2
Then we can write u = u0 + ũ, where u0 ∈ P0 (TH ) and ũ ∈ H̃ 1 (TH ), and also λ = λ0 + λ̃,
for λ0 ∈ Λ0 and λ̃ ∈ Λ̃. It follows from (24) that λ0 ∈ Λ0 and u0 ∈ P0 (TH ) solve
Note that λ0 is defined by the first equation of (13). We obtain the piecewise constant u0
1/2
after the computation of ρ. Then (ũ, λ̃, ρ) ∈ H̃ 1 (TH ) × Λ̃ × H0 (EH ) solves
The first equation of (14) allows the introduction of local solvers. Let K ∈ TH . For µ̃ ∈ Λ̃
and f ∈ L2 (Ω), let T : Λ̃ → H̃ 1 (TH ) and T̃ : L2 (Ω) → H̃ 1 (TH ) be such that
Z Z Z
A∇(T µ̃) · ∇ṽ dx = hµ̃, ṽi∂K and A∇(T̃ f ) · ∇ṽ dx = f ṽ dx, (15)
K K K
ũ = T λ̃ + T̃ f. (16)
1/2
Replacing in (14), we obtain the saddle-point problem of finding (λ̃, ρ) ∈ Λ̃ × H0 (EH )
such that
Next we show that the bilinear form h·, T ·iEH on Λ̃ is coercive. For µ̃ ∈ Λ̃, we get:
X X Z X
hµ̃, T µ̃iEH = hµ̃, T µ̃i∂K = A∇(T µ̃) · ∇(T µ̃) dx ≥ amin k∇T µ̃k20,K
K∈TH K∈TH K K∈TH
X X
≥ CkT µ̃k21,K ≥ C|µ̃|2− 1 ,∂K = C|µ̃|2Λ , (18)
2
K∈TH K∈TH
80
EAMC ARTICLE DE BARROS et al.
where we have used in the last two inequalities the Generalized Poincaré inequality and
the injectivity of the operator T . It allows the introduction of the so called Dirichlet-to-
Neumann operator Belishev and Sharafutdinov [2008]. We define:
Y
G: H 1/2 (∂K) −→ Λ̃, (19)
K∈TH
such that, for K ∈ TH and given φ ∈ H 1/2 (∂K), if λ̃φ |∂K = Gφ|∂K ∈ H̃ −1/2 (∂K), then
Z
A∇(T λ̃φ ) · ∇T µ̃ dx = hµ̃, T λ̃φ i∂K = hµ̃, φi∂K , ∀ µ̃ ∈ Λ̃. (20)
K
λ̃ = G(ρ − T̃ f ). (21)
A second static condensation in (17) implies the global problem that charcterizes the
1/2
MH2 M method. It consists of finding ρ ∈ H0 (EH ) such that
1/2
hGρ, ξiEH = −hλ0 , ξiEH + hGT̃ f, ξiEH , ∀ ξ ∈ H0 (EH ). (22)
It follows from (7),(16) and (21) that the exact solution is given by:
u = u0 + T Gρ + (I − T G)T̃ f. (23)
Remark 1.1. Note that the present method generalizes the MHM method Paredes and
Valentin [2013b]. Of course, we get from the third equation of (24) that λ = σ · n, for
σ ∈ H(div; Ω). It means that the flow λ has null jump. Then, this equation is satisfied
and, by taking the null jump functionals is Λ as the test function, we reduce the second
equation and the sistem becomes: find (u, λ) ∈ H 1 (TH ) × Λ such that
2 Galerkin scheme
We approximate the global problem (22) by considering finite dimensional subspaces
1/2
ΓHΓ ⊂ H0 (EH ) and Λ̃HΛ ⊂ Λ̃, where HΓ , HΛ and alse h are the refinement level of
the finite dimensional spaces. Two compatibility conditions must be satisfied: define
Ṽh ⊂ H̃ 1 (TH ) such that
µ̃HΛ ∈ Λ̃HΛ and hµ̃HΛ , ṽh i∂K = 0, ∀ ṽh ∈ Ṽh , ∀ K ∈ TH =⇒ µ̃HΛ = 0. (25)
81
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Científica, 14 a 17 de Fevereiro de 2023.
Let the discrete operator Th : Λ̃ → Ṽh be such that, for a given µ̃ ∈ Λ̃,
Z
A∇(Th µ̃) · ∇ṽh dx = hµ̃, ṽh i∂K , ∀ ṽh ∈ Ṽh . (26)
K
1/2
Consider Γ̃HΓ := ΓHΓ ∩ H̃ 1/2 (EH ), where H̃0 (EH ) stands for space of "zero mean"
functionals on the elements border, and define Λ̃H0 ⊂ Λ̃ such that
ξ˜HΓ ∈ Γ̃HΓ and hµ̃HΛ , ξ˜HΓ i∂K = 0, ∀ µ̃HΛ ∈ Λ̃H0 , ∀ K ∈ TH =⇒ ξ˜HΓ = 0. (27)
Function Vh := P1 (Th )
Trace ΓHΓ := P1 (EH )
Flux ΛHΛ := P0 (EH )
. The Galerkin scheme of (22) consists to finding ρHΓ ∈ ΓHΓ such that
hGh ρHΓ , ξHΓ iEH = −hλ0 , ξHΓ iEH + hGh T̃h f, ξHΓ iEH , ∀ ξHΓ ∈ ΓHΓ . (29)
The compatibility of the meshes of the flows and traces on the interfaces follows from the
stability result below.
Proposition 2.1. For K ∈ TH , let Λ̃H0 ⊂ Λ̃ introduced in (27). Then, there exists
γK > 0 independent of H such that
hµ̃, ξHΓ i∂K hµ̃HΛ , ξHΓ i∂K
sup ≤ γK sup , (30)
µ̃∈Λ̃ |µ̃|− 1 ,∂K µ̃H ∈Λ̃H |µ̃HΛ |− 1 ,∂K
2 Λ 0 2
hGh ξ˜HΓ , ξ˜HΓ iEH ≥ γ −2 |ξHΓ |21 ,EH and hGh ξHΓ , ρHΓ iEH ≤ C|ξHΓ | 1 ,EH |ρHΓ | 1 ,EH (31)
2 2 2
for all ξHΓ , ρHΓ ∈ ΓHΓ , where γ = max{γK ; K ∈ TH }, and γK is the same as in (2.1).
82
EAMC ARTICLE DE BARROS et al.
Remark 2.1. The exact solution (23) and its numerical approximation (32) are related.
Of course, we define the discrete operator Th (26) by taking as the test function in (7) a
subspace Vh ⊂ H 1 (TH ). The definition of the discrete operator Gh (28) follows from (19)
replacing the space Λ by a subspace Λ̃HΛ ⊂ Λ. In particular the solutions (23) and (32)
1/2
match if the ranges T (Λ) and Th (Λ) are the same, as well as the ranges G(H0 (EH )) and
1/2
Gh (H0 (EH ).
3 Main result
We derive estimates for the approximations errors ρ − ρHΓ , λ − λHΛ and u − uh . The
next result is strongly based on the First Strang Lemma [Ern and Guermond, 1997].
1/2
Theorem 3.1. Let (u, λ, ρ) ∈ H 1 (TH ) × Λ × H0 (EH ) be solution of the infinite dimen-
sional variational formulation (24) and (uh , λHΛ , ρHΓ ) ∈ Vh × ΛHΛ × ΓHΓ its approximated
solution from Galerkin scheme (32). Then, problem (29) is well-posed and
n o
|ρ − ρHΓ | 1 ,EH ≤ inf 2|ρ − φHΓ | 1 ,EH + E(φHΓ ) + |(T̃ − T̃h )f | 1 ,EH + E(T̃h f ); (33)
2 φHΓ ∈ΓH 2 2
1/2
where, for φ ∈ H0 (EH ),
E(φ) := inf CT−1 + 1 |Gφ − µ̃HΛ |Λ + CT−1 S(µ̃HΛ ) ; (36)
µ̃HΛ ∈Λ̃HΛ
holds.
These estimates can be simplified by assuming that local problems have exact solution,
by taking Vh = H 1 (TH ), wich implies Th = T and T̃h = T .
83
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Científica, 14 a 17 de Fevereiro de 2023.
that is, the left-hand side of the global problem (22). Then, we get by joining the right-
hand side of (41) and (22) that
Z
0
−hλ , ξiEH + hGT̃ f, ξiEH = f E(ξ) dx. (43)
Ω
84
EAMC ARTICLE DE BARROS et al.
Assuming that there are exact solutions for second level problems, the solutions ρ from
(22) and (41) coincide pointwise if Λ is an infinite dimensional space. For G = Gh ,
solutions match if range of E is contained in range of T Gh . Moreover, for A = I, the
solutions match, for Vh = P1 (TH ).
6 Numerical results
The following numerical experiments aim to access the analytical predictions and
investigate the performance of the MHHM method compared to MHM, MsFEM and
FEM, see Larson and Bengzon [2013], Paredes and Valentin [2013b], Paredes et al. [2016],
Paredes and Valentin [2013a]. Let Ω :=]0, 1[×]0, 1[ and the boundary value problem (1)
with A = I and f (x, y) := −2x(x − 1) − 2y(y − 1), for (x, y) ∈ Ω. This problem admits
an analytical solution given by
We denote MHHM-1-2 when the flux has one degree of freedom on each interface and
trace has two degrees of freedom. We plot in Figure 3 the convergence curves in the
energy norm |u − uh |A,1,TH . A computational cost graph is depicted in Figure 4. Here we
denote MHHM-1-2 if the method solves a saddle-point problem (17), and we use MHHM-
E-1-2 when method solves an elliptical problem (22). We observe that the accuracy of the
MHHM method matches that of the MHM method with fewer global degrees of freedom.
Fig. 3: Mesh based energy error graph for the analytical solution problem.
7 Conclusion
The Multiscale Hybrid-Hybrid-Mixed method is derived from a hybrid-mixed three-
field formulation and characterized by a symmetric elliptical probem. We relax the flux
defining it on each element boundary, so that different flux meshes can be taken for each
element. Although there is no conformity to the numerical solution, the trace and flux are
conform, that is, our method preserves mass conservation for the flux. Continuous and
85
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Científica, 14 a 17 de Fevereiro de 2023.
Fig. 4: Degrees of freedom by error graph for the analytical solution problem.
discrete inf-sup conditions hold. We introduce a pair of compatible finite element spaces
and error estimates, as well as, numerical experiments to access analytical predictions.
References
I. Babuska and J. E. Osborn. Generalized finite element methods: Their performance and
their relation to mixed methods. SIAM Journal on Numerical Analysis, 20(3):510–536,
1983.
Franklin C.Barros, Alexandre L. Madureira, and Frédéric G.C. Valentin. The Multiscale
Hybrid-Hybrid-Mixed method. Mestrado em modelagem computacional, Laboratório
Nacional de Computação Científica, Petrópolis, RJ, 2022.
Alexandre Ern and Jean-Luc Guermond. Theory and Practice of Finite Elements. Scuola
Norm. Sup. Pisa, 1997.
Gabriel N. Gatica. A Simple Introduction to the Mixed Finite Element Method - The-
ory and Applications. SpringerBriefs in Mathematics, Concepción, Chile, 2014. ISBN
9783319036946.
86
EAMC ARTICLE DE BARROS et al.
87
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
Processos estocásticos são dados por uma sequência de estados que representa a evolução temporal
de um sistema. A ordem do processo mostra quantos estados − atual (k = 1) e anteriores (k = 2, 3, ..)
− são usados para tomada de decisão do próximo estado. Nesse artigo, propõe-se o uso do Critério de
Informação de Akaike para estimativa das ordens das trajetórias de ratos reais e virtuais (obtidos por
inteligência artificial) no labirinto em cruz elevado. Para isso, os ratos foram divididos em três categorias:
controle e com efeito de drogas ansiolı́ticas e ansiogênicas. Foram comparadas as ordens dos processos
estocásticos compreendidos pelas trajetórias de ratos reais e virtuais. Curiosamente, embora os resultados
comportamentais gerais para ambos os tipos de ratos sejam semelhantes, as ordens dos processos diferem.
Esse resultado mostra a complexidade da simulação do comportamento exploratório de ratos, trazendo
uma perspectiva diferente da existente na literatura.
Keywords:Labirinto em cruz elevado, Rato, Redes neurais artificiais, Processo estocástico, Critério de
informação de Akaike
1 INTRODUÇÃO
Em meados dos anos 50, Montgomery criou um labirinto elevado em Y que visava explorar
o comportamento de ratos quando expostos a áreas abertas e fechadas no labirinto [Mont-
gomery, 1955]. Então Pellow [Pellow et al., 1985] criou o labirinto em cruz elevado (LCE),
88
EAMC ARTICLE DIAS et al.
que é usado nos dias de hoje principalmente nas áreas de Psicobiologia e Farmacologia.
O aparato recebe esse nome porque contém dois braços abertos e dois braços fechados,
em formato de cruz, e é mantido elevado do solo (Fig. 1).
Fig. 1: Labirinto em cruz elevado com um rato Wistar durante um experimento. Fonte:
Acervo próprio.
89
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
and Chao, 2005, Tejada et al., 2010]. No caso do LCE especificamente, alguns trabalhos
partiram da suposição de que a ordem do processo estocástico das trajetórias de ratos
é 1, isto é, que são processos Markovianos, e foram calculados os vetores estacionários
que dão a probabilidade de se encontrar o animal em cada posição do labirinto [Tejada
et al., 2010, de Andrade Costa and Tinos, 2016]. Contudo, nunca foram de fato estimadas
as ordens dos processos estocásticos decorrentes das trajetórias de ratos no LCE e nos
diferentes aparatos usualmente utilizados em Farmacologia e Psicobiologia.
Neste trabalho faz-se a análise de trajetórias de ratos reais sem efeitos de drogas e
sob efeitos de drogas ansiogênicas e ansiolı́ticas. Também foram analisadas trajetórias de
ratos virtuais, obtidos por simulações computacionais baseadas em redes neurais artificiais
(RNAs) otimizadas por algoritmo genético (AG) [Costa et al., 2012, 2013, 2014]. Esses
ratos virtuais simulam o comportamento de ratos reais nessas três condições. A utilidade
dessas análises pode ser a proposição de um método quantitativo simples para comparar
o efeito de drogas e possivelmente também de doenças neurológicas no uso de memória
para tomada de decisão do deslocamento de roedores no LCE.
2 MÉTODOS
2.1 Experimentos com ratos reais
O testes com ratos reais consistem em posicionar o rato no centro e deixá-lo percorrer o
LCE por um perı́odo de 5 min (300 s). Esse intervalo é definido, pois após esse perı́odo
o animal perde o interesse em explorar o ambiente e seu comportamento muda significa-
tivamente. A trajetória do animal é filmada para posterior análise.
Os dados de experimentos com ratos reais utilizados neste trabalho foram cedidos
pelo Prof. Silvio Morato de Carvalho, da Faculdade de Filosofia, Ciências e Letras de
Ribeirão Preto (FFCLRP) da Universidade de São Paulo (USP). Os dados são prove-
nientes de testes com ratos controle (sem efeitos de drogas), ratos sob a influência de
drogas ansiogênicas (semicarbazida e pentilenotetrazol) em diferentes dosagens e ratos
sob influência de drogas ansiolı́ticas (clordiazepóxido e midazolam), conforme mostra a
Tabela 1. O número de ratos por subcategoria varia, pois esses dados são provenientes de
experimentos realizados como parte de pesquisas com finalidades diferentes.
90
EAMC ARTICLE DIAS et al.
300
X
f (x) = (r(x, t) − β.s(x, t)) . (1)
t=1
Em r(x, t), o rato virtual recebe um ponto por passo de tempo se estiver em uma
posição não visitada nos últimos 3 passos anteriores. Por s(x, t)), o agente é punido em
um ponto por passo de tempo probabilisticamente, conforme sua posição atual. A chance
de punição é 0, 011 nos braços fechados, 0, 012 no centro e 0, 015 nos braços abertos. Isso
reflete a preferência natural do rato real pelos braços fechados.
91
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Os dois indivı́duos com maior fitness são selecionados diretamente para a próxima
geração (por elitismo). Como a quantidade de indivı́duos em cada geração é mantida
fixa, os demais indivı́duos a comporem a próxima geração são selecionados por torneio.
No torneio, pares aleatórios de indivı́duos são sorteados e, com probabilidade de 75%,
aqueles com maior f itness são selecionados; caso contrário, seguem aqueles com menor
f itness. Os indivı́duos selecionados passam então por recombinação de 1 ponto, com 60%
de chance, e cada alelo pode passar por mutação com 5% de probabilidade. A mutação é
gaussiana, com média 0 e desvio 0,05.
Esse processo completa os indivı́duos da próxima geração e após as 15.000 gerações a
execução é finalizada, conforme o mostra o esquema da Fig 3. Os dados do rato virtual
com maior f itness são registrados. As trajetórias analisadas correspondem a 30 ratos
virtuais, cada um com o melhor f itness de uma execução completa do AG.
92
EAMC ARTICLE DIAS et al.
os processos estocásticos podem ainda ser de ordens maiores que um, quando os estados
seguintes dependem de um ou mais estados passados além do estado atual.
No presente trabalho, os processos estocásticos estudados são as sequências de posições
discretas (ou seja, as trajetórias) de ratos virtuais em um LCE virtual e de ratos reais em
um LCE. É importante destacar que cada posição é incluı́da uma única vez na sequência
mesmo que o tempo de permanência do animal ou do agente virtual seja longa naquele
local; assim, uma nova posição é inserida na sequência sempre que houver a transição
entre posições distintas.
2.5 Análises
Para realizar as estimativas das ordens dos processos estocásticos foi utilizado um pacote
implementado em Python [Singer et al., 2013, 2014, 2015]. O pacote é válido para pro-
cessos dados por sequências de números inteiros, como é o caso das sequências obtidas
pelos deslocamentos dos ratos virtuais no LCE virtual esquematizado na Fig. 2. O LCE
real foi segmentado de maneira semelhante ao LCE virtual durante as análises.
Para as análises estatı́sticas, foi utilizado o Critério de Informação de Akaike (AIC) [Akaike,
1974]. Este método é baseado em teoria da informação e relaciona verossimilhança e a
quantidade de informação que se perde quando aproximamos os dados com um modelo
candidato. Aqui testou-se as ordens de 0 a 3 para os processos estocásticos das trajetórias
dos ratos, tanto reais como virtuais, e a ordem que obteve menor perda foi a estimada
para cada trajetória testada.
3 RESULTADOS E DISCUSSÕES
Inicia-se os resultados mostrando-se comparações do tempo médio que os ratos reais e
virtuais passam nos braços abertos e fechados do LCE. Este é o ponto de partida, pois o
tempo médio é uma das principais medidas usadas para análises do comportamento ex-
ploratório de ratos. O que distingue as simulações dos ratos virtuais é apenas o parâmetro
β, que balanceia a punição e a recompensa no cálculo da função de f itness do agente
virtual. Para β = 2, 2, tem-se a simulação de um rato sob efeito de droga ansiolı́tica
Clordiazepóxido na concentração de 1 mg/kg (Figura 4). Já a Figura 5, compara ratos
virtuais, com β = 3, 2, a ratos reais controle. Por fim, na Figura 6 exibem-se os tem-
pos médios de permanência de ratos reais sob efeito de droga ansiogênica Semicarbazida
na concentração de 20 mg/kg e ratos virtuais (β = 6, 3). Em todos os casos têm-se
poucas amostras e as distribuições são assimétricas. Assim, o teste estatı́stico usado para
validar os resultados obtidos para os ratos virtuais, em relação aos ratos reais, foi o Mann-
Whitney, com significância p = 0, 05. Em todos os casos, as distribuições dos dois grupos
(ratos reais e virtuais) são as mesmas.
Como esperado, ratos controle passam mais tempo nos braços fechados do que nos
braços abertos e no centro do LCE. O mesmo ocorre e é acentuado para ratos mais
ansiosos (sob drogas ansiogênicas). Este é o oposto do observado para ratos sob efeito de
drogas ansiolı́ticas.
Passando da etapa inicial de validação dos dados de ratos virtuais, segue-se com a
apresentação das ordens estimadas para os ratos reais controle e com diferentes dosagens
das drogas ansiolı́ticas e ansiogênicas estudadas (Tabela 2). Pela distinção entre as médias
93
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
e considerando os erros padrões, sugere-se que haja uma diferença estatı́stica entre as
categorias. Uma questão importante é que se pode estabelecer uma sequência crescente
entre as médias das ordens estimadas para as categorias estudadas: ansiogênica, controle
e ansiogênica. Tal resultado indica que os ratos menos ansiosos estariam usando mais
informações do ambiente e/ou memória como critério para a tomada de decisão em seu
percurso no LCE. Quanto maior a ansiedade, menos informação é usada. Uma justificativa
preliminar para este fato é que animais com mais medo/ansiedade agem de forma mais
impulsiva [Jakuszkowiak-Wojten et al., 2015].
Fig. 4: Tempo médio em cada tipo de braço para os ratos reais e virtuais sob efeito de droga
ansiolı́tica clordiazepóxido na concentração de 1 mg/kg. Significância estatı́stica do
Mann-Whitney teste p = 0, 05.
Fig. 5: Tempo médio em cada tipo de braço para os ratos reais e virtuais controles.
Mann-Whitney teste com p = 0, 05.
A ordem do processo estocástico estimada para cada rato virtual é apresentada na
Tabela 3. Os dados dos ratos virtuais utilizados nessa análise são os mesmos das Figu-
94
EAMC ARTICLE DIAS et al.
ras 4-6. Como o número de amostras é reduzido e os resultados obtidos foram binários,
não encontramos um teste estatı́stico apropriado para comparação das categorias, mas
considerando as médias e erros padrões sugere-se que as categorias sejam estatisticamente
distintas umas das outras.
Fig. 6: Tempo médio em cada tipo de braço para os ratos reais e virtuais sob efeito de droga
ansiogênica semicarbazida 20 mg/kg. Teste Mann-Whitney com p = 0, 05.
Nota-se que as médias das ordens estimadas para os processos estocásticos dos ratos
virtuais apresentaram uma sequência diferente da dos ratos reais. Neste caso, a média
dos ratos virtuais simulando efeitos de drogas ansiogênicas é menor do que a de drogas
ansiolı́ticas. Além disso, todos os ratos virtuais controle tiveram a ordem da trajetória
estimada em um, resultando em uma média 1 (ainda maior que a da droga ansiogênica).
Essas análises sugerem que a média de tempo gasta em cada tipo de braço pode não
ser suficiente para caracterizar o comportamento de ratos no LCE. As diferenças obtidas
para as ordens das trajetórias de ratos reais e virtuais podem refletir o uso de memória
operacional e informações ambientais durante o percurso. Assim, os resultados apontam
para uma diferença na tomada de decisão das diferentes categorias de ratos (controle e
sob efeito de drogas) tanto para o grupo de ratos reais quanto dos virtuais.
Ressalta-se que processos estocásticos são caracterizados por ordens representadas
unicamente por números inteiros. Sendo assim, as médias e erros padrões (números reais)
foram calculados apenas como uma forma de se mensurar a diferença entre as categorias
estudadas.
O estudo da ordem dos processos estocásticos pode ajudar a verificar variações no uso
de memória de trabalho de roedores no LCE. Os resultados sugerem que os ratos reais
sob efeito de drogas ansiolı́ticas são menos impulsivos e, estando mais tranquilos, podem
fazer maior uso da memória ambiental.
Uma grande dificuldade ao lidar com animais é a baixa amostragem e o fato que
após os experimentos os animais são, em muitos casos, sacrificados. Cada animal pode
participar de apenas um experimento no aparato, pois eles perdem o interesse exploratório
caso haja uma reexposição. Desta forma, vale destacar que a falta de amostras grandes
95
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
para a análise não é exclusiva de nossas análises, mas do uso de animais em experimentos
de modo geral.
Tabela 2: Ordens dos processos estocásticos estimadas para os ratos sob efeito
de diferentes dosagens de ansiogênicos (Pentilenotetrazol-PTZ e
Semicarbazida-SCZ), ansiolı́ticos (Clordiazepóxido-CDZ e Midazolam-MDZ) e
ratos Controle (sem uso de drogas), bem como as respectivas médias e erros
padrões.
96
EAMC ARTICLE DIAS et al.
4 CONCLUSÃO
Nesta pesquisa buscou-se obter a ordem do processo estocástico da trajetória de animais
controle e sob efeito de drogas ansiolı́ticas e ansiogênicas reais e simulados. Os resultados
mostram que é possı́vel distinguir o nı́vel de ansiedade do animal utilizando o Critério de
Informação de Akaike.
97
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
A comparação dos dados de ratos reais com ratos virtuais é feita no intuito de com-
preender o funcionamento dos ratos virtuais e como aprimorar não apenas esse modelo,
mas outros sistemas artificiais que atuem em situações de tomada de decisão. Assim,
houve diferenças nas ordens dos processos estocásticos estimados para os ratos virtuais
em relação aos ratos virtuais, embora os resultados comumente observados (tempo de
permanência em cada tipo de braço) sejam estatisticamente equivalentes. Desta forma,
mostra-se a importância de futuros estudos para a compreensão do funcionamento interno
das RNAs dos ratos virtuais e da sua tomada de decisão. Tais análises poderão trazer
contribuições no entendimento do papel dos neurônios e da tomada de decisão de ratos
virtuais, bem como inferências sobre relações entre o funcionamento do sistema nervoso
e tomadas de decisão de ratos reais.
5 Agradecimentos
LRF Dias agradece a bolsa de pesquisa concedida por Rafael Grisotto. R Tinós agradece o
CNPq (#306689/2021-9), a FAPESP (#2021/09720-2), o Center for Artificial Intelligence
(C4AI-USP) com suporte da FAPESP (#2019/07665-4) e a IBM Corporation. AA Costa
agradece o suporte do CNPq (Universal #405508/2021-2). Todos os autores são gratos
ao Prof. Silvio Morato pela concessão dos dados de ratos reais.
Referências
Hirotugu Akaike. A new look at the statistical model identification. In Selected Papers
of Hirotugu Akaike, pages 215–222. Springer, 1974.
Ariadne Costa, Patrı́cia Vargas, and Renato Tinós. Using explicit averaging fitness for
studying the behaviour of rats in a maze. In ECAL 2013: The Twelfth European
Conference on Artificial Life, pages 940–946. MIT Press, 2013.
Ariadne A Costa, Antonio C Roque, Silvio Morato, and Renato Tinós. A model based
on genetic algorithm for investigation of the behavior of rats in the elevated plus-maze.
In International Conference on Intelligent Data Engineering and Automated Learning,
pages 151–158. Springer, 2012.
Ariadne A Costa, Silvio Morato, Antonio C Roque, and Renato Tinós. A computational
model for exploratory activity of rats with different anxiety levels in elevated plus-maze.
Journal of neuroscience methods, 236:44–50, 2014.
Ariadne de Andrade Costa and Renato Tinos. Investigation of rat exploratory behavior
via evolving artificial neural networks. Journal of neuroscience methods, 270:102–110,
2016.
Elizabeth Garcia-Perez, Alberto Mazzoni, Davide Zoccolan, Hugh PC Robinson, and
Vincent Torre. Statistics of decision making in the leech. Journal of Neuroscience, 25
(10):2597–2608, 2005.
Patsy Haccou, Herman Dienske, and Evert Meelis. Analysis of time-inhomogeneity in
markov chains applied to mother-infant interactions of rhesus monkeys. Animal Beha-
viour, 31(3):927–945, 1983.
98
EAMC ARTICLE DIAS et al.
KC Montgomery. The relation between fear induced by novel stimulation and exploratory
drive. Journal of comparative and physiological psychology, 48(4):254, 1955.
Sharon Pellow, Philippe Chopin, Sandra E File, and Mike Briley. Validation of open:
closed arm entries in an elevated plus-maze as a measure of anxiety in the rat. Journal
of neuroscience methods, 14(3):149–167, 1985.
Cristiane Salum, Silvio Morato, and Antônio Carlos Roque-da Silva. Anxiety-like behavior
in rats: a computational model. Neural Networks, 13(1):21–29, 2000.
Helder K Shimo, Antônio C Roque, Renato Tinós, Julián Tejada, and Sı́lvio Morato. Use
of evolutionary robots as an auxiliary tool for developing behavioral models of rats in
an elevated plus-maze. In 2010 Eleventh Brazilian Symposium on Neural Networks,
pages 217–222. IEEE, 2010.
Philipp Singer, Thomas Niebler, Markus Strohmaier, and Andreas Hotho. Computing
semantic relatedness from human navigational paths: A case study on wikipedia. In-
ternational Journal on Semantic Web and Information Systems (IJSWIS), 9(4):41–70,
2013.
Philipp Singer, Denis Helic, Behnam Taraghi, and Markus Strohmaier. Detecting memory
and structure in human navigation patterns using markov chain models of varying order.
PloS one, 9(7):e102070, 2014.
Philipp Singer, Denis Helic, Andreas Hotho, and Markus Strohmaier. Hyptrails: A baye-
sian approach for comparing hypotheses about human trails on the web. In Proceedings
of the 24th International Conference on World Wide Web, pages 1003–1013, 2015.
Julián Tejada, Geraldine G Bosco, Silvio Morato, and Antonio C Roque. Characterization
of the rat exploratory behavior in the elevated plus-maze with markov chains. Journal
of neuroscience methods, 193(2):288–295, 2010.
Hsin-Chou Yang and Anne Chao. Modeling animals’ behavioral response by markov chain
models for capture–recapture experiments. Biometrics, 61(4):1010–1017, 2005.
99
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
Due to the occurrence of accidents owing systemic failures during maritime drilling operations of
oil wells, the study of well safety equipment Blowout Preventer (BOP) becomes crucial for accident
prevention. In many cases, computational modeling is used as an instrument for investigating dynamic
behavior and proposition of standardization profiles to support decision-takers in the diagnosis of the
“health”of a given equipment. The present work depict a Virtual Machine (VM) model developed with
the purpose of simulating the dynamics of solenoid valve functions in the electrical-hydraulic circuit of
BOP for activation of the Annular function and future application in the study of failure scenarios.
Qualitative and quantitative analyses of the results provided by the simulator were performed in order to
obtain a validation of the model. To this end, data from pressure and volume curves provided by drilling
contractors and metrics such as MSE, MAE, MAPE and RMSE were used as validation instruments.
The results obtained were satisfactory, showing that the physical model developed has a high rate of
confidential when compared to actual data.
Keywords: Computational modeling, Blowout Preventer (BOP), Solenoid valves, Virtual Machine
(MV), Model simulation validation.
100
EAMC ARTICLE MENDONÇA et al.
1 INTRODUÇÃO
As operações de perfuração marı́tima de poços de petróleo envolvem riscos de acidentes
com formação de blowouts que ocorrem por meio de falhas sistêmicas. Nesses eventos, a
erupção de fluidos oriundos de reservatórios de alta pressão, seguido do desdobramento
de total descontrole, em razão de falhas do sistema, provocam a perda de ativos, capital
e danos ambientais de múltiplas formas [Drægebø, 2014].
O principal equipamento para evitar blowouts é o Blowout P reventer (BOP), que
contempla diversos dispositivos formados por linhas hidráulicas, válvulas gavetas (Blind
Shear Ram), elementos vedadores de espaço anular (Annular ) e dispositivos elétricos que
estão interconectados para enviar e receber sinais distribuı́dos em subsistemas. Possuem
também, funções especı́ficas de nı́vel de importância dinâmica para abertura, fechamento,
além de intertravamento e bloqueio [Tammela et al., 2020a] [Huse and Alme, 2013].
Assim, os relatórios de registros de confiabilidade demonstram que válvulas regulado-
ras de pressão, solenoides e válvulas Sub-Plate Mounted (SPM) são componentes crı́ticos
em razão dos mecanismos de falhas e dos impactos na condição do equipamento para exe-
cutar funções de segurança que são vitais [Huse and Alme, 2013] [Drægebø, 2014] [BSEE,
2016].
Nesse contexto, estudos de análise de confiabilidade e modos de falhas, com a identi-
ficação de mecanismos de degradação, são cada vez mais realizados para buscar alterna-
tivas de tornar o BOP um sistema com maior operacionalidade, para reduzir a ocorrência
de eventos acidentais [Martins et al., 2018] [Drægebø, 2014] [Huse and Alme, 2013].
A evolução dessa abordagem atual está na análise de estados da condição do com-
ponente com o emprego da metodologia Condition-based Maintenance (CBM). A me-
todologia representa a combinação de monitoramento de condição e/ou inspeção e/ou
testes, além das análises e ações de manutenção que fornece um padrão da capacidade
dinâmica de resposta para execução de funções [Tammela et al., 2020b] [Marinho et al.,
2022] [Martins et al., 2018].
Uma das formas de testar os nı́veis de degradação de um componente fı́sico, seja no
domı́nio hidráulico, mecânico, térmico ou elétrico, são por meio da modelagem computa-
cional, seguida da simulação. Os modelos de domı́nios multifı́sicos podem ser obtidos de
forma virtual e buscam representar de forma fiel os subsistemas conforme os fenômenos
envolvidos para simulação dinâmica e extrair informações na previsão, diagnóstico e as-
sociação de efeitos [Khaled et al., 2020].
Dessa forma, a pesquisa busca construir um modelo de Máquina Virtual (MV) com
a finalidade de simular a dinâmica das funções da válvula solenoide no circuito elétrico-
hidráulico do BOP para ativação da função do Annular e futura aplicação no estudo de
cenários de falhas. A modelagem computacional é empregada como instrumento para
investigação do comportamento dinâmico e proposição de perfis de padronização para
subsidiar o tomador de decisão no diagnóstico da “saúde” do componente.
2 FUNDAMENTAÇÃO TEÓRICA
2.1 Compensated Chamber Solenoid Valves (CCSV)
O mecanismo de acionamento do BOP é dinamicamente desenvolvido por meio de um
sistema hidráulico com modos de ativação elétrico por válvulas solenoides.
101
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Uma válvula solenoide pode ser definida em alguns casos como uma Compensated
Chamber Solenoid V alve (CCSV) que consiste em uma câmara em aço inoxidável de
compensação de pressão preenchida com fluido dielétrico com atuadores solenoides pro-
tegidos para executar funções especı́ficas. O componente tem a função eletro-hidráulica
e atua como interface entre o sistema de controle e o piloto hidráulico, sendo responsável
pelo acionamento das SPMs [NOV, 2015].
A CCSV basicamente possui dois componentes principais; o solenoide e o f luid end
para acionamento. Desta forma, a válvula tem a finalidade de atuar após a energização da
haste móvel por atuação hidráulica do fluido na válvula piloto para permitir a passagem
de um fluido piloto [NOV, 2015].
A SPM atua como uma válvula direcional utilizada para fornecer a pressão hidráulica para
várias funções do Stack, consistindo em duas ou mais subplacas conectadas para formar
uma pilha de válvulas com entrada e descarga comum. Dependendo da função, a SPM
pode ser do tipo normalmente fechada (NC), normalmente aberta (NO), normalmente
fechada bidirecional (NCB), de dupla ação bidirecional (DAB) ou de dupla ação normal-
mente fechada bidirecional (DANCB). Quando a SPM é “pilotada”hidraulicamente para
abrir ou fechar no ponto de distribuição POD ativo, ela direciona o fluido de controle regu-
lado para um BOP stack ou função do Lower M arine Riser P ackage (LMRP) especı́fica
ou ventila para o mar. Por outro lado, quando um comando de anulação é recebido pelos
PODs M ultiplex BOP Control System (MUX) submarinos, a CCSV é desenergizada. A
CCSV então fecha e libera a pressão piloto da válvula SPM. Na sequência, a válvula SPM
fecha ou abre, direcionando o fluido de controle regulado para uma BOP stack especı́fico,
função LMRP ou ventila para o mar [BSEE, 2016].
A CCSV pode ser configurada como uma função direta em conjunto com uma válvula
SPM. Deste modo, a válvula é operada por uma solenoide cujo sinal de comando é con-
trolado a partir dos painéis de controle auxiliares ou do Driller (sondador). As válvulas
SPM montadas no POD e montadas na stack são então controladas pela CCSV por
meio da pressão piloto para controlar o fluxo de pressão no circuito de forma a atuar no
componente do equipamento BOP [NOV, 2012].
As CCSVs não configuradas em conjunto com uma válvula SPM operam outras
válvulas SPM montadas na stack ou dispositivos finais. Essas funções são chamadas
de funções “diretas”porque transmitem sinais do piloto diretamente através do POD.
Nesses casos, a CCSV é conectada a uma válvula SPM configurada para permitir o fluxo
contı́nuo o tempo todo. Com efeito, a CCSV está operando outra função SPM montada
na stack da mesma forma que a CCSV independente [NOV, 2012].
Conforme exposto por BSEE [2016], a SPM pode ser destinada para execução de uma
determinada função do BOP. As válvulas SPM de controle direcionam o fluido de supri-
mento para a função desejada do componente do BOP e ventilam o fluido do lado oposto
102
EAMC ARTICLE MENDONÇA et al.
ao daquele componente. As válvulas são operadas por piloto a partir da superfı́cie com
auxı́lio de mangueiras piloto no umbilical. Em geral, duas válvulas SPMs são requeridas
para operar cada função. Por outro lado, os componentes NO e NC operados por piloto e
retorno por mola podem requerer apenas uma SPM. Dentre as diversas funções do BOP,
podem ser citadas as funções: U pper Annular Open , U pper Annular Close, Lower
Annular Open, Lower Annular Close, U pper Blind Shear Ram (UBSR) – HP Close,
Close e Open. Um diagrama hidráulico esquemático para execução da função U pper
Annular Close pelas válvulas CCSV e SPM é apresentado na Fig. (1). De maneira
habitual, essas funções são monitoradas através de curvas de pressão que são obtidas
dos dispositivos medidores de pressão PT-4 e PT-8 localizados em pontos estratégicos
do sistema hidráulico do BOP conforme apresentado na Fig. (1) que fornece destaque
para os medidores de pressão delimitados por cı́rculos azuis. Por vezes, esses dispositivos
de medição podem realizar mais de uma função. Além de desempenharem a função de
sensor de pressão, podem atuar também como transdutores de pressão, transformando
o sinal de pressão obtido em um sinal elétrico [Seborg et al., 2016]. Esses instrumentos
de medição possuem também uma determinada resolução “capacidade de leitura” que
pode afetar a interpretação dos dados em alguns casos. Os sensores/transdutores PT-4
e PT-8 possuem uma resolução de 2 segundos e não são capazes de fornecer uma boa
leitura para funções que são executadas em um curto intervalo de tempo (≤ 1 segundo)
como no caso da solenoide, em que sua energização/desenergização promove efeitos na
leitura da pressão que podem não ser captados com a resolução adequada. O medidor
de pressão PT-4 por estar localizado na linha piloto, se torna ideal para avaliação dos
efeitos surgentes durante a ativação da CCSV/SPM. Já o medidor de pressão PT-8 por
estar localizado na linha de suprimento se torna mais adequado para avaliação dos efeitos
surgentes na execução da função U pper Annular Open/Close, função esta responsável
pela abertura/fechamento do elemento de vedação (Annular) de poço do BOP. Sendo
assim, em conjunto, os dados obtidos dos medidores de pressão fornecem informações
significativas para o monitoramento do sistema hidráulico do BOP durante a execução de
suas funções.
103
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
3 METODOLOGIA
A metodologia aplicada para a pesquisa tem caráter exploratório de abordagem mista, em
que através da análise teórica do sistema foi possı́vel realizar a modelagem computacional,
assim como a validação do simulador elaborado. O desenvolvimento executado no presente
trabalho consistiu em cinco etapas.
Na primeira etapa foi realizada uma análise teórica objetivando o entendimento do
funcionamento dos componentes CCSV e SPM, assim como dos fenômenos fı́sicos proce-
dentes do funcionamento dos mesmos. Para isso, foram realizados estudos em manuais
técnicos e reuniões com especialistas.
Em uma segunda etapa, foram obtidos e processados os dados de monitoramento e
execução das funções analisadas, sendo esses fornecidos pelas drilling contractors, o que
possibilitou o inı́cio da etapa 3 que consistiu na análise dos dados coletados e agrupamento
de curvas de pressão e volume ao decorrer do tempo com comportamento similar utilizando
a técnica de clusterização, tornando possı́vel a determinação de limites superiores, limites
inferiores, médias, desvios padrão e a identificação de um padrão de curva de pressão e
volume ao longo do tempo para a execução das funções CCSV/SPM.
Na etapa 4 ocorreu o desenvolvimento do modelo no ambiente Simulink/Simscape
do sof tware Matlab®, baseado na pesquisa teórica e análise de dados executadas nas
etapas anteriores, gerando o modelo simulado, que teve sua validação realizada na etapa
seguinte através da comparação qualitativa dos perfis das curvas simuladas e reais, assim
como uma analise quantitativa executada por meio de métricas estatı́sticas para validação
do modelo.
4 DADOS EXPERIMENTAIS
Os dados para validação foram coletados do sistema real e disponibilizados pelas drilling
contractors, tratados, compilados e compactados numa base de dados desenvolvida na
ferramenta Power BI.
104
EAMC ARTICLE MENDONÇA et al.
105
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
di dL
V =L +i (1)
dt dt
Como L depende unicamente de x a Eq. (1) pode ser reescrita como:
di dL dx
V =L
+i (2)
dt dx dt
A derivada de L com relação a x pode ser obtida dos dados de f orce-stroke do
fabricante através da relação expressa pela Eq. (3).
dL
F = 0.5i2 (3)
dx
Onde L é a indutância, x a posição do plunger, i a corrente, V a tensão e F é a força
magnética da solenoide.
6 VALIDAÇÃO
A etapa de validação do modelo CCSV/SPM na execução da função U pper Annular
Close foi composta por uma análise mista em duas etapas.
Para isso, foi desenvolvida em uma primeira etapa uma avaliação qualitativa baseada
na comparação dos perfis reais e simulados das curvas obtidas pelos medidores de pressão
PT-4 e PT8, identificando que a curva simulada para ambos apresentam perfis similares
às curvas reais, respeitando os limites de máximo e mı́nimo para cada intervalo de tempo
da execução da função dos componentes.
Em uma segunda etapa, as análises quantitativas objetivaram avaliar a variabilidade
da curva simulada em comparação à curva real. Dentro desse contexto, foram utilizadas
as métricas Erro Absoluto Médio (MAE); Erro Quadrático Médio (MSE); Raiz do Erro
Quadrático Médio (RMSE) e Erro Percentual Médio Absoluto (MAPE) para verificar a
acurácia das curvas. Onde a primeira métrica representa a média dos erros em valores
absolutos, a segunda calcula o quadrado da média de diferença entre o valor simulado
com o real, a terceira é obtida a raiz quadrada da média dos erros quadráticos, e a última
dada pela média do erro percentual em valor absoluto [Hair et al., 2009] [dos Santos et al.,
2011] [Moreno et al., 2013] [Hora and Campos, 2015].
Além das métricas descritas, foi executada a verificação da correlação entre a curva
simulada e os agrupamentos clusterizados previamente obtidos para cada uma das funções
analisadas. Em adição, o modelo foi validado em conjunto com a função close do Annular
U pper que é um dos diversos componentes crı́ticos presentes no sistema hidráulico do BOP
que foi modelado e desenvolvido em paralelo.
7 RESULTADOS E DISCUSSÃO
7.1 Resultados Qualitativos
Na validação qualitativa, foi considerado um tempo de execução das funções para análise
gráfica que fosse capaz de caracterizar o perfil das curvas em análise. Desse modo, foram
analisados os 6 (seis) primeiros segundos para a curva de pressão fornecida pelo sensor
106
EAMC ARTICLE MENDONÇA et al.
PT-4 e 40 (quarenta) segundos para curva de pressão fornecida pelo sensor PT-8, repre-
sentando o intervalo de interesse . A partir da simulação, além das curvas de pressão
foram obtidos os gráficos referentes a execução da solenoide e deslocamento do percursor
da SPM, como apresentado na Fig. (3).
·10−3 ·10−3
6
Deslocamento (m)
Deslocamento (m)
2
4
1
2
0 0
0 1 2 3 0 10 20 30 40
Tempo (s) Tempo (s)
(a) Solenoide. (b) SPM.
Dando continuidade a análise qualitativa, com enfoque para estudo de avaliação do real
perfil, a curva simulada PT-4 obtida foi comparada de forma clusterizada com as curvas:
real média, real superior e real inferior conforme registrado na Fig. (4.a). Os resultados
obtidos são especı́ficos no sentido de demonstrar nessa fase de testes experimentais o
desempenho do simulador, a existência de alta concordância entre as curvas que mostram
o perfil de variação de pressão no intervalo de 0 a 6 segundos após o acionamento.
24
Pressão (MPa)
Pressão (MPa)
22 10
20
5
18 Simulada Simulada
Média Média
Limite Superior Limite Superior
Limite Inferior Limite Inferior
16
0 2 4 6 0 10 20 30 40
Tempo (s) Tempo (s)
(a) Pressão lida pelo PT-4. (b) Pressão lida pelo PT-8.
107
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
0.3
Volume (m³)
0.2
0.1
0 Simulada
Média
Limite Superior
Limite Inferior
0 5 10 15 20 25 30 35 40
Tempo (s)
Uma vez que os resultados gráficos constataram que o simulador apresentou os resul-
tados esperados, se prosseguiu para execução da etapa de validação quantitativa.
N
1 X
M AE = |ei | (4)
N i=1
N
1 X 2
M SE = e (5)
N i=1 i
N
1 X
M AP E = |P Ei | (6)
N i=1
108
EAMC ARTICLE MENDONÇA et al.
v
u N
u1 X
RM SE = t e2 (7)
N i=1 i
No que diz respeito à correlação, as curvas simuladas foram comparadas com as médias
reais obtidas. Para a curva de pressão do sensor PT-4 obteve-se correlação total (100%)
da curva simulada, tanto com relação à curva real do grupo padrão quanto à curva média.
Já para a curva de pressão do sensor PT-8 o resultado da correlação em comparação com
a curva do grupo padrão foi de 0,983 e de 0,752 com a média.
De modo subsequente foram analisadas as métricas MAE, MSE, RMSE e MAPE, para
as mesmas funções. Nessa etapa foram comparadas as curvas de forma individual com a
curva simulada. Tal análise consistiu em verificar individualmente a adequação do perfil
dinâmico de simulação para cada uma das funções. Como critério de validação, uma
curva pode ser considerada significativa quando além do MAPE estiver abaixo de 15%,
houver pelo menos outras duas métricas dentro de um range (intervalo) que representa
“alta acurácia”. As métricas com um range moderado são avaliadas dentro do contexto
de cada função para verificar a significância da curva simulada. A Tabela (1) apresenta
o intervalo de aceitação das métricas analisadas em 3 classes de acurácia de validação do
modelo:
Tabela 1: Intervalo de critério de acurácia para validação do modelo por
métricas estatı́sticas para medidas dos sensores PT-4 e PT-8
8 CONCLUSÃO
Uma vez realizada as análises de validação do modelo, foi possı́vel verificar que os resul-
tados qualitativos obtidos mostraram a existência de alta concordância entre as curvas
de respostas de simulação de ativação e desenergização da CCSV/SPM do BOP e os da-
dos reais dos perfis das curvas de pressão e volume no tempo fornecidas pelas drilling
contractors.
109
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
No que tange a validação quantitativa, as curvas lidas pelo sensor PT-4 relacionadas
a execução da função U pper Annular Close mostraram que de acordo com as métricas
71,42% das curvas apresentaram alta acurácia. Contudo, uma vez que o sensor PT-4
(localizado na linha de “pilotagem”) lê os dados durante a execução da CCSV, que por
sua vez possui duração de execução muito curta (instantânea), a resolução do sensor torna
a leitura real falha, impactando a acurácia dos resultados . Já para as curvas lidas pelo
sensor PT-8 para a execução da mesma função, os resultados indicaram uma adequação
de 93,87% das curvas reais com a curva simulada e de 100% do grupo padrão, uma vez
que as curvas registradas pelo sensor PT-8 são mais longas, possuindo um função com
maior tempo de execução. Dessa forma, o sensor PT-8 captura perfis de curvas que são
medidas de forma mais assertiva fornecendo uma melhor acurácia dos resultados.
Sendo assim, validações qualitativas e quantitativas realizadas do comportamento
dinâmico do sistema demonstram que o modelo desenvolvido atende aos requisitos ne-
cessários para representação do modelo fı́sico real. Para trabalhos futuros e em anda-
mento se busca determinar e compreender os modos de falhas do equipamento através da
simulação de falhas na Máquina Virtual desenvolvida, o que irá permitir um diagnóstico
da “saúde” do equipamento em questão.
9 Agradecimentos
Agradecemos à Petrobras por todo apoio fornecido ao projeto “Desenvolvimento de Meto-
dologia para Manutenção Baseada em Condição (CBM) em Blowout Preventers (BOPs)”,
tornando capaz a construção do presente trabalho.
Referências
BSEE. Report blowout preventer control system reliability. Technical report, Bureau of
Safety and Environmental Enforcement, 2016.
110
EAMC ARTICLE MENDONÇA et al.
J. R. Huse and I. A. Alme. Bop reliabilty monitored real time. Technical report, SPE
(Society Petroleum Engineers) International, 2013.
J. J. Moreno, A. P. Pol, and A. S. Abad. Using the R-MAPE index as a resistant measure
of forecast accuracy. Psicothema, pages 500–506, 2013.
NOV. Multiplex control pod and bop stack control system 1. Technical report, National
Oiwell Varco, Houston,Texas, 2012.
NOV. Acoustic control pod. Technical report, National Oiwell Varco, Houston,Texas,
2015.
J. Smith and R. Nair. Virtual Machines: Versatile Platforms for Systems and Processes.
The Morgan Kaufmann Series in Computer Architecture and Design. Morgan Kauf-
mann, 2005. ISBN 1558609105; 9781558609105.
111
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Resumo
Este trabalho apresenta um estudo inicial sobre a discrepância de modelo na avaliação da resposta
de um sistema dinâmico com amortecimento viscoelástico por meio de um modelo de amortecimento
viscoso. É empregada uma abordagem que visa o desacoplamento dos problemas de inferência sobre o
parâmetro desconhecido do modelo e sobre a discrepância em duas etapas. Na primeira etapa, é realizada
a estimação do parâmetro por meio de uma abordagem bayesiana likelihood-free. Na segunda etapa, a
amostra da distribuição a posteriori do parâmetro do modelo é utilizada para inferir sobre a discrepância
de modelo e a resposta preditiva, empregando regressão por processo gaussiano em conjunto com o Método
de Monte Carlo via amostragem de importância. O sistema estudado apresenta um grau de liberdade e
seu amortecimento viscoelástico é dado pelo modelo de variáveis internas Anelastic Displacement Fields.
O problema inverso de estimação de parâmetros é resolvido por meio do método Sequential Monte Carlo.
A resposta preditiva a posteriori estimada é avaliada com base na sua capacidade em ajustar os dados de
teste. A discrepância obtida via regressão por processo gaussiano é comparada com a discrepância exata
que, no caso estudado, é conhecida.
1 INTRODUÇÃO
Os materiais viscoelásticos recebem essa denominação por apresentarem o comportamento
combinado de um sólido elástico ideal e de um fluido viscoso ideal [Trindade and Almeida,
2006]. Existem diversas metodologias para representar o comportamento desses materiais.
O modelo de variáveis internas Anelastic Displacement Fields (ADF) é um exemplo dessas
metodologias e contabiliza o deslocamento total como a soma de uma parcela elástica com
112
DISCREPÂNCIA DE MODELO DE OLIVEIRA SÁ et al.
113
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
2 FORMULAÇÃO MATEMÁTICA
2.1 Modelos fı́sico-matemáticos
Neste trabalho, é considerado um sistema mecânico de um grau de liberdade e amorte-
cimento viscoelástico dado pelo modelo ADF com um único campo anelástico, conforme
apresentado na Fig. 1a. Nestas condições, o ADF é análogo à forma de Maxwell do
modelo Sólido Linear Padrão [Lin, 2020].
(a) Sistema com amortecimento viscoelástico. (b) Sistema com amortecimento viscoso.
Fig. 1: Representações esquemáticas dos modelos empregados.
114
DISCREPÂNCIA DE MODELO DE OLIVEIRA SÁ et al.
∆1 ˙
ξ1 (t) + ∆1 ξ1 (t) = ∆1 ȳ(t) (2)
Ω1
˙
ȳ(0) = ȳ(0) =0 (3)
ξ1 (0) = 0 (4)
O termo ξ1 é uma variável interna para a representação da evolução temporal do
campo anelástico [Vasques et al., 2010].
A equação de movimento do sistema da Fig. 1b é dada por
115
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
−1
E[f ] = Kt∗ ,t Kt,t + σ 2 It,t yexp (t) (13)
−1
V[f ] = Kt∗ ,t∗ − Kt∗ ,t Kt,t + σ 2 It,t Kt,t∗ (14)
116
DISCREPÂNCIA DE MODELO DE OLIVEIRA SÁ et al.
Assim, o vetor esperança E[f ] e a matriz de covariância V[f ] podem ser expressos
como
Nj Nk
X X −1
E[f ] ∼ (j,k) (j,k) (j,k) 2
= w K t∗ ,t K t,t + σ It,t y exp (t) (15)
j=1 k=1
Nj Nk
X X
V[f ] ∼
(j,k) (j,k) (j,k) (j,k)
= w(j,k) (K t∗ ,t∗ − K t∗ ,t (K t,t + σ 2 It,t )−1 K t,t∗
j=1 k=1 (16)
(j,k) (j,k) (j,k) (j,k)
+K t∗ ,t (K t,t +σ 2 It,t )−1 y exp (t)(K t∗ ,t (K t,t + σ 2 It,t )−1 yexp (t))T ) − E[f ]E[f ]T
Nj Nk
X X −1
E[δ] ∼
(j,k) (j,k)
= w(j,k) (K t∗ ,t K t,t + σ 2 It,t y exp (t) − y(j) (t∗ )) (19)
j=1 k=1
Nj Nk
X X
V[δ] ∼
(j,k) (j,k) (j,k) (j,k)
= w(j,k) (K t∗ ,t∗ − K t∗ ,t (K t,t + σ 2 It,t )−1 K t,t∗
j=1 k=1
(20)
(j,k) (j,k)
+(K t∗ ,t (K t,t + σ 2 It,t )−1 y exp (t) − y(j) (t∗ ))
(j,k) (j,k)
(K t∗ ,t (K t,t + σ 2 It,t )−1 yexp (t) − y(j) (t∗ ))T ) − E[δ]E[δ]T
117
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
3 RESULTADOS E DISCUSSÕES
Neste trabalho, a resposta experimental é a resposta impulsiva obtida a partir das Eqs.(1,2),
considerando G0 = 10 N/m, ∆1 = 10, Ω1 = 20 rad/s, ke = 100 N/m e m = 10 kg, com
ruı́do ε aditivo e não-correlacionado de distribuição normal de média nula e desvio-padrão
σ = 10−3 m. As Equações (1 - 4, 7) são empregadas para construir a resposta experimen-
tal sintética yexp (t∗ ), para t∗ ∈ [0, 10] s em intervalos de 0,1 s (10 amostras por segundo).
Esta resposta corresponde aos dados de teste em yexp (t∗ ) e é utilizada como meio de
validação da predição de f (y, t∗ ). Os dados de treinamento são respostas associadas a
t ∈ [0, 10] s em intervalos de 0,2 s (cinco amostras por segundo), denotados por yexp (t).
Os dados de treinamento são empregados na estimação do parâmetro d e na predição da
resposta f (y, t∗ ).
A resposta sintética empregada na etapa de treinamento, bem como o ruı́do associado,
são apresentados na Fig. 2.
Com base na Figura 2, é possı́vel notar que o ruı́do pode ser considerado de baixa
amplitude em comparação com a resposta experimental de treinamento. Isso representa
o contexto em que o experimento é bem controlado. Desse modo, espera-se que o ruı́do
não tenha impacto relevante sobre os resultados e que a discrepância de modelo seja a
principal fonte de incertezas. Além disso, é importante destacar que o comportamento
oscilante com amplitude decrescente da resposta poderia √ ser reproduzido pelo modelo do
sistema com amortecimento viscoso apenas se 0 < d < 2ξ ke m, caso no qual este modelo
representa um sistema sub-amortecido. Dito isto, para o caso estudado, d ∈ (0; 63, 24)
Ns/m. Esta informação é utilizada na escolha do suporte da distribuição a priori do
parâmetro d. Então, a densidade de probabilidade a posteriori aproximada de d é obtida
considerando a distribuição a priori d ∼ U [0, 63] Ns/m. Isto pode ser visto na Fig. 3.
118
DISCREPÂNCIA DE MODELO DE OLIVEIRA SÁ et al.
119
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Fig. 4: Região de 95% de credibilidade da resposta preditiva a posteriori via regressão por
processo gaussiano.
A discrepância inferida via regressão por processo gaussiano é apresentada na Fig. 5a.
A curva exata da discrepância é obtida por meio das Eqs. (1-8), considerando E[d|yexp (t)]
como estimativa pontual para d. É importante destacar que a discrepância de modelo via
regressão por processo gaussiano apresenta incerteza considerável (área da RC), decorrente
das influências das incertezas do parâmetro do modelo e dos hiperparâmetros do processo
gaussiano, além do próprio ruı́do experimental.
120
DISCREPÂNCIA DE MODELO DE OLIVEIRA SÁ et al.
4 CONCLUSÕES
Neste trabalho, foi realizado um estudo inicial e simplificado sobre a discrepância de
modelo, empregando regressão por processo gaussiano para inferir sobre o comportamento
de um sistema dinâmico com amortecimento viscoelástico por meio de um modelo de
amortecimento viscoso. Alguns aspectos da modelagem foram apresentados de forma
resumida. O modelo escolhido é simples, conhecido e de fácil compreensão. Os autores
empregaram uma abordagem que visa desacoplar os problemas de inferência conforme
mencionado neste artigo. Foram realizadas predições sobre a resposta corrigida do modelo
e sobre a sua discrepância de modelo. Todos os resultados foram satisfatórios.
Com esses resultados, os autores puderam obter uma compreensão inicial sobre o
emprego da técnica de regressão por processo gaussiano na inferência da discrepância de
modelo, permitindo a possibilidade de seu emprego posterior na realização de estudos da
discrepância em contextos de maior complexidade.
5 Agradecimentos
O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pes-
soal de Nı́vel Superior – Brasil (CAPES) – Código de Financiamento 001. Os autores
também agradecem pelo apoio do Conselho Nacional de Desenvolvimento Cientı́fico e
Tecnológico (CNPq) e da Fundação de Amparo à Pesquisa do Estado do Rio de Janeiro
(FAPERJ).
Referências
A. Abdessalem, N. Dervilis, D. Wagg, and K. Worden. Model selection and parame-
ter estimation in structural dynamics using approximate bayesian computation. Me-
chanical Systems and Signal Processing, 99:306–325, 2018. © 2017 The Author(s).
Published by Elsevier Ltd. This is an open access article under the CC BY license
(http://creativecommons.org/licenses/by/4.0/).
P. Gardner, C. Lord, and R.J. Barthorpe. Bayesian history matching for structural dy-
namics applications. Mechanical Systems and Signal Processing, 143:106828, 2020. ©
2020 The Author(s). Published by Elsevier Ltd. This is an open access article under
the CC BY license (http://creativecommons.org/licenses/by/4.0/).
P. Gardner, T.J. Rogers, C. Lord, and R.J. Barthorpe. Learning model dis-
crepancy: A gaussian process and sampling-based approach. Mechanical Sys-
tems and Signal Processing, 152:107381, 2021. © 2021 The Author(s). Pu-
121
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
blished by Elsevier Ltd. This is an open access article under the CC BY license
(http://creativecommons.org/licenses/by/4.0/).
G. A. Lesieutre. Finite elements for dynamic modeling of uniaxial rods with frequency-
dependent material properties. International Journal of Solids and Structures, 29(12):
1567–1579, 1992.
C. Y. Lin. Alternative form of standard linear solid model for characterizing stress re-
laxation and creep: Including a novel parameter for quantifying the ratio of fluids to
solids of a viscoelastic solid. Frontiers in Materials, 7, 2020.
122
Resumos
123
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
As inúmeras publicações nocivas geradas entre grandes quantidades de dados, que são expelidos diari-
amente nas mı́dias sociais, fazem com que seja necessário adotar tecnologias automatizadas de moderação
de conteúdo online. A classificação de sentenças e a análise de sentimentos são técnicas de Processamento
de Linguagem Natural (PLN) utilizadas para detecção de discurso de ódio em plataformas de mı́dias so-
ciais como o Facebook, Twitter e Instagram. Entretanto, ainda existem dificuldades que diminuem a
eficácia dessas ferramentas na lı́ngua portuguesa. Pesquisas anteriores como a de Leite et al. [2020] evi-
denciam como modelos de PLN têm sua acurácia elevada quando são treinados com conjuntos de dados
focadas no domı́nio do idioma português. Neste trabalho, é proposta a criação de um corpus linguı́stico
de larga escala para o português do Brasil composto por tweets coletados após as eleições presidenciais
de 2022. Experimentos utilizando o modelo pré-treinado Bertimbau foram feitos a partir do fine-tuning
com a base de dados pré-existente “hatecheck-portuguese” de Röttger et al. [2022].
Referências
Joao A Leite, Diego F Silva, Kalina Bontcheva, and Carolina Scarton. Toxic language de-
tection in social media for brazilian portuguese: New dataset and multilingual analysis.
arXiv preprint arXiv:2010.04543, 2020.
Paul Röttger, Haitham Seelawi, Debora Nozza, Zeerak Talat, and Bertie Vidgen. Multi-
lingual hatecheck: Functional tests for multilingual hate speech detection models. arXiv
preprint arXiv:2206.09917, 2022.
124
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Científica, 14 a 17 de Fevereiro de 2023.
Abstract
The main goal of this study is to validate a consensus docking calculation to ensemble-docking using
multiple programs. The ensemble-docking will be done with 11 Drosophila melanogaster dopamine transporter
(dDAT), 10 downloaded from RCSB-PDB, and 1 theoretical dDAT was downloaded from AlphaFold and 26
antidepressants downloaded from ZINC and 1550 decoys downloaded from DUD-E. We are using three different
programs, Autodock Vina 1.5.7, DockThor e Gold 2021.3.0. A consensus docking technique combined the score
functions of different programs into one. The consensus will be divided into three steps. The first step of consensus
is to transform the ΔG (to Autodock Vina and DockThor) and fitness (to Gold) for each ligant-dDAT pair in a
standard metric. For this, we will test two different forms of ordination. The first form, the ligand with the best
interaction, receives the 1º position, and the last interaction receives the 1576º position. For that, we will use the
following equation: SUMPRODUCT((x<=1º column element:last column element)/COUNTIF(1º column
element:last column element;1º column element:last column element)). In this way, we lost the scale between the
elements, it is understood here that the difference between elements 1 and 2 is the same difference between
elements 2 and 3, and so on. In the other form, in order to estimate the magnitude of the difference between the
ordered elements, we use the formula of the linear function: f(x)= (x - min)/(min - max). Where the “x” is the ΔG
or fitness, the “min” is the result of the ligand with the minimum value (worse affinity), and the “max” is the result
of the ligand with the maximum value (best affinity). In the linear function, the resulting values range from 0 to 1,
with 0 being the ligand with the best interaction and 1 being the ligand with the worst interaction. Regardless of the
ordering of the ligands, the subsequent steps are the same. In the second step, a consensus will be made between the
programs of each ligand-dDAT pair. For this, the exponential average calculation between the ranks of each
ligand-dDAT pair in each program is applied. The last step is a simple average between the posts of each ligand
docked with all dDATs (TRICHES et al., 2022). In this way, we hope to find antidepressants in the top positions of
the ranking, followed by decoys. We hope that by using the linear function in the first step, it will be possible to
capture the difference between the ranks of the ligands. Finally, we hope that the consensus will give a more
reliable result when compared to the data on the inhibition constant (Ki) in the literature obtained from in vitro
studies.
Referências: TRICHES, F. F.; TRICHES, F.; DE OLIVEIRA, C. L. "Consensus combining outcomes of multiple
ensemble dockings: examples using dDAT crystalized complexes." MethodsX 9 (2022).
125
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
Since the discovery of anticancer activity of cisplatin many direct analogues have been studied and
developed. Those analogues share the same mechanism of action and aim a higher effectiveness with lower
side effects. BBR3464 was the first non-analogue to be tested in humans and it started a new way of
interaction called clamps and forks: a noncovalent cyclic hydrogen interaction stabilized by 6 and 8 atoms,
respectively, among phosphates/sulphates groups in biomolecules and the PtN4 centres. After that, many
compounds that follow the same mechanism of action have been designed, the so called substitution inert
polynuclear platinum complexes [Farrell, 2015, N. M. P. Rosa, 2022]. The main idea of this project is to
substitute the simple diamine linking chains in those complexes for both spermine and spermidine, which
have more amines in the structure, and, thus, may increase the interaction of the metallic complexes
with biological macromolecules. It was performed molecular dynamics simulations on systems containing
both DNA/HS and a SI-PPC and the results were analysed in terms of atomic fluctuations, interaction
energies and solvent accessible surface area in order to evaluate the atomic-scale variables in the studied
arrangements. Those results may corroborate to those available in the experimental literature and might
help explain these results.
References
N. P. Farrell. Multi-platinum anti-cancer agents. substitution-inert compounds for tumor
selectivity and new targets. Chem. Soc. Rev., 44:8773–8785, 2015.
et. al. N. M. P. Rosa. Substitution-inert polynuclear platinum complexes and glycosamino-
glycans: A molecular dynamics study of its non-covalent interactions. Journal of Inor-
ganic Biochemistry, 232:111811, 2022.
126
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
Este trabalho tem como objetivo desenvolver uma ferramenta baseada em visão computacional e
aprendizado de máquina capaz de identificar e estimar a severidade de pragas e doenças em folhas de
café. As doenças abordadas neste trabalho são bicho-mineiro, ferrugem, mancha de olho pardo e phoma,
cujos sintomas manifestam-se principalmente nas folhas. A base utilizada para teste é a BRACOL
[Krohling, 2019], composta por 100 imagens de folhas saudáveis e 400 com sintomas, incluindo exemplos
de folhas com múltiplas doenças. Para tanto, propõe-se explorar e comparar modelos de segmentação
semântica como U-Net, PSPNet e DeepLab, treinados em outras bases de imagens, em conjunto com
técnicas de transfer learning, que possibilita a rede aprender melhores representações ainda que a base
de dados seja pequena, e data augmentation, que auxilia a reduzir o erro de generalização da maioria
dos modelos de visão computacional. Como resultados, espera-se aperfeiçoar o trabalho de Esgario et al.
[2022] ao desenvolver um único modelo de rede neural convolucional capaz de segmentar e classificar esses
sintomas, exprimindo a magnitude do espalhamento da doença, almejando reduzir significativamente o
custo computacional do procedimento, sem perdas significativas na precisão do classificador, permitindo
assim embarcar o modelo em um aplicativo de smartphone que possa identificar e estimar a severidade
de doenças em plantas de café sem a necessidade de conexão com internet.
Referências
José G.M. Esgario, Pedro B.C. de Castro, Lucas M. Tassis, and Renato A. Krohling. An
app to assist farmers in the identification of diseases and pests of coffee leaves using
deep learning. Information Processing in Agriculture, 9(1):38–47, 2022. ISSN 22143173.
doi: 10.1016/j.inpa.2021.01.004.
Renato A. Krohling. Bracol - a brazilian arabica coffee leaf images dataset to identification
and quantification of coffee diseases and pests, 2019. URL https://data.mendeley.
com/datasets/yy2k5y8mxg/1.
127
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
João Pedro Macleure Nunes dos Santos1 and Antônio Tadeu Azevedo Gomes1
1
Laboratório Nacional de Computação Cientı́fica, Petrópolis/RJ, Brasil
Abstract
High performance computing (HPC) enables intensive computations, which allows simulations and
data analyses in different areas of knowledge. Maximizing the throughput of jobs in HPC clusters
accelerates science discoveries and improves resource utilization. Managing resources and job scheduling
policies is key to achieve better usage of computational pools [Prabhakaran, 2016]. Because of that,
resource management systems (RMSs) are deployed in production HPC clusters. Crucially, these systems
allow flexible associations of processing nodes to job queues, being highly configurable in this respect.
Such flexibility comes at the cost of difficulties in determining how to best fit resource usage and slowdown
job waiting time in queues [Simakov et al., 2017]. Simulating the behavior of RMSs allows administrators
to change and test configurations without impacting the production HPC cluster. In this work, we focus
on Slurm, an open source, fault-tolerant, and highly scalable RMS [Yoo et al., 2003]. Slurm is used by
many HPC infrastructures on the Top500 List (http://top500.org). A common approach to simulating
Slurm is to adapt its source code, maintaining its overall functionalities [Jokanovic et al., 2018] and
making the realization process a stochastic problem [Agrawala et al., 1976]. However, we believe that
this approach is limited on the given data based on resources and queue configurations of specific HPC
clusters. The capability of generating various queue configurations is useful in generating data for any
simulation scenario [Barford and Crovella, 1998]. Container technologies allow software stacks to be
delivered independent from the host machine, having minimal or no performance impact compared to
bare metal applications [Torrez et al., 2019]. This work aims at proposing a container-based environment
for the parametric simulation of RMS deployments, allowing various target queue configurations to be
simulated through the execution of standard benchmark jobs. We expect that this work will help HPC
providers to manage their computational pools for optimal usage and to plan the capacity of future
deployments.
128
CONTAINER-BASED ENVIRONMENT FOR SIMULATION OF JOB SCHEDULERS DOS SANTOS et al.
Referências
Ashok K Agrawala, Jeffrey M Mohr, and Raymond M Bryant. An approach to the
workload characterization problem. Computer, 9(6):18–32, 1976.
Paul Barford and Mark Crovella. Generating representative web workloads for network
and server performance evaluation. In Proceedings of the 1998 ACM SIGMETRICS
joint international conference on Measurement and modeling of computer systems, pa-
ges 151–160, 1998.
Ana Jokanovic, Marco D’Amico, and Julita Corbalan. Evaluating Slurm simulator with
real-machine Slurm and vice versa. In 2018 IEEE/ACM Performance Modeling, Bench-
marking and Simulation of High Performance Computer Systems (PMBS), pages 72–82.
IEEE, 2018.
Suraj Prabhakaran. Dynamic resource management and job scheduling for high perfor-
mance computing. Master’s thesis, Technische Universität Darmstadt, 2016.
Alfred Torrez, Timothy Randles, and Reid Priedhorsky. HPC container runtimes have
minimal or no performance impact. In 2019 IEEE/ACM International Workshop
on Containers and New Orchestration Paradigms for Isolated Environments in HPC
(CANOPIE-HPC), pages 37–42. IEEE, 2019.
Andy B Yoo, Morris A Jette, and Mark Grondona. Slurm: Simple linux utility for resource
management. In Workshop on job scheduling strategies for parallel processing, pages
44–60. Springer, 2003.
129
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
Os gateways cientı́ficos são ambientes centrados no usuário que integram diversas tecnologias, re-
unindo recursos avançados de computação, armazenamento, bancos de dados, sistemas de gerenciamento,
sistemas de envio de trabalhos e software cientı́fico em ambiente Web de trabalho unificado. Os gate-
ways incluem interfaces Web, APIs e middleware que fornecem acesso a software e dados [2]. A im-
plementação dessas tecnologias depende amplamente do domı́nio cientı́fico ao qual um gateway oferece
suporte. Neste trabalho, apresentamos um portal cientı́fico de bioinformática chamado BioinfoPortal
[1], que está acoplado ao ambiente do supercomputador Santos Dumont (SDumont), principal recurso
computacional do Sistema Nacional de Computação de Alto Desempenho (SINAPAD). O BioinfoPor-
tal utiliza, via RESTful Web Services, o middleware CSGrid para permitir a extração, gerenciamento e
processamento de dados em cada envio de trabalho. Este trabalho propõe a integração dos dados dos
usuários, das execuções das aplicações e dos recursos da computação de alto desempenho (CAD) em um
banco de dados de proveniência centralizado. Esses dados podem ser usados, por exemplo, para contro-
lar o cache, detectar erros de transmissão, configurar um trabalho usando um aplicativo especı́fico (por
exemplo, o software de bioinofrmatica RAxML), executar o trabalho com eficiência nos recursos CAD e
recuperar resultados. O banco de dados foi projetado para ter dados de proveniência adicionais e serviços
de gerenciamento de metadados. A implementação de serviços e do banco de dados atualizado permite
melhorias no desempenho e funcionalidade do BioinfoPortal em termos de armazenamento, velocidade e
funcionalidades relacionadas às interfaces de gerenciamento de arquivos, envio de trabalhos e contabili-
dade. A integração dos sistemas ao banco de dados centralizado visa tornar mais eficiente a coleta e o
gerenciamento dos dados do BioinfoPortal.
130
EXAMPLE FOR EAMC ABSTRACT CABRAL et al.
References
[1] K. Ocaña, M. Galheigo, C. Osthoff, L. Gadelha, F. Porto, A. Gomes, D. Oliveira,
and A. Vasconcelos. BioinfoPortal: A scientific gateway for integrating bioinformatics
applications on the Brazilian national HPC network. FGCS, 107:192–214, 2020.
131
Anais do XVI Encontro Acadêmico de Modelagem Computacional. Laboratório Nacional
de Computaçãocão Científica, 14 a 17 de fevereiro de 2023.
Introdução: Cerca de 30% da área da bacia amazônica é classificada como áreas de inundação episódica,
periódica ou permanente [Junk et al. 2011]. A proteção dessas áreas é relevante para o abastecimento e
manutenção da qualidade da água dos canais, onde os compartilhamentos terrestres e aquáticos estão
relacionados. Mas estes ambientes urbanos amazônicos têm sido severamente impactados, tornando-se
susceptíveis a alagamentos, exigindo a gestão de risco hidrológico pois causam danos econômicos à
sociedade e ao meio ambiente [Miguez et al.,2018]. No campo da engenharia, o risco urbano está associado
a eventos de chuva/marés [Souza et al.,2021]. Objetivo: Assim, o objetivo da pesquisa foi simular eventos
hidrológicos extremos através da modelagem computacional utilizando os softwares de Modelo de Gestão
de Drenagem Urbana - SWMM concomitantemente com o auxílio da ferramenta de geoprocessamento Qgis
e avaliar os impactos em zona urbana crítica de Macapá. Isto é, se o uso e ocupação da sub-bacia do Jandiá
é fator determinante de geração de episódios de alagamentos, especialmente sobre a infraestrutura próxima
do canal. Descrição da experiência: As seguintes etapas metodológicas foram utilizadas no presente
estudo: a) definição de fluxos de escoamento. Nesta etapa é fundamental o recorte do Modelo Digital do
Terreno (MDT) (Rodrigues, 2021; Cordeiro 2019). (Figura 1); b) identificar a sub-bacia hidrográfica
inserida na área e classificar a direção do escoamento na drenagem (segmentos de fluxo); c) delimitar o
trecho da sub-bacia e o domínio espacial das quadras nelas contidas. Resultados: As simulações
mostraram-se úteis para traçar perfis longitudinais de alagamentos críticos (“nós” críticos de
transbordamento), abrangendo tanto o período chuvoso quanto no período seco. As simulações com o
SWMM sugeriram que o transbordamento do Canal do Jandiá ocorre com impacto significativo na
circunvizinhança durante todo o período anual (chuva e maré). Assim, a diretriz de ocupação do solo em
Macapá não é suficiente para prevenir alagamentos, visto que estes significam alertas frequentes de riscos
hidrológicos extremos evidenciados na simulação com o SWMM.
[email protected], [email protected]
132
Referências
[2] MIGUEZ, M. G., et al. 2018. Gestão de Riscos e Desastres Hidrológicos, RJ.
Elsevier, 2018.
Abstract
Neste trabalho é apresentado o uso de Redes Neurais Convolucionais para separar transientes as-
trofı́sicos de artefatos. Transientes são objetos astronômicos com luminosidade variável, como superno-
vas, kilonovas, entre outrod. Identificar esses transientes no céu é historicamente feito por astrônomos
treinados utilizando inspeção visual, facilitada pelo uso de algoritmos de diferenciação de imagem. Esses
algoritmos subtraem de uma imagem contendo um candidato a transiente (search) uma imagem captu-
rada anteriormente (template), procurando por locais de concentração de fluxo que poderiam indicar a
presença de um transiente. Um dos problemas mais comuns desse método é o chamado Bad-Subtraction,
que ocorre quando o search e template estão desalinhados, gerando artefatos que podem ser confundidos
com transientes (falsos positivos). Para corrigir esse problema, usamos duas redes neurais convolucio-
nais no processo de diferenciação(Shandonay et al. [2022]): a primeira tem como objetivo identificar as
imagens que sofreram Bad-Subtraction, enquanto a segunda identifica os transientes nas imagens que
sobraram. Com isso, nosso objetivo é automatizar a identificação de transientes no pipeline para busca
de contrapartida ótica de ondas gravitacionais do Dark Energy Survey (DES-GW) e acelerar a detecção
fazendo com que o número de imagens que requerem inspeção visual diminua. A primeira rede performou
diminuindo em 95% a quantidade de Bad-Subtraction, e mantendo uma taxa de verdadeiros positivos de
98.3% enquanto que a segunda rede atuando em seguida obteve 94.5% de taxa de verdadeiros positivos.
Oque mostra a capacidade da nossa rede de filtrar artefatos sem perder Transientes.
Referências
Adam Shandonay, Robert Morgan, Keith Bechtol, Clecio R Bom, Brian Nord, Alyssa Gar-
cia, Ben Henghes, Kenneth Herner, Megan Tabbutt, Antonella Palmese, et al. Expe-
diting decam multimessenger counterpart searches with convolutional neural networks.
The Astrophysical Journal, 925(1):44, 2022.
134
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Científica, 14 a 17 de Fevereiro de 2023.
Resumo
O Brasil é um dos países com mais desastres de classificação hidrológica e, a nível nacional, a região Sul e Sudeste são
as mais afetadas [SCHOEN et al., 2015]. Os desastres naturais envolvendo os recursos hídricos podem ocorrer, dentre
outras maneiras, de forma espontânea. Esses tipos de desastres infelizmente não têm como parar, pois, é algo natural e,
muitas vezes, o máximo que se há de conseguir é estimar, prever, seguir protocolos para minimizar os impactos. No
entanto, as ações antrópicas não devem ser desconsideradas. Indiretamente essas ações poderão acelerar tais eventos na
natureza. Por sofrer ações antrópicas discriminatórias e irresponsáveis, a natureza talvez responda de forma violenta e,
em muitos casos, os prejuízos poderão se perpetuar por anos. Diante de um cenário de desastres envolvendo recursos
hídricos que vem a cada dia se tornando mais frequentes, surgem a modelagem matemática e a simulação hidrológica
com o propósito de tentar minimizar os impactos causados por tais eventos. Neste contexto, dentro dos softwares de
modelagem computacional disponíveis para execução da modelagem hidrológica, há a plataforma MOHID, sistema de
modelagem numérica tridimensional. Assim, o objetivo deste trabalho é o estudo dos efeitos decorrentes de desastres
naturais. Embora se sabe que mesmo sendo a modelagem e a simulação ferramentas importantes no processo da
mitigação, ambas sozinhas não serão suficientes para conter os desastres naturais. Considerando que não é possível
eliminar por completo o risco de inundações, medidas devem ser previstas em todo o ciclo da gestão de risco
[MACHADO et al., 2022]. Um fator importante e que pode fazer toda a diferença nesse processo, seja talvez
a sensibilização da humanidade em prol da vida e manutenção do meio ambiente.
Referências
Abstract
Radiotherapy is one of the major cancer treatment strategies. However, its efficacy is limited by the
development of radioresistance and damage to normal tissues. Many efforts have been made to improve
radiotherapy efficacy [Kim et al., 2019]. Recently a novel modality of radiation delivery has emerged.
FLASH radiotherapy (FLASH-RT) allows for radiation delivery at ultra-high dose rates, which are much
higher than conventional radiotherapy (CONV-RT). Studies have demonstrated a potential protective
role of FLASH-RT in normal tissues, despite maintaining levels of tumor control at least equivalent to
those of CONV-RT [Friedl et al., 2022]. Still, the mechanisms of FLASH-RT are not fully elucidated. This
work aims to explore FLASH-RT by examining gene expression patterns with RNA-Seq data through the
use of data mining techniques and High-Performance Computing (HPC). This research could provide a
better comprehension of FLASH-RT biological mechanisms by uncovering its differential gene expression
and activated pathways. FLASH-RT may become one of the main radiotherapy technologies in clinical
practice in the future, being a promising new area of study [Lin et al., 2021].
Referências
Anna A Friedl, Kevin M Prise, Karl T Butterworth, Pierre Montay-Gruel, and Vincent
Favaudon. Radiobiology of the flash effect. Medical Physics, 49(3):1993–2013, 2022.
Wanyeon Kim, Sungmin Lee, Danbi Seo, Dain Kim, Kyeongmin Kim, EunGi Kim, JiHoon
Kang, Ki Moon Seong, HyeSook Youn, and BuHyun Youn. Cellular stress responses in
radiotherapy. Cells, 8(9):1105, 2019.
Binwei Lin, Feng Gao, Yiwei Yang, Dai Wu, Yu Zhang, Gang Feng, Tangzhi Dai, and
Xiaobo Du. Flash radiotherapy: history and future. Frontiers in Oncology, page 1890,
2021.
136
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
Uma das maiores preocupações em uma residência é a invasão por intrusos, assim, devemos encontrar
soluções eficientes e baratas para a segurança. Porém, os dispositivos de monitoramento atuais são
caros ou possuem uma grande dificuldade de implementação, ver Liu and Silverman [2001] e Hemalatha
[2020]. Pensando nisso, criamos uma alternativa com baixo custo, eficiente, autossuficiente e de fácil
instalação para o usuário. O projeto consiste em fabricar um leitor de biometria com Arduino, podendo
ser colocado em qualquer portão elétrico, sem a necessidade de alterar o ambiente no qual ele será
instalado. Além disso, o próprio usuário conseguirá fazer a instalação e a configuração do leitor de
biometria. Pode, também, ser instalado em uma empresa de pequeno porte.Neste projeto utilizamos um
recurso que consiste no cadastro instantâneo de pessoas. No primeiro momento cadastramos o usuário
principal, como primeiro cadastro, em seguida, os demais usuários. A tela contém todas as informações
necessárias para orientar o usuário. As vantagens do nosso leitor é o aparelho não possui acesso à internet
e os códigos ficam gravados no Arduino e não tem como outro usuário, além do usuário principal, ter
acesso ou modificar o código e o baixo custo tanto financeiro como de implementação e manutenção. Esse
projeto ainda se encontra em um formato de prototipagem, o objetivo é transformá-lo em um produto,
e a criação de um aplicativo de celular, gerando um controle remoto dos usuários ao acesso do portão e
para auxiliar no cadastro, provendo mais informações das pessoas que possuem a digital cadastrada.
Referências
S Hemalatha. A systematic review on fingerprint based biometric authentication system.
In 2020 International Conference on Emerging Trends in Information Technology and
Engineering (ic-ETITE), pages 1–4, 2020. doi: 10.1109/ic-ETITE47903.2020.342.
137
Anais do XVI Encontro Acadêmico de Modelagem Computacional.
Laboratório Nacional de Computação Cientı́fica, 14 a 17 de Fevereiro de 2023.
Abstract
In Biomedical Optical techniques, light interaction with biological tissues is used both for therapeutic
and diagnostics purposes. In order to achieve the best outcomes, it is essential to understand how light
propagates through the target tissue. In the last years, GPU-accelerated software for Monte Carlo
simulations of photon transportation like CUDAMCML [Alerstam, 2009] have been shown to be powerful
tools to study light propagation through turbid media, such as biological tissues. To perform simulations
with CUDAMCML, one need to assign the number of layers, the optical properties (absorption coefficient,
scattering coefficient, refractive index and anisotropy factor) and the thickness of each layer. For the
human skin, the wavelength dependent absorption coefficient can be modeled by the melanin volume
fraction (in the epidermis), the blood volume fraction (in the dermis), the melanin blend ratio and the
blood oxygenation ratio [Donner and Jensen, 2006]. This work, thus, aims to evaluate if this modelling
consistently reproduces human skin color diversity with CUDAMCML. The surface diffuse reflectance
spectra output of a four-layered skin model were transformed to sRGB and CIELAB coordinates, which
were then compared to colorimetric experimental measures reported in the litterature [Alaluf et al., 2002].
Referências
Simon Alaluf, Derek Atkins, Karen Barrett, Margaret Blount, Nik Carter, and Alan
Heath. The impact of epidermal melanin on objective measurements of human skin
colour. Pigment Cell Research, 15(2):119–126, 2002.
Craig Donner and Henrik Wann Jensen. A spectral BSSRDF for shading human skin.
Eurographics Symposium on Rendering, 2006.
138