2895-Texto Do Artigo-11169-1-10-20230328
2895-Texto Do Artigo-11169-1-10-20230328
2895-Texto Do Artigo-11169-1-10-20230328
______________________________
RESUMO:
Utilizando o processo de aprendizado de máquina (machine learning), esta pesquisa teve por
objetivo inicial analisar como variáveis relacionadas à quantidade média de dias de
funcionamento, à idade média dos dispositivos de armazenamento, às taxas de falhas
anualizadas, à capacidade de armazenamento, ao fabricante e ao tipo de dispositivo poderiam
caracterizar-se como possíveis determinantes da quantidade de falhas ocorridas nos diversos
modelos de Hard Disk Drive (HD) e Solid State Disks (SSD) utilizados em datacenters de
provedores de serviços de armazenamento de dados em nuvem. Adicionalmente, procurou-se
investigar e identificar um conjunto de métricas voltadas para o processo de análise da
eficiência das estimativas realizadas com base neste estudo, assim como, da eficiência de
algoritmos de previsão em geral. Inicialmente, implementou-se uma rede neural artificial
(RNA) aplicada a um conjunto de dados provenientes de 203.168 HD e 2.200 SSD, agrupados
em 31 diferentes modelos de fabricação. Após isso, procedeu-se à análise da qualidade das
estimativas realizadas com base em RNA, mediante a utilização de um conjunto de métricas
pesquisadas para essa finalidade. Apesar de aparentemente apresentar qualidade analítica
promissora nas fases de treinamento e teste, a RNA pesquisada mostrou-se ineficiente do
ponto de vista preditivo. Por outro lado, foi possível identificar, propor e testar um conjunto
métricas voltadas para a análise e validação da eficiência de algoritmos de previsão baseados
em aprendizado de máquina.
ABSTRACT:
Using the machine learning process, the initial objective of this research was to analyze how
variables related to the average number of operating days, the average age of storage
devices, annualized failure rates, storage capacity, manufacturer and type of device could be
characterized as possible determinants of the number of failures that occurred in the different
models of Hard Disk Drive (HD) and Solid State Disks (SSD) used in datacenters of cloud
1
Doutor em Agronomia pela UNESP (Botucatu) e Mestre em Ciências Contábeis pela PUC-SP. Professor da
Faculdade de Ciências Contábeis da Univ. Federal de Uberlândia (FACIC-UFU). e-mail:
[email protected] / [email protected]. Orcid: https://orcid.org/0000-0002-3806-9228
2
Doutora e mestra em Ciências Contábeis pela PPGCC UFU. Professora da Faculdade de Ciências Contábeis da
Univ. Federal de Uberlândia (FACIC-UFU). e-mail: [email protected]. Orcid: https://orcid.org/0000-0002-5052-
094X.
data storage service providers. Additionally, an attempt was made to investigate and identify
a set of metrics aimed at the process of analyzing the efficiency of the estimates made based
on this study, as well as the efficiency of forecasting algorithms in general. Initially, an
artificial neural network (ANN) was implemented and applied to a set of data from 203,168
HD and 2,200 SSD, grouped into 31 different manufacturing models. After that, we proceeded
to analyze the quality of the estimates based on ANN, using a set of metrics researched for
this purpose. Despite apparently presenting promising analytical quality in the training and
testing phases, the researched ANN proved to be inefficient from a predictive point of view.
On the other hand, it was possible to identify, propose and test a set of metrics aimed at
analyzing and validating the efficiency of prediction algorithms based on machine learning.
Introdução
Ferramentas de busca, armazenamento em nuvem, compras eletrônicas, entre tantos
outros serviços disponibilizados via internet, têm aproximado usuários, consumidores,
fornecedores, entre outros, e elevado consideravelmente a demanda por comunicação e
capacidade armazenamento da informação (SANTOS; MAZIERO; BONA, 2015).
Diante disso, os serviços de armazenamento em nuvem funcionam ininterruptamente,
demandando disponibilidade e capacidade operacionais de forma contínua. Tanto que, em
provedores de serviços de nuvem como Aliyun, Amazon, Microsoft Azure, Backblaze, o de
tempo de atividade dos usuários normalmente é de 99,9%, no mínimo (LI et al., 2021).
Nesse ambiente de prestação de serviços em larga escala são utilizados diversos tipos
de mecanismos de armazenamento, com marcas, tecnologias e modelos variados, cuja
finalidade é atender diferentes tipos de carga de trabalho, o que leva à produção de riscos
relacionados a falhas de funcionamento das mais variadas naturezas (SHEN et al., 2018).
Conforme observam Santos, Maziero e Bona (2015, p. 1), “a tecnologia mais popular
de armazenamento secundário ainda é o disco magnético (HDD – Hard Disk Drive), que alia
grande capacidade de armazenamento e baixo custo [...]”. Sendo que, “recentemente, os
discos de estado sólido (SSD – Solid State Disks) elevaram muito o desempenho no acesso ao
armazenamento secundário [...]”, porém, “[...]seu custo elevado e baixa capacidade
inviabilizam a substituição integral dos discos magnéticos por SSD a curto prazo, sobretudo
em instalações de maior porte” (MAZIERO; BONA, 2015, p. 1)
Mas, ainda que com baixas taxas de problemas de funcionamento e/ou com certo grau
de tolerância a esse tipo de ocorrência, prestadores de serviços de acesso e armazenamento de
dados em larga escala têm especial interesse em compreender a natureza de possíveis falhas
2 Referencial Teórico
Entre os dispositivos de armazenamento secundário, que são aqueles que permitem a
manutenção da informação de maneira não-volátil, os HD são considerados a forma mais
recorrente de armazenamento on-line; contudo, já há algum tempo, os SSD vêm ganhando
espaço devido ao seu melhor desempenho relacionado à velocidade de leitura, entre outros
atributos (SANTOS; MAZIERO; BONA, 2015).
Enquanto um HD utiliza uma cabeça de leitura de funcionamento mecânico para
acessar a mídia armazenada em um disco magnético rotativo, o SSD utiliza memória não
volátil como mídia de armazenamento, o que faz com que eles sejam menos frágeis e mais
rápidos que os HD (CORNWELL, 2012).
Devido à escalada sem precedentes dos sistemas de armazenamento, a incidência de
falhas de dispositivos como os HD e os SSD tem crescido consideravelmente, o que pode
produzir consequências desastrosas como perdas de informação de difícil recuperação ou até
irrecuperáveis, além da elevação dos custos dos provedores de serviços de nuvem ou internet
data center (IDC); por isso, esses IDC monitoram constantemente as condições de trabalho
desses dispositivos com o uso de sensores de emissão de acústica, contadores, sensores
térmicos, entre outros (SHEN et al., 2018).
amostra de pesquisa, de forma conjunta, e ainda, tanto em termos absolutos quanto relativos,
assim como, em termos médios e/ou medianos.
Para tanto, esta investigação científica pesquisou e utilizou 11 medidas diferentes de
erro: determination coefficient ou coeficiente de determinação (R2); mean absolut error ou
erro absoluto médio (MAE); median absolut error ou erro absoluto mediano (MdAE); mean
absolute percentage error ou erro percentual médio absoluto (MAPE); median absolute
percentage error ou erro percentual absoluto mediano (MdAPE); symmetric mean absolute
percentage error ou erro percentual médio absoluto simétrico (SMAPE); median symmetric
absolute percentage error ou erro percentual absoluto simétrico mediano (MdSAPE);
weighted mean absolute percentage error ou erro percentual médio absoluto ponderado
(WMAPE); mean square error ou erro quadrático médio (MSE); median square error ou erro
quadrático mediano (MdSE); e, root mean square error ou raiz do erro quadrático médio
(RMSE).
Muito utilizado na análise de modelos lineares de regressão, o R2 pode ser entendido
como a proporção da variável de estudo explicada pelas variáveis integrantes da respectiva
modelagem analítica (McKEAN, J. W.; SIEVERS, 1987). Comumente utilizado como uma
medida de adequação de modelos de regressão linear, o R2 deve ser empregado com muita
cautela, uma vez que seus altos valores (R2≈1) não necessariamente significam um bom ajuste
do modelo previsor aos dados observados na realidade, sendo que, o inverso (R2≈0) também é
verdadeiro, pois ele pode ser muito influenciado por outliers (MARTINS, 2018).
O MAE é uma medida de erro absoluto (|y-ŷ|) que leva em conta a quantidade total de
observações/previsões, portanto, é expresso nessa mesma unidade de medida; logo, sua
principal limitação é que ele não permite a análise comparativa de modelos com unidades de
medida diferentes, e ainda, tende a penalizar mais previsões com erros maiores (HYNDMAN;
KOEHLER, 2006; KARUNASINGHA,2022).
Como uma medida de erro alternativa ao MAE, o MdAE caracteriza-se pela mediana
dos erros absolutos (|y-ŷ|) ocorridos a cada observação/previsão, portanto, sem levar em conta
a quantidade total de observações/previsões; ou seja, ele é uma medida de posição (central)
(HYNDMAN; KOEHLER, 2006), o que permite que ele seja utilizado comparativamente ao
MAE para identificar a possível influência de grandes erros (extremos).
Calculado inicialmente a partir da média de cada observação e o respectivo erro
individual ([|y-ŷ |]/|y), O MAPE caracteriza-se pela média dos erros percentuais absolutos, o
que facilita pra se realizar comparações entre modelos preditivos cujas variáveis de interesse
apresentam unidades de medidas diferentes; por outro lado, ele pode apresentar-se muito
enviesado quando as observações de Y tenderem a zero (HYNDMAN; KOEHLER, 2006;
HUANG et al., 2023).
Semelhante à relação entre o MAE e o MdAE, o MdAPE caracteriza-se pela mediana
do erro percentual absoluto e, nesse sentido, ambos (MAPE e o MdAPE) têm a desvantagem
de penalizar mais os erros positivos do que em erros negativos (HYNDMAN; KOEHLER,
2006; HUANG et al., 2023), apesar de servir de parâmetro de comparação para “calibrar”
leituras baseadas no valor do MAPE.
O SMAPE representa o erro percentual médio absoluto simétrico, uma vez que no seu
denominador, ele não de leva em conta os valores das respectivas observações (ou seja, o y
no denominador de [|y-ŷ |]/|y), ele leva em conta a média entre valores absolutos observados
(|y|) e valores absolutos previstos (|ŷ|) (HYNDMAN; KOEHLER, 2006), o que suaviza o
reflexo de erros muito elevados e o efeito dos valores negativos e positivos. De forma análoga
ao MdAE e ao MdAPE, o MdSPE caracteriza-se pela mediana do SMAPE.
O WMAPE também é uma medida de erro percentual (ou decimal) médio absoluto,
porém, ele é ponderado tanto pela quantidade de observações quanto pelos respectivos
montantes, e, por ser relativo, ele é livre de escala, o que ele facilita comparações entre
modelos com variáveis de interesse medidas em unidades distintas (BUSARI; LIM, 2021;
FORBES, 2023).
O MSE e o RMSE caracterizam-se pelo erro quadrático médio e por sua raiz quadrada,
respetivamente. Se o MSE é expresso em uma unidade de leitura de difícil compreensão, a
raiz quadrada calculada no RMSE faz com que ele seja expresso na mesma unidade de medida
das observações analisadas, o que facilita sua interpretação; tanto o RMSE quanto MAE
penalizam erros muito elevados, mas, tendem a se aproximar um do outro quando os erros são
menores (DAM et al., 2022; KARUNASINGHA, 2022). E, de forma análoga as todos as
medidas de erro mediano (Md) já expostas (MdAE, MdAPE e MdSPE), o MdSE caracteriza-se
pela mediana do erro quadrático (MSE) (HYNDMAN; KOEHLER, 2006).
Figura 1 – Métricas de precisão utilizadas para avaliar as previsões realizadas com base em RNA
Descrição Fórmula Unidade de medida (un)
e
parâmetro de decisão
Determination coefficient ou 0< < 1 ou 0% < < 100%
coeficiente de determinação ( ) sendo que:
quanto mais próximo de 1 melhor
Legenda:
y = valor da variável analisada;
ŷ = valor previsto para a variável analisada com base em um modelo;
n = quantidade total de observações referentes a y e/ou ŷ ; e
i = cada observação específica de y e/ou ŷ .
Fonte: elaborado pelos autores com base em Mckean e Sievers (1987), Hyndman e Koehler (2006),
Bruce e Bruce (2019), Martins (2018), Harrison (2020), Bojer e Meldgaard (2021) e
Karunasingha (2022).
3 Metodologia de Pesquisa
A Backblaze é uma empresa americana que atua no segmento de armazenamento em
nuvem, backup de negócios e backup pessoal, e, desde 2013, publica estatísticas e insights
com base nos dados dos dispositivos de armazenamento do seu IDC, além de disponibilizar
publicamente os dados que subsidiam as informações contidas em seus relatórios, de tal forma
que qualquer um possa utilizá-los livremente (BACKBLAZE, 2022a).
Em 2021, a Backblaze (2022b) adicionou 40.460 HD ao seu IDC, totalizando 206.928
unidades a partir de dezembro de 2021, das quais 203.168 foram destinadas exclusivamente
ao armazenamento de dados, e ainda, tiveram suas estatísticas disponibilizadas no relatório
“Backblaze Drive Stats for 2021”. Sendo que, também em 2021, a Blackblaze (2022c)
compartilhou os dados dos 2.200 SSD utilizados em seu IDC, a partir do seu relatório “The
SSD edition: 2021 drive stats review”.
Dessa maneira, todos os dados integrantes da amostra desta pesquisa tiveram como
base as informações disponibilizadas pela Backblaze (2022a; 2022b; 2022c) nos seus
relatórios anuais de 2021, conforme detalhado na Tabela 1.
A variável “qtd. de falhas”, que é o objeto inicial deste estudo, diz respeito à
quantidade total de falhas relatadas pela Backblaze (2022b) para cada modelo de HD utilizado
ao longo do período compreendido entre 20/04/2013 a 31/12/2021, bem como, a quantidade
total de falhas ocorridas em cada modelo dos seus SSD desde o início da sua utilização em
2021, até 31/12/2021 (BACKBLAZE, 2022c). Dessa forma, essa variável apresenta o total
referente às falhas ocorridas ao longo de todo o período de funcionamento dos respectivos
dispositivos de armazenamento.
As variáveis “dias de funcionamento “e “idade média” referem-se ao tempo de
atividade de cada modelo de dispositivo (média em dias) e a respectiva idade (média em
meses), respectivamente (BACKBLAZE, 2022b; 2022c).
As variáveis “AFR 2021”, “AFR 2020” e “AFR 2019” referem-se às taxas de falhas
anualizadas dos anos 2021, 2020 e 2019 (percentual médio), respectivamente, calculadas pela
Blackblaze (2022b) conforme descrito na Equação 1.
Total 31 100,00%
Fonte: elaborado pelos autores, com base nos dados da pesquisa.
substituição de HD e SSD que vêm apresentando falhas em anos anteriores, entre outras
possibilidades.
Por outro lado, a despeito das evidências coletadas ao longo do processo de
modelagem propriamente dito, a RNA MLP pesquisada mostrou-se ineficiente do ponto de
vista preditivo, conforme demonstram as métricas descritas na Tabela 3.
Tabela 2 – Avaliação da qualidade das previsões realizadas pela RNA MLP, a partir das métricas
propostas nesta pesquisa
Métricas Valores
R2 0,959
MAE (Mean absolut error) 86,387
MdAE (Median absolut error) 38,000
MAPE (Mean absolute percentage error) 9,225
MdAPE (Median absolute percentage error) 0,747
SMAPE (Symmetric mean absolute percentage error) 0,967
MdSAPE (Median symmetric absolute percentage error) 1,059
WMAPE (Weighted mean absolute percentage error) 0,272
MSE (Mean square error) 29179,419
MdSE (Median square error) 1444,000
RMSE (Root mean square error) 170,820
Fonte: elaborado pelos autores, com base nos dados da pesquisa.
Enquanto únicas medidas dos valores absolutos dos erros de estimativas propriamente
ditos, o desejável era que MAE e MdAE se aproximassem. Contudo, segundo os dados
analisados nesta investigação, o valor do MAE é mais que o dobro do valor do MdAE, o que
pode ser entendido como um indício de que existem erros com valores bem elevados, o que
aumenta consideravelmente a amplitude das respectivas observações. Ou seja, com diferenças
entre falhas observadas (reais) e falhas previstas com um valor de erro mínimo de 4 e um
valor de erro máximo de 713, perfazendo uma amplitude total de 709, pode-se concluir que
tanto o MAE quanto o MdAE não seriam boas métricas para medir a qualidade do modelo
baseado em RNA MLP para previsão de falhas, pois ambos pareceram ter sido influenciados
pela magnitude dos erros observados.
Ao realizar a análise das medidas relativas de erro previstas para este estudo, observa-
se que também não há muita harmonia entre elas, isso é:
a)o MAPE de 9,225 indica um erro percentual médio absoluto na ordem de 922,5%, o
que sinaliza que as previsões de falhas realizadas pela RNA MLP apresentaram
erros com uma magnitude média 9,22 vezes maiores que as respectivas observações
reais;
Em relação às métricas utilizadas para medir essa qualidade, todas foram capazes de
sinalizar problemas inerentes às previsões realizadas pela RNA MLP proposta; contudo, dada
à diversidade de unidades de medidas, o que ficou evidente foi a necessidade de se utilizar
todas de maneira conjunta. Ressaltando-se uma vez mais que, a despeito das respectivas
unidades de medidas, houve convergência em relação à ineficiência preditiva da modelagem
proposta nesta investigação.
5 Considerações Finais
Ao problematizar a quantidade de falhas ocorridas nos diversos modelos de HD e SSD
utilizados nos IDC e seus possíveis determinantes, esta investigação científica fez uso de
técnicas de machine learning baseadas em RNA MLP aplicadas em um conjunto de dados
reais provenientes de mais de 208,000 unidades de armazenamento de dados (206.928 HD e
2.200 SSD) agrupadas em 31 diferentes modelos de fabricação.
Ao apresentar uma qualidade analítica relativamente promissora, a RNA MLP
implementada nesta investigação permitiu avaliar o grau de importância de cada uma
daquelas possíveis variáveis explicativas avaliadas neste estudo de científico de natureza
empírico-analítica baseado em métodos computacionais aplicados. Sendo que, ao levar em
conta a teoria adjacente, a análise dos resultados permitiu corroborar em parte com os
resultados de estudos já realizados anteriormente, e ainda, trouxe algumas evidências que
podem contribuir significativamente com o processo de planejamento e tomada de decisões na
prestação de serviços de armazenamento de dados em IDC.
Por outro lado, a análise preditiva da modelagem implementada nesta pesquisa não se
mostrou capaz de prever satisfatoriamente a quantidade de falhas de dispositivos de
armazenamento utilizados em provedores de serviços de nuvem ou IDC. Porém,
considerando-se que só foi testada uma modelagem preditiva, não é possível inferir se as
divergências (distâncias de valores) entre as métricas utilizadas se devem às observações ou à
cada métrica em si.
Como principal limitação desta investigação científica destaca-se o fato da sua
amostra ter sido constituída a partir da conveniência relacionada à disponibilidade de
informações, o que não permite generalizações acerca dos seus resultados, exceto pela
proposição de um conjunto de métricas voltadas para a análise de precisão das previsões
realizadas com base em RNA.
Referências
BACKBLAZE. Welcome to the Backblaze hard drive data and stats. San Mateo-CA
(EUA), 2022a. Disponível em: https://www.backblaze.com/b2/hard-drive-test-data.html.
Acesso em: 08 abr. 2022.
BACKBLAZE. Backblaze drive stats for 2021. By Andy Klein, San Mateo-CA (EUA),
February 1, 2022b. Disponível em: https://www.backblaze.com/blog/backblaze-drive-stats-
for-2021/. Acesso em: 08 abr.2022.
BACKBLAZE. The SSD edition: 2021 drive stats review. By Andy Klein, San Mateo-CA
(EUA), March 3, 2022c. Disponível em: https://www.backblaze.com/blog/ssd-edition-2021-
drive-stats-review/. Acesso em: 08 abr.2022.
BRUCE, P.; BRUCE, A.. Estatística prática para cientistas de dados: 50 conceitos
essenciais. Rio de Janeiro-RJ: Alta Books, 2019.
BUSARI, G. A.; LIM, D. H.. Crude oil price prediction: a comparison between AdaBoost-
LSTM and AdaBoost-GRU for improving forecasting performance. Computers & Chemical
Engineering, [s. l.], v. 155, e-article 107513, December 2021. Disponível em:
https://doi.org/10.1016/j.compchemeng.2021.107513. Acesso em: 27 dez. 2022.
CHAKRABORTTII, C.; LITZ, H.. Explaining SSD failures using anomaly detection. In:
ANNUAL NON-VOLATILE MEMORIES WORKSHOP (Online Event), 12., 2021, San
Diego-CA. Proceedings [...]. San Diego-CA: University of California/ IEEE Computer
Society, mar. 2021. Disponível em: http://nvmw.ucsd.edu/nvmw2021-program/nvmw2021-
data/nvmw2021-paper44-final_version_your_extended_abstract.pdf. Acesso em: 24 ago.
2022.
CORNWELL, M.. Anatomy of a solid-state drive. Communications of the ACM, [s. l.], v.
55, n. 12, p. 59–63, Dec. 2012. Disponível em:
https://dl.acm.org/doi/fullHtml/10.1145/2380656.2380672. Acesso em: 23 ago. 2022.
FORBES, K. F.. Demand for grid-supplied electricity in the presence of distributed solar
energy resources: Evidence from New York City. Utilities Policy, [s. l.], v. 80, e-article
101447, February 2023. Disponível em: https://doi.org/10.1016/j.jup.2022.101447. Acesso
em 27 dez. 2022.
GABER. S.. The data science of predicting disk drive failures. DELL Technologies
Services: Blog, [s. l.], e-article, June 27, 2016. Disponível em: https://www.dell.com/en-
us/blog/data-science-predicting-disk-drive-failures/. Acesso em: 23 ago. 2022.
HARRISON, M.. Machine learning: guia de referência rápida (trabalhando com dados
estruturado em Python). São Paulo-SP: Novatec, 2020.
KARUNASINGHA, D. S. K.. Root mean square error or mean absolute error? Use their ratio
as well. Information Sciences, [s. l.], v. 585, p. 609-629, March 2022. Disponível em:
https://doi.org/10.1016/j.ins.2021.11.036. Acesso em 26 dez. 2022.
LI, X.; ZHU, L.; ZHANG, C.; YANG, H.; WANG, H.; ZHANG, J.. Failure prediction for
temporal dependency of hard drives. In: INTERNATIONAL WORKSHOP ON COMPUTER
SCIENCE AND ENGINEERING (WCSE 2021), 11., 2021, Shanghai. Proceedings [...].
Shanghai: East China Normal University, China Agricultural University, Science and
Engineering Institute, June, 2021. p. 379-388. Disponível em:
http://www.wcse.org/index.php?m=content&c=index&a=show&catid=22&id=1014. Acesso
em: 24 ago. 2022.
MARTINS, M. E.G. Coeficiente de determinação. Rev. Ciência Elem., [s. l.], v. 6, n. 01, p.
01, mar. 2018. Disponível em: http://doi.org/10.24927/rce2018.024. Acesso em: 25 dez. 2022.
McKEAN, J. W.; SIEVERS, G. L.. Coefficients of determination for least absolute deviation
analysis. Statistics & Probability Letters, [s. l.], v. 5, issue1, p. 49-54 January 1987.
Disponível em: https://doi.org/10.1016/0167-7152(87)90026-5. Acesso em: 27 dez. 2022.
NARAYANAN, I.; WANG, D.; JEON, M.; SHARMA, B.; CAULFIELD, L.;
SIVASUBRAMANIAM, A.; CUTLER, B.; LIU, J.; KHESSIB, B.; VAID, K.. SSD failures
in datacenters: What? When? and Why? SYSTOR '16: Proceedings of the 9th ACM
International on Systems and Storage Conference, [s. l.], article n. 7, p. 1-11, June 2016.
Disponível em: https://doi.org/10.1145/2928275.2928278. Acesso em 25 ago. 2022.
SHEN, J.; WAN, J.; LIM, S-J.; YU, L.. Random-forest-based failure prediction for hard disk
drives. International Journal of Distributed Sensor Networks, [s. l.], v. 14, n. 11, p. 1-15,
2018. Disponível em: https://doi.org/10.1177/1550147718806480. Acesso em: 22 ago. 2022.
SHEN, J.; REN, Y.; WAN, J.; LAN, Y.. Hard disk drive failure prediction for mobile edge
computing based on an LSTM recurrent neural network. Mobile Information Systems, [s.
l.], v. 2021, article ID 8878364, p. 1-12, 2021. Disponível em:
https://doi.org/10.1155/2021/8878364. Acesso em: 23 ago. 2022.