Uma Proposta de Arcabouço para Tolerância a Falhas Multicamadas em Sistemas IoT
IoT, dependabilidade, tolerância a falhas, detecção de erros, recuperação de erros, confiabilidade, disponibilidade
A tolerância a falhas em sistemas IoT é um desafio a ser superado devido à sua com-
plexidade, dinamicidade e heterogeneidade. Os sistemas IoT são normalmente projetados
e construídos em camadas, em que cada uma delas possui seus próprios requisitos e es-
tratégias de tolerância a falhas. No entanto, erros em uma camada podem propagar-se e
causar efeitos em outras. Portanto, é impraticável considerar uma abordagem de tolerân-
cia a falhas centralizada para todo um sistema. Consequentemente, é vital considerar a
colaboração entre várias camadas de maneira a permitir a troca de informações para lidar
com as falhas. O objetivo deste estudo é propor uma abordagem de tolerância a falhas
multicamadas, garantindo a interconexão entre as camadas de um sistema IoT, permitindo
a troca de informações e colaboração para melhorar a dependabilidade desses sistemas.
Portanto, é definida uma estrutura orientada a eventos chamada FaTEMa (Fault Tole-
rance Event Manager) que cria um canal de comunicação dedicado para propagar eventos
relacionados a falhas através dos níveis do sistema. A estrutura implementada auxilia na
detecção de erros e continuação dos serviços. Além disso, o arcabouço proposto oferece
pontos de extensão para suportar protocolos de comunicação heterogêneos e permitir o
desenvolvimento de novos recursos. Os resultados da avaliação empírica demonstraram
que a introdução do FaTEMa estabeleceu melhorias nos tempos de detecção e resolução
de erros, consequentemente melhorando a disponibilidade do sistema. Além disso, o uso
do FaTEMa proporcionou uma melhoria na confiabilidade através da redução do número
de falhas produzidas.