Seleção Dinâmica de Atributos para Comitês de Classificação
Seleção dinâmica de atributos, Comitês de Classificação, Diversidade
Em aprendizado de máquina (AM), o pré-processamento dos dados tem como objetivo aprimorar a qualidade dos dados que serão utilizados, visando apresentá-los em uma forma adequada para a técnica de AM escolhida. A seleção de atributos é uma de suas principais etapas. Seu principal objetivo é escolher o subconjunto que melhor represente o conjunto de dados, permitindo a redução da dimensionalidade e um possível aumento na precisão dos classificadores. Existem diferentes abordagens para se realizar a seleção de atributos. A a Seleção Dinâmica é uma delas e parte do princípio de que cada instância é única e que melhores resultados são obtidos quando se seleciona um subconjunto de atributos para cada instância em vez de um único subconjunto para toda a base de dados. Uma vez que uma representação mais compacta dos dados foi selecionada, o próximo passo na classificação dos dados é a escolha do modelo a ser utilizado. Esse modelo pode ser formado por um único classificador ou por um sistema de combinação de classificadores, conhecido como Comitês de classificadores, que pode ser definido como a combinação múltiplos classificadores que serão utilizados para gerar uma resposta final para o sistema através da combinação de suas respostas individuais. Para que esses sistemas apresentem melhor desempenho que um classificador individual é necessário promover a diversidade entre os componentes que formam o comitê, isto é, que os componentes do sistema não cometam erros nos mesmos padrões. Por este motivo, a diversidade tem sido considerada um dos aspectos mais importantes no projeto de comitês, já que não existe vantagem na combinação de métodos de classificação idênticos. O objetivo deste trabalho é utilizar a seleção dinâmica de atributos em sistemas de combinação de classificadores. Para isso, foram desenvolvidas três versões que realizam essa adaptação de maneira a gerar a diversidade entre os classificadores base. As versões foram comparadas utilizando diferentes taxas de seleção e quantidade de classificadores, logo após, a melhor versão encontrada foi comparada com outros métodos encontrados na literatura.