Técnicas de deep learning aplicadas ao problema do aprendizado semissupervisionado
Deep Learning, Rotulação, Semissupervisionado, Agrupamento, Classificação.
O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado, seguindo duas abordagens: 1) Classificação semissupervisionada, onde treina-se uma rede neural profunda apoiada por um processo de pré-rotulação, utilizando os dados rotulados para influenciar os não rotulados para gerar seus rótulos; 2) Agrupamento semissupervisionado, aplicando um agrupamento profundo por meio de uma rede auto encoder acoplada ao algoritmo K-means. Os dados rotulados são submetidos aos grupos gerados pelo auto encoder, influenciando os não rotulados, grupo à grupo. Com os experimentos realizados pode-se notar o desempenho satisfatório dos modelos propostos quando comparados com outros algoritmos semissupervisionados, mostrando a viabilidade dos modelos proposto no problema abordado.