Banca de DEFESA: ALEXANDRE GOMES DE LIMA

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE : ALEXANDRE GOMES DE LIMA
DATA : 29/06/2023
HORA: 08:00
LOCAL: Google meet
TÍTULO:

Melhorando o Rotulamento de Papel Retórico Legal Através de Dados Adicionais e Uso Eficiente de Modelos Transformadores


PALAVRAS-CHAVES:

codificação de sentenças, BERT, julgamento, classificação de sentenças


PÁGINAS: 132
RESUMO:
Legal AI, a aplicação da Inteligência Artificial (IA) no domínio legal, é um campo de pesquisa que compreende várias dimensões e tarefas de interesse. Tal como em outros domínios de aplicação, um dos benefícios almejados é a automatização de tarefas, a qual aumenta a produtividade dos profissionais da área e torna o Direito mais acessível ao público em geral. Texto é uma fonte de dados importante no domínio legal, consequentemente Legal AI possui um grande interesse nos avanços relacionados ao Processamento de Linguagem Natural (PLN). Esta tese diz respeito à automatização do Rotulamento de Papel Retórico no Domínio Legal (RPRDL), uma tarefa que atribui funçoes semânticas a sentenças textuais em documentos jurídicos. RPRDL é uma tarefa relevante porque ela encontra informação que é útil tanto por si só, bem como para tarefas posteriores tais como sumarização jurídica e recuperação de jurisprudência. Há vários fatores que tornam a RPRDL uma tarefa não trivial, mesmo para os seres humanos: a heterogeneidade das fontes de documentos, a falta de padrões, necessidade de conhecimento específico do domínio e o nível de subjetividade inerente à tarefa. Estes fatores complicadores e o grande volume de documentos jurídicos justificam a automatização da tarefa. Essa automatização pode ser implementada como uma tarefa de classificação de sentenças, ou seja, as sentenças textuais são utilizadas como entrada de um modelo que atribui um rótulo, ou classe, para cada sentença informada. A utilização de Modelos Transformadores de Linguagem Pré-treinados (MTLP) no desenvolvimento de classificadores é uma escolha óbvia visto que MTLP representam o estado da
arte de muitas tarefas de PLN, incluindo a classificação de texto. No entanto,esta tese evidencia dois  roblemas relevantes encontrados em trabalhos sobre RPRDL suportados por MTLP. O primeiro problema é a falta de trabalhos sobre melhores maneiras de lidar com as idiossincrasias de textos jurídicos e com conjuntos de dados relacionados à tarefa de RPRDL os quais são normalmente pequenos e desbalanceados. Quase todos os trabalhos relacionados empregam apenas a estratégia padrão de ajuste fino para treinar seus modelos. O segundo problema é o aproveitamento parcial da capacidade de exploração de contexto que é intrínseca aos MTLPs, um fato que prejudica o desempenho dos modelos. Diante disso, esta tese tem como objetivo avançar o estado da arte na tarefa de RPRDL por meio de três abordagens concebidas para superar esses problemas.
A primeira abordagem tem base em um método de aumento de dados para gerar vetores representativos de sentença sintéticos, aumentando assim a quantidade de dados de treinamento. A segunda abordagem combina representação de conteúdo e representação posicional para enriquecer os vetores de treinamento.
A terceira abordagem, denominada Preenchimento Dinâmico de Blocos de Sentença Contextualizados (PDBSC), define uma forma de produzir vetores representativos de sentença de alta qualidade através de uma utilização eficiente das capacidades de codificação dos MTLP. Os estudos realizados nesta tese mostram que as duas primeiras abordagens têm um impacto limitado no desempenho dos modelos. Por outro lado, os modelos baseados na abordagem PDBSC obtêm resultados notáveis e são os que apresentam melhor desempenho
nos respectivos estudos. A nossa conclusão é que a abordagem PDBSC é uma contribuição valiosa para o estado da arte em RPRDL. 

MEMBROS DA BANCA:
Presidente - 1671962 - EDUARDO HENRIQUE DA SILVA ARANHA
Interno - 1356585 - LEONARDO CUNHA DE MIRANDA
Externo ao Programa - 2885532 - IVANOVITCH MEDEIROS DANTAS DA SILVA - UFRNExterno à Instituição - JOSÉ GUILLERMO MORENO
Externo à Instituição - TAOUFIQ DKAKI
Notícia cadastrada em: 14/06/2023 16:05
SIGAA | Superintendência de Tecnologia da Informação - (84) 3342 2210 | Copyright © 2006-2024 - UFRN - sigaa05-producao.info.ufrn.br.sigaa05-producao