Use este identificador para citar ou linkar para este item:
https://rd.uffs.edu.br/handle/prefix/8110
Tipo: | Artigo Cientifico |
Título: | Estudo do impacto de representações distribuídas geradas por large language models na identificação de expressões idiomáticas |
Autor(es): | Werle, Paulo Eduardo Rodrigues |
Primeiro Orientador: | Salton, Giancarlo Dondoni |
Resumo: | As expressões idiomáticas são construções linguísticas que apresentam significados que não podem ser deduzidos diretamente de suas palavras constituintes, tornando sua identifi- cação e compreensão um desafio significa- tivo para sistemas de processamento de lin- guagem natural (PLN). Este artigo investiga o impacto das representações distribuídas ger- adas por modelos de linguagem de grande es- cala na tarefa de identificar expressões idiomáti- cas, com foco em modelos Transformers como BERT, RoBERTa e mBART. A análise revelou que o modelo BERT, em particular, é capaz de capturar nuances contextuais e semânticas de expressões idiomáticas com maior precisão, ev- idenciado pelas maiores distâncias Euclideanas e de Cosseno observadas para essas expressões em comparação com as literais. Esses resulta- dos positivos destacam o potencial dos modelos baseados em Transformadores para melhorar a identificação e o tratamento de expressões idiomáticas, contribuindo para avanços signi- ficativos no campo do PLN |
Palavras-chave: | Inteligência artificial Processamento de linguagem natural Linguagem natural Redes neurais Aprendizagem profunda |
Idioma: | por |
País: | Brasil |
Instituição: | Universidade Federal da Fronteira Sul |
Sigla da Instituição: | UFFS |
Faculdade, Instituto ou Departamento: | Campus Chapecó |
Tipo de Acesso: | Acesso Aberto |
URI: | https://rd.uffs.edu.br/handle/prefix/8110 |
Data do documento: | 2024 |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
WERLE.pdf | 541,67 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.