RAG em domínio normativo: avaliação de recuperadores e diagnóstico de viés em dados sintéticos do PPC-CC

Catanio, Maurício

Use este identificador para citar ou linkar para este item: https://rd.uffs.edu.br/handle/prefix/9170

Tipo:	Monografia
Título:	RAG em domínio normativo: avaliação de recuperadores e diagnóstico de viés em dados sintéticos do PPC-CC
Autor(es):	Catanio, Maurício
Primeiro Orientador:	Dal Bianco, Guilherme
Resumo:	Sistemas de Recuperação Aprimorada Generativa (RAG) aumentam a confiabilidade de Modelos de Linguagem de Grande Escala (LLMs) ao fundamentar suas respostas em fontes externas. Contudo, a eficácia do RAG depende criticamente do componente de recuperação de informação (RI), cujo comportamento em domínios técnicos per- manece pouco explorado. Este trabalho realiza uma investigação experimental e qua- litativa dos fatores que influenciam o desempenho de recuperadores léxicos (BM25, TF-IDF), densos (embeddings especializados) e híbridos (SPLADE) no contexto de um caso real: um sistema de perguntas e respostas sobre o Projeto Pedagógico do Curso (PPC) de Ciência da Computação da UFFS. Os resultados demonstram que, neste domínio normativo, métodos léxicos tradicionais apresentaram desempenho su- perior ou equivalente ao de abordagens neurais mais complexas. A análise revelou ainda: (i) vieses estruturais em datasets sintéticos de avaliação, que inflam artificial- mente as métricas de métodos baseados em termos; e (ii) limitações práticas significa- tivas na transferência do modelo híbrido SPLADE para o português brasileiro, devido a expansões lexicais ruidosas. O estudo evidencia que a escolha do método de RI deve considerar as características intrínsecas do domínio-alvo, desafiando a pressuposição de superioridade automática das abordagens neurais.
Abstract/Resumen:	Retrieval-Augmented Generation (RAG) systems enhance the reliabi- lity of Large Language Models (LLMs) by grounding responses in external sources. However, RAG effectiveness critically depends on the information retrieval (IR) com- ponent, whose behavior in specific technical domains remains underexplored. This work conducts an experimental and qualitative investigation of the factors influencing the performance of lexical (BM25, TF-IDF), dense (specialized embeddings), and hy- brid (SPLADE) retrievers in a real-world case: a question-answering system for the Computer Science Course Pedagogical Project (PPC) at UFFS. Results demonstrate that, in this normative domain, traditional lexical methods performed equally or supe- riorly to more complex neural approaches. The analysis further revealed: (i) structural biases in synthetic evaluation datasets, which artificially inflate metrics for term-based methods; and (ii) significant practical limitations in transferring the hybrid SPLADE model to Brazilian Portuguese, due to noisy lexical expansions. The study highlights that the choice of IR method must consider the intrinsic characteristics of the target domain, challenging the assumed automatic superiority of neural approaches.
Palavras-chave:	Recuperação da informação Inteligência artificial Processamento de linguagem natural Currículo de ensino superior
Idioma:	por
País:	Brasil
Instituição:	Universidade Federal da Fronteira Sul
Sigla da Instituição:	UFFS
Faculdade, Instituto ou Departamento:	Campus Chapecó
Tipo de Acesso:	Acesso Aberto
URI:	https://rd.uffs.edu.br/handle/prefix/9170
Data do documento:	2025
Aparece nas coleções:	Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CATANIO.pdf		479,93 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas