Please use this identifier to cite or link to this item: https://rd.uffs.edu.br/handle/prefix/9198
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Dal Bianco, Guilherme-
dc.creatorVogt, Rodrigo Ediel-
dc.date2025-12-12-
dc.date.accessioned2026-04-06T19:04:04Z-
dc.date.available2026-
dc.date.available2026-04-06T19:04:04Z-
dc.date.issued2025-
dc.identifier.urihttps://rd.uffs.edu.br/handle/prefix/9198-
dc.description.abstractAdvances in large language models have enabled the automation of complex tasks involving the evalu- ation of technical content. This study investigates the use of Large Language Models to validate the coherence of Question–Answer (QA) pairs extracted from an automotive forum, comparing three approaches: zero-shot classification, retrieval based on semantically similar questions (few-shot), and retrieval based on excerpts from technical manuals. Experimental results indicate a progressive improvement in performance as more structured context is introduced. While the zero-shot approach yields F1-scores below 50%, the use of similar questions as contextual examples provides moderate gains. The best results are achieved with manual-based retrieval, which increases the F1-score to over 70%, highlighting the importance of authoritative technical documentation for reliable automatic answer validation.pt_BR
dc.description.resumoO avanço dos modelos de linguagem de grande porte tem viabilizado a automação de tarefas complexas de avaliação de conteúdo técnico. Este trabalho investiga o uso desses modelos para validar a coerência entre pares de pergunta e resposta extraídos de um fórum automotivo, comparando três abordagens: classificação zero-shot, recuperação baseada em perguntas semanticamente semelhantes (few-shot) e recuperação a partir de trechos de manuais técnicos. Os resultados experimentais evidenciam uma melhoria progressiva no desempenho à medida que contextos mais estruturados são incorporados. Enquanto a abordagem zero-shot apresenta valores de F1 inferiores a 50%, o uso de perguntas semelhantes como exemplos contextuais promove ganhos moderados. O melhor desempenho é obtido com a recuperação baseada em manuais, que eleva o F1-score para valores superiores a 70%, ressaltando a relevância da documentação técnica oficial para a validação automática de respostas.pt_BR
dc.description.provenanceSubmitted by Biblioteca Chapeco (biblio.ch@uffs.edu.br) on 2026-04-02T14:35:39Z No. of bitstreams: 1 VOGT.pdf: 649093 bytes, checksum: cac219ec5e930131a8b8e326a0969a9c (MD5)en
dc.description.provenanceApproved for entry into archive by DIONE ROSSI FARIAS (dione@uffs.edu.br) on 2026-04-06T19:04:04Z (GMT) No. of bitstreams: 1 VOGT.pdf: 649093 bytes, checksum: cac219ec5e930131a8b8e326a0969a9c (MD5)en
dc.description.provenanceMade available in DSpace on 2026-04-06T19:04:04Z (GMT). No. of bitstreams: 1 VOGT.pdf: 649093 bytes, checksum: cac219ec5e930131a8b8e326a0969a9c (MD5) Previous issue date: 2025en
dc.languageporpt_BR
dc.publisherUniversidade Federal da Fronteira Sulpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCampus Chapecópt_BR
dc.publisher.initialsUFFSpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectInteligência artificialpt_BR
dc.subjectRecuperação da informaçãopt_BR
dc.subjectAutomaçãopt_BR
dc.subjectValidação de modelospt_BR
dc.titleValidação automática de respostas técnicas automotivas utilizando modelos de linguagem e recuperação de informaçãopt_BR
dc.typeMonografiapt_BR
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
VOGT.pdf633.88 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.