Please use this identifier to cite or link to this item:
https://rd.uffs.edu.br/handle/prefix/9198Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor1 | Dal Bianco, Guilherme | - |
| dc.creator | Vogt, Rodrigo Ediel | - |
| dc.date | 2025-12-12 | - |
| dc.date.accessioned | 2026-04-06T19:04:04Z | - |
| dc.date.available | 2026 | - |
| dc.date.available | 2026-04-06T19:04:04Z | - |
| dc.date.issued | 2025 | - |
| dc.identifier.uri | https://rd.uffs.edu.br/handle/prefix/9198 | - |
| dc.description.abstract | Advances in large language models have enabled the automation of complex tasks involving the evalu- ation of technical content. This study investigates the use of Large Language Models to validate the coherence of Question–Answer (QA) pairs extracted from an automotive forum, comparing three approaches: zero-shot classification, retrieval based on semantically similar questions (few-shot), and retrieval based on excerpts from technical manuals. Experimental results indicate a progressive improvement in performance as more structured context is introduced. While the zero-shot approach yields F1-scores below 50%, the use of similar questions as contextual examples provides moderate gains. The best results are achieved with manual-based retrieval, which increases the F1-score to over 70%, highlighting the importance of authoritative technical documentation for reliable automatic answer validation. | pt_BR |
| dc.description.resumo | O avanço dos modelos de linguagem de grande porte tem viabilizado a automação de tarefas complexas de avaliação de conteúdo técnico. Este trabalho investiga o uso desses modelos para validar a coerência entre pares de pergunta e resposta extraídos de um fórum automotivo, comparando três abordagens: classificação zero-shot, recuperação baseada em perguntas semanticamente semelhantes (few-shot) e recuperação a partir de trechos de manuais técnicos. Os resultados experimentais evidenciam uma melhoria progressiva no desempenho à medida que contextos mais estruturados são incorporados. Enquanto a abordagem zero-shot apresenta valores de F1 inferiores a 50%, o uso de perguntas semelhantes como exemplos contextuais promove ganhos moderados. O melhor desempenho é obtido com a recuperação baseada em manuais, que eleva o F1-score para valores superiores a 70%, ressaltando a relevância da documentação técnica oficial para a validação automática de respostas. | pt_BR |
| dc.description.provenance | Submitted by Biblioteca Chapeco (biblio.ch@uffs.edu.br) on 2026-04-02T14:35:39Z No. of bitstreams: 1 VOGT.pdf: 649093 bytes, checksum: cac219ec5e930131a8b8e326a0969a9c (MD5) | en |
| dc.description.provenance | Approved for entry into archive by DIONE ROSSI FARIAS (dione@uffs.edu.br) on 2026-04-06T19:04:04Z (GMT) No. of bitstreams: 1 VOGT.pdf: 649093 bytes, checksum: cac219ec5e930131a8b8e326a0969a9c (MD5) | en |
| dc.description.provenance | Made available in DSpace on 2026-04-06T19:04:04Z (GMT). No. of bitstreams: 1 VOGT.pdf: 649093 bytes, checksum: cac219ec5e930131a8b8e326a0969a9c (MD5) Previous issue date: 2025 | en |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal da Fronteira Sul | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.department | Campus Chapecó | pt_BR |
| dc.publisher.initials | UFFS | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.subject | Inteligência artificial | pt_BR |
| dc.subject | Recuperação da informação | pt_BR |
| dc.subject | Automação | pt_BR |
| dc.subject | Validação de modelos | pt_BR |
| dc.title | Validação automática de respostas técnicas automotivas utilizando modelos de linguagem e recuperação de informação | pt_BR |
| dc.type | Monografia | pt_BR |
| Appears in Collections: | Ciência da Computação | |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.