Use este identificador para citar ou linkar para este item: https://rd.uffs.edu.br/handle/prefix/2701
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisor1Duarte, Denio-
dc.creatorCampagnolo, João Marcos-
dc.date2018-
dc.date.accessioned2019-04-10T16:57:05Z-
dc.date.available2019-
dc.date.available2019-04-10T16:57:05Z-
dc.date.issued2018-
dc.identifier.urihttps://rd.uffs.edu.br/handle/prefix/2701-
dc.description.abstractThe growing tendency of store all the knowledge and content produced digitally makes it increasingly difficult to find all this information and organize it. Topical modeling algorithms allows to extract topics from vast collections of documents. A document, which maybe short or long, can be defined as a mixture of topics, which are a set of words sorted by their probability ofoccurrence. Evaluating the quality of a topic is atask that can be simple for humans,al though it is very expensive when dealing with large amounts of data. Thus, computational methods, known as coherence metrics, are used to measure the quality of topics from the co-occurrence between the words that compose them. However, different metrics can generate different results when applied to the same topic. This work will evaluate the sensitivity of some of these metrics by applying them to a set of topics that have been created, adulterated by inserting intrusive words, and validated by humans. As result, in general, the metric CUICI was shown to be the most sensitive, while the metrics CV and CUMASS were shown to be the least sensitive.pt_BR
dc.description.resumoA crescente tendência de armazenar todo o conhecimento e conteúdo produzido de forma digital dificulta cada vez mais a tarefa de buscar e organizar as informações. Os algoritmos de modelagem de tópicos permitem extrair temas/assuntos, em forma de tópicos, de vastas coleções de documentos. Um documento, que pode ser curto ou longo, pode ser definido como uma mistura de tópicos, que são um conjunto de palavras ordenadas por suas probabilidades de ocorrência. Avaliar a qualidade de um tópico é uma tarefa que pode ser simples para seres humanos, tornando-se muito custosa em se tratando de grandes quantidades de dados. Dessa forma, métodos computacionais, conhecidos como métricas de coerência, são utilizados para medir a qualidade de tópicos a partir da co-ocorrência entre as palavras que os compõem. Porém, diferentes métricas podem gerar diferentes resultados quando aplicadas a um mesmo tópico. Neste trabalho será realizada uma avaliação da sensibilidade de algumas dessas métricas, aplicando-as em um conjunto de tópicos que foram criados, deturpados através da inserção de palavras intrusas, e validados por seres humanos. Como resultado, de modo geral, a métrica CUCI se mostrou ser a mais sensível, enquanto as métricas CV e CUMASS se mostraram as menos sensíveis.pt_BR
dc.description.provenanceSubmitted by SUELEN SPINDOLA BILHAR (suelen.bilhar@gmail.com) on 2019-04-10T12:01:09Z No. of bitstreams: 1 CAMPAGNOLO.pdf: 5575809 bytes, checksum: 5621974257c7f54659f8a24b59cff9c9 (MD5)en
dc.description.provenanceApproved for entry into archive by Diego dos Santos Borba (dborba@uffs.edu.br) on 2019-04-10T16:57:05Z (GMT) No. of bitstreams: 1 CAMPAGNOLO.pdf: 5575809 bytes, checksum: 5621974257c7f54659f8a24b59cff9c9 (MD5)en
dc.description.provenanceMade available in DSpace on 2019-04-10T16:57:05Z (GMT). No. of bitstreams: 1 CAMPAGNOLO.pdf: 5575809 bytes, checksum: 5621974257c7f54659f8a24b59cff9c9 (MD5) Previous issue date: 2018en
dc.languageporpt_BR
dc.publisherUniversidade Federal da Fronteira Sulpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCampus Chapecópt_BR
dc.publisher.initialsUFFSpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAlgoritmospt_BR
dc.subjectGeometria e modelagem computacionalpt_BR
dc.subjectMétricas de sofwarept_BR
dc.titleAvaliação da sensibilidade de métricas de avaliação de tópicospt_BR
dc.typeMonografiapt_BR
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CAMPAGNOLO.pdf5,45 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.