Please use this identifier to cite or link to this item: https://rd.uffs.edu.br/handle/prefix/3371
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Duarte, Denio-
dc.creatorPereira, Mariana-
dc.date2019-
dc.date.accessioned2020-02-04T12:07:36Z-
dc.date.available2019-
dc.date.available2020-02-04T12:07:36Z-
dc.date.issued2019-
dc.identifier.urihttps://rd.uffs.edu.br/handle/prefix/3371-
dc.description.abstractTopic modeling is a data mining problem that aims to extract, given a document collection, the main topics that represent the subjects covered in the collection documents. A document, which can be short or long, can be defined as a mixture of topics, being a set of words ordered by their probability of occurrence. Conventional approaches for topic modeling such as LDA and PSLA have been used in long documents and when used it in short texts may not work well since conventional topic models suffer from the severe data sparsity. So, in this paper, an exploratory analysis is performed in the Twitter database applying the Biterm Topic Model (BTM) to discover the main topics discussed during the Rio 2016 Olympic Games. As a result, the topics obtained represents the collection of documents and reflects the events that occurred at the Olympic Games, especially those that made reference to Brazil.pt_BR
dc.description.resumoA modelagem de tópicos é uma forma de mineração de texto que visa extrair, dada uma coleção de documentos, os principais tópicos que representem os assuntos abordados nos documentos da coleção. Um documento, que pode ser curto ou longo, pode ser definido como uma mistura de tópicos, sendo um conjunto de palavras ordenadas por suas probabilidades de ocorrência. Abordagens convencionais de modelagem de tópicos como LDAe PSLA foram desenvolvidas para serem aplicadas em documentos longos e, quando aplicados em textos curtos, não são tão eficientes pelo fato de não conseguir lidar bem com a dispersão dos dados. Sendo assim, para a extração de tópicos em textos curtos, se faz necessário a utilização de modelos de tópicos específicos para tal. Posto isso, neste trabalho será realizada uma análise exploratória na base de dados do Twitter, fazendo a utilização do modelo BTM (Biterm Topic Model) para descobrir os principais tópicos discutidos durante o período das Olimpíadas Rio 2016. Como resultado, os tópicos obtidos representaram a coleção e refletiram os acontecimentos ocorridos nos Jogos Olímpicos, principalmente os que fizeram referência ao Brasil.pt_BR
dc.description.provenanceSubmitted by Suelen Spindola Bilhar (suelen.bilhar@uffs.edu.br) on 2019-12-20T12:39:46Z No. of bitstreams: 1 PEREIRA.pdf: 5316585 bytes, checksum: 795570b9310b7985c474a340de497396 (MD5)en
dc.description.provenanceApproved for entry into archive by Franciele Scaglioni da Cruz (franciele.cruz@uffs.edu.br) on 2020-02-04T12:07:36Z (GMT) No. of bitstreams: 1 PEREIRA.pdf: 5316585 bytes, checksum: 795570b9310b7985c474a340de497396 (MD5)en
dc.description.provenanceMade available in DSpace on 2020-02-04T12:07:36Z (GMT). No. of bitstreams: 1 PEREIRA.pdf: 5316585 bytes, checksum: 795570b9310b7985c474a340de497396 (MD5) Previous issue date: 2019en
dc.languageporpt_BR
dc.publisherUniversidade Federal da Fronteira Sulpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCampus Chapecópt_BR
dc.publisher.initialsUFFSpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectGeometria e modelagem computacionalpt_BR
dc.subjectMineração de dadospt_BR
dc.subjectRedes sociaispt_BR
dc.titleAnálise exploratória de tweets utilizando modelagem de tópicos para textos curtos: caso Olimpíadas Rio 2016pt_BR
dc.typeMonografiapt_BR
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
PEREIRA.pdf5,19 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.