Análise exploratória de tweets utilizando modelagem de tópicos para textos curtos: caso Olimpíadas Rio 2016

Pereira, Mariana

Use este identificador para citar ou linkar para este item: https://rd.uffs.edu.br/handle/prefix/3371

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor1	Duarte, Denio	-
dc.creator	Pereira, Mariana	-
dc.date	2019	-
dc.date.accessioned	2020-02-04T12:07:36Z	-
dc.date.available	2019	-
dc.date.available	2020-02-04T12:07:36Z	-
dc.date.issued	2019	-
dc.identifier.uri	https://rd.uffs.edu.br/handle/prefix/3371	-
dc.description.abstract	Topic modeling is a data mining problem that aims to extract, given a document collection, the main topics that represent the subjects covered in the collection documents. A document, which can be short or long, can be deﬁned as a mixture of topics, being a set of words ordered by their probability of occurrence. Conventional approaches for topic modeling such as LDA and PSLA have been used in long documents and when used it in short texts may not work well since conventional topic models suffer from the severe data sparsity. So, in this paper, an exploratory analysis is performed in the Twitter database applying the Biterm Topic Model (BTM) to discover the main topics discussed during the Rio 2016 Olympic Games. As a result, the topics obtained represents the collection of documents and reﬂects the events that occurred at the Olympic Games, especially those that made reference to Brazil.	pt_BR
dc.description.resumo	A modelagem de tópicos é uma forma de mineração de texto que visa extrair, dada uma coleção de documentos, os principais tópicos que representem os assuntos abordados nos documentos da coleção. Um documento, que pode ser curto ou longo, pode ser deﬁnido como uma mistura de tópicos, sendo um conjunto de palavras ordenadas por suas probabilidades de ocorrência. Abordagens convencionais de modelagem de tópicos como LDAe PSLA foram desenvolvidas para serem aplicadas em documentos longos e, quando aplicados em textos curtos, não são tão eﬁcientes pelo fato de não conseguir lidar bem com a dispersão dos dados. Sendo assim, para a extração de tópicos em textos curtos, se faz necessário a utilização de modelos de tópicos especíﬁcos para tal. Posto isso, neste trabalho será realizada uma análise exploratória na base de dados do Twitter, fazendo a utilização do modelo BTM (Biterm Topic Model) para descobrir os principais tópicos discutidos durante o período das Olimpíadas Rio 2016. Como resultado, os tópicos obtidos representaram a coleção e reﬂetiram os acontecimentos ocorridos nos Jogos Olímpicos, principalmente os que ﬁzeram referência ao Brasil.	pt_BR
dc.description.provenance	Submitted by Suelen Spindola Bilhar (suelen.bilhar@uffs.edu.br) on 2019-12-20T12:39:46Z No. of bitstreams: 1 PEREIRA.pdf: 5316585 bytes, checksum: 795570b9310b7985c474a340de497396 (MD5)	en
dc.description.provenance	Approved for entry into archive by Franciele Scaglioni da Cruz (franciele.cruz@uffs.edu.br) on 2020-02-04T12:07:36Z (GMT) No. of bitstreams: 1 PEREIRA.pdf: 5316585 bytes, checksum: 795570b9310b7985c474a340de497396 (MD5)	en
dc.description.provenance	Made available in DSpace on 2020-02-04T12:07:36Z (GMT). No. of bitstreams: 1 PEREIRA.pdf: 5316585 bytes, checksum: 795570b9310b7985c474a340de497396 (MD5) Previous issue date: 2019	en
dc.language	por	pt_BR
dc.publisher	Universidade Federal da Fronteira Sul	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Campus Chapecó	pt_BR
dc.publisher.initials	UFFS	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Geometria e modelagem computacional	pt_BR
dc.subject	Mineração de dados	pt_BR
dc.subject	Redes sociais	pt_BR
dc.title	Análise exploratória de tweets utilizando modelagem de tópicos para textos curtos: caso Olimpíadas Rio 2016	pt_BR
dc.type	Monografia	pt_BR
Aparece nas coleções:	Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
PEREIRA.pdf		5,19 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas