Use este identificador para citar ou linkar para este item:
https://rd.uffs.edu.br/handle/prefix/3365
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor1 | Dal Bianco, Guilherme | - |
dc.creator | Sponchiado, Artur Constanzi | - |
dc.date | 2019 | - |
dc.date.accessioned | 2020-02-03T15:10:36Z | - |
dc.date.available | 2019 | - |
dc.date.available | 2020-02-03T15:10:36Z | - |
dc.date.issued | 2019 | - |
dc.identifier.uri | https://rd.uffs.edu.br/handle/prefix/3365 | - |
dc.description.abstract | With the advent of online social networking, user interaction spaces are emerging. Such spaces can range from comments on a video site to the discussion section on a news site, for example. In these environments, people can chat, expose their opinions, discuss ideas, etc. However, groups are emerging and taking advantage of anonymity to spread hate speech, disseminating xenophobic and racist views, among others. Individuals who share such messages tend to hide their words with special characters or even sarcasm. It makes a difficult task for basic algorithms to block the content. Thus, it is necessary a way to detect these speeches automatically, since the amount of messages published daily is very large, such task becomes impracticable. Using preprocessing methods for features and meta-features extraction, this work obtain promising results in the area of hate speech detection in texts. The proposed method consists of stemization and removal of stopwords for data pre-processing and meta-features extraction with KNN algorithm. Using 10-fold cross validation and the SVM classifier, the proposed method achieves improvements of up to 9.67% over the baseline presented. | pt_BR |
dc.description.resumo | Com o advento das redes sociais online, espaços de interação entre usuários estão surgindo. Tais espaços podem ser desde comentários em um site de vídeos, até a seção de discussão em um site de notícias, por exemplo. Nesses ambientes, pessoas podem conversar, expor suas opiniões, debater ideias, etc. Todavia, existem grupos se formando que, aproveitando-se do anonimato, propagam discursos de ódio, disseminando ideias xenofóbicas, racistas, entre outras. Indivíduos que compartilham mensagens deste tipo tendem a disfarçar suas palavras, com caracteres especiais ou até mesmo o sarcasmo, tornando assim uma tarefa difícil para algoritmos básicos bloquearem tal conteúdo. Assim, faz-se necessário um meio para detectar estes discursos de forma automática, visto que devido a quantidade de mensagens publicadas diariamente ser muito grande, tal tarefa torna-se inviável. Utilizando abordagens de pré processamento de dados e extração de atributos e meta-atributos, este trabalho obtém resultados promissores na área de detecção de discursos de ódio em textos. O método proposto consiste na stemização e remoção de stopwords na parte do pré-processamento dos dados e na extração de meta-atributos utilizando o algoritmo KNN. Utilizando validação cruzada de 10 vezes e o SVM como classificador, o método proposto obtém melhorias de até 9.67% em relação ao baseline apresentado. | pt_BR |
dc.description.provenance | Submitted by Suelen Spindola Bilhar (suelen.bilhar@uffs.edu.br) on 2019-12-20T17:15:32Z No. of bitstreams: 1 SPONCHIADO.pdf: 1315092 bytes, checksum: b1c60e1cb81ed5e31ced9ec0ee3b90dc (MD5) | en |
dc.description.provenance | Approved for entry into archive by Franciele Scaglioni da Cruz (franciele.cruz@uffs.edu.br) on 2020-02-03T15:10:36Z (GMT) No. of bitstreams: 1 SPONCHIADO.pdf: 1315092 bytes, checksum: b1c60e1cb81ed5e31ced9ec0ee3b90dc (MD5) | en |
dc.description.provenance | Made available in DSpace on 2020-02-03T15:10:36Z (GMT). No. of bitstreams: 1 SPONCHIADO.pdf: 1315092 bytes, checksum: b1c60e1cb81ed5e31ced9ec0ee3b90dc (MD5) Previous issue date: 2019 | en |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal da Fronteira Sul | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Campus Chapecó | pt_BR |
dc.publisher.initials | UFFS | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Processamento de linguagem natural | pt_BR |
dc.subject | Redes sociais | pt_BR |
dc.subject | Processamento de dados | pt_BR |
dc.subject | Aprendizado computacional | pt_BR |
dc.title | Aplicação de meta-atributos para detecção de discurso de ódio | pt_BR |
dc.type | Monografia | pt_BR |
Aparece nas coleções: | Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
SPONCHIADO.pdf | 1,28 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.