Please use this identifier to cite or link to this item: https://rd.uffs.edu.br/handle/prefix/3367
Type: Monografia
Title: Análise exploratória sobre registros eletrônicos de saúde do setor de unidade de terapia intensiva utilizando modelagem de tópicos
Author: Puerari, Ivair
First advisor: Duarte, Denio
Resume: O rápido crescimento dos registros eletrônicos de saúde traz o aumento de informações disponíveis sobre pacientes em hospitais. Essa massiva quantidade de informações em texto é adequada para a extração de informações desconhecidas sobre histórico médico, medicamentos, doenças, alergias, entre outras. A modelagem de tópicos é um problema de aprendizado de máquina que visa extrair, dada uma coleção de documentos, os principais tópicos que representam os assuntos abordados pela coleção. Em modelagem de tópicos, um documento pode ser definido como uma mistura de tópicos, sendo estes gerados a partir de diferentes distribuições probabilísticas de palavras, permitindo assim extrair assuntos em forma de tópicos de coleções de documentos. O objetivo deste trabalho foi realizar uma análise exploratória sobre duas coleções de registros eletrônicos de saúde separados por internações que obtiveram alta e internações que evoluíram a óbito no setor de Unidade de Terapia Intensiva utilizando modelagem de tópicos a fim de identificar os assuntos presentes nas coleções. Após a execução do modelo Latent Dirichlet Allocation (LDA) foram extraídos 11 tópicos para cada coleção de documentos óbito e alta. Como resultado, para a coleção de altas os assuntos com maior predominância são sistema respiratório, sistema renal, sistema neurológico, prematuridade e sistema cardíaco. Por outro lado, a coleção de óbitos apresenta os principais assuntos como sistema hepático, sistema cardiovascular, sistema neurológico e sistema respiratório. Foram analisadas as disjunções e intersecções dos assuntos definidos em cada coleção, e observado a infecção como importante fator contribuinte para evolução a óbito.
Abstract: The rapid growth of electronic health record systems brings the increase of available information about patients in hospitals. This massive amount of text information is suitable for the extraction of unknown information about medical history, medication, deseases, allergies, among others. Topic modeling is a machine learning problem, which aims to extract, given a collection of documents, the main topics that represent the subjects covered by a text collection. In the topic model, the documents can be composed of a mixture of topics with a certain probability. This work aims to make an exploratory analysis of two collections of electronic records health from an intensive care unit. The collection is split into two subcollections: discharged patients and patients who progressed to death. We apply the Latent Dirichlet Allocation (LDA) algorithm in both collections, setting the number of topics to 11. As a result, discharged patients collection shows the following predominant topics: respiratory system, renal system, neurological system, prematurity, and cardiac system. On the other hand, the death collection presents as main topics subjects about the hepatic system, cardiovascular, neurological, and respiratory system. We also analyze the correlation of the topics inter collections, and we observed that the infection as a significant contributing factor to progress to death.
Keywords: Registros hospitalares
Mineração de dados
Ciência da computação
Language: por
Country: Brasil
Publisher: Universidade Federal da Fronteira Sul
Acronym of the institution: UFFS
College, Institute or Department: Campus Chapecó
Type of Access: Acesso Aberto
URI: https://rd.uffs.edu.br/handle/prefix/3367
Issue Date: 2019
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
PUERARI.pdf3,02 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.