Use este identificador para citar ou linkar para este item: https://rd.uffs.edu.br/handle/prefix/2104
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisor1Dal Bianco, Guilherme-
dc.creatorSilva, João Miguel Gehlen da-
dc.date2018-
dc.date.accessioned2018-08-30T19:32:07Z-
dc.date.available2018-08-30T19:32:07Z-
dc.date.issued2018-07-03-
dc.identifier.urihttps://rd.uffs.edu.br/handle/prefix/2104-
dc.description.abstractThe constant growth of online services, for example, price and product comparison, content aggregators, among others, drives the demand for solutions for data extraction. In order for information from the Internet to be compared or grouped, it is first necessary to extract relevant data from web pages in a structured format. The techniques that provide data extraction are known as wrappers. Each wrapper is developed based on the HTML page and produces a set of structured information. But when an HTML page is modified, wrapper may stop working or works incorrectly. Currently there are several studies to perform the automatic adjustment of the data extraction system, procedure known as wrapper maintenance. This work presents some techniques of wrapper maintenance and proposes an improvement in the method of extractor automation based on the presented techniques.pt_BR
dc.description.resumoO constante crescimento de serviços online, por exemplo, comparação de preços e produtos, agregadores de conteúdos, entre outros, impulsiona a demanda por soluções para a extração de dados. Para que informações oriundas internet possam ser comparadas ou agrupadas, é necessário extrair os dados relevantes das páginas web em um formato estruturado. As técnicas que providenciam a extração de dados são conhecidas como wrappers. Cada wrapper é desenvolvido usando como base a página HTML e produz um conjunto de informações estruturadas. Porém quando uma página HTML é modificada, o wrapper para de funcionar ou funciona de maneira incorreta. Atualmente já existem diversos estudos para fazer o ajuste automático do sistema de extração de dados, procedimento conhecido como wrapper maintenance. Este trabalho apresenta algumas técnicas de wrapper maintenance e propõe uma melhoria no método de automação de extratores tomando como base as técnicas apresentadas.pt_BR
dc.description.provenanceSubmitted by ADAIR PERDOMO FALCÃO (adair.falcao@uffs.edu.br) on 2018-08-29T18:00:26Z No. of bitstreams: 1 SILVA, João.pdf: 3030847 bytes, checksum: 4176207d246b14c6a7a8e9a8df610dba (MD5)en
dc.description.provenanceApproved for entry into archive by Diego dos Santos Borba (dborba@uffs.edu.br) on 2018-08-30T19:32:07Z (GMT) No. of bitstreams: 1 SILVA, João.pdf: 3030847 bytes, checksum: 4176207d246b14c6a7a8e9a8df610dba (MD5)en
dc.description.provenanceMade available in DSpace on 2018-08-30T19:32:07Z (GMT). No. of bitstreams: 1 SILVA, João.pdf: 3030847 bytes, checksum: 4176207d246b14c6a7a8e9a8df610dba (MD5) Previous issue date: 2018-07-03en
dc.languageporpt_BR
dc.publisherUniversidade Federal da Fronteira Sulpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCampus Chapecópt_BR
dc.publisher.initialsUFFSpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectExtração de dadospt_BR
dc.subjectExtração webpt_BR
dc.subjectManutenção de wrapperspt_BR
dc.subjectVerificação de wrapperspt_BR
dc.subjectWrapperpt_BR
dc.titleFave: uma proposta para verificação de extratores de dados de páginas htmlpt_BR
dc.typeMonografiapt_BR
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
SILVA, João.pdf2,96 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.