Please use this identifier to cite or link to this item:
https://rd.uffs.edu.br/handle/prefix/8149
Type: | Dissertação |
Title: | Aplicação do aprendizado de máquina sobre a qualidade da produção familiar do leite |
Other Titles: | Application of machine learning on the quality of family milk production |
Author: | Oliveira, Isaac de Jesus de |
First advisor: | Blagitz, Maiara Garcia |
Resume: | O Paraná se destaca na produção leiteira, com um crescimento significativo na atividade. Entretanto, há grande heterogeneidade no perfil dos produtores. A região Sudoeste do Paraná é caracterizada pela produção de leite oriunda principalmente da Agricultura Familiar, que é uma das mais produtivas do estado. O objetivo desta pesquisa foi aplicar a técnica de mineração de dados (aprendizado de máquina) através de modelos de árvores de decisão, compostas por regras, para identificar padrões que permitam prever a qualidade do leite pelos indicadores de contagem de células somáticas (CCS) e contagem bacteriana total (CBT) em dados coletados (questionários e análises laboratoriais) de produtores de leite da região Sudoeste do Paraná. Foram criados modelos para as classes finais CCS e CBT, resultando em duas árvores de decisão. Utilizou-se uma base de dados para treinamento (70%) e uma base de dados para testes (30%), totalizando 221 registros. Na categorização dos dados, a classificação do leite para CCS foi: A (até 400.000 células/mL), B (até 500.000 células/mL) ou C (acima de 500.000 células/mL), e para CBT: A (até 100.000 UFC/mL), B (até 300.000 UFC/mL) e C (acima de 300.000 UFC/mL). Após essas etapas, realizou-se a mineração de dados e extração do conhecimento. Em relação aos resultados para as árvores de decisão, os atributos relevantes para a geração do modelo de CCS foram teor de lactose e tipo de ordenha. Para o modelo de CBT, os atributos principais foram o número de animais e o uso de água sanitária na higienização do resfriador. Para ambos os modelos (CCS e CBT), a produção diária de leite em litros e a origem da água utilizada nos procedimentos de ordenha foram fatores importantes. A eficiência dos modelos gerados foi de 63,64% para CCS e 74,24% para CBT. |
Abstract: | Paraná stands out in dairy production with significant growth in this activity. However, there is great heterogeneity in the profile of the producers. The Southwest region of Paraná is characterized by milk production mainly from family farming and is one of the most productive in the state. The objective of this research was to apply the data mining technique (machine learning) through decision tree models, composed of rules, to identify patterns to predict milk quality using the indicators of somatic cell count (SCC) and total bacterial count (TBC) in data collected (questionnaires and laboratory analyses) from milk producers in the Southwest region of Paraná. Models were created for the final classes SCC and TBC, resulting in two decision trees. A database was used for training (70%) and a database for testing (30%), totaling 221 records. In data categorization, the classification of milk for SCC was: A (up to 400,000 cells/mL), B (up to 500,000 cells/mL), or C (above 500,000 cells/mL), and for TBC: A (up to 100,000 CFU/mL), B (up to 300,000 CFU/mL), and C (above 300,000 CFU/mL). After these steps, data mining and knowledge extraction were performed. Regarding the decision tree results, the relevant attributes for generating the SCC model were lactose content and type of milking. For the TBC model, the main attributes were the number of animals and the use of bleach in cooling tank sanitation. For both models (SCC and TBC), the daily milk production in liters and the origin of the water used in the milking procedures were important factors. The efficiency of the generated models was 63.64% for SCC and 74.24% for TBC. |
Keywords: | Agricultura familiar Bovinocultura leiteira Aprendizado computacional Mineração de dados |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal da Fronteira Sul |
Acronym of the institution: | UFFS |
College, Institute or Department: | Campus Realeza |
Name of Program of Postgraduate studies: | Programa de Pós-Graduação em Saúde, Bem-Estar e Produção Animal Sustentável |
Type of Access: | Acesso Aberto |
URI: | https://rd.uffs.edu.br/handle/prefix/8149 |
Issue Date: | 20-Sep-2024 |
metadata.dc.level: | Mestrado |
Appears in Collections: | Programa de Pós-Graduação em Saúde, Bem-Estar e Produção Animal Sustentável |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
OLIVEIRA.pdf | 664,49 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.