Classificação de dados sensoriais de cafés especiais com resposta multiclasse via Algoritmo Boosting e Bagging
Data
2016-02-25
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Lavras
Resumo
Os métodos automáticos de classificação têm sido desenvolvidos na área de Aprendizado de Máquina com o intuito de facilitar a categorização de dados. Dentre os métodos mais bem sucedidos destacam-se o Boosting e o Bagging. O Bagging funciona combinando classificadores ajustados em amostras bootstrap dos dados e o Boosting funciona aplicando-se sequencialmente um algoritmo de classificação a versões reponderadas do conjunto de dados de treinamento, dando maior peso às observações classificadas erroneamente no passo anterior. Esses classificadores se caracterizam por produzirem resultados satisfatórios, baixo custo computacional e vantagem da simplicidade de implementação. Dadas essas características, surge um interesse em verificar o desempenho desses métodos automáticos comparados com os métodos clássicos de classificação existentes na Estatística, a Análise Discriminante Linear e Quadrática. Com o propósito de comparar essas técnicas, utilizou-se as taxas de erro de classificação dos modelos. Para melhorar a confiança da utilização dos métodos Boosting e Bagging em problemas mais complexos de classificação, um estudo foi realizado aplicando essas técnicas em dados reais e simulados que eram compostos por mais que duas categorias na variável resposta. Nesta dissertação, para estimular a implementação do Boosting e Bagging, realizou-se uma aplicação na Análise Sensorial. Concluiu-se que os métodos automáticos tiverem um bom desempenho de classificação, proporcionando taxas de erro menores que as Análises Discriminante Linear e Quadrática nas aplicações testadas.
Automatic classification methods have been developed in machine learning area in order to facilitate the categorization of data. Among the most successful methods include the Boosting and Bagging. The Bagging works by combining classifiers adjusted in bootstrap samples of the data and the Boosting works by applying sequentially an algorithm to rank the reweighted versions of the set of training data, giving greater weight to the observations misclassified in the previous step. These classifiers are characterized by providing satisfactory results, low computational cost and benefit of implementation simplicity. Given these characteristics, comes an interest in checking the performance of these automated methods compared with traditional existing classification methods in Statistics, Linear Discriminate Analysis and Quadratic. In order to compare these techniques it was used misclassification rates and accuracy of the models. To improve confidence in the use of Boosting and Bagging methods in more complex problems of classification, a study was carried out by applying these techniques in real and simulated data composed of more than two categories in the response variable. In this dissertation, to encourage the implementation of Boosting and Bagging was held in an application Sensory Analysis. We conclude that automatic methods have a good classification performance by providing lower error rates than Discriminant Linear analysis and Quadratic Discriminant analysis in the tested applications.
Automatic classification methods have been developed in machine learning area in order to facilitate the categorization of data. Among the most successful methods include the Boosting and Bagging. The Bagging works by combining classifiers adjusted in bootstrap samples of the data and the Boosting works by applying sequentially an algorithm to rank the reweighted versions of the set of training data, giving greater weight to the observations misclassified in the previous step. These classifiers are characterized by providing satisfactory results, low computational cost and benefit of implementation simplicity. Given these characteristics, comes an interest in checking the performance of these automated methods compared with traditional existing classification methods in Statistics, Linear Discriminate Analysis and Quadratic. In order to compare these techniques it was used misclassification rates and accuracy of the models. To improve confidence in the use of Boosting and Bagging methods in more complex problems of classification, a study was carried out by applying these techniques in real and simulated data composed of more than two categories in the response variable. In this dissertation, to encourage the implementation of Boosting and Bagging was held in an application Sensory Analysis. We conclude that automatic methods have a good classification performance by providing lower error rates than Discriminant Linear analysis and Quadratic Discriminant analysis in the tested applications.
Descrição
Dissertação de Mestrado defendida na Universidade Federal de Lavras
Palavras-chave
Métodos de classificação, Qualidade de cafés, Análise Discriminante
Citação
OLIVEIRA, L. M. Classificação de dados sensoriais de cafés especiais com resposta multiclasse via Algoritmo Boosting e Bagging. 2016. 85 f. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras. 2016.