Eficiência de estimadores robustos a observações discrepantes em regressão multivariada com aplicação na análise sensorial de café
Data
2011-08-03
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Lavras
Resumo
Dada a sensibilidade do método de mínimos quadrados à presença de observações discrepantes, é sabido que as estimativas de mínimos quadrados são afetadas pela presença de uma ou mais dessas observações. Frente ao exposto, esse trabalho foi realizado com o objetivo de pesquisar o efeito de observações discrepantes no ajuste de modelos de regressão multivariada. Com esse propósito, medidas de eficiência entre estimadores robustos denominados Covariância de Determinante Mínimo (Minimum Covariance Determinant - MCD) e Elipsoide de Volume Mínimo (Minimum Volume Ellipsoid - MVE), foram empregadas em simulação Monte Carlo, considerando distribuições que apresentassem desvios de simetria e excesso de curtose em relação à distribuição normal multivariada. Nesse contexto, uma nova medida foi proposta e sua validação se deu na realização de estudos de simulação Monte Carlo, assumindo diferentes configurações paramétricas, especificadas por estrutura da matriz de covariância, número de variáveis e tamanho amostral. Após a validação dos estimadores, modelos de regressão multivariada foram ajustados considerando variáveis relacionadas ao perfil sensorial e químico de genótipos de cafeeiro arábica (Coffea arabica L.). Os resultados relativos à simulação, indicaram que estimador MVE foi mais eficiente quando o efeito das observações foi proveniente de distribuições com desvio de simetria e excesso de curtose. Em se tratando da aplicação, os modelos de regres- são ajustados pelos métodos MCD e MVE foram mais adequados para o estudo das variáveis físico-químicas e sensoriais, sendo condizente com os resultados experimentais.
Given the sensibility of the least squares method to the outliers presence it is known that the estimates of least squares are affected by the presence of one or more of those observations. This way, the objective of this work was to search the effect of outliers in the adjustment of models of multivariate regression. With this purpose, efficiency measures among robust estimators Minimum Covariance Determinant - MCD and Minimum Volume Ellipsoid - MVE were used in simu- lation Monte Carlo considering distributions to present deviations symmetry and excess kurtosis in relation to the multivariate normal distribution. In this context, a new measure was proposed and its validation made by simulation studies Monte Carlo, assuming different parametric configurations specified by structure of the covariance matrix, number of variables and sample size. After the validation of the estimators, multivariate regression models were adjusted considering varia- bles concerning the sensorial and chemical profile of genotypes of arabica coffee (Coffea arabica L.). The relative results to the simulation indicated that MVE estimator was more efficient when the effect of the observations came from distri- butions with deviation symmetry and excess kurtosis. About the application, the regression models adjusted to the MCD and MVE methods were more appropriate for the study of the physiochemical and sensory variables, being consistent with the experimental results.
Given the sensibility of the least squares method to the outliers presence it is known that the estimates of least squares are affected by the presence of one or more of those observations. This way, the objective of this work was to search the effect of outliers in the adjustment of models of multivariate regression. With this purpose, efficiency measures among robust estimators Minimum Covariance Determinant - MCD and Minimum Volume Ellipsoid - MVE were used in simu- lation Monte Carlo considering distributions to present deviations symmetry and excess kurtosis in relation to the multivariate normal distribution. In this context, a new measure was proposed and its validation made by simulation studies Monte Carlo, assuming different parametric configurations specified by structure of the covariance matrix, number of variables and sample size. After the validation of the estimators, multivariate regression models were adjusted considering varia- bles concerning the sensorial and chemical profile of genotypes of arabica coffee (Coffea arabica L.). The relative results to the simulation indicated that MVE estimator was more efficient when the effect of the observations came from distri- butions with deviation symmetry and excess kurtosis. About the application, the regression models adjusted to the MCD and MVE methods were more appropriate for the study of the physiochemical and sensory variables, being consistent with the experimental results.
Descrição
Tese de Doutorado defendida na Universidade Federal de Lavras
Palavras-chave
Análise de regressão, Regressão robusta, Distância de Mahalanobis, Distância robusta
Citação
CHAGAS, E. S. Eficiência de estimadores robustos a observações discrepantes em regressão multivariada com aplicação na análise sensorial de café. 2011. 94 f. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras. 2011.