Mostrar el registro sencillo del ítem

Imputación de valores faltantes utilizando técnicas de mínimos cuadrados en matrices contaminadas

dc.contributor.authorGarcia Peña, Marisol
dc.contributor.authorArciniegas Alarcón, Sergio
dc.contributor.authorKrzanowski, Wojtek J.
dc.date.accessioned2023-11-23T13:50:04Z
dc.date.available2023-11-23T13:50:04Z
dc.date.issued2022
dc.identifier.citationGarcia-Peña, M., Arciniegas-Alarcón, S., & Krzanowski, W. J. (2022). Missing value imputation using least squares techniques in contaminated matrices. MethodsX, 9, 101683.es_CO
dc.identifier.otherhttps://www.sciencedirect.com/science/article/pii/S221501612200067X?ref=pdf_download&fr=RR-2&rr=822f27cac8259ab9
dc.identifier.urihttp://hdl.handle.net/10818/58675
dc.description8 páginas
dc.description.abstractThis paper describes strategies to reduce the possible effect of outliers on the quality of imputations produced by a method that uses a mixture of two least squares techniques: regression and lower rank approximation of a matrix. To avoid the influence of discrepant data and maintain the computational speed of the original scheme, pre-processing options were explored before applying the imputation method. The first proposal is to previously use a robust singular value decomposition, the second is to detect outliers and then treat the potential outliers as missing. To evaluate the proposed methods, a cross-validation study was carried out on ten complete matrices of real data from multi-environment trials. The imputations were compared with the original data using three statistics: a measure of goodness of fit, the squared cosine between matrices and the prediction error. The results show that the original method should be replaced by one of the options presented here because outliers can cause low quality imputations or convergence problems. • The imputation algorithm based on Gabriel's cross-validation method uses two least squares techniques that can be affected by the presence of outliers. The inclusion of a robust singular value decomposition allows both to robustify the procedure and to detect outliers and consider them later as missing. These forms of pre-processing ensure that the algorithm performs well on any dataset that has a matrix form with suspected contamination.en
dc.description.abstract"Este artículo describe estrategias para reducir el posible efecto de los valores atípicos en la calidad de las imputaciones producidas por un método que utiliza una combinación de dos técnicas de mínimos cuadrados: regresión y aproximación de rango inferior de una matriz. Para evitar la influencia de datos discrepantes y mantener la velocidad computacional del esquema original, se exploraron opciones de preprocesamiento antes de aplicar el método de imputación. La primera propuesta es utilizar previamente una descomposición robusta de valores singulares, la segunda es detectar valores atípicos y luego tratar los valores atípicos potenciales como faltantes. Con los métodos propuestos, se llevó a cabo un estudio de validación cruzada sobre diez matrices completas de datos reales provenientes de ensayos multiambientales y se compararon las imputaciones con los datos originales mediante tres estadísticos: una medida de bondad de ajuste, el coseno al cuadrado entre matrices y el error de predicción Los resultados muestran que el método original debe ser reemplazado por una de las opciones presentadas aquí porque los valores atípicos pueden causar imputaciones de baja calidad o problemas de convergencia. • El algoritmo de imputación basado en el método de validación cruzada de Gabriel utiliza dos técnicas de mínimos cuadrados que pueden verse afectadas por la presencia de valores atípicos. La inclusión de una descomposición robusta en valores singulares permite tanto robustecer el procedimiento como detectar valores atípicos y considerarlos posteriormente como faltantes. Estas formas de preprocesamiento garantizan que el algoritmo funcione bien en cualquier conjunto de datos que tenga una forma matricial con sospecha de contaminación".es_CO
dc.language.isoenges_CO
dc.publisherMethodsXes_CO
dc.relation.ispartofseriesMethodsX, 2022, vol. 9, p. 101683
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.sourceUniversidad de La Sabanaes_CO
dc.sourceIntellectum Repositorio Universidad de La Sabanaes_CO
dc.subjectValores propioses_CO
dc.subjectVectores propioses_CO
dc.subjectDescomposición robusta de valores singulareses_CO
dc.subjectValores faltanteses_CO
dc.subjectAI computacional interactivaes_CO
dc.subjectEsquemaValidación cruzadaes_CO
dc.subjectInteracción genotipo por entornoes_CO
dc.subject.otherEigenvaluesen
dc.subject.otherEigenvectorsen
dc.subject.otherRobust singular value decompositionen
dc.subject.otherMissing valuesen
dc.subject.otherAIterative computationalen
dc.subject.otherSchemeCross-validationen
dc.subject.otherGenotype-by-environment interactionen
dc.titleMissing value imputation using least squares techniques in contaminated matricesen
dc.titleImputación de valores faltantes utilizando técnicas de mínimos cuadrados en matrices contaminadases_CO
dc.typejournal articlees_CO
dc.type.hasVersionpublishedVersiones_CO
dc.rights.accessRightsopenAccesses_CO
dc.identifier.doi10.1016/j.mex.2022.101683


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivatives 4.0 InternationalExcepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 International