Los profesores , y de la Facultad de Ciencias Económicas y Empresariales de han publicado recientemente el artículo titulado adabag: An R Package for Classification with Boosting and Bagging en la revista Journal of Statistical Software (Volume 54, Issue 2, Sep 2013, Pages 1-35). Esta revista publicada por la American Statistical Association cuenta actualmente con un índice de impacto de 4,91 en la base de datos JCR y ocupa la primera posición de un total de 117 revistas en la categoría de Statistics & Probability.

Este artículo continúa con la línea de trabajo en tareas de clasificación de este equipo de investigación. En concreto, este trabajo presenta el paquete adabag del programa R (http://cran.r-project.org/web/packages/adabag/) para construir árboles de clasificación combinados desarrollado por estos profesores.

Boosting y Bagging son dos métodos de combinación de clasificadores ampliamente utilizados. Ambos tienen el objetivo de mejorar la precisión de un clasificador combinando clasificadores sencillos que son ligeramente mejores que la elección aleatoria. Entre la familia de algoritmos boosting, AdaBoost (adaptive boosting) es el más conocido, aunque es adecuado solo para problemas dicotómicos. AdaBoost.M1 y SAMME (stagewise additive modeling using a multi-class exponential loss function) son dos extensiones sencillas y naturales al caso general de dos o más clases. La versión actual de adabag implementa los algoritmos AdaBoost.M1, SAMME y Bagging con árboles de clasificación como clasificadores individuales. Una vez que las combinaciones han sido entrenadas, se pueden utilizar para predecir las clases de nuevos ejemplos. La precisión de estos clasificadores se puede estimar en un conjunto de datos distinto o mediante validación cruzada. Además, la evolución del error a medida que aumenta el número de árboles combinados se puede analizar y, si fuese necesario, se puede podar la combinación. También se puede calcular el margen en la predicción de la clase y la probabilidad de cada clase para las observaciones. Finalmente, se muestran varios ejemplos clásicos en la literatura de clasificación para ilustrar el uso de este paquete.

El artículo completo puede obtenerse en esta dirección:

http://www.jstatsoft.org/v54/i02