Resumen:
El café es uno de los pilares principales de la economía colombiana, y Colombia es el mayor productor de café de calidad del mundo, pues cuenta con varias regiones con una oferta ambiental especial, como el departamento del Cauca que gracias a estas condiciones ambientales tiene un gran potencial para producir cafés de alta calidad. La creciente demanda mundial de café especial aumenta la necesidad de mejorar los métodos de evaluación de la calidad del café, donde el grado de tostión determinado por el color de los granos es importante para esta evaluación, pues determina las características de sabor del café. Una de las formas más comunes de determinar el color de café es el uso de colorímetros y cámaras RGB, estos dispositivos están diseñados para trabajar en un rango visible del espectro desde los 400 nm a los 700 nm, obviando una parte muy importante del espectro como el infrarrojo cercano. En el proyecto que aquí se presenta, se desarrolló una herramienta tecnológica, que permite clasificar el café tostado en cinco grados de tostión (ligero, medio-ligero, medio, medio-alto y oscuro) usando técnicas ópticas espectrales. Para esto se usó un espectrómetro óptico, Ocean Optics STS-VIS, operando en un rango entre 350 nm – 800 nm. Así, se usaron muestras de café tostado de 50g, tomando 300 espectros por cada grado de tostión para un total de 1500 espectros, con los cuales se realizó el entrenamiento y test de once sistemas de clasificación basados en machine learning. Entre estos, cinco usaron los datos con preprocesamiento a los cuales se les aplico el filtro Savitzky-Golay y corrección de dispersión multiplicativa (MSC); los seis restantes operaron con los datos crudos, donde se obtuvieron resultados de Accuracy entre 0.71 y 0.96. El grado de tostión medio-alto fue el que mejor desempeño tuvo en 8 de los once sistemas de clasificación. Los sistemas de clasificación entrenados con datos crudos fueron los de mejor rendimiento, de estos se determinó el sistema de clasificación con mayor Accuracy (Accuracy=0.96), el cual fue un modelo de máquinas de soporte vectorial (SVM) con sintonización fina y fue elegido como modelo final. El modelo SVM con sintonización fina fue puesto en producción en servidor local, permitiendo al usuario cargar una huella espectral de datos crudos y obtener la predicción más probable del grado de tostión. Los resultados mostraron que las huellas espectrales son útiles para determinar el grado de tostión del café, mediante técnicas de Machine Learning.