Resumen:
El café es uno de los productos que más impacto tiene en el país, debido a su alta demanda
de consumo tanto a nivel nacional como internacional. Además, el departamento del Cauca
produce alrededor de 1.500.000 sacos al año, lo que se traduce en un 10,46% de la
producción nacional de café. A ello se suma que los estándares son cada vez más exigentes
al momento de generar café excelso de tipo exportación, y la adecuada selección de los
granos de café en el proceso de cosecha juega un papel fundamental en la calidad final.
Por tal motivo, la Inteligencia Artificial se presenta como una alternativa para reducir la
falla humana mediante la implementación de modelos de red neuronal. El presente
proyecto muestra la aplicación de redes neuronales convolucionales (CNN) en la clasificación del fruto de café cereza en diferentes estados de maduración.
Para ello, se utilizaron los mejores resultados obtenidos por Tamayo como punto de partida.
En ese orden de ideas, se empleó Transfer Learning y se crearon cuatro conjuntos de datos
en diferentes entornos de iluminación para el entrenamiento y las pruebas de las
arquitecturas de red neuronal convolucional MobileNetV2, VGG16, VGG19,
InceptionResNetV2, InceptionV3 y DenseNet201. Al realizar las pruebas con el conjunto
de datos número uno este se divide en tres partes: 70% para entrenamiento, 20% para
validación y 10% para prueba; como resultado, se obtuvo que las redes VGG16 y
Densenet201 obtuvieron unas métricas de exactitud, precisión y sensibilidad del 0.98. Al
entrenar los modelos con el Segundo conjunto de datos, el cual fue construido a partir de
imágenes estáticas en superficie plana, y al usar la validación cruzada estas métricas dieron
como resultado una eficiencia del 1.00, y por último se crean dos dataset externos para
prueba de los modelos previamente entrenados, y como consecuencia las arquitecturas
VGG 16 y VGG19 tuvieron los mejores resultados con un F1-score de 0.97 para el
conjunto de datos 3 que validó el conjunto de datos 1, y 0.96 y 0.97 utilizando el conjunto
de datos 4 para validar el 2