Vous êtes sur la page 1sur 34

PROCESAMIENTO DE IMAGENES DE FRUTO DE PALMA DE

ACEITE MEDIANTE TECNICAS DE MACHINE LEARNING PARA


LA CLASIFICACION DE FRUTO Y PREDICCION DE LA CALIDAD
DE ACEITE DE PALMA

Juan Pablo Contreras

Asesor:
PhD. Carlos Valencia

Jurado Interno:
PhD. Camilo Franco

Jurado Externo
PhD. Camilo Acosta
Agenda
1. Motivación.
2. Definición del Problema.
3. Trabajos anteriores.
4. Metodología.
5. Resultados.
6. Conclusiones y trabajos futuros.

2
Motivación
3
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Palma de Aceite
▪ Es la oleaginosa más productiva del planeta;
una hectárea sembrada produce entre 6 y 10
veces más aceite que las demás.

▪ La versatilidad de la palma de aceite permite


múltiples usos en las industrias de alimentos,
oleoquímica energías renovables y de productos
derivados de la biomasa.

Usos del aceite de palma


Fuente: Fedepalma

4
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Palma de Aceite en Colombia


▪ Colombia es el cuarto productor de aceite de
palma en el mundo y el primero en América.

▪ La palma de aceite tiene una participación


actual del 6% en el PIB agropecuario de
Colombia.

▪ 807.434 Ton son Ventas mercado interno


declaradas al FEP (50,13 %). ($1.913/Kg)

▪ 803.153 Ton Ventas mercado exportación


declaradas al FEP (49,87 %) Zonas Culitvadas de palma de aceite en Colombia.
5 Fuente: Fedepalma
Definición del
Problema
6
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Calidad de Aceite de Palma

a b

c d

7 Estados de Maduración del RFF, a) RFF Verde, b) RFF Pinton, c)RFF Maduro, d) RFF Sobremaduro
Fuente: Cenipalma
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Indicadores de Calidad actuales


Los factores principales de calidad que un racimo de fruta (RFF) es su estado de maduración y el
contenido de aceite.

8 Indicador de Calidad fruta recibida en tolva de la planta extractora Guaicaramo. Proveedor: Hacienda la Ilusión
Fuente: Guaicaramo
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Impacto
El estándar estipula que la tasa de
extracción teórica es entre 21–25% y el
contenido de AGL no debe ser mayor
que 5%.

Por cada 1% de los racimos verde


presente, la OER disminuirá en un
0.13%.

Proceso de extracción de aceite de palma


El contenido de AGL aumentará Fuente: Cenipalma

linealmente a medida que el


porcentaje de racimos sobremaduros
ingresen a la tolva.

9
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Objetivos
• Determinar el nivel de maduración de la fruta fresca de palma de aceite (RFF)
en condiciones de campo mediante procesamiento de imágenes y algoritmos
Objetivo General. de Aprendizaje Automático

• Obtener información de las imágenes de racimos identificando las características que


definen los diferentes estados de maduración.
• Obtener el mejor algoritmo para determinar la clasificación del fruto de acuerdo a la
Objetivos
información obtenida de las imágenes.
Específicos

10
Trabajos Anteriores
11
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Trabajos Anteriores
Jamil (2009)
• Valores RGB RFF utilizando una técnica neuro-difusa produjo 73.3% de clasificación correcta.

May y Amaran (2011)


• Lógica difusa para clasificar RFF utilizando los mismos atributos. Clasificación correcta de
86.67%.

Hutsary (2010)
• Valores RGB solo son adecuados para un entorno de iluminación constante, ya que se ven
afectados por el cambio de la intensidad de la luz.

Ishak y Razali (2010)


• Valor de tono (Hue) como parámetro para determinar la madurez de RFF.
12
Metodología
13
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Grandes Pasos
▪ Adquisición de Imágenes.
▪ Pruebas de laboratorio.
▪ Preprocesar imágenes.
▪ Extracción de características.
▪ Clasificación del fruto (RFF).
▪ Calibración del modelo.

14
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Adquisición de Imágenes.
5 estados de maduración

50 imágenes en condiciones de campo y acopio.

Los racimos fueron clasificados manualmente por expertos.

3 muestras de frutos por cada racimo seleccionado. Muestras de imágenes de RFF


Fuente: Propia

15
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Pruebas de Laboratorio
Secado del mesocarpio húmedo en un horno a 105°C hasta
obtener un peso seco constante

Extracción del aceite usando el método de Soxhlet que utiliza


𝑊 −𝑊
hexano como solvente. %𝑂𝑖𝑙𝑚 = 1 2
𝑊3

Calculo de nivel de acidez (AGL), mediante titulación con KOH.


25,6 𝑁∗𝑉
%𝐴𝐺𝐿 = Foto de laboratorio.
𝑊 Fuente: Propia

16
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Preprocesar imágenes
Cada imagen es redimensionada a un tamaño de 512 x 256 pixeles, mediante interpolación por
vecinos cercanos (NN).

Foto original Foto redimensionada


Fuente: Propia Fuente: Propia

17
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Extracción de características.
● El espacio de color HSI ha demostrado ser un buen
discriminador para el color del RFF en comparación
con el espacio de color de RGB CMYk y Lab.

Diagrama de espacio de color (HSI)


1
2 𝑟 − 𝑔 + (𝑟 − 𝑏
Fuente: Gonzalez y Wood
𝑐𝑜𝑠 −1 1 𝑆𝑖 𝑏 ≤ 𝑔
𝑟−𝑔 2 + (𝑟 − 𝑏)(𝑔 − 𝑏 2
ℎ=
1
360 − 𝑐𝑜𝑠 −1 2 𝑟 − 𝑔 + (𝑟 − 𝑏 𝑆𝑖 𝑏 > 𝑔
1
𝑟−𝑔 2 + (𝑟 − 𝑏)(𝑔 − 𝑏 2

18 Foto tomada en espacio de color (HSI)


Fuente: Propia
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Extracción de Características
Cada imagen consiste en el background y el foreground, el cual es la región de pixeles que contiene
los frutos o los datos de interés. Los valores de los píxeles de las frutas se separaron mediante el
uso del algoritmo (KNN).

Selección de Forground y Background Mask Foreground


Fuente: Propia Fuente: Propia Fuente: Propia

19
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Clasificación del fruto.


• Entrenamiento 150 • Red Neuronal
• Validación 50 • Random Forest
• Prueba 50 • Red Convolucional

Algoritmo
Establecer
de
set de datos
clasificación

Medida de
Calibración
desempeño 𝑚
%Error = 1 − 𝑚𝑎𝑥 ∗ 100%
• Cross Validation entre • Porcentaje de error de
50
entrentamiento y clasificación
validación. • Función de perdida
• Establecer (Cross entropy) 𝐻(𝑝, 𝑞) = − ෍ 𝑝 𝑥 log𝑞(𝑥 )
20 hiperparámetros
𝑥
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Calibración de los modelos


Red Neuronal (ANN).
Para definir la cantidad de neuronas, se realiza una calibración con base en la métrica del
porcentaje de exactitud de la predicción y el valor de la función de pérdida.

21
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Calibración de los modelos


Random Forest (RF).
Los hiperparámetros se definen con base en el out of bag error classification, la cantidad de
variables predictoras, la cantidad de árboles y la cantidad de observaciones en los nodos
terminales

Número de predictores empleados vs % Error Tamaño de nodo terminal vs % Error Cantidad de árboles vs % Error

22

300
64 2
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Calibración de los modelos


Red Neuronal (CNN).
No existe una metodología formal para calibrar los hiperparámetros de la red convolucional, es
necesario hacer pruebas de acuerdo al tamaño (cantidad de capas convolucionales y pooling), y
se clasificó en “Smaller, Base y Bigger”.

23
Resultados
24
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Red Neuronal Artificial (ANN)


Red Neuronal (ANN).
La exactitud de la red neuronal tiene un 76% sobre el conjunto de imágenes de prueba, y
un valor de función de pérdida de 1,54.

25 Matriz de Confusión
Fuente: Propio
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Random Forest (RF).


Random Forest (RM).
Con la arquitectura definida con la calibración, se alcanza un porcentaje de acierto de 84%.

26 Matriz de Confusión
Fuente: Propio
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Red Neuronal Convolucional (CNN)


Red Convolucional (CNN).
El porcentaje de exactitud de clasificación de la configuración de la red neuronal convolucional
alcanza el 94%, con relación al conjunto de imágenes de prueba, obteniendo un valor de la función de
pérdida de 0,34.

27 Matriz de Confusión
Fuente: Propio
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Comparación de modelos
Curva ROC
.
Proporción de verdaderos positivos: 𝑃𝑉𝑃 =
𝑉𝑃
. 0,9405
(𝑉𝑃+𝐹𝑁)
0,8376

Proporción de verdaderos negativos: 𝑃𝑉𝑁 = 0,7502


𝑉𝑁
.
𝑉𝑁+𝐹𝑃

28
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Predicción OER y AGL


7.0% y = 5E-07x2 - 0,0002x + 0,0426
30.0%
6.0% R² = 0,2812
25.0%
Contenido de Aceite

5.0%

Nivel de Acidez
20.0% MSE = 0,005
4.0%
15.0%
3.0%
y = 2E-06x2 - 0,0008x + 0,241
10.0% 2.0%
R² = 0,72
5.0% 1.0%
MSE=0,86 0.0%
0.0% 0 100 200 300 400
0 100 200 300 400
Tonalidad predominante (H)
Tonalidad predominante (H)
Correlación Tonalidad dominante vs OER Correlación tonalidad dominante vs AGL
Fuente: Propia Fuente: Propia

29
Conclusiones y
Trabajos Futuros
30
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

La capacidad de identificar correctamente la madurez fisiológica y la madurez de la cosecha de


los frutos de palma por sus características fenológicas puede asegurar una cosecha oportuna
para evitar el corte de frutas poco maduras o demasiado maduras

La metodología propuesta permite clasificar los RFF en diferentes categorías de maduración.


Esta tecnología puede integrarse en una planta de beneficio de palma de aceite para ayudar no
solo a producir aceite de palma crudo de mayor calidad, sino también a reducir sus costos de
mantenimiento y operación

El modelo de contenido de aceite mediante el una regresión polinomial logró un desempeño


aceptable. El coeficiente de determinación del modelo 𝑅2 = 0.72.

El modelo de ácidos grasos libres logró un desempeño deficiente. El resultado bajo en el


coeficiente de determinación del modelo 𝑅2 = 0.28 en cuanto a calibración que el modelo de
regresión polinómica fue menos apto para aplicarse en la determinación del nivel de ácidos
grasos dentro de este análisis.
31
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

La red convolucional (CNN) presenta el mejor resultado (94%), clasificando en las 5 categorías sin
embargo presentan el mayor gasto computacional y por lo tanto mayor tiempo de
procesamiento.

Es recomendable usar esta metodología para realizar inspección de calidad en la entrada de la


tolva de la planta de beneficio donde la discriminación para cada etapa es importante.

La red neuronal artificial (ANN) y Random Forest (RF) presentan resultados aceptables (74% y
83% respectivamente) con un consumo computacional bajo. Sin embargo al clasificar los frutos
en cosecha y no cosecha, los resultados son cercanos al 96%.

Es recomendable usar estos algoritmos en campo, por su poco tiempo de procesamiento y los
RFF maduros y sobremaduros deben ser cosechados.

32
Definición del Trabajos
Motivación Metodología Resultados Conclusiones
Problema Anteriores

Trabajo futuro
▪ Implementar esta metodología como estándar para la medición de la calidad de acuerdo al
color y fenología del racimo.

▪ La implementación de estas metodologías permitirá dimensionar y direccionar los recursos


tal como las cuadrillas de cosecha, tractores y mallas hacia los lotes con mayor proporción
de RFF en estado de maduración, con esto se incrementará la productividad del cosechero
y el rendimiento por hectárea.

▪ El procesamiento de imágenes también puede ser usado para detección de enfermedades y


pestes en sus etapas que afecten el cultivo de palma

▪ Diseñar un modelo de predicción robusto de acuerdo a las características extraídas de las


imágenes.
33
Preguntas
Muchas Gracias

34

Vous aimerez peut-être aussi