Uppsala, Suecia – Un estudio sugiere que los modelos de aprendizaje automático pueden ser herramientas valiosas en los programas de crianza selectiva para la resistencia a las enfermedades.
El investigador Christos Palaiokostas de la Swedish University of Agricultural Sciences evaluó la eficiencia de varios modelos de aprendizaje automático para predecir la resistencia a las enfermedades usando bases de datos reales y simuladas.
Más específicamente, el investigador determinó la eficiencia de predicción de los árboles de decisión (DT), las máquinas de vectores de soporte (SVM), los bosques aleatorios (RF) y los enfoques basados en impulso como AdaBoost y Extreme Gradient Boosting (XGB) se comparó con GBLUP-MCMC.
Los avances en las tecnologías de secuenciamiento durante la última década han transformado el campo de la acuacultura y la genómica.
El conocimiento actual sugiere que la información genómica es particularmente valiosa para estudiar rasgos relacionados a la resistencia a las enfermedades.
Predecir la resistencia a las enfermedades es una de las aplicaciones más prominentes de la crianza selectiva en la acuicultura.
Prácticas de selección genómica
Las reducciones en los costos de genotipado han permitido la implementación de la selección genómica en las especies acuícolas.
La mayoría de las aplicaciones de selección genómica incluyen el uso de algoritmos que se basan en el mejor predictor lineal imparcial genómico (GBLUP) o sus variantes como enfoques de un solo paso y en regresiones lineales bayesianas.
Igualmente importante, la disponibilidad de software como BLUPF90 o R/BGLR, de acceso libre, permiten la implementación de la selección genómica en varias especies acuícolas.
Diversos estudios han evaluado la eficiencia de predicción de los modelos de selección genómica para la resistencia a las enfermedades basados en datos de una sola generación. Esto se debe principalmente a dos razones:
1. Los experimentos de desafíos de enfermedades tiene altos costos, y
2. Los programas de crianza selectiva son relativamente nuevos, y en la mayoría de los casos solo se dispone información genómica de una sola generación.
Aún cuando los rasgos de resistencia de enfermedades puede ser interpretado y tratado en un amplio rango de vías usando enfoques bien documentados del campo de la epidemiología, un enfoque más común es donde la resistencia a las enfermedades se considera un rasgo binario.
En cada situación, el objetivo del modelo probado es clasificar eficientemente los animales en cada categoría (resistentes y no resistentes) basados en la información genómica disponible.
Herramientas de aprendizaje automático
Las herramientas de aprendizaje automático tienen numerosas aplicaciones en la vida real. Los algoritmos se aplican de forma rutinaria, entre otros, en una amplia gama de problemas de regresión y clasificación en todo tipo de disciplinas científicas, siendo una de sus aplicaciones más destacadas el estudio-predicción de enfermedades humanas.
En el campo de cría de animales, los algoritmos de aprendizaje automático han ido ganando impulso en la búsqueda de aplicaciones en una amplia gama de tareas de predicción.
Los modelos de aprendizaje automático son valiosos para realizar predicciones.
El investigador empleó una base de datos de acceso publico para evaluar la eficiencia de los modelos de aprendizaje automático en términos de predecir la resistencia de la carpa a la enfermedad del herpes virus del koi (KHVD).
“En general, se obtuvieron resultados prometedores de los modelos de aprendizaje automático de mejor rendimiento, que se encuentran muy cerca o incluso más que los equivalentes de GBLUP-MCMC” reporta el investigador.
Él indica que los resultados del estudio, incluido las bases de datos simuladas y empíricas, demuestran que los modelos de aprendizaje automático pueden ser aplicados con éxito en la clasificación de problemas relacionados a la crianza.
“En todos los escenarios, XGB fue el modelo que ocupó el primer lugar, aunque su ventaja en comparación con GBLUP-MCMC fue solo leve, oscilando entre el 1 y 4%” destaca.
Palaiokostas detalla que no se ha documentado ninguna aplicación de XGB en la cría selectiva en la acuicultura, pero que los resultados del estudio actual sugieren que podría ser una herramienta valiosa en futuros estudios genéticos de resistencia a enfermedades de las especies acuícolas.
Referencia (acceso abierto):
Christos Palaiokostas. Predicting for disease resistance in aquaculture species using machine learning models. Aquaculture Reports, Volume 20, 2021, 100660, ISSN 2352-5134, https://doi.org/10.1016/j.aqrep.2021.100660.