Implementar cualquier modelo de ML en producción implica ciertos desafíos que incluyen:
Deriva de conceptos y de datos: Concept Drift es básicamente cuando la relación entre la variable de entrenamiento y la salida objetivo cambia, mientras que la deriva de datos es el cambio en la distribución de los datos a lo largo del tiempo. Ambos pueden conducir a una disminución en el rendimiento del modelo.
Problemas de ingeniería de software: Cuando estamos implementando un modelo ML, hay ciertos factores en los que debemos pensar, por ejemplo, la latencia y el rendimiento necesarios, ya sea para tener predicciones en tiempo real o por lotes. Cómo registrar los resultados para monitorear y mantener la seguridad y privacidad de los datos.
Cuando entrenamos Machine Learning usando un algoritmo específico, la mejor manera de implementar el modelo en producción depende de una serie de factores:
El tiempo de inactividad aceptable de nuestra solución de aprendizaje automático.
El costo de operación y la participación humana en la implementación del modelo.
La facilidad con la que podemos hacer retroceder el modelo en caso de desvío.
Si es necesario realizar pruebas con tráfico de producción o no.
Ahora que hemos entendido cuáles son los diferentes desafíos en la implementación de un modelo, echemos un vistazo a las diferentes estrategias de implementación.