El avance en el área de “Machine Learning” va junto con el numero de herramientas open-source disponibles.
Ésto presenta una oportunidad pero tambíen un reto. La pregunta es, ¿Qué modelo debo de utilizar para mi problema y con qué parametros?
Probar diferentes modelos y seleccionar parametros adecuados es un proceso delicado (y aveces tedioso). Requiere conocimientos sobre lo que hace el algoritmo y experiencia en el manejo de las características del conjunto de dato.
Hyperopt-sklearn es una libreria en Python que utiliza a su vez dos librerias: SciKit-Learn y Hyperopt.
Ésta herramienta ayuda a los desarrolladores a seleccionar el mejor modelo de predicción y los mejores parametros para el mismo. Además, cuenta con metodos de pre-procesamiento de información como PCA, TF-IDF, Normalizer y OneHot Encoder.
Utilizar Hyperopt-sklearn mejora los parametros que vienen por default para los modelos. En la siguiente figura se muestra algunos resultados al respecto:
Sin lugar a duda, Hypteropt-sklearn debe de estar en nuestra lista de herramientas a probar en éste 2017.