Python como alternativa a R en Machine Learning
¿Es Python una alternativa a R en machine learning?
A lo largo de este último año he trabajado, entre otras cosas, en proyectos de machine learning como investigador en el COM (Center for Open Middleware). En este centro se realizan seminarios cada dos semanas sobre los proyectos que estamos realizando y las tecnologías utilizadas. Estos últimos meses hemos hablado sobre Big Data, ciencia de datos y machine learning. Los talleres de machine learning han sido varios y se han realizado primero con R y luego con Python, que es el que yo he hecho y que os pongo a continuación.
El objetivo es mostrar que con Python también se puede hacer ciencia de datos y machine learning. Comienzo explicando muy brevemente lo que es Python y las librerías que voy a utilizar, para más tarde pasar a hacer algunos ejemplos.
Por supuesto, tengo el código en este repositorio de Github. Las transparencias están divididas en 4 partes:
- Introducción.
- Ejemplo Iris Flower dataset.
- Ejemplo análisis de los programas de partidos políticos en las Elecciones Autonómicas de 2015 en España.
- Ejemplo 20 News Groups dataset.
Para pasar las diapositivas utilizad la barra espaciadora.
Está grabado en vídeo y dura algo menos de una hora, por lo que si queréis enteraros un poco de lo que hago en el trabajo y también de cómo se utiliza Scikit-Learn, podéis verlo a continuación:
Por supuesto, el código es mejorable, pero al tratarse de un taller quería hacerlo lo más simple posible.
Espero que os sirva. Si tenéis cualquier duda o sugerencia, ya sabéis que podéis dejar un comentario.
¡Un saludo!