Integrar datos a una investigación puede ser complejo. Por tal motivo conviene seguir una metodología para tener una guía clara y no perderse en el camino. Hoy te hablaré de la metodología CRISP-DM la cual se compone de 5 fases.
- Entiende el problema. Antes de ponerte a revisar los datos asegúrate de comprender el problema que deseas resolver. Acude a foros, bibliografía y si es necesario consulta a especialistas en la materia.
- Verifica que datos están disponibles. Una vez comprendido el problema que atenderemos podemos imaginar muchos abordajes distintos, pero es necesario averiguar que datos están disponibles. Muchas veces podemos plantearnos una excelente hipótesis, pero sin datos será imposible verificarla.
- Analiza los datos disponibles y procésalos para un modelo.
- Selecciona el modelo más adecuado para el problema y los datos con los que se planea resolver
- Evalúa el desempeño del modelo, y si es necesario optimízalo
- Pon el producción y ejecuta el modelo.