Un analista de datos domina las técnicas necesarias para realizar análisis descriptivos de datos. Es capaz de manipular, realizar análisis exploratorios, realizar gráficas y redactar informes.
Para ello, requiere habilidades para conseguir datos, ordenarlos, procesarlos y analizarlos con técnicas principalmente descriptivas. Debe saber hacer gráficas, obtener estadísticos descriptivos y extraer conclusiones generalizables de los datos, por lo cual también debe conocer de estadística inferencial.
Sus principales herramientas serán las hojas de cálculo, como google sheets y excel, por lo que debe desarrollar un gran experticia en ellas. También debe conocer lenguajes de programación como python y R. Además debe poseer buenas habilidades comunicativas apoyándose de herramientas visuales como las presentaciones y los tableros. Debe conocer programas para desarrollar dashboards interactivos como tableau, data studio o powerbi.
En cambio, un científico de datos domina técnicas para procesar, analizar grandes cantidades de datos y construir modelos predictivos que permitan predecir el desempeño de indicadores clave.
Sus principales herramientas son lenguajes de bases de datos relacionales y no relacionales como SQL y MongoDB. Mediante ellas, es capaz de procesar grandes cantidades de datos típicamente alojados en servidores. Es capaz de realizar análisis exploratorios de datos y procesar, si es necesario los datos para convertirlos en insumos relevantes para la construcción de modelos predictivos. Para lo emplea lenguajes de programación como Python, R y Scala. Es capaz de construir y poner en producción modelos predictivos, que funcionen incluso frente a grandes cantidades de datos para lo cual emplea herramientas como Hadoop y Spark.
Tipicamente se comienza como analista de datos, y conforme se adquiere experiencia y conocimientos se pasa a ser un científico de datos.