La ciencia de datos es la rama de las matemáticas y las ciencias de la computación que comprenden la captación, el almacenamiento, el acceso, análisis de datos y la creación de modelos predictivos .La ciencia de datos comprende las siguientes fases:
La adquisición de datos de múltiples fuentes. Por ejemplo de internet, de transacciones realizadas, de diagnósticos médicos, del uso de dispositivos. Por ejemplo, los datos se generan con el uso de los teléfonos móviles y de consultas generadas a un portal web. Hoy en día casi cualquier actividad que hagamos y sobre todo cualquier interacción que tengamos genera datos, y es importante captar estos datos para analizarlos después.
La administración de bases de datos. Una vez localizada la fuente el siguiente paso es asegurar los datos. Almacenarlos en tablas que puedan ser relacionadas entre sí. Es importante saber quién puede, y quién no tener acceso a los datos. Que los datos se encuentren íntegros y sin alteraciones para su consulta, y que puedan ser accesados en los momentos en que se les requiera.
El análisis de datos. Una vez captados los datos, y asegurados en bases, el siguiente paso es analizarlos. Analizar los datos nos permite entender mejor a nuestros clientes, pacientes o usuarios, es decir a las personas o máquinas que hayan generado los datos.
La creación de modelos predictivos. Avanzando aún más en el entendimiento de las entidades que hayan generado los datos, podremos adelantarnos a su comportamiento. Es decir, proveer, de acuerdo a las condiciones que encontremos, cómo estos agentes podrían responder. Esto nos sirve, para prevenir enfermedades graves, vender mejor, mejorar nuestra atención al cliente o nuestros procesos productivos.
La ciencia de datos. es multidisciplinaria. Requiere la interacción de múltiples profesionales en cada una de sus fases. Debido a esta complejidad, y a lo rápido que avanza la tecnología deberás estudiar casi todo el tiempo. Pero todos son temas variados e interesantes. Horas de diversión garantizada en la profesión más sexy del siglo XXI.
¿Quieres aprender ciencia de datos?
Si te interesa dar los primeros pasos para convertirte en científico de datos te recomiendo mi curso Aprende lenguaje R desde cero. Ha tenido muy buen recibimiento y es de los mejor puntuados en Udemy.
En mi curso encontrarás los conocimientos necesarios para avanzar en tu carrera, sin importar a qué te dediques, y reforzarla con data super powers.
En el curso aprenderás a usar el lenguaje R. El cuál es uno de los lenguajes de programación más usados en la ciencia de datos. Podrás extraer datos de diversas fuentes, incluyendo directamente de la red empleando web scraping. Aprenderás a realizar análisis descriptivos, y visualizaciones de datos. Y aprenderás a usar encuestas de forma adecuada, declarando su factor de expansión para que tus análisis puedan ser generalizados.
Antes de irte consulta las siguientes entradas sobre Ciencia de Datos
marzo 18, 2023
Desmitificando la ciencia de datos: Todo lo que necesitas saber para comenzar en el fascinante mundo del análisis de datos
marzo 8, 2023
Desmitificando la ciencia de datos: Todo lo que necesitas saber para comenzar en el fascinante mundo del análisis de datos
mayo 6, 2022
¿Por qué sin importar mi carrera debería estudiar ciencia de datos?
mayo 5, 2022
En ciencia de datos. Nunca dejes que la perfección sea enemiga de la acción.
abril 26, 2022