Ciencia de datos
Este perfil está diseñado para desarrollar las habilidades necesarias para el manejo de información y la elaboración de modelos descriptivos y predictivos, ya sea a partir de fuentes estructuradas o no estructuradas de datos, sean internas o externas a la organización, con el objeto de generar información que permita entregar al negocio una visión y que permita el descubrimiento de oportunidades, para así desarrollar en el largo plazo una estrategia centrada en los datos e información.
Duración: 168 horas
Objetivo del curso
Elaborar modelos descriptivos y predictivos utilizando técnicas de aprendizaje de máquina en grandes volúmenes de datos para el descubrimiento de oportunidades de negocio en la organización.
PROGRAMA DE ESTUDIOS
Módulo 1
Fundamentos de Programación de Python
Codificar piezas de software de baja/mediana complejidad en lenguaje Python para resolver una problemática de acuerdo a las buenas prácticas de la industria.
- 16 horas
Módulo 2
Obtención y preparación de datos
En este módulo se utilizarán las librerías Numpy y Pandas para aprender de forma práctica técnicas de extracción y limpieza de datos, utilizando criterios de imputación y manipulando las estructuras de datos a conveniencia para satisfacer las necesidades de información. También haremos un repaso de los conceptos del Álgebra Lineal que son frecuentemente utilizados en la disciplina.
- 24 horas
Módulo 3
Análisis Exploratorio y Programación Estadística
Analizar datos utilizando el lenguaje Python y los conceptos de estadística descriptiva para la exploración y caracterización de la información.
- 24 horas
Módulo 4
Inferencia Estadística
En este módulo se aprenderán los fundamentos de la inferencia estadística, es decir, inferir respecto a la población a partir de los datos de una muestra. Lo anterior, apoyado de los paquetes estadísticos que existen en Python. Aprenderás a reconocer los conceptos más relevantes y ampliamente usados de la disciplina. Conocerás las distribuciones de probabilidad y aprenderás a descubrir la forma en que se distribuyen tus datos.
- 32 horas
Módulo 5
Aprendizaje de Máquina supervisado
Elaborar un modelo predictivo a partir de un set de datos utilizando técnicas de aprendizaje de máquina supervisado implementados en lenguaje Python para resolver un problema.
- 32 horas
Módulo 6
Aprendizaje de Máquina no supervisado
Elaborar un modelo predictivo a partir de un set de datos utilizando técnicas de aprendizaje de máquina no supervisado implementados en lenguaje Python para resolver un problema.
- 16 horas
Módulo 7
Fundamentos de Deep Learning
Elaborar un modelo predictivo aplicando redes neuronales y utilizando lenguaje Python para resolver un problema, además de describir los conceptos fundamentales las mismas redes neuronales y su utilidad para la resolución de problemas de aprendizaje de máquina.
- 16 horas
Módulo 8
Fundamentos de Big Data
Elaborar un modelo predictivo utilizando grandes volúmenes de datos para resolver un problema. Manipular grandes volúmenes de datos utilizando objetos RDD, transformaciones y acciones.
- 16 horas