Ciencia de datos

Este perfil está diseñado para desarrollar las habilidades necesarias para el manejo de información y la elaboración de modelos descriptivos y predictivos, ya sea a partir de fuentes estructuradas o no estructuradas de datos, sean internas o externas a la organización, con el objeto de generar información que permita entregar al negocio una visión y que permita el descubrimiento de oportunidades, para así desarrollar en el largo plazo una estrategia centrada en los datos e información.

Duración: 168 horas

Objetivo del curso

Elaborar modelos descriptivos y predictivos utilizando técnicas de aprendizaje de máquina en grandes volúmenes de datos para el descubrimiento de oportunidades de negocio en la organización.

PROGRAMA DE ESTUDIOS

Módulo 1

Fundamentos de Programación de Python

Codificar piezas de software de baja/mediana complejidad en lenguaje Python para resolver una problemática de acuerdo a las buenas prácticas de la industria.

 

  • 16 horas
Módulo 2

Obtención y preparación de datos

En este módulo se utilizarán las librerías Numpy y Pandas para aprender de forma práctica técnicas de extracción y limpieza de datos, utilizando criterios de imputación y manipulando las estructuras de datos a conveniencia para satisfacer las necesidades de información. También haremos un repaso de los conceptos del Álgebra Lineal que son frecuentemente utilizados en la disciplina.

  • 24 horas
Módulo 3

Análisis Exploratorio y Programación Estadística

Analizar datos utilizando el lenguaje Python y los conceptos de estadística descriptiva para la exploración y caracterización de la información.

  • 24 horas
Módulo 4

Inferencia Estadística

En este módulo se aprenderán los fundamentos de la inferencia estadística, es decir, inferir respecto a la población a partir de los datos de una muestra. Lo anterior, apoyado de los paquetes estadísticos que existen en Python. Aprenderás a reconocer los conceptos más relevantes y ampliamente usados de la disciplina. Conocerás las  distribuciones de probabilidad y aprenderás a descubrir la forma en que se distribuyen tus datos.

  • 32 horas
Módulo 5

Aprendizaje de Máquina supervisado

Elaborar un modelo predictivo a partir de un set de datos utilizando técnicas de aprendizaje de máquina supervisado implementados en lenguaje Python para resolver un problema.

  • 32 horas
Módulo 6

Aprendizaje de Máquina no supervisado

Elaborar un modelo predictivo a partir de un set de datos utilizando técnicas de aprendizaje de máquina no supervisado implementados en lenguaje Python para resolver un problema.

  • 16 horas
Módulo 7

Fundamentos de Deep Learning

Elaborar un modelo predictivo aplicando redes neuronales y utilizando lenguaje Python para resolver un problema, además de describir los conceptos fundamentales las mismas redes neuronales y su utilidad para la resolución de problemas de aprendizaje de máquina.

  • 16 horas
Módulo 8

Fundamentos de Big Data

Elaborar un modelo predictivo utilizando grandes volúmenes de datos para resolver un problema. Manipular grandes volúmenes de datos utilizando objetos RDD, transformaciones y acciones.

  • 16 horas