Análisis de datos
El perfil de Análisis de Datos es clave en la actualidad, en especial, por la cantidad de empresas que utilizan los datos como uno de sus recursos más valiosos. Este curso te permitirá desarrollar las habilidades necesarias para el manejo de información, elaboración de modelos descriptivos, presentación y desarrollo de informes y visualizaciones. Te podrás enfrentar a volúmenes moderados de datos, generar reportes y comunicar resultados a una audiencia general.
Duración: 141 horas
Objetivo del curso
Desarrollar conocimientos sólidos en el uso de Python y sus principales librerías, como herramientas fundamentales de la disciplina. Analizar datos de diversa naturaleza utilizando técnicas de análisis exploratorio para presentar información relevante al negocio. Realizar inferencias sobre poblaciones a partir de muestras y realizar pruebas de hipótesis que permitan sacar conclusiones acerca de experimentos
Aplicar visualizaciones complejas sobre los datos, las cuales puedan adecuarse a diversas necesidades del negocio. Descubrir las potencialidades del aprendizaje de máquina, como una forma de estímulo para continuar el desarrollo de conocimientos a futuro.
PROGRAMA DE ESTUDIOS
Módulo 1
Fundamentos de Python
En este módulo se aprenderán las principales características del lenguaje Python, haciendo énfasis en la programación de algoritmos y el uso de librerías con el objeto de nivelar y profundizar las habilidades de programación de los participantes y cubrir las necesidades del resto del programa. El programa completo se desarrolla en Python con lo cual, al final del mismo, los alumnos tendrán un nivel de proficiencia importante en el lenguaje
Módulo 2
Obtención y preparación de datos
En este módulo se utilizarán las librerías Numpy y Pandas para aprender de forma práctica técnicas de extracción y limpieza de datos, utilizando criterios de imputación y manipulando las estructuras de datos a conveniencia para satisfacer las necesidades de información. También haremos un repaso de los conceptos del Álgebra Lineal que son frecuentemente utilizados en la disciplina.
Módulo 3
Análisis exploratorio de datos
En este módulo se aprenderá acerca de programación estadística con Python para describir y visualizar la información. Conocerás los conceptos básicos de la estadística descriptiva y profundizarán en dos de las librerías de visualización más populares de Python: Matplotlib y Seaborn.
Módulo 4
Inferencia Estadística
En este módulo se aprenderán los fundamentos de la inferencia estadística, es decir, inferir respecto a la población a partir de los datos de una muestra. Lo anterior, apoyado de los paquetes estadísticos que existen en Python. Aprenderás a reconocer los conceptos más relevantes y ampliamente usados de la disciplina. Conocerás las distribuciones de probabilidad y aprenderás a descubrir la forma en que se distribuyen tus datos.
Módulo 5
SQL
En este módulo aprenderán el lenguaje declarativo SQL (Structured Query Language); un elemento esencial en el análisis y extracción de valor desde los datos. El participante aprenderá sobre los fundamentos de la interacción con Bases de Datos Relacionales. Logrará identificar los conceptos asociados, así como poder crear, modificar e interactuar con tablas para extraer información de forma avanzada.
Módulo 6
Visualización interactiva de datos
Este módulo presenta los elementos conformantes de la suite de visualización de datos Tableau. Se visitarán las principales características de la herramienta, así como su usos y aplicaciones. La creación de visualizaciones individuales y dashboards, y la implementación de soluciones en distintos ejemplos.
Módulo 7
Interpretación y presentación de datos
Este módulo busca entregar las habilidades para conceptualizar los problemas y oportunidades a partir de los datos, definir preguntas de investigación y definir las narrativas y las historias que pueden ser contadas a partir de los datos, con foco en responder a las problemáticas posicionadas.
Módulo 8
Introducción al aprendizaje de máquinas
En este módulo se entregarán conceptos básicos que permitan que el participante pueda reconocer un problema de aprendizaje de máquina, junto con utilizar algunos algoritmos simples, supervisados y no supervisados, para lograr un conocimiento general e introductorio de la materia.