CURSO DE CIENCIA DE DATOS APLICADA A E - GOBIERNO
PRESENTACIÓN
La importancia de la información y los datos como ciencia, se debe a que en la actualidad existen grandes cúmulos de información, por lo que se hace necesario formar expertos que analicen, experimenten, exploren y combinen los datos para comprenderlos y encontrar posibilidades diversas de explicación, aplicación y uso de la información. Tener acceso a información a gran escala tiene la ventaja de permitir cruzarla para analizarla, pero no basta con organizar los datos sino estructurarlos para acceder a ellos de manera fácil, rápida y confiable.
OBJETIVO
Implementar en la organización la ciencia de datos para el apoyo a las decisiones por medio de un análisis sustentando de los datos abiertos.
Duración del curso: 20 horas
Horario propuesto:
Miércoles a Viernes 16:00 - 20:00 hrs.
Sábado 8:00 - 16:00 hrs.
Día 1. Introducción a la ciencia de datos
Conocer los antecedentes sobre la ciencia de datos y su interrelación con los datos abiertos, así como el beneficio que genera en las organizaciones.
Temario
1. Definir la ciencia de datos.
2. Relación de la estadística, machine-learning y modelos matemáticos con la ciencia de datos.
3. Proceso de un proyecto de ciencias de datos.
4. Campo de aplicación para la ciencia de datos.
5. Definir los datos abiertos y su interpretación dentro de la organización.
Día 2. Preparación de datos
Comprender el proceso y la relevancia de preparar los datos para su análisis y evaluación.
Temario
1. Describir los tipos de análisis de datos.
2. Identificar los diferentes tipos de datos.
3. Traducir preguntas del negocio a conjunto de datos.
4. Identificar la relevancia de la preparación y calidad de los datos. Garbace in - Garbace out
5. Realizar análisis exploratorio de los datos.
Día 3. Algoritmos Machine Learning
Analizar el funcionamiento de los algoritmos más populares de minería de datos para su aplicación.
Temario
1. Análisis descriptivo
2. Análisis predictivo.
3. Machine Learning & Estadística clásica.
4. Algoritmos analíticos
5. Reglas de asociación
6. Clustering
7. Árboles de decisiones.
8. Modelos de regresión
9. Naïve Bayes
5. Identificar las fortalezas y debilidades
Día 4. Casos prácticos
Aplicar los conocimientos adquiridos en un caso real.
Temario
1. La elección de un tema y definición de variables
2. Análisis de fuentes de datos
3. Pre tratamiento de los datos
4. Obtención de patrones de comportamiento de las variables
5. Análisis a partir de la inferencia
Instructor Dr. Guillermo Alfonso De la Torre Gea
Director de Investigación del Instituto de Investigación y Desarrollo de Tecnologías Garman A.C. www.indetec.org
Egresado del doctorado en ingeniería de la Universidad Autónoma de Querétaro, realizó el posdoctorado en el Centro de Investigación y Estudios Avanzados del IPN (Cinvestav), actualmente pertenece al Sistema Nacional de Investigadores. Ha publicado diversos artículos de investigación y libros sobre Inteligencia Artificial y Ciencia de Datos aplicada a diferentes áreas del conocimiento como son: fenómenos físicos complejos, meteorología, ingeniería, materiales nano estructurados, sistemas de energía, biotecnología, neurociencia, comercio y gobierno electrónico