Curso de Análisis exploratorio de datos para investigación
M.C. Axel Alejandro Ramos García
Tecnológico de Monterrey
Curso de Análisis exploratorio de datos para investigación
Curso en línea
Acceso durante 1 año
10 horas totales
$899.00 MXN ($45 USD)
Información general
Este curso está diseñado especialmente para investigadores que desean fortalecer sus habilidades en análisis exploratorio de datos. Aprenderás los conceptos básicos del análisis de datos, técnicas para identificar problemas y estructurar objetivos de investigación. Además, desarrollarás la capacidad de elaborar gráficos y visualizaciones efectivas que faciliten la interpretación de resultados y apoyen la toma de decisiones en tus proyectos de investigación.
Qué aprenderás
A quién va dirigido este curso
El curso está dirigido a estudiantes y profesionales de distintas disciplinas, especialmente en áreas científicas, ingenierías y negocios. También está orientado a investigadores y analistas que se inician en la gestión y análisis de datos, así como a analistas junior y profesionales de áreas de negocio, marketing o finanzas. En general, resulta de gran utilidad para cualquier persona que trabaje con datos y desee aprender un método sistemático para explorarlos, interpretarlos y extraer valor de ellos antes de realizar análisis más complejos.
Beneficios del curso
Certificado de finalización
Constancia de
finalización del curso
y realización de un
proyecto con valor
curricular
Instructores expertos
Aprende directamente de expertos del área de las mejores instituciones de Latinoamérica y el mundo
Temario
M1 Fundamentos del AED y Análisis Univariado
Introducción al AED: ¿Qué es, por qué es crucial y cuál es su papel en el ciclo de vida del análisis de datos?
AED vs Estadística Tradicional: Enfoque descriptivo y flexible del EDA frente al enfoque inferencial y rígido de los métodos clásicos.
Tipos de Datos: Numéricos (continuos, discretos) y Categóricos (nominales, ordinales).
Estructura de Datos en Celdas: Modelado de tablas (long vs wide).
Medidas de Tendencia Central y Dispersión.
Práctica 1: Generación de histogramas para visualizar distribuciones.
M2 Limpieza y Calidad de Datos
Principio GIGO: Importancia de contar con datos limpios para obtener resultados confiables.
Estrategias de manejo como eliminación o imputación (media, mediana, moda).
Duplicados: Métodos para detectar y consolidar registros repetidos.
Outliers: Qué son, cómo identificarlos visualmente (boxplots) o con reglas.
Funciones clave en Excel: Uso de TRIM, CLEAN, IFERROR, UNIQUE y COUNTIF para limpieza de datos.
Práctica 2: Limpieza de datos en Excel:
Se detectan inconsistencias, valores faltantes, duplicados y outliers, aplicando funciones y estrategias para su corrección.
M3 Variables, Datos y Herramientas Básicas
Validación de Datos: Por qué es importante para mantener la calidad a futuro, Reglas de validación (Listas y rangos numéricos).
Control de Calidad: Protección de celdas/hojas para evitar errores. Verificaciones cruzadas entre tablas.
Normalización y Estandarización: Cuándo y por qué escalar datos.
Ingeniería de Características Simple: Creación de nuevas columnas a partir de las existentes.
Práctica 3: Creación de variables con IF/IFS, aplicación de escalado (Min–Max, Z–score) y uso de listas desplegables para restringir entradas.
M4 Análisis Bivariado y Multivariado
Correlación vs. Causalidad: Concepto clave en análisis de datos.
Análisis de relaciones:
Numérica vs. Numérica: Scatter plots y coeficiente de correlación.
Numérica vs. Categórica: Boxplots y tablas de resumen por grupo.
Categorías vs. Categorías: Tablas de contingencia y gráficos de barras apilados/agrupados.
Introducción al análisis multivariado: Uso de color, tamaño y forma en gráficos para representar variables adicionales.
Práctica 4: Creación de scatter plots, boxplots comparativos, tablas dinámicas con gráficos de barras agrupados y cálculo de la matriz de correlación de variables numéricas.
M5 Síntesis y comunicación de hallazgos
Storytelling con Datos: Cómo construir una narrativa coherente a partir de los hallazgos.
Estructura de un informe de EDA: Introducción, Descripción de Datos, Limpieza, Hallazgos Clave (con gráficos de apoyo), Conclusiones e Hipótesis.
Buenos Prácticas de Visualización: Títulos claros, etiquetas de ejes, uso efectivo del color y anotaciones para resaltar insights.
Formulación de Hipótesis: Cómo traducir observaciones en preguntas comprobables para un análisis más profundo.
Práctica: Síntesis del EDA, destacar hallazgos clave, organizar visualizaciones y redactar un resumen con hipótesis para análisis futuro.
Proyecto
Análisis Exploratorio de Datos para Investigación
A lo largo de las sesiones, aprenderás a limpiar y preparar los datos, explorar relaciones entre variables, crear visualizaciones efectivas, identificar hallazgos clave y sintetizar resultados en un dashboard y un resumen ejecutivo. Finalmente, formularás hipótesis basadas en sus descubrimientos para orientar futuros análisis predictivos, desarrollando habilidades prácticas para la investigación basada en datos.
Instructor
M.C. Axel Alejandro Ramos García
Tecnológico de Monterrey
Especialista en Bioinformática y Biología Computacional, con enfoque en aprendizaje automático aplicado al análisis de datos biológicos. Desarrolló FuNTB, una herramienta para el análisis de SNP en Mycobacterium tuberculosis, e investigó la selección de características en Neisseria gonorrhoeae y Acinetobacter baumannii mediante aprendizaje profundo, inteligencia artificial explicable y enfoques neurosimbólicos. Posee experiencia en el entrenamiento de modelos avanzados como DNABERT y en la optimización de flujos de trabajo de machine learning, así como en el uso de computación de alto rendimiento con clústeres Linux y servidores SLURM para análisis genómicos a gran escala. Además, cuenta con una sólida trayectoria interdisciplinaria en robótica y sistemas inteligentes, destacando el desarrollo de un exoesqueleto para miembros inferiores destinado a personas con paraplejia.
Certificado digital
Obtendrás un certificado con valor curricular, el cual queda registrado dentro de la plataforma de Conociverso y podrás consultar en cualquier momento para su validación.
Requerimientos técnicos
- Conocimiento funcional de Microsoft Excel o Google Sheets.
- Fundamentos de estadística.
- Memoria RAM de 8 GB o superior.
- Procesadores core i5 similar o superior.
Preguntas frecuentes
¿Se entrega un certificado al finalizar este curso?
Sí. Al terminar el curso recibirás un certificado con valor curricular, emitido por Conociverso, que demuestra las habilidades adquiridas durante el curso.
¿Debo tener algún grado académico específico para inscribirme?
No necesariamente. Recomendamos contar con conocimientos básicos en ciencias biológicas, pero el programa está pensado para adaptarse tanto a estudiantes como a profesionales.
¿Necesito tener instalado algún software antes de iniciar?
No. Durante el diplomado aprenderás a instalar y utilizar cada herramienta paso a paso, con la guía de tus profesores. Únicamente necesitas contar con una computadora con al menos 8 GB de RAM.
Si las clases en vivo ya pasaron, ¿aun así puedo tomar este curso?
¡Por supuesto! Todos nuestros cursos están diseñados para que también los puedas realizar en modalidad asincrónica, a tu propio ritmo y en el horario que mejor se adapte a ti. Tendrás acceso a las grabaciones de todas las clases del curso y al material complementario.
¿Emiten factura fiscal?
Sí, emitimos factura fiscal únicamente para México. Para solicitarla, ve a la configuración de tu cuenta, en la sección de pagos encontrarás la opción de facturación. Debe solicitarse dentro del mismo mes en que se realizó la compra.
Reseñas
Este curso me sirvió mucho para ampliar mi conocimiento en el manejo de software para investigación, igualmente puede aclarar todas mis dudas durante el curso. También me gustó que los docentes nos hayan apoyado y explicado de manera clara todos los temas.
Dr. Alejandro Pech Burgos
Médico
La atención a los estudiantes fue de primera en disposición y amabilidad tanto de los organizadores como de los profesores. Los profesores son personas con mucha experiencia y que siempre se esforzaron en dar lo mejor de sí para que pudiésemos aprender cada tema.
Dra. Patricia Landa
Docente e investigadora, Universidad Autónoma de Chapingo
Recomiendo a Conociverso son súper profesionales y flexibles. Me encanta su servicio al cliente de alta calidad y formalidad. Los cursos son de alta calidad académica y lo mejor de expertos en el área. Y costos asequibles para los principiantes.
Dra. Victoria Edwina Campos García
Docente e investigadora, UNAM
Las clases son muy dinámicas y todos los profesores son expertos en su tema, muchos de ellos son jóvenes investigadores y eso es un plus de motivación que te da el verlos y aprender de ellos.
M.C. José Adrián Coral Góngora
Profesor de cátedra, CINVESTAV UNIDAD MONTERREY
Me gustó mucho que trabajamos con ejemplos reales. Adquiriendo herramientas aplicables a nuestras líneas de investigación. Los instructores siempre atentos, siempre pendientes de responder dudas. Todo el material disponible, y la posibilidad de revisar la grabación del curso muy bueno para los que nos somos expertos.
Dra. Maria Leticia Arena Ortiz
Profesora investigadora, UNAM
M1 Fundamentos del AED y Análisis Univariado
Fundamentos del AED y Análisis Univariado
Introducción al AED: ¿Qué es, por qué es crucial y cuál es su papel en el ciclo de vida del análisis de datos?
AED vs Estadística Tradicional: Enfoque descriptivo y flexible del EDA frente al enfoque inferencial y rígido de los métodos clásicos.
Tipos de Datos: Numéricos (continuos, discretos) y Categóricos (nominales, ordinales).
Estructura de Datos en Celdas: Modelado de tablas (long vs wide).
Medidas de Tendencia Central y Dispersión.
Práctica 1: Generación de histogramas para visualizar distribuciones.
M2 Limpieza y Calidad de Datos
Principio GIGO: Importancia de contar con datos limpios para obtener resultados confiables.
Estrategias de manejo como eliminación o imputación (media, mediana, moda).
Duplicados: Métodos para detectar y consolidar registros repetidos.
Outliers: Qué son, cómo identificarlos visualmente (boxplots) o con reglas.
Funciones clave en Excel: Uso de TRIM, CLEAN, IFERROR, UNIQUE y COUNTIF para limpieza de datos.
Práctica 2: Limpieza de datos en Excel:
Se detectan inconsistencias, valores faltantes, duplicados y outliers, aplicando funciones y estrategias para su corrección.
M3 Variables, Datos y Herramientas Básicas
Validación de Datos: Por qué es importante para mantener la calidad a futuro, Reglas de validación (Listas y rangos numéricos).
Control de Calidad: Protección de celdas/hojas para evitar errores. Verificaciones cruzadas entre tablas.
Normalización y Estandarización: Cuándo y por qué escalar datos.
Ingeniería de Características Simple: Creación de nuevas columnas a partir de las existentes.
Práctica 3: Creación de variables con IF/IFS, aplicación de escalado (Min–Max, Z–score) y uso de listas desplegables para restringir entradas.
M4 Análisis Bivariado y Multivariado
Correlación vs. Causalidad: Concepto clave en análisis de datos.
Análisis de relaciones:
Numérica vs. Numérica: Scatter plots y coeficiente de correlación.
Numérica vs. Categórica: Boxplots y tablas de resumen por grupo.
Categorías vs. Categorías: Tablas de contingencia y gráficos de barras apilados/agrupados.
Introducción al análisis multivariado: Uso de color, tamaño y forma en gráficos para representar variables adicionales.
Práctica 4: Creación de scatter plots, boxplots comparativos, tablas dinámicas con gráficos de barras agrupados y cálculo de la matriz de correlación de variables numéricas.
M5 Síntesis y comunicación de hallazgos
Storytelling con Datos: Cómo construir una narrativa coherente a partir de los hallazgos.
Estructura de un informe de EDA: Introducción, Descripción de Datos, Limpieza, Hallazgos Clave (con gráficos de apoyo), Conclusiones e Hipótesis.
Buenos Prácticas de Visualización: Títulos claros, etiquetas de ejes, uso efectivo del color y anotaciones para resaltar insights.
Formulación de Hipótesis: Cómo traducir observaciones en preguntas comprobables para un análisis más profundo.
Práctica: Síntesis del EDA, destacar hallazgos clave, organizar visualizaciones y redactar un resumen con hipótesis para análisis futuro.
Curso de Análisis exploratorio de datos para investigación
M.C. Axel Alejandro Ramos García
Tecnológico de Monterrey
Curso en línea
Acceso durante 1 año
10 horas totales
Nivel intermedio
$899.00 MXN ($45 USD)
Accede a todos nuestros cursos
Especialízate y mantente actualizado como científico bajo un precio cómodo
Conociverso Lite
Cancela cuando lo necesites-
Acceso a más de 40 cursos
-
Certificados ilimitados
-
Ruta personalizada de aprendizaje
Conociverso Pro
Acceso completo anual-
Accede a más de 40 cursos
-
Certificados ilimitados
-
Ruta personalizada de aprendizaje
-
Cursos exclusivos
Plan institucional
Planes personalizados para organizaciones-
Cursos o planes personalizados
-
Evaluación y métricas de aprendizaje
-
Descuento dependiendo el tamaño de tu organización