Curso de Análisis exploratorio de datos para investigación

M.C. Axel Alejandro Ramos García

Tecnológico de Monterrey

Curso de Análisis exploratorio de datos para investigación

Curso en línea

Acceso durante 1 año

10 horas totales

$899.00 MXN ($45 USD)

Información general

Este curso está diseñado especialmente para investigadores que desean fortalecer sus habilidades en análisis exploratorio de datos. Aprenderás los conceptos básicos del análisis de datos, técnicas para identificar problemas y estructurar objetivos de investigación. Además, desarrollarás la capacidad de elaborar gráficos y visualizaciones efectivas que faciliten la interpretación de resultados y apoyen la toma de decisiones en tus proyectos de investigación.

Qué aprenderás

Visualización y análisis de datos

Interpretación de patrones y relaciones

Formulación de hipótesis y comunicación de resultados

A quién va dirigido este curso

El curso está dirigido a estudiantes y profesionales de distintas disciplinas, especialmente en áreas científicas, ingenierías y negocios. También está orientado a investigadores y analistas que se inician en la gestión y análisis de datos, así como a analistas junior y profesionales de áreas de negocio, marketing o finanzas. En general, resulta de gran utilidad para cualquier persona que trabaje con datos y desee aprender un método sistemático para explorarlos, interpretarlos y extraer valor de ellos antes de realizar análisis más complejos.

Beneficios del curso

Certificado de finalización

Constancia de
finalización del curso
y realización de un
proyecto con valor
curricular

Instructores expertos

Aprende directamente de expertos del área de las mejores instituciones de Latinoamérica y el mundo

Educación con proyectos

Realizarás un
proyecto académico
para demostrar las
habilidades
adquiridas en el
curso

Temario

M1 Fundamentos del AED y Análisis Univariado
  • Introducción al AED: ¿Qué es, por qué es crucial y cuál es su papel en el ciclo de vida del análisis de datos?

  • AED vs Estadística Tradicional: Enfoque descriptivo y flexible del EDA frente al enfoque inferencial y rígido de los métodos clásicos.

  • Tipos de Datos: Numéricos (continuos, discretos) y Categóricos (nominales, ordinales).

  • Estructura de Datos en Celdas: Modelado de tablas (long vs wide).

  • Medidas de Tendencia Central y Dispersión.

Práctica 1: Generación de histogramas para visualizar distribuciones.

  • Principio GIGO: Importancia de contar con datos limpios para obtener resultados confiables.

  • Estrategias de manejo como eliminación o imputación (media, mediana, moda).

  • Duplicados: Métodos para detectar y consolidar registros repetidos.

  • Outliers: Qué son, cómo identificarlos visualmente (boxplots) o con reglas.

  • Funciones clave en Excel: Uso de TRIM, CLEAN, IFERROR, UNIQUE y COUNTIF para limpieza de datos.

Práctica 2: Limpieza de datos en Excel:
Se detectan inconsistencias, valores faltantes, duplicados y outliers, aplicando funciones y estrategias para su corrección.

  • Validación de Datos: Por qué es importante para mantener la calidad a futuro, Reglas de validación (Listas y rangos numéricos).

  • Control de Calidad: Protección de celdas/hojas para evitar errores. Verificaciones cruzadas entre tablas.

  • Normalización y Estandarización: Cuándo y por qué escalar datos.

  • Ingeniería de Características Simple: Creación de nuevas columnas a partir de las existentes.

Práctica 3: Creación de variables con IF/IFS, aplicación de escalado (Min–Max, Z–score) y uso de listas desplegables para restringir entradas.

  • Correlación vs. Causalidad: Concepto clave en análisis de datos.

  • Análisis de relaciones:

    • Numérica vs. Numérica: Scatter plots y coeficiente de correlación.

    • Numérica vs. Categórica: Boxplots y tablas de resumen por grupo.

    • Categorías vs. Categorías: Tablas de contingencia y gráficos de barras apilados/agrupados.

    • Introducción al análisis multivariado: Uso de color, tamaño y forma en gráficos para representar variables adicionales.

Práctica 4: Creación de scatter plots, boxplots comparativos, tablas dinámicas con gráficos de barras agrupados y cálculo de la matriz de correlación de variables numéricas.

  • Storytelling con Datos: Cómo construir una narrativa coherente a partir de los hallazgos.

  • Estructura de un informe de EDA: Introducción, Descripción de Datos, Limpieza, Hallazgos Clave (con gráficos de apoyo), Conclusiones e Hipótesis.

  • Buenos Prácticas de Visualización: Títulos claros, etiquetas de ejes, uso efectivo del color y anotaciones para resaltar insights.

  • Formulación de Hipótesis: Cómo traducir observaciones en preguntas comprobables para un análisis más profundo.

  • Práctica: Síntesis del EDA, destacar hallazgos clave, organizar visualizaciones y redactar un resumen con hipótesis para análisis futuro.

Proyecto

Análisis Exploratorio de Datos para Investigación

A lo largo de las sesiones, aprenderás a limpiar y preparar los datos, explorar relaciones entre variables, crear visualizaciones efectivas, identificar hallazgos clave y sintetizar resultados en un dashboard y un resumen ejecutivo. Finalmente, formularás hipótesis basadas en sus descubrimientos para orientar futuros análisis predictivos, desarrollando habilidades prácticas para la investigación basada en datos.

Instructor

M.C. Axel Alejandro Ramos García

Tecnológico de Monterrey

Especialista en Bioinformática y Biología Computacional, con enfoque en aprendizaje automático aplicado al análisis de datos biológicos. Desarrolló FuNTB, una herramienta para el análisis de SNP en Mycobacterium tuberculosis, e investigó la selección de características en Neisseria gonorrhoeae y Acinetobacter baumannii mediante aprendizaje profundo, inteligencia artificial explicable y enfoques neurosimbólicos. Posee experiencia en el entrenamiento de modelos avanzados como DNABERT y en la optimización de flujos de trabajo de machine learning, así como en el uso de computación de alto rendimiento con clústeres Linux y servidores SLURM para análisis genómicos a gran escala. Además, cuenta con una sólida trayectoria interdisciplinaria en robótica y sistemas inteligentes, destacando el desarrollo de un exoesqueleto para miembros inferiores destinado a personas con paraplejia.

Certificado digital

Certificado

Obtendrás un certificado con valor curricular, el cual queda registrado dentro de la plataforma de Conociverso y podrás consultar en cualquier momento para su validación.

Requerimientos técnicos

  • Conocimiento funcional de Microsoft Excel o Google Sheets.
  • Fundamentos de estadística.
  • Memoria RAM de 8 GB o superior.
  • Procesadores core i5 similar o superior.

Preguntas frecuentes

¿Se entrega un certificado al finalizar este curso?

Sí. Al terminar el curso recibirás un certificado con valor curricular, emitido por Conociverso, que demuestra las habilidades adquiridas durante el curso.

No necesariamente. Recomendamos contar con conocimientos básicos en ciencias biológicas, pero el programa está pensado para adaptarse tanto a estudiantes como a profesionales.

No. Durante el diplomado aprenderás a instalar y utilizar cada herramienta paso a paso, con la guía de tus profesores. Únicamente necesitas contar con una computadora con al menos 8 GB de RAM.

¡Por supuesto! Todos nuestros cursos están diseñados para que también los puedas realizar en modalidad asincrónica, a tu propio ritmo y en el horario que mejor se adapte a ti. Tendrás acceso a las grabaciones de todas las clases del curso y al material complementario.


Sí, emitimos factura fiscal únicamente para México. Para solicitarla, ve a la configuración de tu cuenta, en la sección de pagos encontrarás la opción de facturación. Debe solicitarse dentro del mismo mes en que se realizó la compra.

Reseñas

M1 Fundamentos del AED y Análisis Univariado

Fundamentos del AED y Análisis Univariado

  • Introducción al AED: ¿Qué es, por qué es crucial y cuál es su papel en el ciclo de vida del análisis de datos?

  • AED vs Estadística Tradicional: Enfoque descriptivo y flexible del EDA frente al enfoque inferencial y rígido de los métodos clásicos.

  • Tipos de Datos: Numéricos (continuos, discretos) y Categóricos (nominales, ordinales).

  • Estructura de Datos en Celdas: Modelado de tablas (long vs wide).

  • Medidas de Tendencia Central y Dispersión.

Práctica 1: Generación de histogramas para visualizar distribuciones.

  • Principio GIGO: Importancia de contar con datos limpios para obtener resultados confiables.

  • Estrategias de manejo como eliminación o imputación (media, mediana, moda).

  • Duplicados: Métodos para detectar y consolidar registros repetidos.

  • Outliers: Qué son, cómo identificarlos visualmente (boxplots) o con reglas.

  • Funciones clave en Excel: Uso de TRIM, CLEAN, IFERROR, UNIQUE y COUNTIF para limpieza de datos.

Práctica 2: Limpieza de datos en Excel:
Se detectan inconsistencias, valores faltantes, duplicados y outliers, aplicando funciones y estrategias para su corrección.

  • Validación de Datos: Por qué es importante para mantener la calidad a futuro, Reglas de validación (Listas y rangos numéricos).

  • Control de Calidad: Protección de celdas/hojas para evitar errores. Verificaciones cruzadas entre tablas.

  • Normalización y Estandarización: Cuándo y por qué escalar datos.

  • Ingeniería de Características Simple: Creación de nuevas columnas a partir de las existentes.

Práctica 3: Creación de variables con IF/IFS, aplicación de escalado (Min–Max, Z–score) y uso de listas desplegables para restringir entradas.

  • Correlación vs. Causalidad: Concepto clave en análisis de datos.

  • Análisis de relaciones:

    • Numérica vs. Numérica: Scatter plots y coeficiente de correlación.

    • Numérica vs. Categórica: Boxplots y tablas de resumen por grupo.

    • Categorías vs. Categorías: Tablas de contingencia y gráficos de barras apilados/agrupados.

    • Introducción al análisis multivariado: Uso de color, tamaño y forma en gráficos para representar variables adicionales.

Práctica 4: Creación de scatter plots, boxplots comparativos, tablas dinámicas con gráficos de barras agrupados y cálculo de la matriz de correlación de variables numéricas.

  • Storytelling con Datos: Cómo construir una narrativa coherente a partir de los hallazgos.

  • Estructura de un informe de EDA: Introducción, Descripción de Datos, Limpieza, Hallazgos Clave (con gráficos de apoyo), Conclusiones e Hipótesis.

  • Buenos Prácticas de Visualización: Títulos claros, etiquetas de ejes, uso efectivo del color y anotaciones para resaltar insights.

  • Formulación de Hipótesis: Cómo traducir observaciones en preguntas comprobables para un análisis más profundo.

  • Práctica: Síntesis del EDA, destacar hallazgos clave, organizar visualizaciones y redactar un resumen con hipótesis para análisis futuro.

Curso de Análisis exploratorio de datos para investigación

M.C. Axel Alejandro Ramos García

Tecnológico de Monterrey

Curso en línea

Acceso durante 1 año

10 horas totales

Nivel intermedio

$899.00 MXN ($45 USD)

Accede a todos nuestros cursos

Especialízate y mantente actualizado como científico bajo un precio cómodo

Conociverso Lite

Cancela cuando lo necesites
$ 799
00
Mensual
  • Acceso a más de 40 cursos
  • Certificados ilimitados
  • Ruta personalizada de aprendizaje

Conociverso Pro

Acceso completo anual
$ 584
00
Mensual
Un solo pago de $6,999.00
  • Accede a más de 40 cursos
  • Certificados ilimitados
  • Ruta personalizada de aprendizaje
  • Cursos exclusivos

Plan institucional

Planes personalizados para organizaciones
Cursos para empresas e instituciones
Más estudiantes más ahorro
  • Cursos o planes personalizados
  • Evaluación y métricas de aprendizaje
  • Descuento dependiendo el tamaño de tu organización