🎯 Objetivo:
Aprender a trabajar con modelos de datos analíticos usando pandas en Jupyter Notebook para facilitar el análisis y visualización de datos.
🧩 ¿Por qué usar pandas y Jupyter?
-
pandas: biblioteca Python especializada en manipulación y análisis de datos con estructuras tipo DataFrame, muy parecidas a tablas.
-
Jupyter Notebook: entorno interactivo para escribir y ejecutar código Python, documentar análisis y visualizar resultados en un solo lugar.
⚙️ Paso 1: Cargar datos en pandas
Supongamos que tienes archivos CSV exportados desde tu modelo estrella o base de datos.
⚙️ Paso 2: Unir tablas (merge)
Para analizar los datos, debes unir las tablas de hechos con dimensiones, igual que en SQL con JOIN.
⚙️ Paso 3: Análisis y agregación
Por ejemplo, calcular ventas totales por cliente y año:
⚙️ Paso 4: Visualización básica con matplotlib
📝 Actividad práctica
-
Exporta tus tablas de modelo estrella a CSV.
-
Carga los datos en pandas dentro de Jupyter Notebook.
-
Realiza uniones y agrupaciones para analizar las ventas.
-
Genera gráficos simples para visualizar resultados.
✅ Revisión rápida
-
¿Qué función de pandas une DataFrames?
-
¿Por qué es útil Jupyter para análisis?
-
¿Cómo agrupas datos y calculas sumas en pandas?