Contenido del curso
Bases de Datos: De Cero a Experto

🎯 Objetivo:

Aprender a trabajar con modelos de datos analíticos usando pandas en Jupyter Notebook para facilitar el análisis y visualización de datos.


🧩 ¿Por qué usar pandas y Jupyter?

  • pandas: biblioteca Python especializada en manipulación y análisis de datos con estructuras tipo DataFrame, muy parecidas a tablas.

  • Jupyter Notebook: entorno interactivo para escribir y ejecutar código Python, documentar análisis y visualizar resultados en un solo lugar.


⚙️ Paso 1: Cargar datos en pandas

Supongamos que tienes archivos CSV exportados desde tu modelo estrella o base de datos.

python
import pandas as pd

# Cargar dimensiones y hechos
df_producto = pd.read_csv('dim_producto.csv')
df_cliente = pd.read_csv('dim_cliente.csv')
df_fecha = pd.read_csv('dim_fecha.csv')
df_ventas = pd.read_csv('fact_ventas.csv')


⚙️ Paso 2: Unir tablas (merge)

Para analizar los datos, debes unir las tablas de hechos con dimensiones, igual que en SQL con JOIN.

python
df = df_ventas
.merge(df_producto, on='producto_id')
.merge(df_cliente, on='cliente_id')
.merge(df_fecha, on='fecha_id')

# Mostrar las primeras filas
print(df.head())


⚙️ Paso 3: Análisis y agregación

Por ejemplo, calcular ventas totales por cliente y año:

python
ventas_agrupadas = df.groupby(['nombre_cliente', 'año'])
.agg({'cantidad': 'sum', 'monto': 'sum'})
.reset_index()

print(ventas_agrupadas)


⚙️ Paso 4: Visualización básica con matplotlib

python
import matplotlib.pyplot as plt

ventas_agrupadas.plot(kind='bar', x='nombre_cliente', y='monto')
plt.title('Ventas por Cliente')
plt.ylabel('Monto Total')
plt.show()


📝 Actividad práctica

  1. Exporta tus tablas de modelo estrella a CSV.

  2. Carga los datos en pandas dentro de Jupyter Notebook.

  3. Realiza uniones y agrupaciones para analizar las ventas.

  4. Genera gráficos simples para visualizar resultados.


✅ Revisión rápida

  • ¿Qué función de pandas une DataFrames?

  • ¿Por qué es útil Jupyter para análisis?

  • ¿Cómo agrupas datos y calculas sumas en pandas?

Scroll al inicio