Vous êtes sur la page 1sur 4

PRUEBA INGENIERO DE DATOS PARTE II

Cargue de Archivos ETL (GoAnyWhere + SQL Server)


Para el proceso de ETL se hizo uso de la herramienta GoAnyWhere para el cargue de los archivos a una base de datos
SQL Server. Se adjunta el archivo XML que contiene la informacion del ETL y el log de ejecucion exitosa del mismo.

ETL_Cargue.xml

Luego del cargue se tienen las siguientes tablas


#Cual es la tienda con el mayor valor en ventas totales?

df_p1 =
df.groupby(["store"])["weekly_sales"].sum().sort_values(ascending=False).reset_index().rename(columns={'weekly_
sales': 'total_ventas'})

df_p1.head(1)
#Entre las 3 tiendas más grandes cuál es la que más ventas totales registra?

df_p2 = df.groupby(["store","size"])["weekly_sales"].sum().reset_index().rename(columns={'weekly_sales':
'total_ventas'})

df_p2 = df_p2.sort_values(by=["size"],ascending=False).head(3)

df_p2.sort_values(by=["total_ventas"],ascending=False).head(1)

#Cual es la tienda con menor ventas ?

df_p3 =
df.groupby(["store"])["weekly_sales"].sum().sort_values(ascending=True).reset_index().rename(columns={'weekly_s
ales': 'total_ventas'})

df_p3.head(1)

Cargue de Archivos con Pandas (Python)


Notebooks de las soluciones anteriores

Vous aimerez peut-être aussi