Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCION
La Inteligencia de Negocios (BI)
• Un conjunto de herramientas y técnicas
basadas en el procesamiento de datos, para
generar información útil para la toma de
decisiones
Big Picture del BI
Sistemas
Transaccionales y Reportería
otras fuentes Repositorio
Distribución
Analítico de
Contabilidad Información
Ventas
ETL Data Warehouse / Explotación OLAP
Data Mart
RRHH
Excel Data
Mining
csv
Ventas
ETL Data Warehouse / Explotación OLAP
Data Mart
OPERACIÓN DEL
ANÁLISIS PARA TOMA DE DECISIONES
NEGOCIO
RRHH
Excel Data
Mining
csv
Power BI Mobile
Roles de aplicaciones
Power BI Desktop
Importar los datos y crear reportes.
OBTENCIÓN Y PREPARACIÓN DE
DATOS
Orígenes de Datos
• Orígenes de datos variados: Siempre aumentan
• Algunas clasificaciones:
– Archivo
– Base de datos
– Servicios Azure
– Servicios Online
– Otros
Carga de datos
• Orígenes posibles
– Azure
• Azure SQL Server
• Azure SQL Datawarehouse
– La versión Azure de APS
• Cuentas de Storage
• Azure Marketplace
• DocumentDB (NoSQL)
• etc
Carga de datos
• Archivos de texto
– Deben estar bien estructurados
• Mismo número de elementos por cada fila
– Idealmente, sólo contenido tabular
• Sin encabezados como un título del archivo o algo así
• Encabezados de columnas son bienvenidos
Carga de datos
• Otras fuentes
– Odata feeds
– Web
• Páginas HTML con tablas
• Hadoop
– Lee archivos de HDFS
• Facebook
• Google Analytics
• Salesforce
• Y más
– ODBC
Carga de datos
• Otras fuentes
– Scripts en R!
Modo de Obtención de datos
• Import
– Power BI genera extracción de datos y los almacena
en un modelo tabular optimizado para su
procesamiento en memoria.
– Se aplican transformaciones y filtros de los datos
extraídos (preparación).
– Los datos, la lógica relacional y la forma de reportes
son almacenados en un archivo .pbix
– Límite máximo de .pbix, 1 GB.
Import Data
• Orígenes soportados
– En general todos
– Excepciones:
• Cubos multidimensionales
• Modelos tabulares
Modo de Obtención de datos
• DirectQuery
– No se importan o copian datos hacia Power BI Desktop
– Se utiliza el motor de datos de origen para procesar
cada consulta.
– Se genera archivo .pbix con el modelo de datos tabular y
la definición de los reportes. Los datos se almacenan en
el origen.
• Cada interacción del usuario implica una consulta
– Orígenes de datos Multidimensional o tabular sólo
pueden usar este tipo de conexión.
DirectQuery
• Desde SQL Server
• Desde Analysis Services
• Desde SQL Datawarehouse
• SAP HANA
• BD Oracle
• BD Teradata
• Amazon Redshift (preview)
• Impala (preview)
• Snowflake (preview)
DirectQuery
• Beneficios:
– Permite construir visualizaciones sobre datasets
muy grandes que no se podrían importar
– Latencia de datos prácticamente cero. Siempre
se consultan datos frescos.
– La limitación de dataset de 1 GB no aplica a
Direct Query
DirectQuery
• Limitaciones
– Todas las tablas deben provenir de una sola BD
– No soporta Cross Filter bidireccional.
– Capacidades de Time intelligence no son soportadas
– Limitaciones en las expresiones DAX que se pueden utilizar
– Límite de 1 millón de filas leidas en una consulta
– El performance depende de la red y del performance del
origen de datos
– Limitaciones en transformaciones en el editor de consultas
• Cambio de tipo de dato, por ejemplo
Limpieza y Transformación de datos
• Editor de consultas
– Poderosa herramienta para dar forma y transformar datos.
– Cumple la función de Extracción, transformación y carga
(proceso ETL).
• Funciones destacables:
– Nuevo Origen.
– Tipo de dato.
– Filtro de fila
– Nueva Columna.
– Combinar Consultas,
Editor de Consultas
Transformaciones
• Varias…
– De tipos de datos
• Reinterpretar un tipo de dato por otro
– Split
– Manipulaciones de fechas
• Duplicar fechas y generar partes de fecha
– Replace de valores
– Replace de errores
– Extract de texto
Transformaciones
• Varias…
– Aplicar cálculos
• Statistic, Standard Scientific
– Merge y Append
– Add Column
– Pivot
– Unpivot
Merge y Append
• Merge
– Juntar 2 o más columnas en una
– Juntar 2 queries (como un join)
• Append
– Equivalente al Union de SQL , para queries
• Se juntan los filas de ambas queries, considerando
que
Add Column
• Agregar columna
– En dos modalidades
• La columna agregada es resultado de otra
transformación (merge, Parse, Extract, Format)
– Útil para que las columnas originales no desaparezcan con
dichas operaciones
• La columna agregada es definida explícitamente
Transformaciones
• Unpivot
– Convertir una tabla de doble entrada en una
tabla normal
• Un set de columnas se convierte en valores de una
columna que las viene a reemplazar
• Los valores de cada columna ahora se asocian a las
filas con los nombres de las columnas a las que
pertenecían
Transformaciones
• Pivot
– Convertir datos de una columna en nombres de
columnas nuevas
• Cada valor distinto se convierte en el título de una
columna nueva
• Por ej: Si la columna contenía 12 valores distintos (los
12 meses del año), el efecto del pivot es generar 12
columnas que reemplazan a la seleccionada
Transformaciones
• Pivot
– De las columnas que no son pivoteadas, se debe
seleccionar una
• A esta se le aplicará una función de agregación a
gusto del cliente.
• Los valores de la(s) otra(s) columnas(s) no pivoteadas
serán criterios de agrupación, al igual que los valores
de la pivoteada
Nombres de columnas que
queremos pivotear
UNPIVOT
Ahora estos nombres son valores de
una columna nueva
Transformaciones
• Para cálculos complejos
– Hacerlos sobre el modelo de datos (posterior al
editor de queries)
• Se puede utilizar lenguaje DAX
Intensivo Power BI
MODELAMIENTO DE DATOS
Tablas y Relaciones
– Drill Down
• Navegación hacia niveles crecientes de detalle
Mejorando el Modelo de datos
• Creando jerarquías
– Condición necesaria:
• Las columnas que participen deben estar ubicadas en
la misma tabla
Mejorando el Modelo de datos
• Creando jerarquías
– Tenemos 3 tablas relacionadas
con columnas que forman una
jerarquía:
• EnglishProductName
• EnglishProductSubcategoryname
• EnglishProductCateboryName
– ¿qué hacemos en este caso
entonces?
Invocamos el poder de DAX
• Creamos columnas calculadas que traigan
los valores a la tabla que necesitamos
– A la tabla DimProduct nos traemos:
• EnglishProductSubcategoryname
• EnglishProductCategoryName
Invocamos el poder de DAX
• Creamos columnas calculadas que traigan
los valores a la tabla que necesitamos
– A la tabla DimProduct nos traemos:
• EnglishProductSubcategoryname
• EnglishProductCategoryName
Invocamos el poder de DAX
Invocamos el poder de DAX
• Columna “catprod”:
SubCat =
RELATED ( DimProductSubcategory[EnglishProductSubcategoryName] )
Categoria =
RELATED ( DimProductCategory[EnglishProductCategoryName] )
Mejorando el Modelo de datos
• Creando jerarquías
– Seleccionamos la columna de
mayor nivel jerárquico
• En este caso, Categoria
– Hacemos click derecho y “New
Hierarchy”
Mejorando el Modelo de datos
• Creando jerarquías
– Arrastramos los demás campos
en orden jerárquico a la jerarquía
Mejorando el Modelo de Datos
• Eliminar columnas y tablas que no tengan
valor analítico
– Un monto, una cantidad, un ratio, etc. Tienen
valor analítico
– Una llave (un rut, un ID, número de boleta,
folio,…) (generalmente) no tienen valor
analítico
Mejorando el Modelo de Datos
• Si no tiene valor analítico
– Igual puede tener valor para la construcción del
modelo.
• Llaves participan en relaciones!!
– ¿Entonces?
• No podemos eliminarlas, pero sí ocultarlas del usuario
Mejorando el Modelo de Datos
• El usuario debe tener a la vista sólo lo que le
reporta valor directamente
– Escondemos columnas y tablas.
Both
Intensivo Power BI
VISUALIZACIONES EN POWER BI
Opciones en Visualización
Analytics:
Lineas de tendencia,
proyecciones, lineas de
promedio y otros valores de
interés.
Formato:
Aquí se escoge el tamaño de
letra, color, posición.
Campos:
Aquí se arrastran las columnas
que serán utilizadas.
Construcción de Visualizaciones Arrastrar
valores aquí
Valor
Eje
Construcción de Visualizaciones
Valor
La mayor parte de las
visualizaciones se
compone de dos Punto de Comparación
elementos principales
Comparación: Categorías
en la cual se dividen
estos valores (Los meses
en el caso de la
izquierda)
Otros Detalles Interesantes.
Es possible importar
visuales personalizadas a
Power BI, descargandolas
de la Office Store
Cuando en el gráfico
de línea se tiene un
solo dato, es possible
agregar una línea de
tendencia en la
opción de analytics.
Tipos de gráficos en Power BI
68
Gráfico de barra apiladas
69
Gráfico de barras agrupadas
70
Gráfico de barras al 100%
71
Gráfico de líneas
72
Gráfico de áreas
73
Gráfico de áreas apiladas
74
Gráfico de columnas y líneas
75
Gráfico de cascada
76
Gráfico de burbujas
77
Gráfico de pie y donuts
78
Treemaps
79
Maps
80
Gráfico de embudo
81
Tarjetas y múltiples columnas
82
KPI
83
Tablas y matriz
84
Filtros
85
Intensivo Power BI
POWER BI EN LA NUBE
Power BI en la nube
• Para distribuir la
información Power BI
Desktop no es efectivo
• Lo que haremos es
Publicar nuestros
reportes
Power BI en la nube
• Si no lo hemos hecho
antes, debemos
identificarnos con una
cuenta Power BI
– Es gratuito crear una
Tipos de cuenta Power BI
• Power BI gratuita • Power BI Pro
– Gratis – Puede compartir y ser
– 1 GB de datos como receptor de contenido
máximo compartido
– No se puede compartir ni – Costo mensual (aprox 10
recibir contenido USD)
compartido – 10 GB datos como
máximo
– Conexión a datos on
premise con Power BI
Gateway
Distintos objetos
• Datasets
– Representan los datos de origen de un reporte
• Reportes
– Son nuestras creaciones
– Publicados desde Power BI Desktop
– Editables en la nube!
– No se pueden compartir directamente
• Dashboards
– Son visualizaciones de alto nivel
• Tienen elementos de uno o más reportes
• Se pueden compartir con otros usuarios, lo que
implícitamente permite compartir reportes.
Dashboards (paneles)
• Elementos
1. Barra de navegación
2. Panel con iconos
3. Cuadro de pregunta de
Preguntas y respuestas
4. Botones de ayuda y comentarios
5. Título del panel
6. Iniciador de aplicaciones de
Office 365
7. Botones de la página principal de
Power BI
8. Acciones adicionales del panel
Q&A
• En un dashboard podemos visualizaciones
creadas a partir de preguntas
– En pseudo-inglés
Q&A
• En un dashboard podemos visualizaciones
creadas a partir de preguntas
– En pseudo-inglés
Q&A
Accediendo a datos locales
• Armé un reporte conectado a datos de
nuestra base de datos
– Cuando lo publique ¿podré actualizar los datos
o tendré que publicarlo nuevamente cada vez
que necesite actualizarlo?
– ¡¡¡Power BI puede acceder a datos dentro de mi
red!!!
Accediendo a datos locales
• La solución: On premises data Gateway
– Un puente que permite transferencia rápida y
segura (encriptada) de datos entre una fuente
local y servicios como Power BI
– (Sólo una cuenta Pro puede configurarlo)
Power BI Gateway
El Gateway se instala
localmente y envía los
datos a la nube a través de
canales seguros
encriptados
Credenciales de
acceso son
controladas desde la
nube
Fuentes de datos
corporativos