Vous êtes sur la page 1sur 97

Intensivo Power BI

INTRODUCCION
La Inteligencia de Negocios (BI)
• Un conjunto de herramientas y técnicas
basadas en el procesamiento de datos, para
generar información útil para la toma de
decisiones
Big Picture del BI
Sistemas
Transaccionales y Reportería
otras fuentes Repositorio
Distribución
Analítico de
Contabilidad Información

Ventas
ETL Data Warehouse / Explotación OLAP
Data Mart

RRHH

Excel Data
Mining
csv

Datos Información Conocimiento


Big Picture del BI
Sistemas
Transaccionales y Reportería
otras fuentes Repositorio
Distribución
Analítico de
Contabilidad Información

Ventas
ETL Data Warehouse / Explotación OLAP
Data Mart
OPERACIÓN DEL
ANÁLISIS PARA TOMA DE DECISIONES
NEGOCIO
RRHH

Excel Data
Mining
csv

Datos Información Conocimiento


Cómo Agilizar el BI
• Proyectos de BI toman tiempo
– ¿Pero qué pasa cuando necesitamos más
agilidad analítica que la que el avance de los
proyectos nos permite?
– Queremos agilizar el proceso de generar
información
Cómo agilizar el BI
• Self Service BI
– Darle más herramientas a los usuarios de
negocio para desarrollar soluciones
– Principalmente de explotación
• Visualización y Distribución de información
¿Qué es Power BI?

“Power BI es una colección de servicios de Software, aplicaciones y


conectores que trabajan juntos para transformar sus fuentes de
datos no relacionadas en visualizaciones coherentes, absorbentes e
interactivas.“
Fuente: https://powerbi.microsoft.com/en-us/guided-learning/powerbi-learning-0-0-what-is-power-bi/
Qué es Power BI
• Power BI viene a atacar 2 objetivos:
– Visualización de información para toma de
decisiones
– Distribución de información
Ecosistema de Power BI
Power BI Desktop
Power BI Service (SaaS)

Power BI Mobile
Roles de aplicaciones
Power BI Desktop
Importar los datos y crear reportes.

Publicar a Power BI service, donde se pueden crear


nuevas visualizaciones o bien construir Dashboards.

Compartir los Dashboards con otras personas, Power BI Mobile

Power BI Service (SaaS)


especialmente personas que están en constante
movimiento.

Ver e interactuar con los Dashboards compartidos y


los reportes en Power BI Mobile.
A quién está dirigido
• Usuarios de negocio
– Personas que usarían Excel
• Tablas dinámicas
• Gráficos dinámicos
• Gráficos en general
– No es necesario tener conocimientos técnicos de
desarrollo de aplicaciones ni de SQL
• Aunque de todas maneras servirá saber más.
– La herramienta permite desde lo simple a lo complejo
A quién está dirigido
• … desde lo simple a lo complejo…
– Lo simple:
• Un par de clicks y tenemos una visualización
– Lo complejo:
• Extracciones y transformaciones complejas de datos con
“Power Query Formula Language” (o más conocido como
“M”)
• Lenguaje DAX para fórmulas en Power BI, muy poderoso.
A quién está dirigido
• Extracciones y transformaciones complejas
de datos con “Power Query Formula
Language” (o más conocido como “M”)
let
Source = Csv.Document(File.Contents("D:\temp\Ejemplo\datos\poblacionPaises.txt"),[Delimiter=" ",
Columns=3, Encoding=1252, QuoteStyle=QuoteStyle.None]),
#"Promoted Headers" = Table.PromoteHeaders(Source),
#"Changed Type" = Table.TransformColumnTypes(#"Promoted Headers",{{"Rank", type text}, {"Country
(or dependent territory)", type text}, {"Population", Int64.Type}})
in
#"Changed Type"
Capacitación Power BI

OBTENCIÓN Y PREPARACIÓN DE
DATOS
Orígenes de Datos
• Orígenes de datos variados: Siempre aumentan
• Algunas clasificaciones:
– Archivo
– Base de datos
– Servicios Azure
– Servicios Online
– Otros
Carga de datos
• Orígenes posibles
– Azure
• Azure SQL Server
• Azure SQL Datawarehouse
– La versión Azure de APS
• Cuentas de Storage
• Azure Marketplace
• DocumentDB (NoSQL)
• etc
Carga de datos
• Archivos de texto
– Deben estar bien estructurados
• Mismo número de elementos por cada fila
– Idealmente, sólo contenido tabular
• Sin encabezados como un título del archivo o algo así
• Encabezados de columnas son bienvenidos
Carga de datos
• Otras fuentes
– Odata feeds
– Web
• Páginas HTML con tablas
• Hadoop
– Lee archivos de HDFS
• Facebook
• Google Analytics
• Salesforce
• Y más
– ODBC
Carga de datos
• Otras fuentes
– Scripts en R!
Modo de Obtención de datos
• Import
– Power BI genera extracción de datos y los almacena
en un modelo tabular optimizado para su
procesamiento en memoria.
– Se aplican transformaciones y filtros de los datos
extraídos (preparación).
– Los datos, la lógica relacional y la forma de reportes
son almacenados en un archivo .pbix
– Límite máximo de .pbix, 1 GB.
Import Data
• Orígenes soportados
– En general todos
– Excepciones:
• Cubos multidimensionales
• Modelos tabulares
Modo de Obtención de datos
• DirectQuery
– No se importan o copian datos hacia Power BI Desktop
– Se utiliza el motor de datos de origen para procesar
cada consulta.
– Se genera archivo .pbix con el modelo de datos tabular y
la definición de los reportes. Los datos se almacenan en
el origen.
• Cada interacción del usuario implica una consulta
– Orígenes de datos Multidimensional o tabular sólo
pueden usar este tipo de conexión.
DirectQuery
• Desde SQL Server
• Desde Analysis Services
• Desde SQL Datawarehouse
• SAP HANA
• BD Oracle
• BD Teradata
• Amazon Redshift (preview)
• Impala (preview)
• Snowflake (preview)
DirectQuery
• Beneficios:
– Permite construir visualizaciones sobre datasets
muy grandes que no se podrían importar
– Latencia de datos prácticamente cero. Siempre
se consultan datos frescos.
– La limitación de dataset de 1 GB no aplica a
Direct Query
DirectQuery
• Limitaciones
– Todas las tablas deben provenir de una sola BD
– No soporta Cross Filter bidireccional.
– Capacidades de Time intelligence no son soportadas
– Limitaciones en las expresiones DAX que se pueden utilizar
– Límite de 1 millón de filas leidas en una consulta
– El performance depende de la red y del performance del
origen de datos
– Limitaciones en transformaciones en el editor de consultas
• Cambio de tipo de dato, por ejemplo
Limpieza y Transformación de datos
• Editor de consultas
– Poderosa herramienta para dar forma y transformar datos.
– Cumple la función de Extracción, transformación y carga
(proceso ETL).
• Funciones destacables:
– Nuevo Origen.
– Tipo de dato.
– Filtro de fila
– Nueva Columna.
– Combinar Consultas,
Editor de Consultas
Transformaciones
• Varias…
– De tipos de datos
• Reinterpretar un tipo de dato por otro
– Split
– Manipulaciones de fechas
• Duplicar fechas y generar partes de fecha
– Replace de valores
– Replace de errores
– Extract de texto
Transformaciones
• Varias…
– Aplicar cálculos
• Statistic, Standard Scientific
– Merge y Append
– Add Column
– Pivot
– Unpivot
Merge y Append
• Merge
– Juntar 2 o más columnas en una
– Juntar 2 queries (como un join)
• Append
– Equivalente al Union de SQL , para queries
• Se juntan los filas de ambas queries, considerando
que
Add Column
• Agregar columna
– En dos modalidades
• La columna agregada es resultado de otra
transformación (merge, Parse, Extract, Format)
– Útil para que las columnas originales no desaparezcan con
dichas operaciones
• La columna agregada es definida explícitamente
Transformaciones
• Unpivot
– Convertir una tabla de doble entrada en una
tabla normal
• Un set de columnas se convierte en valores de una
columna que las viene a reemplazar
• Los valores de cada columna ahora se asocian a las
filas con los nombres de las columnas a las que
pertenecían
Transformaciones
• Pivot
– Convertir datos de una columna en nombres de
columnas nuevas
• Cada valor distinto se convierte en el título de una
columna nueva
• Por ej: Si la columna contenía 12 valores distintos (los
12 meses del año), el efecto del pivot es generar 12
columnas que reemplazan a la seleccionada
Transformaciones
• Pivot
– De las columnas que no son pivoteadas, se debe
seleccionar una
• A esta se le aplicará una función de agregación a
gusto del cliente.
• Los valores de la(s) otra(s) columnas(s) no pivoteadas
serán criterios de agrupación, al igual que los valores
de la pivoteada
Nombres de columnas que
queremos pivotear

UNPIVOT
Ahora estos nombres son valores de
una columna nueva
Transformaciones
• Para cálculos complejos
– Hacerlos sobre el modelo de datos (posterior al
editor de queries)
• Se puede utilizar lenguaje DAX
Intensivo Power BI

MODELAMIENTO DE DATOS
Tablas y Relaciones

Una tabla en Power BI es el


Tablas resultado de una query

Responden a vínculos predefinidos


o a nombres de campos en común
Relaciones
Creación de relación

Drag and Drop


Cardinalidad de relaciones
• Indica el número máximo de
entidades relacionadas por cada lado
de la relación
• Esto determina cómo Power BI
vinculará los datos de las tablas
Many to One
One to One
Desarrollo recomendado
1. Importar datos para crear tablas
2. Definir relaciones entre tablas
• Poderoso! Puedo relacionar datos de orígenes diversos
3. Mejorar el diseño del modelo de datos con jerarquías,
columnas calculadas y KPIs
4. Preparar el modelo de datos para que sea usable por
usuarios
5. Producir reportes basados en el modelo de datos
6. Publicar el reporte al servicio Power BI
Mejorando el Modelo de Datos
• Un buen modelo de datos debería
– Tener relaciones creadas
– Tener jerarquías relevantes
– Tener escondidos los campos que no tienen
utilidad analítica
– Tener escondidas tablas que no tienen utilidad
analítica
Mejorando el Modelo de datos
• Jerarquías
– Asociaciones de columnas de una tabla, que
representan cadenas de relaciones 1:n entre ellas
– Por ejemplo:
• Categoría  Sub Categoría  Producto
• Año  Quarter  Mes  Fecha
Mejorando el Modelo de datos
• Jerarquías
– Visualizaciones que pueden hacer drill down
aprovechan las jerarquías
• Gráficos de barra, de línea

– Drill Down
• Navegación hacia niveles crecientes de detalle
Mejorando el Modelo de datos
• Creando jerarquías
– Condición necesaria:
• Las columnas que participen deben estar ubicadas en
la misma tabla
Mejorando el Modelo de datos
• Creando jerarquías
– Tenemos 3 tablas relacionadas
con columnas que forman una
jerarquía:
• EnglishProductName
• EnglishProductSubcategoryname
• EnglishProductCateboryName
– ¿qué hacemos en este caso
entonces?
Invocamos el poder de DAX
• Creamos columnas calculadas que traigan
los valores a la tabla que necesitamos
– A la tabla DimProduct nos traemos:
• EnglishProductSubcategoryname
• EnglishProductCategoryName
Invocamos el poder de DAX
• Creamos columnas calculadas que traigan
los valores a la tabla que necesitamos
– A la tabla DimProduct nos traemos:
• EnglishProductSubcategoryname
• EnglishProductCategoryName
Invocamos el poder de DAX
Invocamos el poder de DAX
• Columna “catprod”:
SubCat =
RELATED ( DimProductSubcategory[EnglishProductSubcategoryName] )

Categoria =
RELATED ( DimProductCategory[EnglishProductCategoryName] )
Mejorando el Modelo de datos
• Creando jerarquías
– Seleccionamos la columna de
mayor nivel jerárquico
• En este caso, Categoria
– Hacemos click derecho y “New
Hierarchy”
Mejorando el Modelo de datos
• Creando jerarquías
– Arrastramos los demás campos
en orden jerárquico a la jerarquía
Mejorando el Modelo de Datos
• Eliminar columnas y tablas que no tengan
valor analítico
– Un monto, una cantidad, un ratio, etc.  Tienen
valor analítico
– Una llave (un rut, un ID, número de boleta,
folio,…)  (generalmente) no tienen valor
analítico
Mejorando el Modelo de Datos
• Si no tiene valor analítico
– Igual puede tener valor para la construcción del
modelo.
• Llaves participan en relaciones!!
– ¿Entonces?
• No podemos eliminarlas, pero sí ocultarlas del usuario
Mejorando el Modelo de Datos
• El usuario debe tener a la vista sólo lo que le
reporta valor directamente
– Escondemos columnas y tablas.

• Así logramos un modelo “limpio”.


Mejorando el Modelo de Datos
• Sobre las relaciones, 2
temas importantes:
– Cardinalidad
– Cross filtering bien
definido
Mejorando el Modelo de Datos
• Cardinalidad de relación
– Concepto análogo al de un modelo de BD relacional
• Power BI lo deduce de las restricciones de integridad de
llave foránea en las BD
• Power BI se da cuenta si nos estamos equivocando al
definir la cardinalidad
– Tabla de ventas tiene llave foránea de IdVendedor
– Tabla de vendedores tiene llave primaria IdVendedor
Relación no puede ser 1:1 entre ambas.
Mejorando el Modelo de Datos
• Cross Filter Direction
– Indica la dirección en que
se propaga el efecto de
aplicar un filtro
– Ej:
• Si filtro productos de
DimProduct, se filtran
ventas en FactOnlineSales.
• ¿Pero quiero que pase lo
contrario?
Mejorando el Modelo de Datos
• Cross Filtering: 2
posibilidades
– Single
• El efecto del filtrado se
difunde desde tabla en
lado 1 a tabla del lado n
de la relación
– Both
• El efecto del filtrado se
difunde en ambas
direcciones.
Cross Filter Direction
Single

Both
Intensivo Power BI

VISUALIZACIONES EN POWER BI
Opciones en Visualización

Analytics:
Lineas de tendencia,
proyecciones, lineas de
promedio y otros valores de
interés.

Formato:
Aquí se escoge el tamaño de
letra, color, posición.
Campos:
Aquí se arrastran las columnas
que serán utilizadas.
Construcción de Visualizaciones Arrastrar
valores aquí
Valor

Eje
Construcción de Visualizaciones
Valor
La mayor parte de las
visualizaciones se
compone de dos Punto de Comparación
elementos principales

Valor: El tamaño de las


barras, o los angúlos que
usa un gráfico de torta

Comparación: Categorías
en la cual se dividen
estos valores (Los meses
en el caso de la
izquierda)
Otros Detalles Interesantes.
Es possible importar
visuales personalizadas a
Power BI, descargandolas
de la Office Store
Cuando en el gráfico
de línea se tiene un
solo dato, es possible
agregar una línea de
tendencia en la
opción de analytics.
Tipos de gráficos en Power BI

68
Gráfico de barra apiladas

69
Gráfico de barras agrupadas

70
Gráfico de barras al 100%

71
Gráfico de líneas

72
Gráfico de áreas

73
Gráfico de áreas apiladas

74
Gráfico de columnas y líneas

75
Gráfico de cascada

76
Gráfico de burbujas

77
Gráfico de pie y donuts

78
Treemaps

79
Maps

80
Gráfico de embudo

81
Tarjetas y múltiples columnas

82
KPI

83
Tablas y matriz

84
Filtros

85
Intensivo Power BI

POWER BI EN LA NUBE
Power BI en la nube
• Para distribuir la
información Power BI
Desktop no es efectivo
• Lo que haremos es
Publicar nuestros
reportes
Power BI en la nube
• Si no lo hemos hecho
antes, debemos
identificarnos con una
cuenta Power BI
– Es gratuito crear una
Tipos de cuenta Power BI
• Power BI gratuita • Power BI Pro
– Gratis – Puede compartir y ser
– 1 GB de datos como receptor de contenido
máximo compartido
– No se puede compartir ni – Costo mensual (aprox 10
recibir contenido USD)
compartido – 10 GB datos como
máximo
– Conexión a datos on
premise con Power BI
Gateway
Distintos objetos
• Datasets
– Representan los datos de origen de un reporte
• Reportes
– Son nuestras creaciones
– Publicados desde Power BI Desktop
– Editables en la nube!
– No se pueden compartir directamente
• Dashboards
– Son visualizaciones de alto nivel
• Tienen elementos de uno o más reportes
• Se pueden compartir con otros usuarios, lo que
implícitamente permite compartir reportes.
Dashboards (paneles)
• Elementos
1. Barra de navegación
2. Panel con iconos
3. Cuadro de pregunta de
Preguntas y respuestas
4. Botones de ayuda y comentarios
5. Título del panel
6. Iniciador de aplicaciones de
Office 365
7. Botones de la página principal de
Power BI
8. Acciones adicionales del panel
Q&A
• En un dashboard podemos visualizaciones
creadas a partir de preguntas
– En pseudo-inglés
Q&A
• En un dashboard podemos visualizaciones
creadas a partir de preguntas
– En pseudo-inglés
Q&A
Accediendo a datos locales
• Armé un reporte conectado a datos de
nuestra base de datos
– Cuando lo publique ¿podré actualizar los datos
o tendré que publicarlo nuevamente cada vez
que necesite actualizarlo?
– ¡¡¡Power BI puede acceder a datos dentro de mi
red!!!
Accediendo a datos locales
• La solución: On premises data Gateway
– Un puente que permite transferencia rápida y
segura (encriptada) de datos entre una fuente
local y servicios como Power BI
– (Sólo una cuenta Pro puede configurarlo)
Power BI Gateway
El Gateway se instala
localmente y envía los
datos a la nube a través de
canales seguros
encriptados

Credenciales de
acceso son
controladas desde la
nube

Fuentes de datos
corporativos

Vous aimerez peut-être aussi