Vous êtes sur la page 1sur 33

<Insert Picture Here>

Data Warehousing Extremo!!


Dario Valderrama
Business Intelligence Specialist

Los Sistemas de Informacin en las


Organizaciones

Tratamiento
automtico
de la
informacin

La
Informacin
como soporte
a toma de
decisiones

La
Informacin
como
insumo
estratgico
para la
generacin
de ventajas
competitivas

Todas las lneas de negocio esperan


tener un mejor auto-conocimiento
Industria
Retail
Telecomunicaciones
Cuidado en Salud

Preguntas Tpicas
Cuales tiendas deberan ser cerradas o vendidas?
Cuales clientes respondern a una nueva promocin?
Cuales aspectos afectan la desercin de clientes por cada regin?
Cual es la ganancia promedio por usuario
Cuales son las peticiones de servicio ms frecuentes de los
pacientes?

Servicios Financieros

De qu manera sern impactados los depsitos con nuevos


servicios en lnea?
Cmo es el promedio de prstamos comparado con el del ao
pasado?

Utilidades

Quien ser nuestro objetivo para el programa de eficiencia en


energa?
Qu recursos son necesarios para restaurar un corte de luz?

Sector Publico

Cual es la tendencia en presupuesto y gastos?


Cual es la forma mas costo efectiva de administrar los gastos?

Los Principales Desafos

Reto: Muchos ms datos para analizar


Tamao y crecimiento en Bodegas de Datos

Source: TDWI Next Generation Data Warehouse Platforms Report, 2009

Reto: No Hay una Fuente nica de Verdad


Arquitectura de Bodega de Datos Costosa

Data
Marts
OLAP

Data Mining

ETL

Data
Marts
ETL

OLAP

Data Mining

Reto: Requerimentos de Usuario No se


Cumplen
Alto abandono de plataformas de Bodega de Datos

Source: TDWI Next Generation Data Warehouse Platforms Report, 2009

Como Enfrentar los


Desafos?

Centralizacin e Integracin Analtica

OLAP

Spatial

Statistics

Images

Data Mining

Centraliza la informacin y tipos de datos en un solo lugar


Incluye los anlisis en donde se almacenan los datos
Se apalanca en las tecnologas core de la base de datos

Solucin de Oracle para BI & DW


Interactive
Dashboards

Reporting &
Publishing

Ad-hoc
Analysis

Proactive
Detection
and Alerts

Disconnected
Analytics

MS Office
Plug-in

Web
Services

Common Enterprise Information Model


Oracle BI Server

Olap

Data Mining

Partitioning

Spatial

Data Profiling, Data Modelling, ETL

OLTP & ODS


Systems

OLAP

SAP, Oracle, Siebel, Peoplesoft, Files Excel


JDEdwards, Custom
XML

Business
Process

Estrategia de Oracle para


Data Warehousing

Una Sola Plataforma para Consolidacin


Altsimo desempeo, Una sola versin de la verdad

Data
Marts

Online
Analytics

ETL
Data Mining

Oracle Database 11g


Oracle Exadata Database Machine

Oracle Exadata Database Machine


La Plataforma Ideal para Bodega de Datos
Mejoras en desempeo de consultas 10x
Consolida cargas OLTP y Analticas

Analticos y minera de datos


integrados
Menos riesgo

ETL con Oracle


Staging
Raw Files

BCP
Unload
FTP

Parallel
Loads

Non-Oracle Source
Data Pump
Unload

SCP

Oracle Source

Cargue rpido de datos usando DBFS y Tablas Externas


Rpidas transformacionesque en Oracle Database 11g por medio
de operaciones DML en paralelo
Best-in-class performance for large batch oriented data loads

El concepto de Particionamiento
Mantiene el rendimiento consistente cuando la base
de datos crece
SALES

SALES

SALES
Europe
USA

Jan

Feb

Tablas Grandes

Particin

Difcil de
Administrar

Divide y Conquistars
Ms Fcil de
Administrar
Mejor Rendimiento

Jan

Feb

Particionamiento
Compuesto
Alto desempeo
Acorde con las
necesidades del negocio

Particionamiento para Desempeo


Partition Pruning

Sales Table
5/19

What was the total


sales amount for May
20 and May 21 2010?

Select sum(sales_amount)
From SALES

5/20

Where sales_date between


to_date(05/20/2010,MM/DD/YYYY)
And
to_date(05/22/2010,MM/DD/YYYY);

5/21
5/22

Ejecuta operaciones solo en las particiones relevantes


Reduce dramticamente la cantidad de datos devueltos del disco
Mejora el desempeo de las consultas y optimiza la utilizacin de
recursos

Particionamiento para la gestin del


crecimiento de los datos
Comprime los datos y Reduce los costos de Almacenamiento
Archive Data

Read Only Data

Active Data

15-50x Archive
Compression

10-15x DW
Compression

3x OLTP
Compression

Distribuye particiones a travs de multiples capas de compresin


Libera espacio de almacenamiento y ejecuta las consultas ms
rpido
No es necesario hacer cambios en las aplicaciones existentes

Consultas paralelas en Memoria


Usa recursos disponibles de memoria para
incrementar el desempeo

Utiliza memoria distribuida en todos los nodos del clster


El Algoritmo esparce fragmentos de tablas en la memoria de
todos los nodos
Reduce el acceso a disco I/O

Gestin Sumarizada
Mejore el tiempo de respuesta con vistas materializadas
Region

SQL Query

Date

Query
Rewrite

Products

Relational Star
Schema

Channel

Sales by
Region

Sales by
Date

Sales by
Product

Sales by
Channel

Materialized Views

Informacin almacenada dentro de Oracle Database 11g preresumida


Objetos de Base de Datos separados, consultas transparentes
Soporte sofisticado a re-escritura de consultas
Rpido e incremental cambio de datos

Cubos Organizados mediante Vistas


Materializadas
Region

SQL Query

Summaries

Date

Query Rewrite

Automatic
Refresh
Products

Channel

Expone cubos OLAP de Oracle como vistas materializadas


relacionales
Provee acceso SQL a datos almacenados en un cubo OLAP
Cualquier herramienta de BI o aplicacin SQL puede aprovechar
los cubos OLAP

Oracle OLAP
Built-in Access to Analytic Calculations
Cmo funcionan las ventas en la regin
occidental de este trimestre comparadas
con las ventas de hace un ao?
Cules sern las ventas del prximo
trimestre?
Qu factores podemos alterar para
mejorar el pronstico de ventas?

Motor multidimensional que analiza el resumen de datos


Ofrece rendimiento de consultas mejorado y actualizaciones
rpidas e incrementales
Embebido en el almacenamiento y las bases de datos Oracle

Oracle OLAP and OBIEE


Clculos computarizados ms rpido en Motor OLAP

Oracle Data Mining


Encuentre patrones ocultos , Realice Predicciones
Venta al por Menor

Servicios Financieros

Segmentacin del Mercado


Response Modeling

Credit Scoring
Posibilidad de incumplimiento

Comunicaciones
Rotacin de Clientes
Intrusin en la Red
Servicios Mdicos
Prediccin de Resultados del
Paciente
Deteccin de Fraudes

Utilidades
Product bundling
Prediccin de fallo en la lnea
de alimentacin
Sector Pblico
Fraude Fiscal
Anlisis Criminal

Recoleccin de algoritmos de minera de datos que resuelven


problemas de negocio
Simplifica el desarrollo de aplicaciones predictivas BI
Embebido en el almacenamiento y las bases de datos Oracle

Data Mining Provee


Mejor Informacin, comportamientos y predicciones
Cell Phone Churners

vs. Loyal Customers


Segment #3:
IF CUST_MO > 7 AND
INCOME > $175K, THEN
Prediction = Cell Phone
Churner, Confidence =
83%, Support = 6/39

Comportamiento
s & Prediccin
Segment #1:
IF CUST_MO > 14 AND
INCOME < $90K, THEN
Prediction = Cell Phone
Churner, Confidence =
100%, Support = 8/39

Customer Months
Source: Inspired from Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management by Michael J. A. Berry, Gordon S. Linoff

In-Database Data Mining


Traditional Analytics

Oracle Data Mining

Resultados

Data Import
Data Mining
Model Scoring
Data Preparation
and
Transformation

Ahorros

Mas rpido de
Datos a Comportamientos
Menor TCOElimina
Movimiento de Datos
Duplicacin de Datos
Garantiza Seguridad

Data Mining
Model Building
Model Scoring
Los datos permanecen en la BD
Preparacin de datos embebida

Data Prep &


Transformation

Model Scoring
Embedded Data Prep

Data Extraction

Model Building
Data Preparation

Hours, Days or Weeks


Source
Data

SAS
Work
Area

SAS
Process
ing

Process
Output

Secs, Mins or Hours


Target

Algoritmos incluidos SQL kernel


de la Base de Datos
SQLEl mas poderoso lenguaje para
preparacin de datos
Los datos permanecen en la BD

Oracle Data Mining and OBIEE


Prediccin y Resultados de Probabilidad integrados en los informes

Oracles BI/Geospatial Platform


Visualizacin Geogrfica
de BI como just another
interactive chart type
Integracin Bidireccional
Visualiza y asocia
mltiples medidas en un
mapa.
Drill y Navegacin
dashboards desde
mapas

MapViewer
Geospatial
Interactive Mapping
Spatial Analysis
Optimized Spatial Data
Management

OBIEE
Business
Intelligence
Enterprise Business
Information Model
Optimized Data Access
Analytical
Capabilities

Oracle Fusion
Middleware

Oracle Spatial and OBIEE

Enriquezca BI con la visualizacin de mapas de datos espaciales Oracle


Habilite el anlisis de ubicacin en informes, alertas y notificaciones
Use mapas para guiar la navegacin de datos, el filtrado, y el drill-down
Incremente el retorno de inversin de datos geoespaciales y no espaciales

Ejemplos

Environmental Protection
Crime Analysis
Transportation Management

Municipal Services
Case Management
Citizen Services

Oracle Exadata Intelligent Warehouse


Para Industrias

Data Models
Business Intelligence
Exadata

Combine un profundo conocimiento del sector con experiencia en


bodega de datos
Ponga en marcha el diseo y la implementacin de bodegas de datos
Disponible para las verticales de Retail y Comunicaciones

Extreme Performance Data Warehousing


Soluciones Integradas
BI Applications
Una sola versin de la verdad
BI Tools
ELT Tools
Data Models

Fcil implementacin y manejo


Extremo desempeo
Cumple todos los
requerimientos de usuario final

Database
Smart Storage

Bajo costo total de propiedad

Oracle #1 para Data Warehousing

Source: IDC, July 2009 Worldwide Data Warehouse Management Tools 2008 Vendor Shares

Vous aimerez peut-être aussi