Vous êtes sur la page 1sur 38

ABB OPEX Basic Skills Development

Análisis de Datos

© ABB
Month DD, YYYY | Diapositiva 51
Objetivos del entrenamiento

 Aprender a aplicar e interpretar los resultados de técnicas de


análisis de datos estadísticos básicos
 Media, Mediana, Amplitud, Desvío Estándar
 Comprensión de la naturaleza de la variación y distribución
normal
 Ser capaz de utilizar herramientas básicas de visualización de
datos gráficos
 gráfico secuencial
 Histograma
 Box plot
 Comprender estratificación de datos

© ABB
Month DD, YYYY | Diapositiva 52
Estadística básica
Media
[16, 14, 12, 18, 9, 15]

 Media
(    ...  xn)
x   xi  x1 x2 x3
1 n
n i 1 n

© ABB
Month DD, YYYY | Diapositiva 53
Estadística básica: Medidas de tendencia central
Media
[16, 14, 12, 18, 9, 15] 9 12 141516 18

 Media 14
16  14  12  18  9  15
x  14
6

Importante:
La media es un valor representativo, debido a que es el centro de gravedad o
punto de equilibrio de un conjutno de observaciones
Es el “estándar” de la muestra

Importante:
La media aritemetica está afectada por los llamados valores extremos

© ABB
Month DD, YYYY | Diapositiva 54
Estadística básica: Medidas de tendencia central
Mediana
[16, 14, 12, 18, 9, 15]

• La Mediana es útil para describir el valor central de


un conjunto de datos si hubiere valores extremos

Para calcular la mediana, en primer lugar organice


sus valores de datos del menor al mayor
• Si N es ímpar, la mediana es el valor del
medio
• Si N es par, la mediana es la media de los dos
valores del medio.

© ABB
Month DD, YYYY | Diapositiva 55
Estadística básica
Mediana
[16, 14, 12, 18, 9, 15]

• N = 6 (par) 9 12 141516 18

( x3  x 4 ) 14,5
Median 
2

• Mediana = 14,5

© ABB
Month DD, YYYY | Diapositiva 56
Estadística básica
Mediana
[16, 14, 12, 18, 9]

• N = 5 (inpar) 9 12 14 16 18

• Mediana = 14 14

N+1
Tpos =
2

Importante:
La mediana está influenciada por el número de observaciones y
no por el valor de las observaciones

© ABB
Month DD, YYYY | Diapositiva 57
Estadística básica
Amplitud (Range)
 Diferencia entre la observación de mayor valor y la
de menor valor.

Ejemplo:
[16, 14, 12, 18, 9, 15]

• Amplitud = ¿?

• Se utiliza para tener una idea rápida del grado de


dispersión de un conjunto de datos.
• Es poco confiable

© ABB
Month DD, YYYY | Diapositiva 58
Estadística básica
Amplitud
[16, 14, 12, 18, 9, 15]

• Amplitud = 9 9 12 141516 18

máx – mín = 9

© ABB
Month DD, YYYY | Diapositiva 59
Estadística básica
Desviación Estándar
[16, 14, 12, 18, 9, 15]

• Desviación Estándar = ¿?

• Es una medida Confiable


• Tiene la misma unidad de medida de los datos
originales

© ABB
Month DD, YYYY | Diapositiva 510
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]

• Desvío Estándar =

n
 desvío estándar es la medida más común
de la dispersión estadística.
s = ∑ ε2i
i=1 n-1  El desvío estándar se define como la raíz
cuadrada de la variancia.
 Ԑ =(valor – media)

© ABB
Month DD, YYYY | Diapositiva 511
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]

• Desvío Estándar =
19 ε4
n 18

σ = ∑ ε2i 17 ε1
n-1 16 ε6
i=1 15 ε2
14
13
12
11 ε3
10
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 512
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]

• Desvío Estándar =
19 ε4
n 18

σ = ∑ ε2i 17 ε1
n-1 16 ε6
i=1 15 ε2
14
13
12
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 513
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]

• Desvío Estándar =
19 ε4
n 18

σ = ∑ ε2i 17 ε1
n-1 16 4 ε6
i=1 15
2 ε2 0 1
14
13 -2
12
-5
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 514
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]

• Desvío Estándar =
19 ε4
n 18

σ = ∑ ε2i 17 ε1
n-1 16 16 ε6
i=1 15
4 ε2 0 1
14
13 4
12
25
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 515
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]

• Desvío Estándar = 50/5


19 ε4
n 18

σ = ∑ ε2i 17 ε1
n-1 16 16 ε6
i=1 15
4 ε2 0 1
14
13 4
12
25
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 516
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]

• Desvío Estándar = 50/5 = 10


19 ε4
n 18

σ = ∑ ε2i 17 ε1
n-1 16 16 ε6
i=1 15
4 ε2 0 1
14
13 4
12
25
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 517
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]

• Desvío Estándar = 50/5 = 10 = 3,16


19 ε4
n 18

σ = ∑ ε2i 17 ε1
n-1 16 16 ε6
i=1 15
4 ε2 0 1
14
13 4
12
25
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 518
Gráfico Secuencial e Histograma
Medidas de temperatura ambiente
date room temperature [oC] date room temperature [oC]
1.5.2009 19,1 21.5.2009 21,7
2.5.2009 19,9 22.5.2009 17,0
3.5.2009 21,5 23.5.2009 18,7
4.5.2009 19,8 24.5.2009 18,7
5.5.2009 20,4 25.5.2009 22,4 Time Series Plot of room temperature
6.5.2009 22,4 26.5.2009 22,5 23
7.5.2009 18,1 27.5.2009 16,3
22
8.5.2009 20,0 28.5.2009 21,4
9.5.2009 20,2 29.5.2009 18,0
21

room temperature
10.5.2009 21,0 30.5.2009 20,6
11.5.2009 20,8 31.5.2009 17,3 20 20
12.5.2009 19,3 1.6.2009 19,2
13.5.2009 20,5 2.6.2009 20,4 19
14.5.2009 19,5 3.6.2009 20,7
18
15.5.2009 21,3 4.6.2009 19,4
16.5.2009 19,2 5.6.2009 20,6 17
17.5.2009 17,2 6.6.2009 18,4
18.5.2009 19,6 7.6.2009 17,8 16
19.5.2009 20,3 8.6.2009 19,5 4.5.2009 8.5.2009 12.5.2009 16.5.2009 20.5.2009 24.5.2009 28.5.2009 1.6.2009 5.6.2009 9.6.2009
date
20.5.2009 20,4 9.6.2009 22,9

 Este conjunto de datos fue utilizado Histogram of room temperature

para elaborar: 9

 gráfico secuencial 7

6
Frequency

 histograma 5

 Estos diagramas nos ayudan a 3

2
analizar los datos visualizándolos 1
en formas diferentes 0
16,0 17,6 19,2 20,8 22,4
room temperature

© ABB
Month DD, YYYY | Diapositiva 519
Gráfico temporal en serie para Histograma
Medidas de temperatura ambiente

Time Series Plot of room temperature


23

22,4
22

21
room temperature

20,8
20 20

19,2
19

18

17,6
17

16

16,0
4.5.2009 8.5.2009 12.5.2009 16.5.2009 20.5.2009 24.5.2009 28.5.2009 1.6.2009 5.6.2009 9.6.2009
date

0
La temperatura ambiente fue medida diariamente (40 veces) Los puntos son contados en
cada intervalo de datos menor

© ABB
Month DD, YYYY | Diapositiva 520
Gráfico temporal en serie para Histograma
Medidas de temperatura ambiente

22,4
20,8
19,2
17,6
16,0
9

0
© ABB
Month DD, YYYY | Diapositiva 521
Gráfico temporal en serie para Histograma
Medidas de temperatura ambiente

7
9

8
6
7

6
5
5

4
4
3

2
3 1

0
2 16,0 17,6 19,2 20,8 22,4

0
16,0 17,6 19,2 20,8 22,4

Medidas de temperatura en un histograma

© ABB
Month DD, YYYY | Diapositiva 522
Gráfico temporal en serie para Histograma
Medidas de temperatura ambiente

Histogram of room temperature


Normal
9

6
Frequency

0
16,0 17,6 19,2 20,8 22,4
room temperature

Este histograma es normalmente distribuido

© ABB
Month DD, YYYY | Diapositiva 523
Distribución Normal

 La mayoría de los fenómenos naturales y procesos efectuados por el


hombre siguen distribución normal. Es así como debería funcionar el
universo
 Puede haber Distribución No Normal en otros procesos del trabajo, o
en comparación a un límite

© ABB
Month DD, YYYY | Diapositiva 524
Distribución Normal

 Los conjuntos de datos de proceso que tienen distribución


normal indican un proceso bajo control, pero no
necesariamente un proceso capaz de atender las
especificaciones del cliente
 A – representa un proceso capaz de atender las
especificaciones del cliente
 B – representa un proceso que posee distribución normal,
pero no atiende las especificaciones del cliente

El mismo número de
B puntos indica cada

límite de especificación del


cliente

© ABB
Producción inaceptable
Month DD, YYYY | Diapositiva 525
Distribución Normal

La Distribución normal se puede describir por


 Media
 Desvío Estándar (σ)
media

4 3 2 1 1 2 3 4
68%
95,46%
99,73%
© ABB
Month DD, YYYY | Diapositiva 526
Fuentes de variación

La variación existe en cada sistema


Las principales fuentes de variación vienen de:
 proceso inadecuado (factores controlables, factores
no controlables)
 variación de material
 medición inadecuada

© ABB
Month DD, YYYY | Diapositiva 527
Visualización de datos gráficos
Gráfico secuencial
Evalúe estándares de datos de prueba de producto con un gráfico secuencial
 Al evaluar estándares en datos, se puede observar que el proceso
varía mucho en un período de tiempo
 Piense en las posibles razones para esto

Time Series Plot of Result

0,50

0,45

0,40
Result

0,35

0,30

0,25
1 11 22 33 44 55 66 77 88 99 110
Index

© ABB
Month DD, YYYY | Diapositiva 528
Visualización de datos gráficos
Histograma
Evalúe estándares de datos de prueba de producto con Histograma
 Al usar un Histograma para el conjunto de datos, se puede
observar que ellos no son distribuidos normalmente
 Parece haber dos grupos diferentes

Histogram of Result

20
non-normal distribution

15
Frequency

10

0
0,28 0,32 0,36 0,40 0,44 0,48 0,52
Result

© ABB
Month DD, YYYY | Diapositiva 529
Visualización de datos gráficos
Histograma/Estratificación
Evalúe estándares de datos de prueba de producto con Histograma
 Al dividir el conjunto de datos en dos categorías, se puede visualizar que hay
dos grupos diferentes que son distribuidos normalmente
 Esto es muy importante al considerar las actividades de mejoría del proceso

Histogram of Result Histogram of Result


group
20 20
two different groups
1
non-normal distribution 2

(both normally distributed)


15 15

Frequency
Frequency

10 10

5 5

0 0
0,28 0,32 0,36 0,40 0,44 0,48 0,52 0,28 0,32 0,36 0,40 0,44 0,48 0,52
Result Result

© ABB
Month DD, YYYY | Diapositiva 530
Visualización de datos gráficos
Gráfico Secuencial/Estratificación
Evalúe estándares de datos de prueba de producto con un gráfico secuencial
 Al dividir el conjunto de datos en dos categorías, se puede visualizar que hay dos
grupos diferentes proporcionando diferentes tipos de resultados
 Esto es muy importante al considerar las actividades de mejoría del proceso

Time Series Plot of Result Time Series Plot of Result


group
0,50 0,50 1
2

0,45 0,45

0,40 0,40
Result

Result
0,35 0,35

0,30 0,30

0,25 0,25
1 11 22 33 44 55 66 77 88 99 110 1 11 22 33 44 55 66 77 88 99 110
Index Index

© ABB
Month DD, YYYY | Diapositiva 531
Visualización de datos gráficos
Box Plot
 El Box Plot sumariza los conceptos de estadística (mediana, variación,
puntos fuera de la curva, tipo de distribución) de los datos dentro de la
“caja” y “líneas”.
 En los gráficos de cajas se presentan la mediana y los cuartiles,
permitiendo tener una idea de la dispersión de los datos.

*
Líneas representan el
rango de los datos
(cada línea representa un
25% de los datos)
Outlier – pequeña (o grande)
observación no usual

Box representa un 50% de los datos (línea del medio es la mediana)


Visualización de datos gráficos
Box Plot

 El Box Plot puede utilizarse cuando comparamos varios


subgrupos, que tienen como mínimo 25 puntos de datos.
 La diferencia estadística puede ser verificada dibujando
una línea en el medio de los grupos que queremos
comparar (ej. B y E son diferentes.
Proveedores diferentes para el producto x

*
Plazo de entrega [días]

**

A B C D E F
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Role model to employees

Building relationships with the client

Profit Center management


Box Plot
Strategy

Knowledge and Networking

Competence management

Motivation management

HSE manangement

Finance & Cost management

Information management

Material management

Contractor management

Facilities, tools and equipment

Partnership Reailzation

Maintenance Concept

Maintenance Operations

Plant Performance Improvement


Visualización de datos gráficos

Shutdown management
Global APS Benchmark figures

Client Satisfaction

Client Value

Competence and Motivation

Safety and Environment

Profitability

Effectiveness and Efficiency


0
100
200
300
400
500
600
700
800
900
1000

Total
Return to
Main Menu
Visualización de datos gráficos
Correlación
 Correlación, también denominada coeficiente de correlación,
indica la fuerza y la dirección de la relación lineal entre dos
variables aleatorias.
 Varios coeficientes son utilizados para situaciones diferentes.
Lo más conocido es el coeficiente de correlación de Pearson
(rango de +1 a -1).
 +1 = Significa una correlación perfecta positiva entre las dos variables
 0 = Significa que las dos variables no dependen linealmente una de la otra.
 -1 = Significa una correlación negativa perfecta entre las dos variables

 Calculation e.g. by using Microsoft Excel's Data Analysis Tool


Correlation
40
Correlación de Pearson = -0,8331
35

 Significante correlación lineal inversa


energy efficency [km/liter]

30
entre velocidad y km/litro
25

20

15
60 65 70 75 80

speed [kph] 0,06

0,055

engergy efficency [liter/km]


0,05

Correlación de Pearson = 0,7972 0,045

0,04

 Significante correlación lineal 0,035

directa entre velocidad y litros / km 0,03

0,025
60 65 70 75 80

speed [kph]

135

125

115
parameter 2

105
Correlación de Pearson = -0,1203
95  Correlación no lineal entre el parámetro 1 y
85 el parámetro 2.
75
85 90 95 100 105 110 115 120

parameter 1
Workshop 6
Box Plot

 Divídanse en pares.
 Piensen sobre la situación abajo (dispersión, media, mediana,
outliers) y escriban sus comentarios en una hoja.
 ¿Con cuál proveedor a usted le gustaría trabajar en el futuro y por
qué? (¿Cuál sería más fácil para mejorar?

Proveedores diferentes para el producto x

*
Plazo de entrega [días]

**

A B C D E F

Vous aimerez peut-être aussi