Académique Documents
Professionnel Documents
Culture Documents
Análisis de Datos
© ABB
Month DD, YYYY | Diapositiva 51
Objetivos del entrenamiento
© ABB
Month DD, YYYY | Diapositiva 52
Estadística básica
Media
[16, 14, 12, 18, 9, 15]
Media
( ... xn)
x xi x1 x2 x3
1 n
n i 1 n
© ABB
Month DD, YYYY | Diapositiva 53
Estadística básica: Medidas de tendencia central
Media
[16, 14, 12, 18, 9, 15] 9 12 141516 18
Media 14
16 14 12 18 9 15
x 14
6
Importante:
La media es un valor representativo, debido a que es el centro de gravedad o
punto de equilibrio de un conjutno de observaciones
Es el “estándar” de la muestra
Importante:
La media aritemetica está afectada por los llamados valores extremos
© ABB
Month DD, YYYY | Diapositiva 54
Estadística básica: Medidas de tendencia central
Mediana
[16, 14, 12, 18, 9, 15]
© ABB
Month DD, YYYY | Diapositiva 55
Estadística básica
Mediana
[16, 14, 12, 18, 9, 15]
• N = 6 (par) 9 12 141516 18
( x3 x 4 ) 14,5
Median
2
• Mediana = 14,5
© ABB
Month DD, YYYY | Diapositiva 56
Estadística básica
Mediana
[16, 14, 12, 18, 9]
• N = 5 (inpar) 9 12 14 16 18
• Mediana = 14 14
N+1
Tpos =
2
Importante:
La mediana está influenciada por el número de observaciones y
no por el valor de las observaciones
© ABB
Month DD, YYYY | Diapositiva 57
Estadística básica
Amplitud (Range)
Diferencia entre la observación de mayor valor y la
de menor valor.
Ejemplo:
[16, 14, 12, 18, 9, 15]
• Amplitud = ¿?
© ABB
Month DD, YYYY | Diapositiva 58
Estadística básica
Amplitud
[16, 14, 12, 18, 9, 15]
• Amplitud = 9 9 12 141516 18
máx – mín = 9
© ABB
Month DD, YYYY | Diapositiva 59
Estadística básica
Desviación Estándar
[16, 14, 12, 18, 9, 15]
• Desviación Estándar = ¿?
© ABB
Month DD, YYYY | Diapositiva 510
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]
• Desvío Estándar =
n
desvío estándar es la medida más común
de la dispersión estadística.
s = ∑ ε2i
i=1 n-1 El desvío estándar se define como la raíz
cuadrada de la variancia.
Ԑ =(valor – media)
© ABB
Month DD, YYYY | Diapositiva 511
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]
• Desvío Estándar =
19 ε4
n 18
σ = ∑ ε2i 17 ε1
n-1 16 ε6
i=1 15 ε2
14
13
12
11 ε3
10
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 512
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]
• Desvío Estándar =
19 ε4
n 18
σ = ∑ ε2i 17 ε1
n-1 16 ε6
i=1 15 ε2
14
13
12
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 513
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]
• Desvío Estándar =
19 ε4
n 18
σ = ∑ ε2i 17 ε1
n-1 16 4 ε6
i=1 15
2 ε2 0 1
14
13 -2
12
-5
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 514
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]
• Desvío Estándar =
19 ε4
n 18
σ = ∑ ε2i 17 ε1
n-1 16 16 ε6
i=1 15
4 ε2 0 1
14
13 4
12
25
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 515
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]
σ = ∑ ε2i 17 ε1
n-1 16 16 ε6
i=1 15
4 ε2 0 1
14
13 4
12
25
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 516
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]
σ = ∑ ε2i 17 ε1
n-1 16 16 ε6
i=1 15
4 ε2 0 1
14
13 4
12
25
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 517
Estadística básica
Desvío Estándar
[16, 14, 12, 18, 9, 15]
σ = ∑ ε2i 17 ε1
n-1 16 16 ε6
i=1 15
4 ε2 0 1
14
13 4
12
25
11 ε3
10 Media = 14
9
8 ε5
7
1 2 3 4 5 6
© ABB
Month DD, YYYY | Diapositiva 518
Gráfico Secuencial e Histograma
Medidas de temperatura ambiente
date room temperature [oC] date room temperature [oC]
1.5.2009 19,1 21.5.2009 21,7
2.5.2009 19,9 22.5.2009 17,0
3.5.2009 21,5 23.5.2009 18,7
4.5.2009 19,8 24.5.2009 18,7
5.5.2009 20,4 25.5.2009 22,4 Time Series Plot of room temperature
6.5.2009 22,4 26.5.2009 22,5 23
7.5.2009 18,1 27.5.2009 16,3
22
8.5.2009 20,0 28.5.2009 21,4
9.5.2009 20,2 29.5.2009 18,0
21
room temperature
10.5.2009 21,0 30.5.2009 20,6
11.5.2009 20,8 31.5.2009 17,3 20 20
12.5.2009 19,3 1.6.2009 19,2
13.5.2009 20,5 2.6.2009 20,4 19
14.5.2009 19,5 3.6.2009 20,7
18
15.5.2009 21,3 4.6.2009 19,4
16.5.2009 19,2 5.6.2009 20,6 17
17.5.2009 17,2 6.6.2009 18,4
18.5.2009 19,6 7.6.2009 17,8 16
19.5.2009 20,3 8.6.2009 19,5 4.5.2009 8.5.2009 12.5.2009 16.5.2009 20.5.2009 24.5.2009 28.5.2009 1.6.2009 5.6.2009 9.6.2009
date
20.5.2009 20,4 9.6.2009 22,9
para elaborar: 9
gráfico secuencial 7
6
Frequency
histograma 5
2
analizar los datos visualizándolos 1
en formas diferentes 0
16,0 17,6 19,2 20,8 22,4
room temperature
© ABB
Month DD, YYYY | Diapositiva 519
Gráfico temporal en serie para Histograma
Medidas de temperatura ambiente
22,4
22
21
room temperature
20,8
20 20
19,2
19
18
17,6
17
16
16,0
4.5.2009 8.5.2009 12.5.2009 16.5.2009 20.5.2009 24.5.2009 28.5.2009 1.6.2009 5.6.2009 9.6.2009
date
0
La temperatura ambiente fue medida diariamente (40 veces) Los puntos son contados en
cada intervalo de datos menor
© ABB
Month DD, YYYY | Diapositiva 520
Gráfico temporal en serie para Histograma
Medidas de temperatura ambiente
22,4
20,8
19,2
17,6
16,0
9
0
© ABB
Month DD, YYYY | Diapositiva 521
Gráfico temporal en serie para Histograma
Medidas de temperatura ambiente
7
9
8
6
7
6
5
5
4
4
3
2
3 1
0
2 16,0 17,6 19,2 20,8 22,4
0
16,0 17,6 19,2 20,8 22,4
© ABB
Month DD, YYYY | Diapositiva 522
Gráfico temporal en serie para Histograma
Medidas de temperatura ambiente
6
Frequency
0
16,0 17,6 19,2 20,8 22,4
room temperature
© ABB
Month DD, YYYY | Diapositiva 523
Distribución Normal
© ABB
Month DD, YYYY | Diapositiva 524
Distribución Normal
El mismo número de
B puntos indica cada
© ABB
Producción inaceptable
Month DD, YYYY | Diapositiva 525
Distribución Normal
2σ
3σ
4 3 2 1 1 2 3 4
68%
95,46%
99,73%
© ABB
Month DD, YYYY | Diapositiva 526
Fuentes de variación
© ABB
Month DD, YYYY | Diapositiva 527
Visualización de datos gráficos
Gráfico secuencial
Evalúe estándares de datos de prueba de producto con un gráfico secuencial
Al evaluar estándares en datos, se puede observar que el proceso
varía mucho en un período de tiempo
Piense en las posibles razones para esto
0,50
0,45
0,40
Result
0,35
0,30
0,25
1 11 22 33 44 55 66 77 88 99 110
Index
© ABB
Month DD, YYYY | Diapositiva 528
Visualización de datos gráficos
Histograma
Evalúe estándares de datos de prueba de producto con Histograma
Al usar un Histograma para el conjunto de datos, se puede
observar que ellos no son distribuidos normalmente
Parece haber dos grupos diferentes
Histogram of Result
20
non-normal distribution
15
Frequency
10
0
0,28 0,32 0,36 0,40 0,44 0,48 0,52
Result
© ABB
Month DD, YYYY | Diapositiva 529
Visualización de datos gráficos
Histograma/Estratificación
Evalúe estándares de datos de prueba de producto con Histograma
Al dividir el conjunto de datos en dos categorías, se puede visualizar que hay
dos grupos diferentes que son distribuidos normalmente
Esto es muy importante al considerar las actividades de mejoría del proceso
Frequency
Frequency
10 10
5 5
0 0
0,28 0,32 0,36 0,40 0,44 0,48 0,52 0,28 0,32 0,36 0,40 0,44 0,48 0,52
Result Result
© ABB
Month DD, YYYY | Diapositiva 530
Visualización de datos gráficos
Gráfico Secuencial/Estratificación
Evalúe estándares de datos de prueba de producto con un gráfico secuencial
Al dividir el conjunto de datos en dos categorías, se puede visualizar que hay dos
grupos diferentes proporcionando diferentes tipos de resultados
Esto es muy importante al considerar las actividades de mejoría del proceso
0,45 0,45
0,40 0,40
Result
Result
0,35 0,35
0,30 0,30
0,25 0,25
1 11 22 33 44 55 66 77 88 99 110 1 11 22 33 44 55 66 77 88 99 110
Index Index
© ABB
Month DD, YYYY | Diapositiva 531
Visualización de datos gráficos
Box Plot
El Box Plot sumariza los conceptos de estadística (mediana, variación,
puntos fuera de la curva, tipo de distribución) de los datos dentro de la
“caja” y “líneas”.
En los gráficos de cajas se presentan la mediana y los cuartiles,
permitiendo tener una idea de la dispersión de los datos.
*
Líneas representan el
rango de los datos
(cada línea representa un
25% de los datos)
Outlier – pequeña (o grande)
observación no usual
*
Plazo de entrega [días]
**
A B C D E F
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Role model to employees
Competence management
Motivation management
HSE manangement
Information management
Material management
Contractor management
Partnership Reailzation
Maintenance Concept
Maintenance Operations
Shutdown management
Global APS Benchmark figures
Client Satisfaction
Client Value
Profitability
Total
Return to
Main Menu
Visualización de datos gráficos
Correlación
Correlación, también denominada coeficiente de correlación,
indica la fuerza y la dirección de la relación lineal entre dos
variables aleatorias.
Varios coeficientes son utilizados para situaciones diferentes.
Lo más conocido es el coeficiente de correlación de Pearson
(rango de +1 a -1).
+1 = Significa una correlación perfecta positiva entre las dos variables
0 = Significa que las dos variables no dependen linealmente una de la otra.
-1 = Significa una correlación negativa perfecta entre las dos variables
30
entre velocidad y km/litro
25
20
15
60 65 70 75 80
0,055
0,04
0,025
60 65 70 75 80
speed [kph]
135
125
115
parameter 2
105
Correlación de Pearson = -0,1203
95 Correlación no lineal entre el parámetro 1 y
85 el parámetro 2.
75
85 90 95 100 105 110 115 120
parameter 1
Workshop 6
Box Plot
Divídanse en pares.
Piensen sobre la situación abajo (dispersión, media, mediana,
outliers) y escriban sus comentarios en una hoja.
¿Con cuál proveedor a usted le gustaría trabajar en el futuro y por
qué? (¿Cuál sería más fácil para mejorar?
*
Plazo de entrega [días]
**
A B C D E F