Vous êtes sur la page 1sur 40

20130101 ANÁLISIS BLANCOS FLINT

NIT 860048626 - 8

INTEGRANTES
Camilo Peña Mahecha- 53481
Laura Tatiana Fajardo Gómez- 62840
Natali Osorio Tangarife- 50080
Manuel Felipe Reyes Rengifo- 63647

DOCENTE
Ing. Msc. Carlos Alberto Castiblanco Vargas

BOGOTÁ, D.C – 2018

1
Contenido
1. INTRODUCCION....................................................................................................................3
2. OBJETIVO...............................................................................................................................3
3. VISCOSIDAD INICIAL..............................................................................................................4
3.1 Estadística Descriptiva................................................................................................4
3.2 Análisis..........................................................................................................................5
3.3 Histograma...................................................................................................................6
3.4 Polígono de frecuencias...............................................................................................7
3.5 Distribución acumulada menor que..........................................................................8
3.6 Distribución acumulada mayor que..........................................................................9
3.7 Análisis........................................................................................................................10
3.8 Box plot.......................................................................................................................11
3.9 Análisis........................................................................................................................12
3.10 Teorema de chevyshev..............................................................................................13
3.11 Análisis......................................................................................................................13
3.12 Box plot de la mayor frecuencia de datos..............................................................17
3.13 Teorema de chevyshev de la mayor frecuencia de datos.........................................18
3.14 Teorema de chevyshev de la mayor frecuencia de datos.........................................23
3.15 Análisis......................................................................................................................23
3.16 Regresión lineal........................................................................................................24
3.17 Análisis......................................................................................................................24
4. CUBRIMIENTO....................................................................................................................25
4.1 Histograma............................................................................................................25
4.2 Conversión de variable Poliatómica a Dicotómica..............................................27
4.3 Distribución acumulada menor que........................................................................28
4.4 Distribución acumulada mayor que........................................................................29
5. DIAS DE REPOSO................................................................................................................30
5.1 Análisis..................................................................................................................30
5.2 Histograma............................................................................................................31
5.3 Polígono de frecuencias........................................................................................32
5.4 Distribución acumulada menor que........................................................................33
5.5 Distribución acumulada mayor que...................................................................34

2
5.6 Análisis..................................................................................................................35
5.7 Box plot..................................................................................................................36
5.8 Análisis.......................................................................................................................37
5.9 Teorema de chevyshev................................................................................................37
5.10 Análisis......................................................................................................................37
6. BRILLO..................................................................................................................................37
6.1 Histograma............................................................................................................38
6.2 Distribución media de brillo................................................................................40
6.3 Distribución acumulada menor que...................................................................41
6.4 Distribución acumulada mayor que...................................................................41
6.5 Box Plot..................................................................................................................42
6.6 Teorema de chebyshev.........................................................................................43
6.7 Estadística de la regresión.....................................................................................43

1. INTRODUCCION
Minipak es una empresa dedicada al diseño y fabricación de flexo empaque.
Entre sus principales proveedores se encuentra Flint Group, los cuales proporcionan tintas
de color blanco, de cada lote de tinta se extrae una muestra de 100 g, la cual es expuesta a
diferentes pruebas para evaluar sus propiedades y aprobarla para ser usarla.

2. OBJETIVO
Caracterizar las propiedades de las tintas blancas, para determinar relación entre estas y
lograr mejores procedimientos de calidad, utilizando viscosidad, brillo reflejado,
cubrimiento y días de reposo.
Nombre: Viscosidad Inicial; Tipo: Cuantitativa continua; Escala de medición: Razón o
Proporción
Nombre: Medición de brillo Reflejado; Tipo: Cuantitativa continua; Escala de Medición:
Razón o Proporción
Nombre: Cubrimiento; Tipo: Cualitativa poliatómica; Escala de Medición: Ordinal
Nombre: Dias de Reposo Tipo: Cuantativa discreta; Escala de Medición: ordinal

3
3. VISCOSIDAD INICIAL
La viscosidad es una propiedad física que se mide a las tintas para determina la resistencia a
la fluidez. Esta propiedad se mide por medio de 2 instrumentos, la copa zhan#2 y un
cronometro. La medición consiste en llenar la copa zhan#2 y cronometrar el tiempo en que
la tinta deja de fluir constantemente.
3.1 Estadística Descriptiva

Por medio del software Excel determinamos los valores de la estadística descriptiva, los
cuales se muestran en la siguiente tabla.

viscosidad inicial
   
49,840234
Media 4
0,5264680
Error típico 2
Mediana 49,52
Moda 47,15
5,9563056
Desviación estándar 6
35,477577
Varianza de la muestra 1
0,2089390
Curtosis 1
De esta tabla tendremos Coeficiente de 0,2711998 en cuenta los datos más
representativos para asimetría 5 nuestro análisis, que son:
 Media: Es el Rango 29,36 promedio de la variable,
nos muestra el Mínimo 38,15 valor característico entre
todos los datos Máximo 67,51 tomados.
 Desviación Suma 6379,55 estándar: Es el índice
que nos muestra Cuenta 128 que tan dispersos están
los datos del Mayor (1) 67,51 promedio de la variable.
 Curtosis: Nos Menor (1) 38,15 muestra la característica
que tendrá la 0,1195079 distribución de los datos.
 Coeficiente de CV 8 variación: es la relación
entre la desviación estándar y el promedio.

3.2 Análisis
En esta variable se puede observar que la media, moda y mediana son muy cercanos, lo que
nos indica que los datos de la variable son bastante comunes entre sí.

4
La curtosis de la variable es positiva lo que nos indica que la mayor cantidad de datos se
organizan en intervalos más bajos.
Como el coeficiente de variación nos da un numero menos a 1, podemos decir que la
variable es homogénea la mayor parte de sus datos se encuentran entre los mismos valores.
Como el valor de la desviación estándar es bajo podemos decir que el promedio de la
variable es confiable.

3.3 Histograma

Es la representación gráfica de la distribución de los datos. Después de calcular datos


como:
 Rango: Es la diferencia entre el valor máximo y mínimo de la variable.
 Numero de intervalos: Es la cantidad de intervalos que satisface la variable, es
decir, en número de intervalos en que entran todos los datos de la variable.
 Longitud de intervalos: Es el valor que define el tamaño de los intervalos, para
obtener el número de intervalos deseados. Este valor se debe aproximar para poder
dar una holgura y asegurar que no van a quedar datos por fuera de los intervalos.

I
APROXIMAD TOLERANCI TOLERANCIA
R K I A R* A MINIMA
29,36 7,0 4,2 4,25 29,75 0,39 0,195

Con estos datos se determinan los intervalos de clase con los cuales se puede determinar el
histograma.

INTERVALOS DE CLASE
37,955 42,205
42,205 46,455
46,455 50,705
50,705 54,955
54,955 59,205
59,205 63,455
63,455 67,705

5
Distribucion de viscosidad inicial
40 1.2
36
35
31 0.98 1 1
30 0.93
F r e c u e n c ia

0.8 0.8
25 Frecuencia
22
% acumulado
20 0.6
0.56 16
15 13
0.4
10 0.28 7
0.2
5
0.1 2
0 0
42.21 46.46 50.71 54.96 59.21 63.46 67.71

El histograma nos muestra la distribución de los datos además de mostrarnos de forma


gráfica en que intervalo se ubican la media, moda y mediana. También nos muestra la
curtosis y el porcentaje acumulado de la variable.

intervalos de viscosidad Frecuenci %


inicial a acumulado
42,205 13 10,24%
46,455 22 27,56%
50,705 36 55,91%
54,955 31 80,31%
59,205 16 92,91%
63,455 7 98,43%
67,705 2 100,00%

3.4 Polígono de frecuencias

El polígono de frecuencia se lleva a cabo con las marcas de clase, las cuales son el
promedio de cada intervalo. Este grafico nos muestra el punto máximo de cada intervalo
respecto a su frecuencia.

Distribución media de viscosidad inicial


0 0
40,08 13
44,33 22
48,58 36
52,83 31
57,08 16
61,33 7
65,58 2

6
Distribucion media de viscosidad inicial
12

0
2 3 4 5 6 7 8 9 10 11

3.5 Distribución acumulada menor que

Es la suma de las distribuciones de frecuencias de cada uno de los intervalos de la variabl


intervalos de viscosidad Distribución acumulada
inicial menor que
37,955 0
42,205 13
46,455 35
50,705 71
54,955 102
59,205 118
63,455 125
67,705 127

Distribucion acumulada viscosidad inicial menor que


140

120 125 127


118
100
102

80

71
60

40
35
20

13
0
37 0 42 47 52 57 62 67 72

7
3.6 Distribución acumulada mayor que

Es la resta de las distribuciones de frecuencias de cada uno de los intervalos de la variable

intervalos de viscosidad Distribución acumulada


inicial mayor que
37,955 127
42,205 114
46,455 92
50,705 56
54,955 25
59,205 9
63,455 2
67,705 0

140
Distribucion acumulada viscosidad inicial mayor que

120 127

114
100

92
80

60
56
40

20 25

0 9
37 42 47 52 57 62 2 67 0 72

3.7 Análisis

El histograma muestra de forma clara que el promedio de la variable se encuentra en el


intervalo numero 3 dando a entender que la mayor cantidad se encuentra en el lado
izquierdo del histograma, confirmado lo que el valor de la curtosis nos indicó en la
estadística descriptiva, que la variable posee un sesgo positivo.
El polígono de frecuencias nos muestra cuales son los valores promedios de cada intervalo,
es decir en valor que caracteriza cada intervalo.

8
Las distribuciones acumuladas menor que y mayor que nos muestra gráficamente el numero
de datos en el que se encuentra un valor dado.

3.8 Box plot

Para la interpretación de este tipo de gráfico, primero obtenemos la media de cada


intervalo, y luego la mediana de la tabla de frecuencias en general. Con estos datos
utilizamos la fórmula de la media de cada intervalo elevado a la mediana. Los datos
obtenidos en esta fórmula son la interpretación.

L1 L2 L3
32,25 64,5 96,75
32(45,98) y 64(49,37) Y 96(53,79) Y
Posiciones 33(45,99) 65(49,67) 97(54,06)
diferencia
posiciones 0,01 0,3 0,27

Teniendo estos datos se hallan los cuartiles para poder llevar a cabo la construcción de la
caja de bigotes.
Q1 Q2 Q3
45,9899 49,571 53,8062
4,2352
3,5811
     
   
7,8399     13,70
X1= 38,15     X128= 67,51
     

7,8163
Después de tener los determinar los 3 cuartiles de la variable, se construye la caja de
bigotes con sus respectivas acotaciones.

Luego se determina si existen valores atípicos en la variable

9
Valores atípicos en la
variable
V.A< = 34,26545
V.A> = 65,53065

3.9 Análisis

El box plot nos muestra la mediana en el cuartil 2, también nos muestra la diferencia de
entre los datos, desde el menor dato y el cuartil 1 , como la diferencia entre el cuartil 3 y el
último dato, también nos muestra el rango cuartilico, que es la diferencia entre el cuartil 1 y
el cuartil 3.
Además por medio del box plot se puede evidenciar que no existen valores atípicos hacia el
límite inferior del box plot. Pero si existen valores atípicos en el limite superior de la caja
de bigotes.

3.10 Teorema de chevyshev

proporciona un intervalo de confianza donde se pueden encontrar la mayor cantidad de


datos cercanos al promedio.
Media- K*desviación
Estándar= 37,93
Media+ K*desviación
Estándar= 61,75
Para esta variable se tomó el valor de K igual a 2.

3.11 Análisis

Después de realizar el teorema de chevyshev se puede evidenciar que gracias al valor de


K=2 se garantiza que mínimo el 75% de los datos están ubicados en el intervalo obtenido
por el teorema de chevyshev. El intervalo es el siguiente: [37,93 ; 61,75].

Después de realizar estos análisis estadísticos, se tomo la decisión de separar las variables
para poder tener mayor veracidad de los datos obtenidos en los análisis estadísticos, se
separaron la mayor frecuencia de datos de la menor frecuencia de datos. Se presentan los
datos y graficas obtenidos para la separación de la variable.

10
Estadística Descriptiva de la mayor frecuencia de datos

viscosidad inicial

Media 47,7412621
Error típico 0,43047965
Mediana 48,01
Moda 47,15
Desviación estándar 4,36889129
Varianza de la muestra 19,0872111
Curtosis -0,82572527
Coeficiente de asimetría -0,32189353
Rango 16,48
Mínimo 38,15
Máximo 54,63
Suma 4917,35
Cuenta 103
Mayor (1) 54,63
Menor(1) 38,15
Nivel de
confianza(95,0%) 0,85385435
Histograma de la mayor frecuencia de datos
I TOLERANCIA
R K I APROXIMADA R* TOLERANCIA MINIMA
16,48 7,0 2,4 2,45 17,15 0,67 0,335

INTERVALOS DE
CLASE
37,815 40,265
40,265 42,715
42,715 45,165
45,165 47,615
47,615 50,065
50,065 52,515
52,515 54,965

11
Distribucion de viscosidad inicial
25 120.00%
23

100.00%
100.00%
20 19
18
F r e c u e n c ia

84.47%
16 80.00%
15 14 Frecuencia
66.02% % acumulado
60.00%
10 48.54%
7 40.00%
6
5 26.21%
19.42% 20.00%

5.83%
0 0.00%
40.27 42.72 45.17 47.62 50.07 52.52 54.97

%
viscosidad Frecuenci acumulad
inicial a o
40,265 6 5,83%
42,715 14 19,42%
45,165 7 26,21%
47,615 23 48,54%
50,065 18 66,02%
52,515 19 84,47%
54,965 16 100,00%

Polígono de frecuencias de la mayor frecuencia de datos


Distribucion media de viscosidad inicial
Distribucion media de viscosidad inicial
0 0
39,04 6
41,49 14
43,94 7
46,39 23
48,84 18
51,29 19
53,74 16

12
Distribucion media de viscosidad inicial
12

10

0
2 3 4 5 6 7 8 9 10 11

Distribución acumulada menor que de la mayor frecuencia de datos

intervalos de Distribucion
viscosidad inicial acumulada menor que
37,815 0
40,265 6
42,715 20
45,165 27
47,615 50
50,065 68
52,515 87
54,965 103

Distribucion acumulada menor que


120

103
100

87
80

68
60
50
40

27
20 20

6
0 0
37.5 39.5 41.5 43.5 45.5 47.5 49.5 51.5 53.5 55.5 57.5

Distribución acumulada mayor que de la mayor frecuencia de datos

13
intervalos de viscosidad Distribucion acumulada
inicial mayor que
37,815 103
40,265 97
42,715 83
45,165 76
47,615 53
50,065 35
52,515 16
54,965 0

Distribucion acumulada mayor que


120

103
100
97

83
80
76

60
53

40
35

20
16

0 0
37.5 39.5 41.5 43.5 45.5 47.5 49.5 51.5 53.5 55.5 57.5

3.12 Box plot de la mayor frecuencia de datos

Este tipo de cálculos se realizaron de forma rápida y sencilla con el software Excel

Q1 Q2 Q3

45,12 48,01 51,54


2,89
3,53
     
   
6,97     3,09
X1= 38,15     X128= 54,63
     

6,42

14
Luego se determina si existen valores atípicos en la variable
Valores atípicos en la
variable
V.A< = 35,49
V.A> = 61,17

3.13 Teorema de chevyshev de la mayor frecuencia de datos

proporciona un intervalo de confianza donde se pueden encontrar la mayor cantidad de


datos cercanos al promedio.
Media- K*desviación
Estándar= 39,00
Media+ K*desviación
Estándar= 56,48
Para esta variable se tomó el valor de K igual a 2.

Estadística Descriptiva de la mayor frecuencia de datos

viscosidad inicial

Media 58,488
0,6263319
Error típico 1
Mediana 58,26
Moda 55,41
3,1316595
Desviación estándar 7
9,8072916
Varianza de la muestra 7
1,3523611
Curtosis 6
Coeficiente de 1,1604566
asimetría 5
Rango 12,38
Mínimo 55,13
Máximo 67,51
Suma 1462,2
Cuenta 25
Mayor (1) 67,51
Menor (1) 55,13

15
Nivel de confianza 1,2926855
(95,0%) 4
Coeficiente de 0,0535436
variación 3

Histograma de la mayor frecuencia de datos


I
APROXIMA TOLERANC TOLERANC
R K I DA R* IA IA MINIMA
12,38 5,0 2,5 2,52 12,6 0,22 0,11

%
viscosidad Frecuenci acumulad
inicial a o
57,54 12 48,00%
60,06 6 72,00%
62,58 5 92,00%
65,1 1 96,00%
67,62 1 100,00%

16
INTERVALOS DE
CLASE
55,02 57,54
57,54 60,06
60,06 62,58
62,58 65,1
65,1 67,62

Distribucion de viscosidad inicial


14 120.00%
12
12 100.00%
100.00%
96.00%
92.00%
10
F r e c u e n cia

80.00%
72.00% Frecuencia
8
% acumulado
60.00%
6
6
48.00% 5
40.00%
4

2 20.00%
1 1

0 0.00%
57.54 60.06 62.58 65.1 67.62

Polígono de frecuencias de la mayor frecuencia de datos


Distribución media de
viscosidad inicial
Distribución media de
viscosidad inicial
0 0
56,28 12
58,8 6
61,32 5
63,84 1
66,36 1

17
Distribucion media de viscosidad inicial
12

10

0
2 3 4 5 6 7 8 9 10 11

Distribución acumulada menor que de la mayor frecuencia de datos

intervalos Distribució
de n
viscosida acumulada
d inicial menor que
55,02 0
57,54 12
60,06 18
62,58 23
65,1 24
67,62 25

Distribucion acumulada menor que


30

25 25
24
23

20
18

15

12
10

0 0
55 57 59 61 63 65 67 69

Distribución acumulada mayor que de la mayor frecuencia de datos

18
intervalos Distribucio
de n
viscosida acumulada
d inicial mayor que
55,02 25
57,54 13
60,06 7
62,58 2
65,1 1
67,62 0

Distribucion acumulada mayor que


30

25 25

20

15
13

10

7
5

2
1
0 0
55 57 59 61 63 65 67 69

Box plot de la mayor frecuencia de datos

Q1 Q2 Q3
55,855 58,26 60,64

2,405 2,38
     
   
0,725     6,87
X1= 55,13     X128= 67,51
     

4,785

19
Valores atípicos en la
variable
V.A< = 48,6775
V.A> = 67,8175

3.14 Teorema de chevyshev de la mayor frecuencia de datos


Utilizaremos K=2 para garantizar que por lo menos el 75% de los datos se encuentre en
el intervalo.
media-
K*desviación
= 52,22
media+
K*desviación
= 64,75

3.15 Análisis

Después de realizar la separación de la variable en su mayor frecuencia y menos frecuencia


se puede determinar que la variable original entragaba datos confiables, ya que el
promedio, mediana y moda de la variable original y el promedio, mediana, moda de la
mayor frecuencia de datos son datos muy cercanos, lo que nos dice que entre la mayor
cantidad de datos existe una cercanía.
Por otro lado esta separación nos mostró de forma clara que existen datos atípicos en los
mayores, más alto y al separar la variable, pudimos dar por alto estos datos atípicos para
confirmar los datos de la variable original.
3.16 Regresión lineal

20
Para llevar a cabo el análisis de regresión lineal, nos preguntamos si existe alguna relación
entre la viscosidad inicial y el brillo de una tinta. Para ello tomamos la viscosidad como la
variable dependiente y el brillo como la variable independiente.

Estadísticas de la regresión
Coeficiente de correlación 0,86010762
múltiple 8
Coeficiente de determinación 0,73978513
R^2 2
0,73771993
R^2 ajustado 5
3,05041984
Error típico 6
Observaciones 128

Curva de regresión ajustada


70
f(x) = 0.98 x + 21.65
65 R² = 0.74
visco sid ad in icial

60

55
viscosidad inicial
50 Linear (viscosidad

45

40

35
20 25 30 35 40 45 50
BRILLO

21
Analisis

3.17 Análisis

De la gráfica de regresión lineal podemos asegurar que las variables son directamente
proporcionales, ya que la mayor cantidad de puntos de las variables se ubican en el
cuadrante 1 y 3.(estos cuadrantes son determinados con los promedios de las variables).
Tambien podemos decir que las varibles tienen mucha compatibilidad ya que su coeficiente
de correlación es del 86%, y como su coeficiente de determinación es del 73% podemos
decir que el brillo explica de muy buena forma la relación que tiene con la viscosidad
inicial.
4. CUBRIMIENTO
El cubrimiento es una propiedad que se le mide a las muestras sobre una superficie. Esta
propiedad se mide por medio de 3 categorías (MENOR – IGUAL - MAYOR). La medición
consiste en el cubrimiento que cumple la muestra sobre una superficie y va determinado
con respecto al cubrimiento estándar.

El cubrimiento se mide con un microgloss, realizando barridos en una máxima llamada RK,
el cubrimiento es la forma en que se adhiere la tinta en el que el sustrato (polímeros en los
que se imprime).

4.1 Histograma

22
Es la representación gráfica de la distribución de los datos. Después de calcular datos
como:
Frecuenci Frecuencia %
Cubrimiento a relativa % Acumulado
IGUAL 59 0,4609375 46,09% 46,09%
MAYOR 27 0,2109375 21,09% 67,19%
MENOR 42 0,328125 32,81% 100,00%
 Cubrimiento: Es la categoría en las que se distribuyen el cubrimiento de las
muestras.
 Frecuencia: Es la cantidad de muestras que se repite por cada categoría.
 Frecuencia relativa: Es la proporción de veces que se repite la categoría en el total
de las Muestras.
De acuerdo con la tabla obtenida podemos determinar la moda y la mediana de los datos.

Media No aplica
Mediana MAYOR
Moda IGUAL

 Mediana: Se determina que el 50% de las muestras se encuentra entre un


cubrimiento IGUAL y MAYOR y el otro 50% restante se encuentra entre MAYOR
y MENOR, por lo que se determinar una mediana en un cubrimiento “MAYOR” al
estándar.
 Moda: Se determina que la Moda corresponde a la categoría con mayor frecuencia
dentro de los datos, por lo que corresponde a la categoría de las muestra con un
cubrimiento IGUAL al estándar.

23
Diagrama de Frecuencias
70

60
59

50
42
40

30 27

20

10

0
IGUAL MAYOR MENOR
CUBRIMIENTO

De acuerdo al grafico de barras simples mostrado se puede demostrar que de las 128
Muestras, 59 tienen un Cubrimiento Igual al STD, el cual es el más común, y con la menor
frecuencia tenemos que 27 Muestras tienen un cubrimiento Mayor al STD.

PROBABILIDAD
0.5
0.46

0.4
0.33
0.3

0.21
0.2

0.1

0
IGUAL MAYOR MENOR

De acuerdo el grafico de barras simples mostrado se puede demostrar que de las 128
muestras, hay un 46% de seleccionar un muestra que tienen un Cubrimiento Igual al STD,
el cual es el más común, y con el menor porcentaje tenemos que el 21% de muestras tienen
un cubrimiento Mayor al STD.

24
PORCENTAJE

MENOR
33%
IGUAL
IGUAL
46% MAYOR
MENOR

MAYOR
21%

Con este grafico complementamos lo demostrado en las gráficas anteriores, el cual


demuestra que el porcentaje mayor de las muestras tienen un cubrimiento Igual al STD
con un 46.09%, el cual es el más común, con el menor porcentaje tenemos a un 21.09% de
Muestras con un Cubrimiento Mayor al STD y por ultimo tenemos a un 32.81% de las
muestras con un Cubrimiento Menor al STD

4.2 Conversión de variable Poliatómica a Dicotómica

Debido a que la variable “Cubrimiento” es un variable Categórica Polinómica se decide


convertirla en una variable Dicotómica, con el fin de poder otros datos de análisis
estadísticos como lo es la proporción y la variación estándar.
Para la conversión de la variable Politómica a Dicotómica se decide tomar la categoría con
mayor frecuencia (IGUAL) y asignarle el valor “1” y a las demás el valor de “0”.
DICOTÓMIC
CUBRIMIENTO A
IGUAL 1
MAYOR 0
MENOR 0

Una vez realizada la conversión podemos calcular la proporción y la desviación estándar,


de acuerdo con los nuevos valores.

25
Proporción Categoría IGUAL
(P) 0,4609375
Proporción Complemento (Q) 0,5390625
Desviación Estándar 0,500430425

 P: Corresponde a la proporción que representa la categoría “IGUAL” con respecto


al total de datos.
 Q: Corresponde a la proporción que representa el resto de las muestras que no
cuentan con un cubrimiento “IGUAL” al estándar después de la conversión de la
variable a Dicotómica.
 Desviación Estándar: Determina la que tan dispersas están la muestras con
respecto a su nivel de cubrimiento. De acuerdo al valor obtenido se puede decir que
el grupo de muestras no tienen una gran dispersión con respecto al nivel de
cubrimiento.

4.3 Distribución acumulada menor que

Es la suma de las distribuciones de frecuencias de cada una de las categorías de la variable


Cubrimient Frecuencia
o Acumulada
IGUAL 59
MAYOR 86
MENOR 128

Frecuencia Acumulada menor que


140

130 128
120

110

100

90
86
80

70

60 59

50
1 2 3
CUBRIMIENTO

26
4.3 Distribución acumulada mayor que
4.4

Es la resta de las distribuciones de frecuencias de cada una de las categorías de la variable

Cubrimient Frecuencia
o Acumulada
IGUAL 128
MAYOR 69
MENOR 42

Frecuencia Acumulada mayor que


130 128

120

110

100

90

80

70 69
60

50

40 42
1 2 3
CUBRIMIENTO

Las distribuciones acumuladas menor que y mayor que nos muestra gráficamente el número
de datos en el que se encuentra una categoría dada.

27
5. DIAS DE REPOSO

Días de reposo
Media 2,453125
0,11466066
Error típico 8
Mediana 2
Moda 1
1,29723737
Desviación estándar 3
Varianza de la 1,68282480
muestra 3
-
0,58868688
Curtosis 5
Coeficiente de 0,62132619
asimetría 5
Rango 4
Mínimo 1
Máximo 5
Suma 314
Cuenta 128

De esta tabla tendremos en cuenta los días de reposo que tiene el brillo para nuestro
análisis, que son:
Media: Es el promedio de la variable, nos muestra el valor característico entre todos los
datos tomados.
Desviación estándar: Es el índice que nos muestra que tan dispersos están los datos del
promedio de la variable.
Curtosis: Nos muestra la característica que tendrá la distribución de los datos.
Coeficiente de variación: es la relación entre la desviación estándar y el promedio.

5.1 Análisis

En esta variable se puede observar que la media, moda y mediana son muy cercanos, lo que
nos indica que los datos de la variable son bastante comunes entre sí. Aunque la moda

28
La curtosis de la variable es positiva lo que nos indica que la mayor cantidad de datos se
organizan en intervalos mas bajos.
Como el coeficiente de variación nos da un numero menos a 1, podemos decir que la
variable es homogénea la mayor parte de sus datos se encuentran entre los mismos valores.
Como el valor de la desviación estándar es bajo podemos decir que el promedio de la
variable es confiable.

5.2 Histograma

I
APROXIMAD TOLERANCI TOLERANCIA
R K I A R* A MINIMA
4,00 7,0 0,6 0,6 4,2 0,20 0,1

Con estos datos se determinan los intervalos de clase con los cuales se puede determinar el
histograma.

INTERVALOS DE
  CLASE
0,9 1,5
1,5 2,1
2,1 2,7
2,7 3,3
3,3 3,9
3,9 4,5
4,5 5,1

Histograma
40 37 120.00%
35
35 32 100.00%
30
80.00%
Fre cue ncia

25
Frecuencia
20 60.00%
15 % acumulado
15
40.00%
10 9
20.00%
5
0 0
0 0.00%
1.5 2.1 2.7 3.3 3.9 4.5 5.1
INTERVALOS DE CLASE

29
El histograma nos muestra la distribución de los datos además de mostrarnos de forma
gráfica en que intervalo se ubican la media, moda y mediana. También nos muestra la
curtosis y el porcentaje acumulado de la variable.

INTERVALOS %
DE CLASE Frecuencia acumulado
1,5 37 28,91%
2,1 35 56,25%
2,7 0 56,25%
3,3 32 81,25%
3,9 0 81,25%
4,5 9 88,28%
5,1 15 100,00%
     

5.3 Polígono de frecuencias

El polígono de frecuencia se lleva a cabo con las marcas de clase, las cuales son el
promedio de cada intervalo. Este grafico nos muestra el punto máximo de cada intervalo
respecto a su frecuencia.
Distribución media días de
reposo

0 0
1,2 37
1,8 35
2,4 0
3 32
3,6 0
4,2 9
4,8 15

30
Distribucion media dias de reposo
40

35

30

25

20

15

10

0
0 1 2 3 4 5 6

5.4 Distribución acumulada menor que

Es la suma de las distribuciones de frecuencias de cada uno de los intervalos de la variable

intervalos de Distribucion
das de reposo acumulada
menor que
0 0
0,9 37
1,5 72
2,1 72
2,7 104
3,3 104
3,9 113
4,5 128

31
Distribucion acumulada menor que
140

120

100

80

60

40

20

0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

5.5 Distribución acumulada mayor que

Es la resta de las distribuciones de frecuencias de cada uno de los intervalos de la variable

Distribucion
intervalos de
acumulada
das de reposo
mayor que
0 128
0,9 113
1,5 104
2,1 104
2,7 72
3,3 72
3,9 37
4,5 0

32
Distribucion acumulada mayor que
140

120

100

80

60

40

20

0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

5.6 Análisis

El histograma muestra de forma clara que el promedio de la variable se encuentra en el


intervalo numero 3 dando a entender que la mayor cantidad se encuentra en el lado
izquierdo del histograma, confirmado lo que el valor de la curtosis nos indicó en la
estadística descriptiva, que la variable posee un sesgo positivo.
El polígono de frecuencias nos muestra cuales son los valores promedios de cada intervalo,
es decir en valor que caracteriza cada intervalo.
Las distribuciones acumuladas menor que y mayor que nos muestra gráficamente el número
de datos en el que se encuentra un valor dado.
5.7 Box plot

Para la interpretación de este tipo de gráfico, primero obtenemos la media de cada


intervalo, y luego la mediana de la tabla de frecuencias en general. Con estos datos
utilizamos la fórmula de la media de cada intervalo elevado a la mediana. Los datos
obtenidos en esta fórmula son la interpretación.

  L1 L2 L3
  32,25 64,5 96,75
Posiciones 32(1) y 33(1) 64(2) Y 65(2) 96(3) Y 97(3)
diferencia
posiciones 0 0 0

Teniendo estos datos se hallan los cuartiles para poder llevar a cabo la construcción de la
caja de bigotes.

33
Q1 Q2 Q3
1 2 3
1
1
     
   
-37,15     64,51
X1= 38,15     X128= 67,51
     

2
Después de tener los determinar los 3 cuartiles de la variable, se construye la caja de
bigotes con sus respectivas acotaciones.
Luego se determina si existen valores atípicos en la variable

Valores atipicos en la variable


V.A< = -2
V.A> = 6

5.8 Análisis

Además por medio del box plot se puede evidenciar que no existen valores atípicos hacia el
límite inferior del box plot. Pero si existe el último valor de la variable la cual es atípico

5.9 Teorema de chevyshev


Proporciona un intervalo de confianza donde se pueden encontrar la mayor cantidad de
datos cercanos al promedio.

Utilizaremos K=2 para garantizar que por lo menos el 75% de


los datos se encuentre en el intervalo.
media- K*desviacion= -0,14
media+ K*desviacion= 5,05

5.10 Análisis

34
Después de realizar el teorema de chevyshev se puede evidenciar que gracias al valor de
K=2 se garantiza que mínimo el 75% de los datos están ubicados en el intervalo obtenido
por el teorema de chevyshev. El intervalo es el siguiente: [37, 93 ; 61,75].

6. BRILLO
Es una de las variables analizadas en nuestra base de datos que hace referencia a cuanto de
oscuro o claro es un color, a mayor luminosidad, mayo luz reflejara los colores, esta es una
variable, es cuantitativa continua y su Escala de Medición: Razón o Proporción
El brillo se mide con un microgloss.
Tomamos los primeros valores en donde el rango es la resta entre los valores máximo y
mínimo de nuestra base de datos.
Calculamos la constante a partir de la siguiente ecuación: =+ENTERO((3,2*LOG10(128))
+1)

Posteriormente analizamos los intervalos de confianza que son los que nos van a decir entre
que valores se va a mover el promedio o la media poblacional, hay un nivel de confianza
para el cálculo del intervalo.
Y la tolerancia es un valor de un rango autorizado de diferencias.
I
APROXIMAD TOLERANCIA
R K I A R* TOLERANCIA MINIMA
27,30 7,0 3,9 4 28 0,70 0,35

INTERVALOS DE CLASE
Para efectos de nuestro ejercicio tomamos los
20,75 24,75
intervalos de clase que hace referencia al intervalo que
24,75 28,75
encierra parte o cierta cantidad de datos de nuestro
variable brillo.
28,75 32,75
32,75 36,75
Nuestros intervalos representa la cantidad de datos 36,75 40,75
tomadosBrillo
a partir de los resultados
  de brillo en el 40,75 44,75
análisis de control de calidad
Media en las tintas.
28,78796875 44,75 48,75
Error típico 0,462356069
Mediana 27,95
Moda 26,3
Desviación estándar 5,230961785
Varianza de la muestra 27,3629612
Curtosis 6,3316073

35
En la estadística descriptiva encontramos un resumen
de datos.

Tenemos las medidas de tendencia central.

Coeficiente de El error típico es la medida de la cuantía de error en e


asimetría 2,369938806 pronostico del valor de y, para un valor individual de x.
Rango 27,3 En la forma de distribución de frecuencias, observamos
Mínimo 21,1 según la curtuosis que es elevada es decir leptocurtica.
Máximo 48,4
Suma 3684,86
Cuenta 128

6.1 Histograma

Distribucion Brillo
70 66 1.2

60 1

50
0.8
Frecuencia
40
Frecuencia

35 % acumulado
0.6
30
0.4
20
15

10 7 0.2
3
0 1
0 0
24.75 28.75 32.75 36.75 40.75 44.75 48.75

Se determina a partir del histograma que las tintas que presentan una mayor frecuencia
presentan un menor brillo que las de menor frecuencia que presentan mayor brillo, un
ejemplo de esto es la tinta 28,75 con una frecuencia de 66 repeticiones alcanza un 40% de
brillo, comparándola con la tinta número 48,75 que posee una frecuencia de 7 con una
acumulación de 59% de brillo.
En la forma de distribución de frecuencias, observamos según la curtuosis que es elevada
es decir leptocurtica, por ende los datos agrupados a la izquierda refleja un sesgo positivo, y
los datos que observamos del lado izquierdo nos da una curtuosis platicurtica.

Distribución media de brillo


22,75 15
26,75 66
30,75 35
34,75 3

36
38,75 0
42,75 1
46,75 7

6.2 Distribución media de brillo

Distribucion media brillo


12

10

0
0 2 4 6 8 10 12

A partir de la gráfica de media se determina que los datos que más abundan son 66 y 35,
que los datos que están a la derecha son los que presentan más índice de brillo reflejado que
los que está a la izquierda.
La mayor disminución de brillo se ve considerablemente a partir de su punto más alto que
es el número 66, hasta cero y asciende nuevamente hasta el número 7, es decir que hay una
gran variedad de tintas que tienen mucho o nada de brillo, para los que están en cero y
valores muy bajos no es conveniente que tenga estos valores ya que todas las tintas deben
tener un grado de brillo reflejado.

Intervalos de viscosidad Distribución acumulada menor


inicial que
20,75 0
24,75 15
28,75 81
32,75 116
36,75 119
40,75 119

37
44,75 120
48,75 127

6.3 Distribución acumulada menor que

Distribucion acumulada menor que


140

127
120 119 119 120
116

100

80 81

60

40

20
15

0 0
15 20 25 30 35 40 45 50 55

La distribución acumulada menor que son aquellos valores que están ordenados de cero al
número mayor y a través de la gráfica podemos analizar cómo es su comportamiento,
entonces observamos que para intervalos menores encontrados en el eje x los valores de la
distribución acumulada igualmente son bajos, a medida que observamos los datos en su
secuencia así mismo aumenta entonces podemos decir que las tintas que se analizan de
primero no presentan mucho brillo, pero el grafico nos muestras que entre más avancemos
en la cantidad de tinta analizada mayor brillo va a tener, teniendo en cuento la
luminiscencia a las que van a estar expuestas.

Distribución acumulada menor


intervalos de viscosidad inicial
que
20,75 127
24,75 120
28,75 119
32,75 119
36,75 116
40,75 81
44,75 15
48,75 0

38
6.4 Distribución acumulada mayor que

Distribucion acumulada mayor que


140
127
120 120 119 119 116

100

80 81

60

40

20
15

0 0
15 20 25 30 35 40 45 50 55

En este grafico observamos todo lo contrario del anterior, pues los datos de la frecuencia
acumulada están ordenados de mayor a menor, podríamos decir que hay algo que tiene que
intervenir mientras se analizan las muestras de tintes que en este caso es el eje x, con sus
intervalos, sobre la cantidad de brillo a medida que ascienden los datos del eje x, en estas
dos graficas podemos analizar que los valores de intervalos vs. Los valores de frecuencia
acumulada son inversamente proporcional, ya que en el último valor de 48,75 la cantidad
de brillo reflejado es cero.
6.5 Box Plot

Aquí observamos ampliamente el conjunto de dato, los bigotes muestran cómo se disemina
la información, el eje x es la diferencia entre el cuartil 1 y cuartil 2 que es el rango, la línea
de la mitad es la mediana y dice que la mitad de las cantidades de tintas son menores que
3,o8 y la otra mitad es mayor.

39
6.6 Teorema de chebyshev

6.7 Estadística de la regresión

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,809573747
Coeficiente de determinación R^2 0,655409651
R^2 ajustado 0,652674807
Error típico 3,082830805
Observaciones 128

Dias de reposo Curva de regresión ajustada


60

50

40
f(x) = 3.26 x + 20.78 Brillo
30 R² = 0.66
Brillo

Linear (Brillo)
20

10

0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Dias de reposo

El coeficiente de relación es favorable junto con el coeficiente de relación que está en o,80
y 0,65 respectivamente.

40

Vous aimerez peut-être aussi