Vous êtes sur la page 1sur 40

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Obtención de datos

• Big DATA

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Mejora de procesos y los sistemas de la
calidad en la obtención de datos

La toma de decisiones
se apoye en un Contar con
correcto análisis de información de calidad
datos e información

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Ejemplo: está el Tabúes y errores
Obtención de
diseño de sobre el papel de la
información para
“Datitis” cuestionarios con estadística en la
validar decisiones
papel, lápiz y obtención de
previamente tomadas
ocurrencias información
Es raro que se
tenga un plan global
de por qué se va a
Se obtienen datos
obtener
sin ningún propósito
información, cuál es Por ejemplo,
claro ni importante,
Es decir, sólo tomar la mejor fuente, tamaño de la
lo cual resulta en
en cuenta la cómo, cuándo, muestra, confianza
datos, cuestionarios,
información quién, dónde, cómo estadística y
registros y reportes
favorable. se va a analizar, y selección aleatoria
en espera de que
qué decisiones se de la muestra.
tengan alguna
pretenden tomar. a
utilidad.
Información poco
representativa y
sesgada.

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Problema u Objeto Objetivos que se ¿Qué información
de Estudio persiguen se requiere?

La toma de
decisiones y ¿Dieron
Resultados?
Obtenerla
No
Existe

la estadística
Acciones y
Conclusiones Análisis
Deciciones

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


• La variabilidad y el pensamiento
estadístico

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Esta variación que ocurre en nuestras vidas, también
ocurre en los resultados de los procesos, ya que son
generados por la interacción de
Mano o
Materiales Maquinas Mente de
obra

Medio
Mediciones Métodos
Ambiente

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Identificar dónde, cómo, cuándo y con qué frecuencia se
presentan los problemas (regularidad estadística).

Analizar los datos procedentes de las guías clave del negocio,


para así identificar las fuentes de variabilidad, analizar su
estabilidad y pronosticar su desempeño.

Detectar con rapidez, oportunidad y a un bajo costo


anormalidades en los procesos y sistemas de medición
(monitoreo eficaz).

Ser objetivos en la planeación y toma de decisiones, evitando


frases como el “yo siento”, el “yo creo”, “mi experiencia” y el
abuso de poder en la toma de decisiones.

Expresar los hechos en forma de datos y evaluar de manera


objetiva el impacto de acciones de mejora.

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Pensamiento Estadístico

1) todo el trabajo
3) entender y reducir la
ocurre en un sistema 2) la variación existe
variación son claves
de procesos en todos los procesos
para el éxito
interconectados

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


• Tipos de variables

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Variables cualitativas
(nominales o de atributos)

Profesor: Alexander Toscano


PROGRAMA CERTIFICADO EN BIG DATA
Variables Cuantitativas

Variables discretas

Variables continuas

Variables de entrada

Variables de salida
Variables de Salida
• Son variables o • Son variables o • Variables que deben

Entre más grande mejor.


Entre más pequeño mejor.

El valor nominal es el mejor.


características de características de tener un valor
calidad cuya única calidad a las que se les específico y que, por lo
exigencia es que no exige que sean tanto, no deben ser
excedan un cierto mayores que un valor menores que una
valor máximo tolerado mínimo o que una especificación inferior
o una especificación cierta especificación (EI), pero tampoco
superior (ES), y entre inferior (EI), y entre mayores que una
más pequeño sea su más grande sea el superior (ES). Por
valor es mejor. Por valor de la variable es ejemplo, el diámetro
ejemplo, el porcentaje mejor. Por ejemplo, la interior de una tuerca
de impurezas en una resistencia de una o la longitud de una
sustancia o la cantidad pieza de plástico pieza para ensamble;
de sustancias tóxicas inyectado o la no pueden ser ni muy
en un producto “blancura” de una tela chicas ni muy grandes.
alimenticio. de color blanco.

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Una tarea primordial del control de calidad es conocer qué tanto
los valores de una variable de salida de un proceso son
satisfactorios, y saber de esa manera si el proceso es capaz de
cumplir las especificaciones para esa variable. Por ello es
necesario tomar datos de esta variable y analizarlos
adecuadamente.

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


• Capacidad de un proceso,
estadística descriptiva

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Las variables de Por ello, una tarea
salida o de respuesta primordial del control
de un proceso deben de calidad es conocer
cumplir con ciertas la capacidad o
metas y/o habilidad de un
especificaciones, a fin proceso, que consiste
de que sea posible en determinar la
considerar que el amplitud de la
proceso funciona de variación natural del
manera satisfactoria. proceso para una
característica de
calidad dada.

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


el histograma y la tabla de frecuencias permiten visualizar estos dos
aspectos de un conjunto de datos, y además muestran la forma en la que
los datos se distribuyen dentro de su rango de variación. Específicamente,
el histograma es una representación gráfica, en forma de barras, de la
distribución de un conjunto de datos o una variable, cuyos datos se
clasifican por su magnitud en cierto número de grupos o clases, y cada
clase se representa por una barra, cuya longitud es proporcional a la
cantidad de datos que pertenecen a dicha clase. Usualmente, el eje
horizontal está formado por una escala numérica para mostrar la magnitud
de los datos y en el eje vertical se representan las frecuencias.

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


484
501 501 502 509
490 497 500 502 498
501
496 500 502 500
501
487 500
502 505 506
501
493 501 508 506
506 504
493
506 508 510

508 504 509 510


511 518 515
PROGRAMA CERTIFICADO EN BIG DATA
505
Profesor: Alexander Toscano
Construcción de un Histograma
Paso 1 (Hallar el Rango)

• 𝑅 = 𝐷𝑎𝑡𝑜 𝑀á𝑥𝑖𝑚𝑜 − 𝐷𝑎𝑡𝑜 𝑀í𝑛𝑖𝑚𝑜


• 𝑅 = 515 − 484 = 31

Paso 2 (Hallar el Número de Clases – NC) (de 5 a 15)


𝑠𝑒 𝑎𝑐𝑒𝑟𝑐𝑎 𝑎
• NC(5−15) = 1 + 3,3 ∗ 𝐿𝑜𝑔10 40 = 6,33 7
𝑠𝑒 𝑎𝑐𝑒𝑟𝑐𝑎 𝑎
• NC(5−15) = 40 = 6,29 7

Paso 3 (Hallar la Longitud de la Clase – LC)

• 𝐿𝐶 = 𝑅 + /𝑁𝐶 = (520 − 480) 7 = 5.7

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Construcción de un Histograma
Paso 4

• Construir los Intervalos de Clases

Paso 5

• Obtener la Frecuencia de Cada Clase

Paso 6

• Graficar el Histograma

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Interval (480 - (485,7 - (491,4 - (497,1 - (502,9 - (508,6 - (514,3 -
o 485,7) 491,4) 497,1) 502,9) 508,6) 514,3) 520)
484 490 493 498 508 510 515
487 493 502 505 510 518
496 502 505 509
497 501 506 511
500 506 509
500 506
Datos
501 504
502 506
500 508
500 508
501 504
501
502
501
PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Tabla de Frecuencias para el peso de un
producto dado

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Ejemplo Histograma

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Datos

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Ejemplo A

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Ejemplo B

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Información del ejercicio
• En un proceso de inyección de plástico una característica de calidad del producto
(disco) es su grosor, que debe ser de 1.20 mm con una tolerancia de ±0.10 mm
• Así, para considerar que el proceso de inyección fue satisfactorio, el grosor del
disco debe estar entre la especificación inferior, EI = 1.10 y la superior, ES = 1.30.
En un estudio de capacidad para este proceso es necesario contestar las
siguientes interrogantes: ¿qué tipo de discos en cuanto a grosor se están
produciendo? ¿El grosor medio es adecuado? ¿La variabilidad del grosor es
mucha o poca?
• Para contestar estas preguntas, durante una semana se obtuvieron de una línea
de producción los 125 datos de la tabla. El muestreo fue sistemático: cada
determinado tiempo se tomaban cinco productos y se medían y al final de la
semana se tuvieron los datos referidos. A continuación se analizarán estos datos
por medio de diferentes estadísticos.

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Elementos Relevantes
Límites Cantidad de datos Calidad

• Especificación • 125 • Grosor de 1,20


inferior EI=1.10 mm
• Especificación • Tolerancia de
superior ±0,10 mm
ES=1.30

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Datos
1,15 1,2 1,17 1,16 1,16 1,15 1,17 1,2 1,16 1,19 1,17 1,13 1,15 1,2 1,18 1,17 1,16
1,2 1,17 1,17 1,2 1,14 1,19 1,13 1,19 1,16 1,18 1,16 1,17 1,15 1,21 1,15 1,2 1,18
1,17 1,17 1,13 1,16 1,16 1,17 1,2 1,18 1,15 1,13 1,2 1,17 1,19 1,23 1,2 1,24 1,17
1,17 1,17 1,17 1,18 1,24 1,16 1,18 1,16 1,22 1,23 1,22 1,19 1,13 1,15 1,15 1,22 1,19
1,18 1,19 1,17 1,16 1,17 1,18 1,19 1,23 1,19 1,16 1,19 1,2 1,17 1,13 1,22 1,19 1,21
1,2 1,19 1,17 1,19 1,22 1,19 1,18 1,11 1,19 1,19 1,17 1,19 1,17 1,2 1,16 1,19 1,2
1,2 1,17 1,25 1,16 1,16 1,2 1,2 1,16 1,18 1,21 1,2 1,22 1,19 1,14 1,19 1,17 1,2
1,16 1,15 1,2 1,12 1,11 1,18

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Media muestral
• Medida de tendencia
central que es igual al
promedio aritmético de
un conjunto de datos,
que se obtiene al
sumarlos y el resultado es decir, la media muestral se obtiene
se divide entre el número sumando todos los datos y el resultado de
de datos. la suma se divide entre el número de datos
(n).

MEDIA POBLACIONAL O DEL PROCESO, 𝜇


se denota con la letra griega μ (mu)
PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Problemas de la Media

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Mediana o
percentil 50
Medida de tendencia central
~
=1,18
que es igual al valor que
divide a la mitad a los datos
cuando son ordenados de
menor a mayor. 𝑋

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Datos Organizados
1,11 1,11 1,12 1,13 1,13 1,13 1,13 1,13 1,13 1,14 1,14 1,15 1,15 1,15 1,15
1,15 1,15 1,15 1,15 1,15 1,16 1,16 1,16 1,16 1,16 1,16 1,16 1,16 1,16 1,16
1,16 1,16 1,16 1,16 1,16 1,16 1,16 1,17 1,17 1,17 1,17 1,17 1,17 1,17 1,17
1,17 1,17 1,17 1,17 1,17 1,17 1,17 1,17 1,17 1,17 1,17 1,17 1,17 1,17 1,17
1,18 1,18 1,18 1,18 1,18 1,18 1,18 1,18 1,18 1,18 1,18 1,19 1,19 1,19 1,19
1,19 1,19 1,19 1,19 1,19 1,19 1,19 1,19 1,19 1,19 1,19 1,19 1,19 1,19 1,19
1,19 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2 1,2
1,21 1,21 1,21 1,22 1,22 1,22 1,22 1,22 1,22 1,23 1,23 1,23 1,24 1,24 1,25

1,18
PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Otra forma de medir la
tendencia central de un
Moda
conjunto de datos es
mediante la moda, que es
igual al dato que se repite
más veces. Si varios datos
se repiten el mismo número
de veces, entonces cada uno
de ellos es una moda, y se
dice que el conjunto de datos
es multimodal. La función
MODA( ) de Excel calcula la
moda de un conjunto de
datos.

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Desviación estándar poblacional o del proceso, 𝜎
• Refleja la variabilidad de un
proceso. Para su cálculo se debe
2
utilizar un número grande de datos (𝑋 − 𝜇)
que hayan sido obtenidos en el
𝜎=
transcurso de un lapso de tiempo
amplio. Se denota con la letra 𝑁
griega sigma σ.

VARIANZA, 𝜎 2 (𝑋 − 𝜇)
2
2
• Media aritmética de las desviaciones 𝜎 =
de la media elevadas al cuadrado. 𝑁
PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Bibliografía y recursos electrónicos

PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


Bibliografía

• Gutiérrez Pulido, H., & de la Vara Salazar,


R. (2009). Control Estadístico de Calidad y
Seis Sigma. México: McGraw Hill.
• Real Academia Española © Todos los
derechos reservados
PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano


¡Muchas Gracias!
PROGRAMA CERTIFICADO EN BIG DATA

Profesor: Alexander Toscano

Vous aimerez peut-être aussi