Vous êtes sur la page 1sur 34

PROBABILIDAD

Y
ESTADSTICA
FMS 176

Semestre 1 - 2011
FMS 175-8


Profesora: Cecilia Larran R.




PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 2

Introduccin
Qu es la Estadstica?

La Estadstica es la Ciencia que se ocupa de la ordenacin y anlisis de datos
procedentes de muestras y de la realizacin de inferencias sobre las
poblaciones de las que stas proceden.

Por qu hay que estudiar Estadstica?
Si se revisan las mallas curriculares de las distintas carreras profesionales,
veremos que en la mayora existe por lo menos una asignatura de Estadstica.
Bsicamente los contenidos de un primer curso de Estadstica en diferentes
carreras son los mimos, la mayor diferencia radica en los ejemplos utilizados.

La principal razn es que el rol ms destacado de la Estadstica es la
recopilacin, presentacin, anlisis de un conjunto de datos, a partir de los
cuales se obtienen conclusiones y se toman decisiones.


Saber Estadstica es de gran utilidad en cualquier rea del conocimiento y en
particular en Ingeniera.

Ejemplos:
- Diseo y desarrollo y mejora en los proceso productivos como control de
calidad, control de la variabilidad del proceso,
- Estudios de materiales en cuanto a duracin, dureza, elasticidad, .
- Control de inventarios, con la estadstica se analiza la tendencia de flujo
de ciertos materiales y ciertos productos.
-
-


La mayor contribucin de la Estadstica en la resolucin de problemas en
ingeniera es su utilizacin como herramienta de aprendizaje. El aprendizaje
que se obtiene mediante la estadstica forma parte del denominado Mtodo
Cientfico
El mtodo cientfico es la estrategia de la investigacin cientfica: afecta a todo
ciclo completo de investigacin y es independiente del tema en estudio.
Al ser la Ingeniera la aplicacin del conocimiento cientfico, todo proyecto en
ingeniera debe contener los rasgos del mtodo cientfico.






PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 3

La estadstica se puede clasificar como:
Estadstica
descriptiva
Tiene como objetivo caracterizar, describir y extraer
conclusiones sobre una muestra de datos o de la poblacin
de inters.

Probabilidad
Mide la incertidumbre, deduce las leyes que rigen a los
fenmenos que se investigan.
Es la herramienta a partir de la que se desarrolla la
inferencia estadstica
Estadstica
Inferencial
Implica realizar inferencias acerca de la de la poblacin a
partir de datos muestrales y requiere clculo de
probabilidades.
La inferencia de conclusiones generales a partir de datos de muestrales
es siempre incierta Uno de los objetivos principales de la
estadstica es medir esa incertidumbre




















PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 4

Estadstica descriptiva (ejemplos)














































Reporte de la inspeccin final de
defectos de 150 productos para la
lnea de armado A12.
Rayado Manchado Manchado Manchado
Abollado Astillado Doblado Manchado
Astillado Rayado Manchado Rayado
Astillado Astillado Manchado Manchado
Otros Astillado Astillado Abollado
Manchado Manchado Rayado Astillado
Rayado Rayado Manchado Manchado
Astillado Rayado Abollado Manchado
Doblado Manchado Manchado Astillado
Rayado Manchado Manchado Doblado
Rayado Manchado Doblado Abollado
Manchado Manchado Astillado Manchado
Manchado Manchado Astillado Rayado
Otros Otros Rayado Doblado
Abollado Rayado Manchado Astillado
Manchado Manchado Astillado Manchado
Rayado Manchado Rayado Rayado
Manchado Rayado Manchado Rayado
Otros Astillado Manchado Astillado
Rayado Rayado Abollado Manchado
Doblado Astillado Manchado Rayado
Doblado Manchado Abollado Rayado
Rayado Manchado Rayado Rayado
Manchado Doblado Manchado Rayado
Manchado Manchado Manchado Manchado
Rayado Astillado Astillado Rayado
Abollado Manchado Rayado Manchado
Manchado Manchado Rayado Rayado
Rayado Manchado Manchado Rayado
Rayado Astillado Astillado Astillado
















Defecto del
producto Frecuencia Porcentaje
Abollado
8 5,3
Astillado
23 15,3
Doblado
12 8,0
Manchado
56 37,3
Otros
6 4,0
Rayado
45 30,0
Total
150 100,0



F
r
e
c
u
e
n
c
i
a
60
50
40
30
20
10
0
6
45
56
12
23
8
Defecto del producto
Otro Rayado Manchado Doblado Astillado Abollado
El defecto ms frecuente en la
lnea de armado es Manchado

Moda = manchado







PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 5





































Nmeros de averas en
Febrero.2011 de 40 centrales
Elctricas.

0 1 0 0 2
2 1 3 1 1
0 1 1 3 1
2 0 0 0 1
0 0 1 1 0
3 1 1 1 0
0 2 3 4 2
2 0 3 2 2

Tabla de frecuencias

N de
averas Frecuencia Porcentaje
Porcentaje
acumulado
0
13 32,5 32,5
1
13 32,5 65,0
2
8 20,0 85,0
3
5 12,5 97,5
4
1 2,5 100,0
Total
40 100,0

Grfico

N de averas
4 3 2 1 0
R
e
c
u
e
n
t
o
14
12
10
8
6
4
2
0
1
5
8
13
13

Estadsticos (Medidas de resumen)
N de averas
40
0
1,20
1,00
0
a
1,114
,637
,374
-,445
,733
0
4
,00
1,00
2,00
Vlidos
Perdidos
n
Media
Mediana
Moda
Desv. tp.
Asimetra
Error tp. de asimetra
Curtosis
Error tp. de curtosis
Mnimo
Mximo
25
50
75
Percentiles
Existen varias modas. Se mostrar el menor de los
valores.
a.



PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 6





































Edad (en aos) de 50
estudiantes seleccionados
de una casa de estudio
superior

21 24 29
18 19 19
25 31 23
22 21 22
25 18 27
19 25 34
20 22 19
19 19 18
28 20 22
23 36 23
26 36 20
25 25 25
23 23 21
21 19 24
21 21 22
27 33 19
23 26


Tabla de frecuencias

Edad
(aos) Frecuencia Porcentaje
Porcentaje
acumulado

18 - 21 14 28,0 28,0
21 - 24 17 34,0 62,0
24 - 27 10 20,0 82,0
27 - 30 4 8,0 90,0
30 - 33 1 2,0 92,0
33 - 36 4 8,0 100,0
Total 50 100,0

Grfico

Edad
39 36 33 30 27 24 21 18 15
N


e
s
t
u
d
i
a
n
t
e
s
20
15
10
5
0
4
1
4
10
17
14
Histograma


Estadsticos (medidas de resumen)
Edad (aos)
50
0
23,42
22,50
19
4,540
20,616
1,252
1,284
18
18
36
20,00
22,50
25,00
Vlidos
Perdidos
n
Media
Mediana
Moda
Desv. tp.
Varianza
Asimetra
Curtosis
Rango
Mnimo
Mximo
25
50
75
Percentiles


PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 7













TRMINOS BSICOS
Poblacin y Muestra
Poblacin es el conjunto de individuos (personas, animales o cosas) sobre el
que estamos interesados en obtener conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder abarcarlo. (Tamao poblacin: N)
Censo: estudio completo de la poblacin
A las medidas de resmenes poblacionales como la media poblacional ,
desviacin estndar poblacional , , se les denominan parmetros.

Muestra: subconjunto de la poblacin al que tenemos acceso y sobre el que
realmente hacemos las observaciones (mediciones).
Debera ser representativo
Est formado por miembros seleccionados de la poblacin (individuos,
unidades experimentales).
A las medidas de resmenes muestrales como la media de la muestra
x, desviacin estndar de la muestra s, se les denomina
estadsticos.


De una poblacin existen muchas muestras posibles, pero slo observamos una!

La Estadstica Descriptiva utiliza, tablas,
grficos y resmenes numricos

Para realizar cualquier estudio estadstico,
hay que tener en cuenta:
Cmo y de donde se recolect la
informacin
Qu se midi atributos o cantidades?




PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 8

Encuesta: Tcnica de investigacin para obtener informacin de grupos de
personas mediante el uso de instrumentos como cuestionarios diseados en
forma previa.

Diseo de experimentos: Metodologa estadstica destinada a la planificacin y
anlisis de un experimento. El objetivo del diseo de experimento es estudiar si
utilizar un determinado tratamiento produce mejora en el proceso o no.


Variable: una variable es una caracterstica observable que vara entre los
diferentes individuos de una poblacin. La informacin que disponemos de cada
individuo es resumida en variables.







En la poblacin de alumnos de Ingeniera de una universidad, es variable:

- El gnero: {Femenino, Masculino} var. cualitativa dicotmica
- Especialidad :{Informtica, Mecnica, Obras Civiles, } var. cualitativa politmica

- El nmero de asignatura aprobadas: {0,1,2,3,...} var. cuantitativa discreta
- Nivel de Educ. del padre: {Bsica, Media Superior} var. cualitativa ordinal
- La altura (en cm.): {162 , 156, 170 ...} var. cuantitativa continua
- Edad (aos): {17, 18, 19, } var. cuantitativa continua
.
.
.





Obs.: Se acostumbra denotar a las variables con letras maysculas. X, Y, Z

Dato: valor de la variable asociado a un elemento de la poblacin o muestra.

HAY QUE CONOCER EL TIPO DE
VARIABLE PARA UTILIZAR LA
HERRAMIENTA ESTADSTICA
ADECUADA



PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 9

Ejemplo: (archivo de datos)
Sujeto Sexo Edad Especialidad
01 M 21 IND observacin 1
02 M 22 INF
03 F 31 METAL
. . . .
. . . .
. . . .

La primera observacin indica que el sujeto es de sexo masculino, tiene 21 aos y
estudia Ingeniera Mecnica. Cada una de estas tres mediciones es un dato para
cada una de las variables medidas para el sujeto 1.
El alumno de Ingeniera es la unidad de observacin

Datos primarios
Son aquellos que el investigador obtiene directamente de la realidad,
recolectndolos con sus propios instrumentos.

Datos secundarios
Son registros escritos que proceden tambin de un contacto con la prctica,
pero que ya han sido elegidos y procesados por otros investigadores.
Las fuentes son informacin de datos secundarios deben ser fidedignas.

Los datos primarios y secundarios no son dos clases esencialmente diferentes
de informacin, sino partes de una misma secuencia: todo dato secundario ha
sido primario en sus orgenes, y todo dato primario, a partir del momento en
que el investigador concluye su trabajo, se convierte en dato secundario para
los dems.

Clasificacin de variables
Para realizar un anlisis de datos, es indispensable saber cmo es la variable
que consideramos, pues ello determina el tipo de mtodo estadstico que se
debe utilizar. Las variables se clasifican como:



PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 10



































Segn su naturaleza
Cualitativas o atributos
No toman valores numricos
(modalidades) y describen
cualidades. (no se pueden hacer
operaciones algebraicas con ellos).
Ejemplos: Estado Civil
Profesin

Cuantitativas
Sus valores son numricos (tiene
sentido hacer operaciones
algebraicas con ellos).
Ejemplos: Estatura
Nmero de errores
Segn tamao del recorrido
Dicotmicas
Toman uno de
dos valores.

Ejem.: Sexo

Discretas
Corresponden en general a
contar el nmero de veces
que ocurre un suceso.
Tienen un recorrido contable

Ejem.: Nmero de cargas
familiares.
Nmero de fallas en
un centro de cmputo.


Continuas
Entre dos valores,
son posibles infinitos
valores intermedios
Ejemplos: Altura
Edad



PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 11

Segn el nivel de medicin
La medicin es el proceso mediante el cual se les asignan valores numricos
a objetos siguiendo unas determinadas reglas. Los instrumentos que se
utilizan para llevar a cabo tal medicin se les denominan escalas de medicin.
El criterio utilizado convencionalmente para clasificar las escalas de medida es
el propuesto por Stevens (1946), quien establece cuatro tipos de escala:
nominal, ordinal, de intervalo y de razn.

































N
NNO
OOM
MMI
IIN
NNA
AAL
LL
ORDINAL
INTERVALAR
RAZN
E
EES
SSC
CCA
AAL
LLA
AAS
SS D
DDE
EE M
MME
EED
DDI
IIC
CCI
II
N
NN

nicamente permiten
establecer relaciones de
igualdad/desigualdad
entre los objetos que se
estn midiendo.

NO INDICA ORDEN O
JERARQUA

Ejemplos
SEXO:
Masculino (1)
Femenino (2)

PROFESIN:

Ingeniero (1)
Profesor (2)
Mdico (3)





PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 12









































NOMINAL
O
OOR
RRD
DDI
IIN
NNA
AAL
LL
INTERVALAR
RAZN
E
EES
SSC
CCA
AAL
LLA
AAS
SS D
DDE
EE M
MME
EED
DDI
IIC
CCI
II
N
NN
Adems de permitir relaciones
de igualdad /desigualdad,
permite establecer relaciones
de orden (mayor o menor que)
entre los objetos que se estn
midiendo.
EXISTE UN ORDEN O
JERARQUA

Ejemplo
NIVEL EDUCACIONAL:

Univ. con doctorado (5)
Univ. con Magister (4)
Superior (3)
Media (2)
Bsica (1)





PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 13











































NOMINAL
ORDINAL
I
IIN
NNT
TTE
EER
RRV
VVA
AAL
LLA
AAR
RR
RAZN
E
EES
SSC
CCA
AAL
LLA
AAS
SS D
DDE
EE M
MME
EED
DDI
IIC
CCI
II
N
NN
Al igual que los dos tipos de escalas anteriores (nominal u ordinal), esta escala
permite establecer relaciones de igualdad /desigualdad y de orden entre los objetos
que se miden. Los intervalos entre los nmeros de la escala son iguales, por lo
tanto se puede realizar las operaciones suma y resta. Este tipo de escala carece de
un cero absoluto, por lo que no estn permitidas ni la multiplicacin ni la divisin
entre los nmeros de la escala. Una escala de intervalo es, por ejemplo, la utilizada
para medir la temperatura. Como los intervalos de la escala son iguales, se puede
afirmar que la diferencia de temperatura que existe entre 25 y 28 grados es la
misma que existe entre 30 y 33 grados. Sin embargo, dado que el punto 0 de la
escala es arbitrario -no existe ausencia de temperatura- no se puede afirmar,
por ejemplo, que 20 grados es exactamente la mitad de 40 grados.



PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 14













































NOMINAL
ORDINAL
INTERVALAR
R
RRA
AAZ
ZZ
N
NN
E
EES
SSC
CCA
AAL
LLA
AAS
SS D
DDE
EE M
MME
EED
DDI
IIC
CCI
II
N
NN
Es la escala que permite el nivel ms alto de medicin.
Adems de las operaciones que permiten las escalas
anteriores, en una escala de razn existe el cero (0)
emprico, por lo cual se puede efectuar cualquier operacin
aritmtica con los nmeros de la escala. El tiempo de
reaccin, por ejemplo es una variable medida en escala
de razn. No slo se puede afirmar que la diferencia entre
3 y 6 segundos es la misma que entre 6 y 9 segundos
(afirmacin vlida tambin en la escala de intervalos), sino,
adems, que 6 s es el doble de 3 s Afirmacin que es
posible establecer gracias a que en la escala de tiempo de
reaccin existe el cero absoluto: cero significa ausencia de
tiempo de reaccin.



PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 15



Clasificacin de variables segn su funcin












Ejemplo: Los hbitos de estudios influyen en el rendimiento acadmico de los
Estudiantes

VI = hbitos de estudio
VD = Rendimiento acadmico
V interv. = Aptitud personal
Nivel nutricional
.
Prctica n 1.1.
1. Determine en cada caso, si se trata o no de una variable.

- La edad mnima para poder votar por primera vez en Chile.
- Nmero de errores en un centro de cmputo.
- Tiempo (en aos) de experiencia laboral.
- Profesin de los clientes de un banco.
- Sueldo de Ingeniero.
VI
Independiente
Introduce o manipula el
investigador

VD
Dependiente
Se observa y se miden los
cambios

Interviniente
Es la que puede mediar en la
relacin entre VI y VD y que
puede influir en los resultados




PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 16

2. Se quiere analizar el nmero de horas de estudio semanal que dedican los
estudiantes de primer ao de Ingeniera de esta Universidad. Para ello se
selecciona a 90 alumnos que ingresaron el 2011 a la facultad de Ingeniera.
Indique cual es la:
Poblacin:
Variable:
Muestra:

3. El coeficiente intelectual (CI) promedio en la poblacin adulta chilena es 100
puntos. Un investigador educacional est interesado en probar que las
personas adultas que hablan ms de un idioma tienen un CI superior a la
media poblacional.
En una muestra de 250 personas que hablan ms de un idioma se obtuvo
un promedio (CI medio) de 102.

Complete:

Variable de inters (nombre)
X
Clasificacin de la variable
Naturaleza Recorrido Medicin




Promedio
poblacional

Promedio
muestral
x
















PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 17

FMS 1Estadstica Descriptiva Univariada
Organizacin de los datos
La estadstica descriptiva, entrega las tcnicas que permiten condensar grandes
grupos de datos mediante el uso de tablas de frecuencias, grficos y medidas
de resumen como media, desviacin estndar, correlacin.
d resumen.
Datos en bruto o directos
Cuando la informacin es recolectada, sea de una muestra o de una poblacin,
esta se organiza en la secuencia en que fue obtenida. Esta secuencia de datos
registrados se encuentra desorganizada, lo que no permite extraer informacin
fcilmente, siendo difcil detectar cualquier patrn de variabilidad o estructura de
los datos.
Datos en bruto: Datos registrados en la secuencia en que fueron
recolectados, antes de ser procesados u ordenados.

Ejemplo 1 (ArmadoA12.xls): El reporte de la inspeccin final de defectos de 150
productos para la lnea de armado A12 se muestra en la tabla siguiente:
Producto Defecto Producto Defecto Producto Defecto Producto Defecto Producto Defecto
1 Rayado 31 Manchado 61 Manchado 91 Manchado 121 Manchado
2 Abollado 32 Rayado 62 Astillado 92 Doblado 122 Manchado
3 Astillado 33 Rayado 63 Rayado 93 Manchado 123 Rayado
4 Astillado 34 Manchado 64 Astillado 94 Manchado 124 Manchado
5 Otros 35 Manchado 65 Astillado 95 Astillado 125 Abollado
6 Manchado 36 Doblado 66 Manchado 96 Rayado 126 Astillado
7 Rayado 37 Manchado 67 Rayado 97 Manchado 127 Manchado
8 Astillado 38 Manchado 68 Rayado 98 Abollado 128 Manchado
9 Doblado 39 Manchado 69 Manchado 99 Manchado 129 Astillado
10 Rayado 40 Rayado 70 Manchado 100 Manchado 130 Doblado
11 Rayado 41 Astillado 71 Manchado 101 Doblado 131 Abollado
12 Manchado 42 Rayado 72 Manchado 102 Astillado 132 Manchado
13 Manchado 43 Otros 73 Manchado 103 Astillado 133 Rayado
14 Otros 44 Astillado 74 Otros 104 Rayado 134 Doblado
15 Abollado 45 Rayado 75 Rayado 105 Manchado 135 Astillado


PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 18

16 Manchado 46 Rayado 76 Manchado 106 Astillado 136 Manchado
17 Rayado 47 Rayado 77 Manchado 107 Rayado 137 Rayado
18 Manchado 48 Doblado 78 Rayado 108 Manchado 138 Rayado
19 Otros 49 Manchado 79 Astillado 109 Manchado 139 Astillado
20 Rayado 50 Manchado 80 Rayado 110 Abollado 140 Manchado
21 Doblado 51 Manchado 81 Astillado 111 Manchado 141 Rayado
22 Doblado 52 Rayado 82 Manchado 112 Abollado 142 Rayado
23 Rayado 53 Otros 83 Manchado 113 Rayado 143 Rayado
24 Manchado 54 Rayado 84 Doblado 114 Manchado 144 Rayado
25 Manchado 55 Doblado 85 Manchado 115 Manchado 145 Manchado
26 Rayado 56 Manchado 86 Astillado 116 Astillado 146 Rayado
27 Abollado 57 Rayado 87 Manchado 117 Rayado 147 Manchado
28 Manchado 58 Rayado 88 Manchado 118 Rayado 148 Rayado
29 Rayado 59 Doblado 89 Manchado 119 Manchado 149 Rayado
30 Rayado 60 Rayado 90 Astillado 120 Astillado 150 Astillado

Ejemplo 2: : Datos sobre el nmeros de averas en Febrero.2011 de 40
centrales Elctricas.

0 1 0 0 2 0 0 1 1 0
2 1 3 1 1 3 1 1 1 0
0 1 1 3 1 0 2 3 4 2
2 0 0 0 1 2 0 3 2 2

Ejemplo 3: Se recolect informacin sobre la edad (en aos) de 50 estudiantes
seleccionados de una casa de estudio superior. El valor de los datos, en el orden
en que fueron recolectados se presenta a continuacin. (Este es un ejemplo de
datos cuantitativos en bruto)
21 24 29 26 36
18 19 19 25 25
25 31 23 23 23
22 21 22 21 19
25 18 27 21 21
19 25 34 27 33
20 22 19 22 23
19 19 18 19 26
28 20 22 20 21
23 36 23 25 24






PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 19












Tabla o distribucin de La presentacin grfica
frecuencias puede revelar de un
Es una tabla que constituye vistazo las
el resumen bsico de principales
los datos caractersticas
de un conjunto
de datos
Ejemplo 1 : El reporte de la inspeccin final de defectos para la lnea de armado A12 se
muestra en la tabla siguiente:
Defectos_Linea A12

Defectos del
producto
Frecuencia absoluta
n
i

Frecuencia Relativa
f
i
Porcentaje
%
Abollado 8 0,05 5,33
Astillado 23 0,15 15,33
Doblado
Manchado 56 37,33
Rayado
Otros
Total 150 1,00 100%

Complete la tabla de frecuencias
Frecuencia absoluta (n
i
): Nmero de veces que ocurre la modalidad i. i = 1,2, ,k
Frecuencia relativa (f
i
): Es la proporcin de la categora o modalidad respecto del total
de datos. i = 1,2, ,k


Descripcin estadstica de una variable cualitativa
Grficos

- Sectorial
- Barras
Separadas
- Diagrama
de Pareto

- Pictograma










Medida de resumen
Moda: es el dato o
modalidad de mayor
frecuencia dato
ms representativo








PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 20

Grfico sectorial:
Crculo dividido en
porciones que
representan las
frecuencias relativas o
porcentajes de una
poblacin o muestra
perteneciente a diferentes
categoras.

Como sabemos, un crculo
contiene 360 grados. Para
construir un grfico sectorial,
se multiplica por 360 la
frecuencia relativa de cada
categora, para obtener la
medida del ngulo
correspondiente



Defectos del producto

Cul es Defecto ms frecuente?

Cunto mide el de sector Defecto Manchado?


Grfico de Barras Separadas








Abollado
5,33%
Astillado
15,33%
Doblado
8,00%
Manchado
37,33%
Rayado
30,00%
Otros
4,00%
F
r
e
c
u
e
n
c
i
a
60
50
40
30
20
10
0
6
45
56
12
23
8
Defecto del producto
Otro Rayado Manchado Doblado Astillado Abollado


PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 21

Diagrama de Pareto

Herramienta bsica de la mejora de calidad. Muy til para priorizar los problemas
o las causas que los generan.
Su fundamento parte de considerar que un pequeo porcentaje de las causas
producen la mayora de los efectos. Se tratar de identificar ese pequeo
porcentaje de causas vitales para actuar prioritariamente sobre l.


Defecto frecuencia % frec. Acum. % acumulado

Manchado 56 37,33 56 37,33
Rayado 45 30,00 101 67,33
Astillado 23 15,33 124 82,67
Doblado 12 8,00 136 90,67
Abollado 8 5,33 144 96,00
Otros 6 4,00 150 100
TOTAL 150 100,0%


Se calculan solamente para el diagrama
Pareto (en este tipo de variable)










PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 22

Descripcin estadstica de una variable cuantitativa
TABLAS Y GRFICOS

Si las observaciones en un conjunto de datos cuantitativos son discretos
(contables) o si los valores de la variable asumen slo unos pocos valores
distintos, puede ser apropiado armar tablas de frecuencia con valores nicos.

La distribucin de frecuencias (tabla)

- La distribucin de frecuencias para variables cuantitativas discretas es
similar a la de variables cualitativas. Los valores que toma la variable se
ordenan de de menor a mayor lo que permite registrar en la tabla las
frecuencias acumuladas. La representacin grfica que se utiliza para este
tipo de variables es barras separadas
Distribucin de frecuencias de la variable X
Nombre de la
variable
X
Frec.
Absoluta
n
i
Frec. Relativa
i
i
n
f =
n

Frec. Abs.
Acumulada
N
i
Frec. Relat.
Acumulada
i
i
N
F=
n

x
1
n
1
f
1
N
1
= n
1
F
1

x
2
n
2
f
2 N
2
= n
1
+ n
2

F
2

x
3
n
3
f
3 N
3
= n
1
+ n
2
+ n
3

F
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
k
n
k
f
k
N
k
= n F
k
= 1
Total n 1

x
i
= valor que toma la variable. i= 1,2, ,k








PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 23

Cuntas centrales tienen menos de 2 averas?
Qu porcentajes de centrales tienen 3 o menos averas?
Qu porcentaje de centrales tienen ms de 3 averas?
Interprete:
n
2

f
3

N
4

F
4













N de averas
4 3 2 1 0
1
5
8
13 13
N


d
e

c
e
n
t
r
a
l
e
s
12
10
8
5
2
0
Ejemplo 2 : Datos sobre el nmeros de averas de 40 centrales elctricas se
resumen en la tabla siguiente:

N de averas Frec.
Absoluta
n
i
Frec.
Relativa
f
i
Frec. Abs. Acumulada
N
i
Frec. Relat.
Acumulada
F
i
0 13 13 0,325
1 13 26
2
3 5
4 1 40
Total 40 1,000

GRFICO DE BARRAS SEPARADA





















PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 24

Cuando la variable es continua o el nmero de valores posibles de una
variable discreta sea grande, para construir la tabla de frecuencias,
conviene agrupar los datos intervalos reales. stos agrupan todos
aquellos casos contenidos entre dos valores, conocidos como el lmite
superior e inferior.








Ejemplo: Se recolect informacin sobre la edad (en aos) de 50 estudiantes
seleccionados de una casa de estudio superior. El valor de los datos, en el orden
en que fueron recolectados se presenta a continuacin. (Este es un ejemplo de
datos cuantitativos en bruto)
21 24 29 26 36
18 19 19 25 25
25 31 23 23 23
22 21 22 21 19
25 18 27 21 21
19 25 34 27 33
20 22 19 22 23
19 19 18 19 26
28 20 22 20 21
23 36 23 25 24
Construyendo tablas de frecuencias
Al construir tablas de frecuencias es necesario tomar las siguientes 3 decisiones:

i) Nmero de clases (intervalos)
Usualmente el nmero de intervalos de una distribucin de frecuencias vara
entre 5 y 20, dependiendo principalmente del nmero de casos con los cuales se
cuente. La decisin del nmero de clases es decidida arbitrariamente por quien
organiza la informacin.
Reglas que puede ayudar a decidir el nmero de clases o intervalos:
- Nmero de intervalos = n ; n = nmero de datos, o
- Nmero de intervalos = [1 + 3,3 log n] (frmula de Sturge)
ii) Amplitud de intervalo


PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 25

Aunque no es comn tener clases o intervalos de diferentes tamaos o
amplitud, la mayora del tiempo es preferible tener la misma amplitud de intervalo
en todos ellos.
Para determinar esta amplitud cuando las clases o intervalos tienen el mismo
tamao, primero se debe encontrar la diferencia entre el mayor y el menor de los
datos en los datos. Luego, la amplitud aproximada es obtenida dividiendo esta
diferencia por el nmero deseado de clases o intervalos.

valor mximo - valor mnimo
Amplitud del intervalo =
nmero de intervalos




iii) Lmite inferior de la primera clase o punto de partida
Cualquier nmero que sea igual o menor que el ms bajo de los valores del
conjunto de datos ser conveniente para ser usado como el lmite inferior del
primer intervalo.

En el ejemplo (Edad): n = 50 mx = 36 mn = 18
Si utilizamos nmero de intervalos = [1 + 3,3 log (50)] = 6
Amplitud =
36 18
= 3
6



Se lee

Edad

n de alumnos
14 alumnos con edades entre 18 y menos de 21 aos
18 21 14
17 alumnos con edades entre 21 y menos de 24 aos
21 24 17

24 27 10

27 30 4

30 33 1
4 alumnos con edades entre 33 y 36 aos
33 36 4

Total = 50









PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 26

Frecuencias relativas y porcentaje
Es posible calcular la frecuencia relativa y el porcentaje de las distribuciones cuantitativas del
la misma forma que en las distribuciones cualitativas o discretas.

Edad Marca de clase
x
i
Frec. Absoluta
n
i
Frec. Relativa
f
i
Porcentaje
18 21 19,5 14 0,28 28
21 24 22,5 17 0,34 34
24 27 25,5 10 0,20 20
27 30
30 33
33 36
Total = 50 1,00 100%
Tambin se pueden registrar las frecuencias acumuladas

limite inferior +limite superior
marca de clase =
2


Representacin grfica de distribuciones de frecuencias con datos en intervalos

Las representaciones grficas ms frecuentes de una tabla de frecuencias donde los
datos han sido agrupados en intervalos son el histograma o el polgono de
frecuencias.



Edad
39 36 33 30 27 24 21 18 15
N


e
s
t
u
d
i
a
n
t
e
s
20
15
10
5
0
4
1
4
10
17
14
Histograma


PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 27

Donde cada rectngulo corresponde con una clase y la altura es proporcional
a la frecuencia de dicha clase o intervalo.

Formas de histogramas
Un histograma puede asumir diferentes formas. Las ms comunes son:
simtricos, asimtricos y uniforme o rectangular.
Simtrico Asimetra Positiva Asimetra Negativa








Observacin: Describir datos utilizando grficos puede ayudar a iluminarnos acerca de
las caractersticas principales de la informacin. Desafortunadamente, tambin pueden
ser utilizados, casual o intencionadamente, para distorsionar informacin y desorientar
a quien la recibe. Las siguientes son dos formas de hacerlo:
1. Cambiar la escala en uno o en ambos ejes (esto es alargando o acortando los ejes)
2. Truncando las frecuencias, es decir, comenzando el eje en un nmero mayor que
cero.
Polgono de frecuencias
Grfico alternativo al histograma
Los polgonos de frecuencias se realizan trazando los puntos formados por las
marcas de clase y las frecuencias, y unindolos mediante segmentos.






x
32.5 27.5 22.5 17.5 12.5 7.5 2.5
Simtrica
10
8
6
4
2
0
X
32.5 27.5 22.5 17.5 12.5 7.5 2.5
10
8
6
4
2
0
X
32.5 27.5 22.5 17.5 12.5 7.5 2.5
10
8
6
4
2
0


PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 28

Polgono de frecuencias



Grafico de tendencia

Consumo humano de leche de cabra en Espaa. (millones de litro)

Ao 1990 1991 1992 1993 1994 1995 1996 1997 1998
Consumo 62,5 29,9 31,3 25,2 20,8 16,1 15,8 15,9 16,6
Ao 1999 2000 2001 2002 2003 2004 2005 2006

Consumo 16,2 17,1 15,5 17,6 11,9 11,8 12,3 13,1

Edad
39,0 37,5 36,0 34,5 33,0 31,5 30,0 28,5 27,0 25,5 24,0 22,5 21,0 19,5 18,0 16,5 15,0
N


a
l
u
m
n
o
s
20
15
10
5
0
0
4
1
4
10
17
14
0


PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 29


- El consumo anual de leche de cabra en el ao 1991 disminuy en 52,16% con
respecto al consumo del ao 1990 (variacin porcentual)
- Determine la variacin porcentual entre los aos 2001 y 2002.
Variacin porcentual =
Final
- 1 100
Inicial












PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 30

Prctica 1.2.
En cada uno de los siguientes ejercicios debe indicar cul es la variable de inters y
clasificarla segn naturaleza, T_recorrido y nivel de medicin
1. El Ingeniero a cargo del control de calidad del agua de una ciudad, es responsable
del nivel de cloracin del agua. Dicho nivel debe acercarse bastante al que exige el
Departamento de Sanidad. Para vigilar el cloro, sin necesidad de verificar cada
galn de agua que sale de la planta, el Ingeniero muestrea diariamente algunos
galones, mide el contenido de cloro y saca una conclusin sobre el nivel promedio
de cloracin que tiene el agua tratada ese da. La tabla anexa exhibe las
concentraciones de cloro correspondiente a 30 galones seleccionados como
muestra de un da. A partir de esta muestra diaria el Ingeniero obtiene sus
conclusiones respecto a la poblacin total a la que se le aplic la cloracin.

Diagrama de tallo-hojas
Tabla de Concentraciones de Cloro
en partes por milln (ppm)

16.2 15.7 16.4 15.4 16.4 15.8 16.0 15.2
15.7 16.6 15.8 16.2 15.9 15.9 15.6 15.8
16.1 15.9 16.0 15.6 16.3 16.8 15.9 16.3
16.9 15.6 16.0 16.8 16.0 16.3




(Utilice una amplitud de 0.3 ppm).

Construya una tabla de distribucin de frecuencias y un grfico adecuado.

2. En un centro de computacin, el nmero de veces que el computador se detiene,
por error de mquina, diariamente, fue recolectado por un perodo de 70 das. Los
datos obtenidos fueron los siguientes.

N de detenciones del computador por da.
0
1
0
2
0
0
8
3
2
1
2
5
1
0
6
0
0
1
0
4
0
0
0
0
3
0
4
1
1
3
3
3
0
2
1
3
0
1
1
2
0
6
1
2
4
0
2
0
0
0
1
0
2
0
2
0
2
2
5
0
0
3
1
2
0
0
0
0
1
4

- Tabule y grafique los datos adecuadamente.
- Cul es la proporcin de das en que ocurren ms de 3detenciones?

Stem-and-Leaf Plot

Frequency Stem & Leaf

,00 15 .
1,00 15 . 2
1,00 15 . 4
5,00 15 . 66677
7,00 15 . 8889999
5,00 16 . 00001
5,00 16 . 22333
2,00 16 . 44
1,00 16 . 6
3,00 16 . 889

Stem width: 1,0
Each leaf: 1 case(s)



PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 31

3. Un fabricante de envases de plstico desea analizar cules son las causas que
generan los envases defectuosos que se producen. Observa 248 envases
defectuosos obteniendo:

Coloque los n
i
en las barras. Interprete el grfico.

4. En un proceso de fabricacin de circuitos integrados las causas ms comunes de
fallas son: la contaminacin (1), xido(2), metalizacin (3), la corrosin(4), doping (5)
,los defectos del silicio (6) y varios (7). En un proceso de control de calidad de estos
circuitos las causas de falla de 31 de ellos han resultado las siguientes:

corrosin, xido, contaminacin, xido, xido, varios, xido, contaminacin,
metalizacin, xido, contaminacin, contaminacin, xido, contaminacin,
contaminacin, contaminacin, corrosin, silicio, varios, contaminacin,
contaminacin, contaminacin, varios, contaminacin, contaminacin, doping,
xido, xido, metalizacin, contaminacin y contaminacin.
Se pide: Construir una distribucin de frecuencias y confeccione dos grficos
adecuados.

Defectos
Color Fuera de
medida
Rosca Rotura Desbalanceo Aplastamiento
F
r
e
c
u
e
n
c
i
a
100
80
60
40
20
0
P
o
r
c
e
n
t
a
j
e
100%
80%
60%
40%
20%
0%
100,00% 99,60%
97,18%
92,34%
76,61%
60,48%
Diagrama de Pareto


PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 32

5. El responsable en control de industrial de una empresa somete a un test de
fiabilidad 150 dispositivos electrnicos idnticos y anota su duracin (tiempo hasta
fallo en horas). La recogida de datos lleva al histograma siguiente:


5.1. Construya la tabla de frecuencias (absolutas, relativas, absolutas acumulada y
relativas acumulada)
5.2. Aproximadamente, cul es la duracin ms frecuente?
5.3. Qu porcentaje de dispositivos duraron entre 600 Y 1400 horas? (aprox.)
5.4. Qu porcentaje de dispositivos duraron menos de 900 horas? (aprox.)
5.5. Qu porcentaje de dispositivos duraron entre 420 y 1180 horas? (aprox.)
5.6. Determine entre que valores se encuentran el 50% de los dispositivos con
mayor duracin.
Del diagrama siguiente, determine los valores? (puntos de corte) e Interprete



|
25%
|
25%
|
25%
|
25%
|
Duracin (hrs)

0 ?

?

? 1600
Mn Mx

6. Se seleccionaron de un proceso de fabricacin, aleatoriamente 270 ladrillos y se
llev a cabo una prueba para determinar la resistencia transversal de stos. Se
obtuvieron los siguientes datos:
Duracion
2000 1800 1600 1400 1200 1000 800 600 400 200 0
N


d
e

d
i
s
p
o
s
i
t
i
v
o
s
60
50
40
30
20
10
0
3 3
6
18
21 21
27
51
Histograma


PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 33

Resistencia (MN/m
2
)
X

n
i
1.5 3.5
3.5 4.5
4.5 5.5
5.5 6.5
6.5 7.5
7.5 8.5
8.5 9.5
9.5 10.5
10.5 11.5
11.5 14.5
2
4
24
81
78
51
18
9
2
1

Construya un grfico adecuado
El histograma es especialmente adecuado para representar tablas de frecuencias en el
caso de variables de de nivel por lo menos intervalar (o discretas con un gran nmero
de valores observados distintos). Este grfico consiste en una serie de barras
adyacentes cuyas superficies son proporcionales a la frecuencia del intervalo sobre el
cual se levantan. Si los intervalos son de igual amplitud, los rectngulos sern de
altura proporcional a la frecuencia correspondiente. Es decir, si la amplitud del i-simo
intervalo es a
i
y su frecuencia n
i
la barra deber tener una altura h
i
que satisfaga:

i i i
i
i
i
ah = kn
n
h = k
a

donde k es cualquier constante, aunque la misma para cada intervalo.
n
i
frecuencia absoluta del intervalo i; h
i
frecuencia absoluta corregida

Se corrige la frecuencia solamente para graficar el histograma, cuando
existen intervalos de distinta amplitud (no es usual intervalos de distinta
amplitud)

Determine el porcentaje de ladrillos con resistencia inferior a 8,5 MN/m
2






Determine el porcentaje de ladrillos con resistencia superior a 5 MN/m
2











PROBABILIDAD Y ESTADSTICA FMS 176 PROFESORA: CECILIA LARRAN R. Pgina 34

7. Los accidentes de los empleados en una planta de papas fritas se clasifican de
acuerdo con la zona daada.
(Ejer. 2.1 pg. 18- texto Prob. y Est. para Ing.- Miller, Freund, Johnson)
D = dedos O = ojos B = brazos P = piernas
Los datos obtenidos son los siguientes:
D D D O D
O B D D D
D D O D O
P D D D D
D O B D D
Realice un anlisis estadstico descriptivo (anlisis de datos), con la informacin
dada.
(unidad de observacin variable de inters tabla de frecuencias grfico medida de resumen-interpretacin)

6. En un estudio sobre el nivel de ruido en un concierto de rock se toma una muestra
de 60 valores, medidos en decibelios y en distintos momentos del concierto.
Los datos obtenidos se encuentran el el diagrama tallo-hojas siguiente

NIVEL DE RUIDO

Frequency Stem & Leaf

1,00 8 . 3
3,00 8 . 789
22,00 9 . 0000111123333334444444
21,00 9 . 555566677777777889999
11,00 10 . 00001122234
2,00 10 . 57

Encuentre:
Valor mnimo
Valor mximo
El % de mediciones inferior a 91 db.
El % de mediciones superior a 100 db.

7. Con el propsito de mejorar el tiempo de entrega desde una embotelladora de
refrescos a mquinas vendedoras de una universidad, se ha obtenido 25 datos.

Tiempo de entrega en minutos
9,45 24,45 31,75 35,00 25,02 16,86 14,38 9,60 24,35 37,50
17,08 37,00 41,95 11,66 21,65 17,89 69,45 10,30 34,93 46,59
44,88 54,12 56,63 22,13 21,15 10,02 14,88 16,97 17,73 21,84
24,45 33,66 37,10 39,73 44,29 55,12 56,63 29,41 24,45 9,45

Organice los datos en una tabla de frecuencias con igual amplitud y confecciones un
grfico adecuado

Vous aimerez peut-être aussi