Académique Documents
Professionnel Documents
Culture Documents
ESTADSTICA APLICADA
UNA VISIN INSTRUMENTAL
Teora y ms de 500 problemas
resueltos o propuestos con solucin
NDICE
1
12
14
17
17
18
20
26
PRIMERA PARTE
ESTADSTICA DESCRIPTIVA
2. Estadstica descriptiva unidimensional
2.1. Introduccin .................................................................................
2.2. Tablas de frecuencias ...................................................................
2.3. Representaciones grficas ............................................................
2.3.1. Caracteres cualitativos ......................................................
2.3.2. Caracteres cuantitativos discretos .....................................
2.3.3. Caracteres cuantitativos continuos ...................................
2.4. Anlisis numrico ........................................................................
2.4.1. Medidas de posicin .........................................................
IX
31
33
37
37
40
42
48
48
NDICE
2.5.
2.6.
2.7.
2.8.
2.9.
61
66
67
71
74
75
85
92
99
100
103
104
106
108
110
110
113
115
119
129
130
134
135
136
136
137
144
SEGUNDA PARTE
PROBABILIDAD. DISTRIBUCIONES DE PROBABILIDAD
4. Probabilidad
4.1. Introduccin ...............................................................................
4.2. Experimentos aleatorios .............................................................
4.3. lgebra de sucesos y lgebra ..............................................
4.4. Frecuencia relativa de un suceso. Probabilidad en espacios
muestrales finitos .......................................................................
155
157
159
162
NDICE
4.5.
4.6.
4.7.
4.8.
4.9.
4.10.
4.11.
4.12.
XI
164
170
171
173
174
175
179
183
191
192
197
199
201
201
203
206
207
208
208
210
212
215
218
220
226
230
233
234
241
242
243
244
246
250
251
253
XII
NDICE
254
255
257
257
258
264
265
273
275
277
278
280
282
285
287
292
294
295
296
298
299
300
301
302
305
308
309
TERCERA PARTE
INFERENCIA ESTADSTICA
8. Inferencia estadstica. Teoremas del lmite
8.1. Introduccin .................................................................................
8.2. Poblacin de las muestras ............................................................
8.3. La distribucin normal y la inferencia estadstica .......................
8.4. Teoremas del lmite .....................................................................
8.4.1. El teorema central .............................................................
8.4.2. Teorema de Lindeberg-Lvy ............................................
319
320
322
325
325
326
NDICE
8.5.
8.6.
8.7.
8.8.
XIII
327
327
332
335
336
337
340
345
345
348
351
353
354
355
355
356
357
358
361
365
371
372
375
375
378
381
382
383
386
387
389
390
XIV
NDICE
| X | d? ..........................................................................
10.7.2. Cul debe ser el tamao de la muestra que se necesita para estimar p con confianza 1 , y con precisin
| p p | d?.........................................................................
10.8. Intervalo de confianza para la diferencia de medias 1 2 ....
10.8.1. Si se conocen las varianzas poblacionales 12 y 22 ......
10.8.2. Si no se conocen las varianzas poblacionales pero se
pueden suponer iguales ...............................................
10.8.3. Si no se conocen las varianzas poblacionales 12 y 22 y
no se pueden suponer iguales ......................................
10.9. Intervalo de confianza para la diferencia de proporciones p1 p2 ..
10.10. Intervalo de confianza para el cociente de varianzas ...............
Tabla de intervalos de confianza (distribucin de los estadsticos en el
muestreo) .....................................................................................
10.11. Problemas propuestos ..............................................................
11. Contrastes de hiptesis paramtricos
11.1. Introduccin .............................................................................
11.2. Etapas a seguir en un contraste paramtrico ............................
11.3. La nocin de riesgo. Errores ....................................................
11.4. El P-valor .................................................................................
11.5. Prueba de conformidad con una proporcin terica (binomial) .....
11.5.1. Prueba bilateral para p .................................................
11.5.2. Pruebas unilaterales para p ..........................................
11.6. Prueba de conformidad con una media terica ........................
11.6.1. Pruebas bilaterales para ............................................
11.6.2. Pruebas unilaterales para ..........................................
11.7. Prueba de conformidad con una varianza terica ....................
11.7.1. Prueba bilateral para 2 ...............................................
11.7.2. Pruebas unilaterales para 2 ........................................
11.8. Prueba de comparacin de dos proporciones ...........................
11.8.1. Contraste bilateral .......................................................
395
396
398
400
401
403
403
404
405
406
407
407
408
409
412
414
417
423
424
429
437
439
439
441
443
443
445
447
447
448
450
450
NDICE
XV
452
453
454
455
456
456
460
464
471
473
524
527
530
539
542
546
548
549
479
480
487
487
488
496
500
503
507
509
512
515
519
521
XVI
NDICE
554
556
559
563
566
567
573
576
578
579
581
584
CUARTA PARTE
UNA INTRODUCCIN A LOS PROCESOS ESTOCSTICOS
Y A LA GEOESTADSTICA
595
598
604
610
612
614
619
622
623
628
631
632
633
634
634
635
636
636
NDICE
14.13.
14.14.
14.15.
14.16.
14.17.
14.18.
14.19.
14.20.
14.21.
14.22.
XVII
637
638
638
640
641
644
650
660
663
668
669
671
677
APNDICE I
Tabla I. reas bajo la curva normal ..........................................................
Tabla II. reas bajo la curva de densidad de la 2n a la izquierda de 2;n ...
Tabla III. reas bajo la curva de densidad de la tn a la izquierda de t;n ....
Tabla IV. reas bajo la curva de densidad de la F[n1, n2] a la izquierda de
F[n1, n2]; , = 0,05...................................................................................
Tabla V. reas bajo la curva de densidad de la F[n1, n2] a la izquierda de
F[n1, n2]; , = 0,01 .................................................................................
Tabla VI. reas bajo la curva de densidad de la F[n1, n2] a la izquierda de
F[n1, n2]; , = 0,025 ................................................................................
Tabla VII. reas bajo la curva de densidad de la F[n1, n2] a la izquierda de
F[n1, n2]; , = 0,005 ................................................................................
Tabla VIII. Nmeros aleatorios ..............................................................
Tabla IX. Valores crticos H;[k,n1] del contraste de Hartley de homogeneidad de las varianzas ........................................................................
Tabla X. Valores crticos Dn; del contraste de Kolmogorov-Smirnov para
una muestra ..........................................................................................
685
686
687
688
689
690
691
692
693
694
APNDICE II
Soluciones a los problemas propuestos ...................................................
Bibliografa ................................................................................................
ndice de materias .....................................................................................
697
747
753
POR QU Y PARA QU SE HA
ESCRITO ESTE LIBRO
XX
PRLOGO
XXII
ciones en la biologa, en la medicina, en hidrologa, en edafologa, y en otros campos muy diversos, dando lugar a una rama de investigacin fascinante y en continuo desarrollo.
Los catorce temas de los que se compone el libro estn ordenados de forma
secuencial. Es conveniente, y recomendable, seguir el orden presentado y hacer un
razonable esfuerzo por comprender los ejemplos. Los captulos se ilustran con
ejercicios y problemas resueltos tomados de diferentes campos, y al final de cada
uno se insertan problemas propuestos cuya solucin se incluye en el Apndice II.
Se comienza con ejercicios sencillos para pasar a resolver otros ms complicados o que requieren hacer uso del ordenador para facilitar los clculos. Son muchos los programas que se pueden utilizar para el anlisis estadstico en un ordenador personal, de entre ellos hemos elegido STATGRAPHICS1 Plus para
Windows, Versin 5.1, cuyo uso est ampliamente extendido, por ser sta la
versin del programa ms empleada en la actualidad, por su facilidad de manejo
y por los resultados grficos que ofrece; Excel2, Versin 2003, porque permite
formar tablas detalladas de los clculos; DERIVE3, Versin 6.10, para efectuar
clculos y para el dibujo de algunas grficas, SURFER4, Versin 8, y la Versin 4 de GRAPHER, para la geoestadstica.
Agradecemos al analista del Departamento de Apoyo a Investigacin de los
Servicios Informticos de Apoyo a la Docencia e Investigacin, rea de Informtica y Comunicaciones de la UCM, Dr. D. Santiago Cano Alsa, su continua
orientacin y asesoramiento en la eleccin y uso del software.
Los ejercicios se resuelven a mano, haciendo uso de calculadora, hojas de clculo y tablas, que se incluyen en el Apndice I, y tambin, si es posible, con
STATGRAPHICS. El conjugar ambos procedimientos ayuda, entre otras cosas, a
comprender mejor el mtodo para obtener la solucin, a interpretar los resultados
que proporcionan los programas, a valorar la ayuda que supone poder hacer uso de
software, que ahorra tiempo facilitando los clculos y que permite manejar grandes
cantidades de datos, y a desarrollar el espritu crtico fomentando el hbito de no
aceptar sin justificacin ningn resultado. Familiarizarse con la utilizacin de algn
programa estadstico e interpretar la salida facilita la comprensin de cualquier salida de otro programa y esto es hoy en da imprescindible en el trabajo cientfico.
Queremos agradecer a todas las personas que han contribuido a que este libro
se haya podido escribir, a nuestros profesores que nos han ayudado a formarnos,
a los compaeros principalmente de las facultades de Ciencias Biolgicas y de
Ciencias Geolgicas de la UCM por animarnos a redactarlo y por sus comentarios, a los compaeros que nos han proporcionado datos, en especial a la Dra. D.a
Paloma Sevilla Garca y al Dr. D. Sergio Rodrguez Garca, ambos profesores del
1
STATGRAPHICS es una marca registrada por Manugistics Inc. and Statistical Graphics Corporation. USA.
2
Excel es una marca registrada por Microsoft Corporation.
3
DERIVE es una marca registrada por Texas Instruments Incorporated.
4
SURFER y GRAPHER son marcas registradas por Golden Software, Inc.
PRLOGO
XXIII
Departamento de Paleontologa de la Facultad de Ciencias Geolgicas, a los antiguos alumnos que nos han alentado en esta tarea, a la Editorial Daz de Santos,
por haber confiado de nuevo en nuestro trabajo, a la Imprenta Fernndez Ciudad
por su esmero en la fotocomposicin y por su saber hacer, mejorando la presentacin y el resultado final de esta obra, a nuestras familias por el tiempo que les
hemos sustrado durante la elaboracin de este libro.
Gracias al Dr. D. Benjamn Fernndez Ruiz, catedrtico del Departamento de
Biologa Celular, al Dr. D. Antonio Tormo Garrido, actual Decano de la Facultad
de Ciencias Biolgicas, al Dr. D. Eduardo de Juana Aranzana, Presidente de la
Sociedad Espaola de Ornitologa (SEO), y al Dr. D. Carlos Vicente Crdoba, catedrtico del Departamento de Biologa Vegetal I (Botnica y Fisiologa Vegetal)
por su generosidad al cedernos las fotografas que ilustran la portada del libro.
Nuestro agradecimiento muy especial al Dr. D. Francisco Jos Cano Sevilla,
catedrtico de Estadstica e Investigacin Operativa de la UCM y asesor del
Consejo de Coordinacin Universitaria, por su valiosa colaboracin en la lectura
y correccin del original. Sus acertadas observaciones nos han servido de gran
ayuda.
Queremos hacer constar nuestro homenaje pstumo y nuestra gratitud a dos
catedrticos: D. Rafael Garca Arez, fallecido el pasado 28 de mayo, que fue catedrtico de Matemticas de Instituto y de la E.U.I.T. Forestal de la UPM, donde
ocup tambin el cargo de Jefe de Estudios desde 1975 hasta 1986, y D. Sixto
Ros Garca, el Padre de la Estadstica en Espaa, fallecido el pasado 8 de julio,
que fue catedrtico de Estadstica en la Facultad de Matemticas de la UCM, Acadmico numerario de la Real Academia de Ciencias Exactas, Fsicas y Naturales
desde 1961, Fundador y Director del Instituto de Estadstica e Investigacin
Operativa del CSIC y de la primera Escuela de Estadstica de Espaa. Los que hemos tenido la suerte de conocerlos y de trabajar con ellos no los podemos olvidar
y les estaremos siempre agradecidos.
Se lo dedicamos a todos ellos, a los futuros alumnos, a los investigadores que
necesiten hacer uso de la estadstica y a todos aquellos que precisen aplicarla, para
los que hemos hecho esta obra de un modo especial, con el deseo de que les ayude en su formacin y en sus trabajos.
Si a las personas que utilicen este libro les resulta provechoso habremos logrado nuestro objetivo y nos sentiremos satisfechos. Tambin estaremos muy
agradecidos a todos los que nos remitan sus opiniones, sugerencias o comentarios
a la siguiente direccin: mtgmant@bio.ucm.es
LOS AUTORES
Captulo preliminar
1.1.
INTRODUCCIN
La estadstica es una rama de las matemticas con origen remoto y en continua evolucin y desarrollo. Hasta el siglo XVII se entenda por estadstica la recopilacin de datos para la administracin del Estado. Ya en el Imperio Romano
se hizo enumeracin y recuento de soldados, medios de transporte, riquezas... y se
tiene constancia de que en tiempos de Csar Augusto se realiz un censo de la poblacin. De status, o estado de las cosas, parece derivarse la palabra estadstica.
Aqu se encuentra el origen de la estadstica descriptiva.
Vivimos inmersos en un mundo de cifras: evolucin del paro, variaciones en
los ndices de precios (IPC), gastos familiares, ndice de la bolsa, IBEX-35, cotizaciones burstiles, nmero de accidentes de circulacin, censo electoral, porcentaje de personas que padecen una enfermedad, prediccin del tiempo, resultados de unas elecciones, porcentaje de hogares que utilizan Internet, eficacia de
una campaa publicitaria, prospecciones petrolferas y de minas, relacin entre el
nmero de hijos nacidos con Sndrome de Down y la edad de la madre, frecuencias genotpicas en una poblacin y frecuencias fenotpicas que son objeto de estudio de la gentica de poblaciones, gasto por usuario de telfono mvil, etc. Hay
dos formas de ver los datos, la del periodista, que se ocupa de la ancdota, y la del
estadstico, que est interesado por la regularidad.
En la prensa escrita, en los medios audiovisuales, en los textos aparecen recuentos y porcentajes.
En la Figura 1.1 se puede observar doble informacin. En los sectores se representa el nmero de habitantes que eran usuarios de Internet en 2006, en cabeza est Asia. Adems, se refleja el porcentaje de usuarios de Internet en relacin
al nmero total de habitantes de cada una de las poblaciones examinadas; en este
aspecto Asia baja al quinto lugar de las siete porciones en las que se ha dividido la
poblacin mundial.
1