Académique Documents
Professionnel Documents
Culture Documents
ESTADSTICA
Sociedad Espaola Sociedad Espaola de Bioqumica Clnica y Patologa Molecular (SEQC),
Calle Padilla 268, despacho 68, 08025-Barcelona, http://www.seqc.es
Jul i o-Agosto, 2008
Vol umen 2, Nmero 7
Gua de estudio. 8. Estadstica aplicada (y 3) Muestreo. Diseo experimental (DDE). Determinacin del
nmero necesario de observaciones 1
Nombres propios 6
Pierre de Fermat (1601-1665) 6
Tests para evaluar la aleatoriedad de una muestra (1) 6
Problemas 11
Introduccin a : Regresin no linear en 13
Uso del foro del curso de estadstica 16
Segunda prueba de evaluacin 19
Prximo nmero 22
Gua de estudio. 8.
Estadstica aplicada (y 3)
Muestreo. Diseo
experimental (DDE).
Determinacin del nmero
necesario de observaciones
Introduccin
El muestreo es una parte esencial del anlisis
estadstico, de la misma forma que la fase
preanaltica es un componente decisivo del ciclo
analtico del laboratorio clnico. La literatura
estadstica est repleta de tpicos como los
resultados nunca son mejores que la calidad de
la muestra o las muestras han de ser
representativas para que el anlisis tenga
validez. Se ha estimado que la incertidumbre
ligada al muestreo es unas 100 veces superior a
la incertidumbre ligada al anlisis estadstico. Es
incuestionable que un proceso estadstico en que
se haya realizado una seleccin de observaciones
negligente tiene grandes posibilidades de
arruinar total e irreversiblemente cualquier
investigacin.
Puede parecer que se trata de un captulo
destinado a aplicaciones en el campo econmico
o social, donde se realizan encuestas de forma
casi continua. Sin embargo los conceptos son
aplicables a cualquier aplicacin estadstica o
cientfica. El tema del muestreo est ntimamente
relacionado con la determinacin del nmero de
casos necesarios para realizar una inferencia
potente, y ambos aspectos resultan fundamentales
para un correcto diseo experimental.
Forma parte inherente a la investigacin la
definicin meridianamente clara de la poblacin
objeto del estudio. No existe, sin embargo un cdigo
o unas normas estrictas que seguir. En cada caso los
objetivos de la investigacin, la lgica y el sentido
comn del investigador debern establecer las
caractersticas de la poblacin. En algunos, pocos,
casos la poblacin ser lo suficientemente pequea
o asequible como para permitir al investigador que
la incluya en su totalidad en el estudio. Todos los
miembros de la poblacin participan en el estudio,
por lo que ste recibe la calificacin de censal. Sin
embargo, lo ms frecuente es que la poblacin sea
tan extensa que el investigador debe limitarse a un
segmento de la totalidad de la poblacin de inters.
Este fragmento, para que proporcione informacin
til, debe ser un fiel reflejo de la poblacin, debe
ser representativa.
El procedimiento de seleccin de los individuos, el
muestreo, puede ser probabilstico o no
probabilstico. Una seleccin es probabilstica si
cada individuo tiene una probabilidad (no nula,
entre 0 y 1) de ser seleccionado. Los mtodos de
muestreo denominados aleatorio, sistemtico y
estratificado pertenecen a esta clase de muestreo
probabilstico. Los procedimientos de muestreo de
comodidad (o conveniencia
1
), por prejuicio
2
, por
1
Sera el caso de un investigador en una fase preliminar de un
proyecto en que selecciona individuos simplemente por
proximidad (comodidad) sin preocuparse en disear un costoso o
caro procedimiento de seleccin.
2
Por ejemplo, cuando en unas elecciones se obtiene el resultado
de todas las votaciones en una mesa electoral que se juzga
Vol. 2, nm. 7, Pg. 2
Curso de estadstica
cuotas
3
, o por efecto bola de nieve
4
son ejemplos
de muestreo no probabilstico. La diferencia est
en que los mtodos probabilsticos permiten
calcular un error de muestreo o grado en que la
muestra es diferente de la poblacin, y por tanto
los nicos que sern objeto de estudio.
El muestreo aleatorio es la forma ms tpica de
muestreo probabilstico. En l, cada miembro de
la poblacin tiene una probabilidad igual y
conocida de ser seleccionado. No obstante, en
grandes poblaciones, en las que no es posible
identificar todos sus miembros, se desconoce la
dimensin exacta y por tanto el nmero de
individuos puede estar manos o menos segado.
Cuando se conoce el contingente a seleccionar,
puede extraerse sistemticamente un individuo
de cada n integrantes de la lista (confeccionada
sin intencionalidad). Este muestreo sistemtico
constituye un procedimiento tan vlido pero ms
simple que el muestreo aleatorio.
Con el fin de reducir el error de muestreo, en el
muestreo estratificado el investigador
previamente define subpoblaciones (estratos)
mediante caractersticas comunes y su
representatividad en la poblacin.
El muestreo forma parte inherente de un
experimento cientfico. Poco puede decirse de la
importancia de un correcto diseo experimental
para obtener conclusiones vlidas. El diseo de
experimentos es un captulo de la estadstica
bien establecido desde hace muchos aos y que
va incorporando progresivamente novedades y
mejoras para optimizar el rendimiento de los
recursos cientficos y la potencia de las
conclusiones que se derivan de tales
experimentos.
Conocimientos previos
Estadstica descriptiva: mtodos grficos y
diagramas.
Distribuciones muestrales. distribucin normal
Estadstica inferencial: valor p, tipos de error,
clculo de la potencia, intervalos de confianza,
de tolerancia y predictivos. Tests de hiptesis:
tests de normalidad, tests de aleatoriedad,
comparacin de medias y varianzas; ANOVA,
regresin. Anlisis de datos cualitativos: tablas
de contingencia. Test no paramtricos.
Familiaridad con el uso de programas aplicados
al anlisis estadstico: visualizacin de datos,
clculos de probabilidad y simulacin.
sociolgicamente representativa para obtener una
estimacin de los resultados de las elecciones en toda la
demarcacin electoral.
3
El investigador identifica unos estratos vase muestreo
estratificado) pero realiza la seleccin mediante muestreo
de conveniencia o de prejuicio.
4
El hecho de seleccionar un individuo desencadena la
seleccin de otros individuos, aunque reducindose la
posibilidad de que stos sean genuinamente representativos
de la poblacin.
Contenidos
1. MUESTREO
1. Introduccin
1.1. Parmetros poblacionales y muestrales;
1.2. Heterogeneidad y error de muestreo;
1.2.1. Errores debidos al procedimiento;
1.2.2. Errores estadsticos.
2. Metodologa
2.1. Muestreo probabilstico y no probabilstico;
2.2. Muestreo aleatorio;
2.2.1. Muestreo aleatorio sin reposicin;
2.2.2. Muestreo aleatorio con reposicin;
2.2.3. Produccin y utilizacin de tablas de
nmeros aleatorios;
2.2.4. Utilizacin del mtodo de Montecarlo;
2.3. Muestreo aleatorio estratificado;
2.3.1. Asignacin proporcional;
2.3.2. Asignacin ptima;
2.4. Muestreo sistemtico;
2.5. Muestreo por estadios mltiples;
2.6. Muestreo por conglomerados;
3. Diseo adecuado e inapropiado: planificacin
para evitar sesgos
4. Planificacin coste/efectiva del muestreo
(minimizar los costes cuando la incertidumbre es
conocida, o minimizar la incertidumbre cuando
los costes son fijos)
5. Dimensin del muestreo: cuntas observaciones
hacen falta
6. Aplicaciones estadsticas del muestreo:
inferencia.
2. DISEO EXPERIMENTAL, NMERO DE
OBSERVACIONES NECESARIAS
1. Introduccin al diseo estadstico experimental
(DEE)
1.1. El mtodo cientfico. Investigacin
experimental y no experimental;
1.2. Diferentes tipos de experimentos. Experimentos
exploratorios y confirmatorios. Experimentos
espaciales y temporales;
1.3. Formulacin y desarrollo de un diseo
estadstico;
1.4. Conceptos de unidad experimental,
tratamiento, error, variable aleatoria,
variable dummy, variabilidad, precisin y
exactitud, datos continuos y discretos, pulsos...;
1.5. Objetivos del DEE;
1.6. Anlisis del DEE: interpretacin y presentacin
de resultados. Generacin hiptesis: hiptesis
estadsticas e hiptesis cientficas;
1.7. Fundamentos del DEE: replicacin,
aleatorizacin, bloqueo o control.
2. Diseo completamente aleatorizado
2.1. Conceptos (aleatorizacin, muestreo), ventajas
y desventajas, aplicaciones;
2.2. Estadstica: ANOVA (tablas e inferencia de la
comparacin de medidas de centralizacin,
anlisis de residuales); homoscedasticidad
Vol. 2, nm. 7, Pg. 3
Curso de estadstica
(comprobacin de la homogeneidad de la
varianza);
2.3. Regresin. Regresin no linear. Regresin
mltiple;
2.4. Alternativas al ANOVA convencional: ANOVA
no equilibrado. ANOVA no paramtrico;
2.5. Comparaciones mltiples. Contrastes;
2.6. Anlisis de la covarianza (ANCOVA).
3. Diseos factoriales
3.1. Conceptos, ventajas y desventajas,
aplicaciones;
3.2. Modelo de efectos fijos;
3.3. Diseo anidado, diseo de dos factores,
diseo split-plot;
3.4. Estadstica inferencial en experimentos
factoriales.
4. Diseo de bloques al azar
4.1. Conceptos, ventajas y desventajas,
aplicaciones;
4.2. Estadstica inferencial en el diseo de
bloques al azar: hiptesis y estimacin de
parmetros.
5. Cuadrados latinos y grecolatinos, mediciones
repetidas, tablas para variables categricas y
otros diseos
5.1. Conceptos, ventajas y desventajas,
aplicaciones;
5.2. Estadstica inferencial en el diseo de
cuadrados latinos y otros diseos.
Objetivos
Al terminar esta parte del curso, los
participantes deben ser capaces, en el apartado
de muestreo, de:
Describir las diferentes formas de obtener
muestras de una poblacin;
Describir las diferentes formas
probabilsticas y sus aplicaciones de obtener
muestras de una poblacin;
Describir y aplicar los mtodos estadsticos
(tabla de nmeros aleatorios, simulacin
Monte-Carlo...) para asegurar la aleatoriedad
de una seleccin muestral;
Describir y aplicar procedimientos de
inferencia estadstica para verificar la
aleatoriedad de una muestra.
Y por lo que hace referencia al diseo
experimental,
Conocer los fundamentos y conceptos del
diseo de estudios bioestadsticos y su
relacin con los mtodos inferenciales
(estimacin y contraste de hiptesis) como
base del razonamiento cientfico;
Saber leer y comprender en artculos o
informes de investigacin el apartado que
describe el anlisis estadstico de
investigaciones experimentales;
Saber planificar una investigacin
experimental;
Aplicar adecuadamente los mtodos estadsticos
utilizados en el anlisis de investigaciones
experimentales;
Conocer y utilizar herramientas informticas
utilizadas para analizar los datos obtenidos en
una investigacin experimental;
Presentar adecuadamente de manera verbal o
escrita los resultados estadsticos obtenidos en
una investigacin experimental.
Bibliografa
Existe una inmensa cantidad de bibliografa
dedicada a estos temas. De forma clsica se ha
tomado en consideracin en mbitos como la
econometra y la sociologa. Tambin en la
quimiometra y biometra. En todos los libros de
texto de estadstica, cualquiera que sea su nivel,
son tratados de forma suficiente. Existe, no
obstante campos especialmente debatidos por su
trascendencia, como puede ser los ensayos clnicos,
que debern ser estudiados con literatura
especializada.
A continuacin se aporta una serie de literatura
tradicionalmente recomendada en los cursos
monogrficos sobre muestreo y diseo
experimental, especialmente en lengua espaola.
(a) Muestreo
Abad de Servin, A. Introduccin al muestreo.
Mxico: Limusa,1978.
Alberdi J. Metodologa de investigacin por
sampling; Madrid: Euroamericana, 1969.
Azorn F. Curso de muestreo y aplicaciones. Madrid:
Aguilar, 1969.
Azorn F, Snchez Crespo JL. Mtodos y aplicaciones
del muestreo. Madrid: Alianza, 1986.
Barnett V. Elements of sampling theory. London:
The English Universities Press; 1974.
Fernndez Garca R. Muestreo en poblaciones finitas
curso bsico. Barcelona: EUB, 1995.
Chambers RL, Skinner CJ, eds. Analysis of survey
data. New York: Wiley, 2003.
Cochran WG. Sampling techniques. 3 ed. New York:
Wiley, 1977; (Tcnicas de muestreo; Mxico:
Continental, 1986)
Deming WE. On probability as a basis for action. Am
Stat, 1975; 29: 146-52.
Deming WE. Sample design in business research.
New York: Wiley, 1960.
Escuder Valls R. Manual de teora de probabilidades
con nociones de muestreo e inferencia. Valencia:
Tirant lo Blanc, 1992
Fernndez Trocniz A. Probabilidad estadstica
muestreo. Madrid: Tebar Flores, 1987.
Flyvbjerg B. Five misunderstandings about case
study research. Qualitative Inquiry. 2006; 12: 219-
45.
Gy PM. Sampling of heterogeneous and dynamic
material systems: Theories of heterogeneity,
Vol. 2, nm. 7, Pg. 4
Curso de estadstica
sampling and homogenizing. Amsterdam:
Elsevier, 1992.
Kish L. Survey sampling. New York: Wiley, 1995.
Korn EL, Graubard BI. Analysis of health surveys.
New York: Wiley, 1999.
Levy PS, Lemeshow S. Sampling of populations:
methods and applications. New York: Wiley,
1991.
Lohr, SL. Sampling: Design and analysis. Pacific
Grove, CA: Duxbury Press, 1999
Prez Lpez C. Tcnicas de muestreo estadstico
teora, prctica y aplicaciones informticas.
Madrid: Ra-MA, 1999.
Snchez Crespo JL. Esquema de muestreo con
reposicin parcial. Estadstica Espaola, 1994;
36: 143-60.
Snchez Crespo JL. A sampling scheme with
partial replacement. J Off Statis, 1997; 13: 327-
39.
Srndal CE, Swenson. A general view of
estimation in survey sampling. Int Stats Rev,
1987; 55: 279-94.
Srndal CE, Swenson B, Wretman J. Model
assisted survey sampling. New York: Springer-
Verlag, 1992.
Scheaffer RL, Mendenhall W, Ott L. Elementary
survey sampling. Boston, MA: PWS-Kent
Publishing Co, 1990 (Elementos de muestreo.
Mxico: Iberoamericana, 1987).
Stevens DL, Olsen AR. Variance estimation for
spatially balanced samples of environmental
resources. Environmetrics. 2003; 14: 593-610.
Stevens DL, Olsen AR. Spatially balanced
sampling of natural resources. J Am Stat Assoc
2004; 99: 262-78.
Strayer DL, Smith DR. A guide to sampling
freshwater mussel populations. Amer Fisheries
Soc Monograph 8, 2003.
Stuart A. Basic ideas of scientific sampling. New
York: Hafner Publishing Co, 1962.
Thompson SK. Sampling. 2 ed. New York: Wiley,
2002.
(a) Diseo de experimentos
Anderson VL, McClean RA. Design of
experiments. A realistic approach. New York:
Marcel Dekker, 1974.
Borrs F, Ferrandis E, Snchez A, Segura JV.
Cuadernos de bioestadstica II. Alicante: Club
Universitario, 1996.
Box GEP, Hunter WG, Hunter JS. Statistics for
experimenters. An introduction to design, data
analysis, and model building. New York: John
Wiley, 1978 (Estadstica para investigadores.
Introduccin al diseo de experimentos, anlisis
de datos y construccin de modelos. Barcelona:
Reverte, 1988).
Box GEP, Draper NR. Empirical model-building
and response surfaces. New York: Wiley, 1987.
Canavos G. Probabilidad y estadstica. Aplicaciones
y mtodos. Mxico: McGrawHill, 1987.
Cochran WG, Cox GM. Experimental designs. 2 ed.
New York: Wiley, 1977. (Diseos experimentales.
Mxico: Editorial Trillas, 1981).
Dean A, Voss D. Design and analysis of experiments.
New York: Springer-Verlag, 1999.
Federer WT. Experimental design. Theory and
application. New York: Macmillan, 1955.
Freund JE, Williams F, Perles BM. (Estadstica para
la administracin, con enfoque moderno. 5 ed.
Mxico: Prentice Hall Hispanoamericana, 1990).
Freund JE, Perles BM. Statistics: a first course. 12
ed. Upper Saddle River, NJ: Pearson Prentice-Hall,
2006.
Grove DM, Davis TP. Engineering quality and
experimental design. London: Longman, 1992.
Hernndez R, Fernndez C, Baptista P. Metodologa
de la investigacin. Mxico: McGraw-Hill, 1998.
Hinkelman K, Kempthorne O. Design and analysis of
experiments. Vol I. New York: Wiley, 1994.
Kenett R. Zacks Z. Modern industrial statistics:
design and control of quality and reliability
Belmont, CA:
Duxbury Press, 1998 (Estadstica industrial moderna.
Diseo y control de la calidad y la confiabilidad.
Mxico: Thomson Learning, 2000).
Li CC. Introduccin a la estadstica experimental.
Barcelona: Omega, 1969.
Little TM, Hills FJ. Statistical methods in
agricultural research. 2 ed. New York: Wiley, 1980.
(Mtodos estadsticos para la investigacin en la
agricultura. 1 ed. Mxico: Trillas, 1976).
Martnez Garza, A.. Diseos experimentales.
Mtodos y elementos de teora. Mxico: Trillas,
1988.
Mendenhall W. Sincich T. Statistics for engineering
and the sciences, 4 ed. Englewood Cliffs, NJ:
Prentice Hall, 1995 (Probabilidad y estadstica para
ingeniera y ciencias. Mxico: Prentice-Hall
Hispanoamericana, 1997).
Mendenhall W. The design and analysis of
experiments. Belmont, CA: Wadsworth, 1968.
Montgomery DC. Design and analysis of experiments.
6 ed. New York: Wiley, 2004. (Diseo y anlisis de
experimentos. Mxico: Iberoamericana, 2001).
Myers RH. Montgomery DC. Response surface
methodology. Process and product optimization
using designed experiments. 2 ed. New York: Wiley,
2002.
Ostle B. Statistics in research. Ames, lA: lowa State
University Press, 1963 (Estadstica aplicada. Mxico:
Limusa-Wiley, 1973).
Pea D. Estadstica, modelos y mtodos. Madrid:
Alianza, 1987.
Rios S. Mtodos estadsticos. Madrid: Castillo, 1987.
Romero R, Znica L.. Estadstica. Diseo de
experimentos. Modelos de regresin. Valencia:
SPUPV, 1994.
Vol. 2, nm. 7, Pg. 5
Curso de estadstica
Ruiz P. Estadstica aplicada a la investigacin
agraria. Madrid: Ministerio de Agricultura, 1980.
Scheaffer R, Mendenhall W, Ott L. Elementary
survey sampling. 2
nd
ed. North Scituate, MA:
Duxbury, 1979 (Elementos de muestreo. Mxico:
Iberoamericana. 1987).
Snedecor GW, Cochran WG. Statistical methods.
8 ed. Ames, IA: Iowa State University Press,
1989. (Mtodos estadsticos. Mxico: Compaa
editorial Continental, 1977).
Snedecor GW. Statistical methods applied to
experiments in. agriculture and biology. 5 ed.
Ames, IA: Iowa State University Press, 1956).
Metodos estadsticos aplicados a la investigacin
agrcola y biologa. Mxico: Continental, 1966).
Sokal RR, Rohlf FJ. Biometry: The principles and
practice of statistics in biological research. 3
ed. New York: WH Freeman & Co, 1995.
(Biometra. Madrid: Blume, 1989).
Steel RGD, Torrie JH. Principles and procedures
of statistics. A biometrical approach. 2 ed. New
York: McGraw-Hill, 1980 (Bioestadstica:
principios y procedimientos. Mxico: McGraw-
Hill, 1989),
Tabachnick B, Fidel L. Using multivariate
statistics. 2 ed. New York: Harper Collins
Publishers, 1989.
Walpole R, Myers R. Probability and statistics for
engineers and scientists. 5 ed.. New York:
MacMillan, 1993 (Probabilidad y estadstica.
Mxico: McGraw-Hill, 1992).
Zar JH. Biostatistical analysis. New Jersey:
Prenctice-Hall, 1996.
Recursos en Internet
Los recursos en Internet son tambin muy
abundantes. Como muestra, los siguientes
Artculos y material sobre muestreo
http://www.socialresearchmethods.net/kb/sam
pling.php
http://www2.uiah.fi/projekti/metodi/252.htm
http://www.geocities.com/ResearchTriangle/Fa
cility/1075/principi.htm
Artculos y material sobre diseo de
experimentos
http://tarwi.lamolina.edu.pe/~ivans/aspgen.pdf
http://www.tesisenxarxa.net/TESIS_URV/AVAILA
BLE/TDX-0809102-131116//m%E8todes.pdf
http://www.cema.edu.ar/publicaciones/downlo
ad/documentos/258.pdf
http://www.rdg.ac.uk/ssc/publications/guides/
doe.pdf
Artculos y material sobre nmero de casos
necesario
http://www.itl.nist.gov/div898/handbook/ppc/sect
ion3/ppc333.htm
http://ravenanalytics.com/Articles/Sample_Size_Ca
lculations.htm
http://www.osra.org/itlpj/bartlettkotrlikhiggins.pd
f
http://bioinformatics.oxfordjournals.org/cgi/reprin
t/18/9/1184.pdf
http://biostatistics.oxfordjournals.org/cgi/reprint/
6/1/27.pdf
http://www.biomedcentral.com/content/pdf/1471-
2164-5-87.pdf
http://www.saem.org/download/lewis4.pdf
http://www.stat.uiowa.edu/techrep/tr303.pdf
Calculadoras on line y software gratuito
Tambin son abundantes los recursos para realizar
clculos de potencia y nmero de casos necesarios.
Ya que obviamente no existen garantas de
exactitud, ni muchas veces se indica el algoritmo de
clculo, es recomendable siempre verificar los
resultados con ms de una aplicacin. Algunas de
ellas son:
http://www.psycho.uni-
duesseldorf.de/aap/projects/gpower/
http://www.stat.uiowa.edu/~rlenth/Power/
http://www.graphpad.com/quickcalcs/NNT1.cfm
http://www.dssresearch.com/toolkit/sscalc/size_a
1.asp
http://www.raosoft.com/samplesize.html
http://www.surveysystem.com/sscalc.htm
http://www.macorr.com/ss_calculator.htm
http://home.ubalt.edu/ntsbarsh/Business-
stat/otherapplets/SampleSize.htm
Vol. 2, nm. 7, Pg. 6
Curso de estadstica
Vol. 2, nm. 7, Pg. 6
Curso de estadstica
Nombres propios
Pierre de Fermat
(1601-1665)
Jurista y matemtico francs nacido en
Beaumont-de-Lomagne, a menos de 60 km de
Toulouse y fallecido en Castres
Hijo de Dominique Fermat, un comerciante
burgus acomodado e interesado en la poltica
local. Estudi en Toulouse y derecho en Orleans.
En 1631, ao en que despos a Louise de Long,
de la que tuvo cinco hijos, adquiri un cargo de
consejero real o magistrado, en la Chambre des
Requtes del parlamento de Toulouse.
Medr rpidamente hasta lograr el cargo de
funcionario de la Chambre Criminelle y de la
GrandChambre. En 1648, adems, fue nombrado
miembro de la cmara de la poblacin vecina de
Castres.
Tambin fue miembro de la Acadmie des
Sciences Inscriptions et Belles-Lettres de
Toulouse.
Su formacin como matemtico parece ser que
fue autodidacta, mediante el estudio de las
obras del clebre matemtico francs Franois
Viete (1540-1603) que le prest un amigo.
Dotado de un prodigioso talento matemtico lo
ejerci como aficionado, al margen de su trabajo
de magistrado y jurista. No public ningn
artculo o libro. Sus escritos matemticos se
limitan a las anotaciones en textos clsicos y a la
correspondencia con otros cientficos del siglo
XVII. Es particularmente famoso el ltimo
teorema de Fermat cuya enunciacin aparece
en un margen de su texto de la Aritmtica de
Diofanto. Entre sus amigos matemticos,
Roverbal, Torricelli, Huygens..., destacan
Mersenne, su mentor, Descartes con quien
mantuvo polmicas y Pascal. La correspondencia
mantenida entre ambos el verano de 1656 se
considera el nacimiento formal de la teora de la
probabilidad
Su hijo public pstumamente en 1670 la
Aritmtica de Diofanto anotada por Pierre de
Fermat (vase la siguiente ilustracin)y en 1679
una antologa de escritos y correspondencia bajo
el ttulo de Varia opera mathematica.
Fermat comparte con Descartes el mrito de
haber aplicado el lgebra a la geometra, fue el
precursor del clculo diferencial al utilizar por
primera vez el concepto y la frmula de
derivada, hizo contribuciones decisivas a la
teora de los nmeros, y como se mencion
anteriormente, es cofundador de la moderna
teora de la probabilidad.
Tests para evaluar la
aleatoriedad de una muestra
(1)
(a) Test de la diferencia de signos
(b) Test de las rachas en diferencias
sucesivas
(c) Test de las rachas
Objetivo
Comprobar que las fluctuaciones de una muestra
son aleatorias, es decir, independientes del
orden o secuencia con que fueron obtenidas.
Vol. 2, nm. 7, Pg. 7
Curso de estadstica
Limitaciones
Las observaciones se habrn producido en
circunstancias similares.
Para el test (a), el nmero n de observaciones
debe ser grande.
Hiptesis nula
0
H : las observaciones se han obtenido
aleatoriamente
1
H : las observaciones no se han obtenido
aleatoriamente
Mtodo
1. Obtener los valores reseados en la tabla 1.
2. Para los tests (a) y (b), obtener una secuencia
con las diferencias entre observaciones
sucesivas, es decir, sustrayendo cada valor de su
precedente
( )
1 i i
x x
;
3. Para el test (c) obtener una secuencia con las
diferencias entre las observaciones y la mediana
Me muestral
( )
i
x Me .
4. Para el test (a) Contar el nmero p de
diferencias positivas, q de diferencias
negativas. Para los tests (b) y (c), contar las
rachas de valores positivos y negativos en las
correspondientes secuencias obtenidas en el paso
3.
5. Calcular los valores descritos en la tabla 2.
6. Establecer la regin crtica segn la tabla 3.
(a) (b) (c)
Me mediana =
1
2
n
m
=
2 1
3
n
m
= 1 m n = +
1
12
n
v
+
=
16 29
90
n
v
=
( )
( )
2 2
2 2 1
n n
v
n
=
Tabla 1
(a) (b) (c)
0, 5 p m
p
v
=
( ) ( ) k rachas p rachas q = + ( ) ( ) k rachas p rachas q = +
Tabla 2
(a) (b) (c)
Se asume que p sigue una
distribucin normal de media m y
varianza v : ( ) , N m v . Por ello se
estandariza el valor p y se
compara con los valores crticos
de la distribucin normal (tabla 4)
Para tamaos muestrales
5 40 n obtener los valores
crticos de la tabla 5.
Para tamaos muestrales 40 n>
se asume que k sigue una
distribucin normal de media m
y varianza v : ( ) , N m v . Por
ello se estandariza el valor p y
se compara con los valores
crticos de la distribucin normal
(tabla 4)
Para tamaos muestrales 30 n<
obtener los valores crticos de la
tabla 6.
Para tamaos muestrales 30 n>
se asume que k sigue una
distribucin normal de media m
y varianza v : ( ) , N m v . Por
ello se estandariza el valor p y
se compara con los valores
crticos de la distribucin normal
(tabla 4)
Tabla 3
Decisin
Cuando el test estadstico cae dentro de la regin crtica, se rechaza la hiptesis nula
0
H
Vol. 2, nm. 7, Pg. 8
Curso de estadstica
Ejemplos
Sean cuatro conjuntos de observaciones ( ) , , , A B C D a los que se ha aplicado los tres tests descritos. En
la tabla siguiente se presentan los valores y los clculos intermedios:
A B C D
x x
i
-x
i-1
x
i
-Me x x
i
-x
i-1
x
i
-Me x x
i
-x
i-1
x
i
-Me x x
i
-x
i-1
x
i
-Me
1 7,60 -0,49 7,4 -2,43 9,0 -12,77 7,8 -36,21
2 13,13 -5,54 5,05 15,6 -8,2 5,78 15,4 -6,4 -6,35 14,9 -7,1 -29,15
3 8,65 4,49 0,56 9,9 5,7 0,05 15,1 0,3 -6,65 20,3 -5,4 -23,75
4 4,43 4,22 -3,65 13,4 -3,5 3,57 15,4 -0,3 -6,35 24,2 -3,9 -19,85
5 8,42 -3,99 0,34 10,8 2,6 0,96 15,6 -0,3 -6,08 26,0 -1,8 -18,05
6 5,02 3,40 -3,06 7,8 3,0 -1,99 14,9 0,8 -6,84 26,0 0,0 -18,05
7 9,04 -4,02 0,96 10,1 -2,3 0,27 19,8 -4,9 -1,93 33,1 -7,1 -10,95
8 7,02 2,02 -1,07 8,6 1,5 -1,23 17,2 2,6 -4,50 28,1 5,0 -15,95
9 4,36 2,65 -3,72 9,1 -0,5 -0,70 18,2 -1,0 -3,53 33,3 -5,2 -10,75
10 13,90 -9,53 5,81 8,8 0,3 -0,99 24,8 -6,6 3,02 42,8 -9,5 -1,25
11 6,27 7,62 -1,81 13,1 -4,2 3,25 21,0 3,7 -0,71 42,0 0,8 -2,05
12 4,93 1,34 -3,15 10,8 2,2 1,04 16,6 4,4 -5,15 45,3 -3,3 1,25
13 10,22 -5,29 2,14 9,8 1,1 -0,05 22,4 -5,9 0,71 57,8 -12,5 13,75
14 11,95 -1,73 3,87 10,4 -0,7 0,64 28,4 -6,0 6,68 59,0 -1,2 14,95
15 12,20 -0,25 4,12 10,3 0,1 0,54 34,8 -6,3 13,03 64,0 -5,0 19,95
16 6,41 5,79 -1,67 10,4 0,0 0,56 27,2 7,5 5,50 65,5 -1,5 21,45
17 9,26 -2,84 1,17 8,6 1,7 -1,16 29,7 -2,5 7,98 65,6 -0,1 21,55
18 7,74 1,51 -0,34 8,2 0,4 -1,57 24,8 4,9 3,04 64,0 1,6 19,95
19 9,96 -2,21 1,88 9,5 -1,2 -0,32 28,5 -3,7 6,74 57,8 6,2 13,75
20 11,26 -1,30 3,18 9,5 0,0 -0,28 40,1 -11,6 18,35 66,0 -8,2 21,95
21 5,53 5,73 -2,56 8,9 0,7 -0,94 28,4 11,6 6,71 67,2 -1,2 23,15
22 5,40 0,13 -2,68 10,6 -1,8 0,83 26,7 1,8 4,95 67,3 -0,1 23,25
Tabla 5
Los correspondientes estadsticos son:
test (a) test (b) test (c)
n 22 22 22
1 2
n n = 11 11 11
x m 10,500 14,333 23,000
2
s
1,917 3,589 10,744
Valor crtico ( ) 0, 05 1,64 10 y 18
Valor crtico ( ) 0,10 7 y 17
Tabla 6
Finalmente, la interpretacin de los resultados de los tests estadsticos son:
A B C D
Me 8,08 9,80 21,73 44,05
p
11 13 9 5
p p' 0,000 1,445 1,445 -4,334
rachas test (b) 14 15 14 9
rachas test (c) 15 10 4 2
Tabla 7
Vol. 2, nm. 7, Pg. 9
Curso de estadstica
Tablas
nivel de significacin () valor crtico
0,0010 3,29
0,0020 3,09
0,0026 3,00
0,0100 2,58
0,0200 2,33
0,0456 2,00
0,0500 1,96
0,1000 1,64
0,2000 1,28
0,3180 1,00
Tabla 8. Distribucin normal
unidireccional 0,01 0,05 unidireccional 0,01 0,05
bidireccional 0,02 0,10 bidireccional 0,02 0,10
n mn mx mn mx n1=n2 mn mx mn mx
5 1 5 2 10 3 9
6 1 1 6 2 12 3 11
7 1 2 7 3 13 4 12
8 2 2 8 4 14 5 13
9 2 3 8 9 4 16 6 14
10 3 3 9 10 5 17 6 16
11 3 4 10 11 6 18 7 17
12 4 4 11 12 7 19 8 18
13 4 5 12 13 7 21 9 19
14 5 13 6 12 14 8 22 10 20
15 5 14 6 13 15 9 23 11 21
16 6 15 7 14 16 10 24 11 23
17 6 16 7 15 17 10 26 12 24
18 7 17 8 15 18 11 27 13 25
19 7 17 8 16 19 12 28 14 26
20 8 18 9 17 20 13 29 15 27
21 8 19 10 18 21 14 30 16 28
22 9 20 10 18 22 14 32 17 29
23 10 21 11 19 23 15 33 17 31
24 10 21 11 20 24 16 34 18 32
25 11 22 12 21 25 17 35 19 33
26 11 23 13 21 26 18 36 20 34
27 12 24 13 22 27 19 37 21 35
28 12 24 14 23 28 19 39 22 36
29 13 25 14 24 29 20 40 23 37
30 13 26 15 24 30 21 41 24 38
31 14 27 16 25
32 15 27 16 26
33 15 28 17 27
34 16 29 17 27
35 16 30 18 28 35 25 46 28 43
36 17 30 19 29
37 18 31 19 29
38 18 32 20 30
39 19 33 20 31
40 19 33 21 32 40 30 51 33 48
45 34 57 37 54
Vol. 2, nm. 7, Pg. 10
Curso de estadstica
unidireccional 0,01 0,05 unidireccional 0,01 0,05
bidireccional 0,02 0,10 bidireccional 0,02 0,10
n mn mx mn mx n1=n2 mn mx mn mx
50 38 63 42 59
55 43 68 46 65
60 47 74 51 70
65 52 79 56 75
70 56 85 60 81
75 61 90 65 86
80 65 96 70 91
85 70 101 74 97
90 74 107 79 102
95 79 112 84 107
100 84 113 88 117
Tabla 9. Las columnas mn denotan los lmites inferiores de la zona crtica
o el valor crtico a la izquierda,
las columnas mx denotan los lmites superiores de la zona crtica
o el valor crtico a la derecha.
Vol. 2, nm. 7, Pg. 11
Curso de estadstica
Problemas
1. Un fabricante de material volumtrico afirma que sus matraces estn aforados exactamente a 1 L.
Un investigador, a la vista de sus resultados, ponen en duda tal afirmacin y rene una muestra de 20
matraces adquiridos a este fabricante y comprueba mediante pesada su volumen. Qu conclusiones
puede alcanzar a partir de los resultados obtenidos?:
970,7 1006,3 996,0 980,5 980,5
1003,3 992,4 970,5 1008,0 967,2
1016,9 974,1 1007,1 988,1 1009,5
996,9 974,9 997,8 988,7 989,3
Solucin
La regla de decisin o contraste para decidir si una
muestra aleatoria sencilla cumple o no una
determinada hiptesis (que se denomina hiptesis
nula,
0
H ) se basa en establecer una regin crtica
o regin de rechazo de dicha hiptesis asociada a
la regla:
Si
observada
t (siendo t un estadstico genrico)
pertenece a la regin crtica entonces se rechaza
la hiptesis
0
H , en caso contrario no se rechaza:
0
0
observada
observada
t regin de rechazo rechazar la H
t regin de rechazo no rechazar la H
En este caso,
0
1
: 1.000
: 1.000
H m mL
H m mL
<
Cuando se rechaza la
0
H siendo cierta se incurre
en un error denominado de tipo I. La probabilidad
de cometer este error es el nivel de
significacin y se representa por . Es frecuente
fijar esta probabilidad en 0,05.
Cuando no se rechaza la
0
H siendo falsa, se
incurre en un error denominado de tipo II. La
probabilidad de cometer este error se representa
por . La cantidad complementaria 1 se
denomina potencia del contraste o del test
permite conocer qu tests es mejor para un
dado para descartar o no una
0
H para un nivel de
significacin determinado.
Si se cumple la
0
H , con un nivel de significacin
de 0, 05 = , la media en cuestin se distribuye
normalmente con media 1.000 mL y varianza
2
conocida.
La media muestral obtenida con 20 n=
observaciones, tiene 990, 94 m= y desviacin
tpica 14, 93 s = . Si m est dentro de la regin
crtica, deber rechazarse la hiptesis de que
aforo de los matraces es de 1.000 mL. Por el
contrario, si m est fuera de esta regin crtica,
deber aceptarse la afirmacin del fabricante.
La regin crtica se establece en funcin del nivel
de significacin, es decir, el rea delimitada por el
origen inferior de la funcin de distribucin hasta
un valor k que depende del nivel de significacin.
Por tanto la regin crtica debiera ir desde
hasta este valor k .
Los valores negativos no son posibles, por lo que se
considera, de forma ms prctica e igualmente
vlida, la regin comprendida entre 0 y k .
( )
( )
0
0
Pr | 0, 05
1 0, 05
H
x regin crtica H
f
=
=
En este caso se admite que la funcin con que se
distribuye la media,
0
H
f , sea la normal y que el
valor k sea el habitual nivel de significacin,
0,05:
1 0, 05
0, 95
k m
n
k m
n
| |
|
= |
|
|
\ .
| |
|
= |
|
|
\ .
El valor de la distribucin normal para este nivel
de significacin es 1,645:
1, 645
1, 645
k m
n
k m
n
=
= +
k
Vol. 2, nm. 7, Pg. 12
Curso de estadstica
En el presente caso,
( ) ( )
0
0
Pr |
1.000
0, 05
14, 93
20
1.000
1, 645
14, 93
20
996, 4
H
x regincrtica H f k
k
k
k
=
| |
|
= = |
|
|
\ .
= =
=
La regin crtica ser, pues:
( ) ( ) 0 , 0 , 996, 4 k =
Al ser la media observada 990,94 queda dentro de
la regin crtica y, consecuentemente, debe
rechazarse la hiptesis nula
0
H y admitir que el
investigador estaba acertado en sospechar una
infravaloracin media del aforado.
2. En una publicacin se afirma que la determinacin analtica de un compuesto biolgico permite
diagnosticar una enfermedad en el 76 % de pacientes. Para comprobar esta afirmacin un investigador
selecciona una muestra aleatoria de 144 pacientes de esta misma enfermedad y realiza la
determinacin propuesta. El resultado es positivo en 104 individuos. Con un nivel de significacin de
0,05, puede afirmar que ha confirmado las conclusiones de la publicacin?
Solucin
Las hiptesis de trabajo son:
0
1
| 0, 76
| 0, 76
H p
H p
<
Expresado formalmente:
( )
( ) ( )
( )
( )
( )
0 0
0 0
Pr |
Pr 0, | 0, 05
1
0, 76
0, 05
0, 76 1 0, 76
144
k
H
p regincrtica H
p k H
k p
f k
p p
n
k
=
= =
| |
|
|
= =
|
|
\ .
| |
|
|
= =
|
|
\ .
Para un nivel de significacin de 0,05 la
distribucin normal establece una abscisa de -
1,645, por tanto,
( )
0, 76
1, 645
0, 76 1 0, 76
144
0, 76
1, 645
0, 036
0, 70
k
k
k
=
=
Es decir, la regin crtica es ( ) 0 , 0, 70 . Puesto
que la proporcin observada por el investigador,
0, 72 , cae fuera de la regin crtica, puede
afirmase que, con una confianza del 95 %, los
resultados de la publicacin son reproducibles.
Vol. 2, nm. 7, Pg. 13
Curso de estadstica
Vol. 2, nm. 7, Pg. 13
Curso de estadstica
3. La estancia media de los pacientes de determinada enfermedad en un Hospital es de 10,2 das con
una desviacin tpica de 2,2 das. La introduccin de una nueva prueba de laboratorio pretende
acortar dicha estancia media. Para evaluar la influencia de la prueba de laboratorio se toma una
muestra aleatoria sencilla de las estancias de 153 pacientes a los que se realiz la prueba de
laboratorio, y se obtuvo una media de 9,1 das. El gerente del Hospital deseara saber si la
introduccin de la prueba de laboratorio fue estadsticamente satisfactoria (95 %) para reducir la
estancia media.
Solucin
Hiptesis de trabajo
0
1
| 10, 2
| 10, 2
H x
H x
<
= =
Tratndose de estimaciones de la media
aritmtica, se puede asumir que la distribucin
muestral es la distribucin normal, formalmente:
( )
( )
2
10, 2
0, 05
4, 84
153
10, 2
1, 645
4, 84
153
1, 645 0,178 10, 2 9, 90
k
H
k x k
f k
n
k
k
| |
| |
|
|
|
|
= = =
|
|
| |
\ .
\ .
=
= + =
Es decir, la regin crtica es ( ) 0 , 9, 90 . Puesto
que la estancia media observada despus de
introducir la determinacin, 9,1, cae fuera de la
regin crtica, puede afirmase que, con una
confianza del 95 %, la nueva prueba reduce la
hospitalizacin mnima de los pacientes.
Introduccin a : Regresin
no linear en
En experimentos de biologa se producen
ocasionalmente respuestas que presentan
curvaturas de tipo exponencial, sigmoideo, etc.
que no pueden ser modeladas con el
procedimiento habitual de regresin lineal. En el
modelo linear de regresin, observaciones y
predictores se relacionan mediante una funcin
lineal sencilla puede escribirse, en notacin
matricial (ms compacta y prctica):
i i i
y = + x
donde:
i
x es un vector fila de predictores de la
i -sima observacin ( ) 1, 2, , i n = .
Por lo general el primer elemento es
un 1 que representa la constante de
regresin;
es el vector (de la misma dimensin
que
i
x ) de parmetros de regresin
que debern ser estimados,
1
y
2
;
es el error aleatorio, que se supone
distribuido normal y mutuamente
independientemente, con media 0 y
varianza constante
2
.
En el modelo general, la funcin que relaciona
y
i
x no es necesariamente linear y ambos
vectores no tienen las mismas dimensiones
5
.
( )
,
i i i
y f = + x
As, por ejemplo, la funcin logstica constituye un
modelo utilizado con frecuencia en biologa
2 3
1
1
i
i i x
y
e
= +
+
La verosimilitud del modelo de regresin no lineal
es:
5
Para casos especiales existen paquetes de extensin de
especializados. Por ejemplo, para estudios dosisrespuesta,
existe el paquete drc. Vase
http://apt.allenpress.com/perlserv/?request=get-
abstract&doi=10.1614%2FWT-06-161.1
Vol. 2, nm. 7, Pg. 14
Curso de estadstica
( )
( )
( ) ( )
2
1 2
2
2
1
, exp
2
2
n
i
i
n
y f
L
n
=
| |
|
|
=
|
|
\ .
i
, x
La mxima verosimilitud se alcanza minimizando
la suma de cuadrados residuales,
( ) ( )
2
1
,
n
i i
i
x f x
=