Vous êtes sur la page 1sur 22

CURSO DE

ESTADSTICA
Sociedad Espaola Sociedad Espaola de Bioqumica Clnica y Patologa Molecular (SEQC),
Calle Padilla 268, despacho 68, 08025-Barcelona, http://www.seqc.es
Jul i o-Agosto, 2008
Vol umen 2, Nmero 7
Gua de estudio. 8. Estadstica aplicada (y 3) Muestreo. Diseo experimental (DDE). Determinacin del
nmero necesario de observaciones 1
Nombres propios 6
Pierre de Fermat (1601-1665) 6
Tests para evaluar la aleatoriedad de una muestra (1) 6
Problemas 11
Introduccin a : Regresin no linear en 13
Uso del foro del curso de estadstica 16
Segunda prueba de evaluacin 19
Prximo nmero 22
Gua de estudio. 8.
Estadstica aplicada (y 3)
Muestreo. Diseo
experimental (DDE).
Determinacin del nmero
necesario de observaciones
Introduccin
El muestreo es una parte esencial del anlisis
estadstico, de la misma forma que la fase
preanaltica es un componente decisivo del ciclo
analtico del laboratorio clnico. La literatura
estadstica est repleta de tpicos como los
resultados nunca son mejores que la calidad de
la muestra o las muestras han de ser
representativas para que el anlisis tenga
validez. Se ha estimado que la incertidumbre
ligada al muestreo es unas 100 veces superior a
la incertidumbre ligada al anlisis estadstico. Es
incuestionable que un proceso estadstico en que
se haya realizado una seleccin de observaciones
negligente tiene grandes posibilidades de
arruinar total e irreversiblemente cualquier
investigacin.
Puede parecer que se trata de un captulo
destinado a aplicaciones en el campo econmico
o social, donde se realizan encuestas de forma
casi continua. Sin embargo los conceptos son
aplicables a cualquier aplicacin estadstica o
cientfica. El tema del muestreo est ntimamente
relacionado con la determinacin del nmero de
casos necesarios para realizar una inferencia
potente, y ambos aspectos resultan fundamentales
para un correcto diseo experimental.
Forma parte inherente a la investigacin la
definicin meridianamente clara de la poblacin
objeto del estudio. No existe, sin embargo un cdigo
o unas normas estrictas que seguir. En cada caso los
objetivos de la investigacin, la lgica y el sentido
comn del investigador debern establecer las
caractersticas de la poblacin. En algunos, pocos,
casos la poblacin ser lo suficientemente pequea
o asequible como para permitir al investigador que
la incluya en su totalidad en el estudio. Todos los
miembros de la poblacin participan en el estudio,
por lo que ste recibe la calificacin de censal. Sin
embargo, lo ms frecuente es que la poblacin sea
tan extensa que el investigador debe limitarse a un
segmento de la totalidad de la poblacin de inters.
Este fragmento, para que proporcione informacin
til, debe ser un fiel reflejo de la poblacin, debe
ser representativa.
El procedimiento de seleccin de los individuos, el
muestreo, puede ser probabilstico o no
probabilstico. Una seleccin es probabilstica si
cada individuo tiene una probabilidad (no nula,
entre 0 y 1) de ser seleccionado. Los mtodos de
muestreo denominados aleatorio, sistemtico y
estratificado pertenecen a esta clase de muestreo
probabilstico. Los procedimientos de muestreo de
comodidad (o conveniencia
1
), por prejuicio
2
, por

1
Sera el caso de un investigador en una fase preliminar de un
proyecto en que selecciona individuos simplemente por
proximidad (comodidad) sin preocuparse en disear un costoso o
caro procedimiento de seleccin.
2
Por ejemplo, cuando en unas elecciones se obtiene el resultado
de todas las votaciones en una mesa electoral que se juzga
Vol. 2, nm. 7, Pg. 2
Curso de estadstica
cuotas
3
, o por efecto bola de nieve
4
son ejemplos
de muestreo no probabilstico. La diferencia est
en que los mtodos probabilsticos permiten
calcular un error de muestreo o grado en que la
muestra es diferente de la poblacin, y por tanto
los nicos que sern objeto de estudio.
El muestreo aleatorio es la forma ms tpica de
muestreo probabilstico. En l, cada miembro de
la poblacin tiene una probabilidad igual y
conocida de ser seleccionado. No obstante, en
grandes poblaciones, en las que no es posible
identificar todos sus miembros, se desconoce la
dimensin exacta y por tanto el nmero de
individuos puede estar manos o menos segado.
Cuando se conoce el contingente a seleccionar,
puede extraerse sistemticamente un individuo
de cada n integrantes de la lista (confeccionada
sin intencionalidad). Este muestreo sistemtico
constituye un procedimiento tan vlido pero ms
simple que el muestreo aleatorio.
Con el fin de reducir el error de muestreo, en el
muestreo estratificado el investigador
previamente define subpoblaciones (estratos)
mediante caractersticas comunes y su
representatividad en la poblacin.
El muestreo forma parte inherente de un
experimento cientfico. Poco puede decirse de la
importancia de un correcto diseo experimental
para obtener conclusiones vlidas. El diseo de
experimentos es un captulo de la estadstica
bien establecido desde hace muchos aos y que
va incorporando progresivamente novedades y
mejoras para optimizar el rendimiento de los
recursos cientficos y la potencia de las
conclusiones que se derivan de tales
experimentos.
Conocimientos previos
Estadstica descriptiva: mtodos grficos y
diagramas.
Distribuciones muestrales. distribucin normal
Estadstica inferencial: valor p, tipos de error,
clculo de la potencia, intervalos de confianza,
de tolerancia y predictivos. Tests de hiptesis:
tests de normalidad, tests de aleatoriedad,
comparacin de medias y varianzas; ANOVA,
regresin. Anlisis de datos cualitativos: tablas
de contingencia. Test no paramtricos.
Familiaridad con el uso de programas aplicados
al anlisis estadstico: visualizacin de datos,
clculos de probabilidad y simulacin.

sociolgicamente representativa para obtener una
estimacin de los resultados de las elecciones en toda la
demarcacin electoral.
3
El investigador identifica unos estratos vase muestreo
estratificado) pero realiza la seleccin mediante muestreo
de conveniencia o de prejuicio.
4
El hecho de seleccionar un individuo desencadena la
seleccin de otros individuos, aunque reducindose la
posibilidad de que stos sean genuinamente representativos
de la poblacin.
Contenidos
1. MUESTREO
1. Introduccin
1.1. Parmetros poblacionales y muestrales;
1.2. Heterogeneidad y error de muestreo;
1.2.1. Errores debidos al procedimiento;
1.2.2. Errores estadsticos.
2. Metodologa
2.1. Muestreo probabilstico y no probabilstico;
2.2. Muestreo aleatorio;
2.2.1. Muestreo aleatorio sin reposicin;
2.2.2. Muestreo aleatorio con reposicin;
2.2.3. Produccin y utilizacin de tablas de
nmeros aleatorios;
2.2.4. Utilizacin del mtodo de Montecarlo;
2.3. Muestreo aleatorio estratificado;
2.3.1. Asignacin proporcional;
2.3.2. Asignacin ptima;
2.4. Muestreo sistemtico;
2.5. Muestreo por estadios mltiples;
2.6. Muestreo por conglomerados;
3. Diseo adecuado e inapropiado: planificacin
para evitar sesgos
4. Planificacin coste/efectiva del muestreo
(minimizar los costes cuando la incertidumbre es
conocida, o minimizar la incertidumbre cuando
los costes son fijos)
5. Dimensin del muestreo: cuntas observaciones
hacen falta
6. Aplicaciones estadsticas del muestreo:
inferencia.
2. DISEO EXPERIMENTAL, NMERO DE
OBSERVACIONES NECESARIAS
1. Introduccin al diseo estadstico experimental
(DEE)
1.1. El mtodo cientfico. Investigacin
experimental y no experimental;
1.2. Diferentes tipos de experimentos. Experimentos
exploratorios y confirmatorios. Experimentos
espaciales y temporales;
1.3. Formulacin y desarrollo de un diseo
estadstico;
1.4. Conceptos de unidad experimental,
tratamiento, error, variable aleatoria,
variable dummy, variabilidad, precisin y
exactitud, datos continuos y discretos, pulsos...;
1.5. Objetivos del DEE;
1.6. Anlisis del DEE: interpretacin y presentacin
de resultados. Generacin hiptesis: hiptesis
estadsticas e hiptesis cientficas;
1.7. Fundamentos del DEE: replicacin,
aleatorizacin, bloqueo o control.
2. Diseo completamente aleatorizado
2.1. Conceptos (aleatorizacin, muestreo), ventajas
y desventajas, aplicaciones;
2.2. Estadstica: ANOVA (tablas e inferencia de la
comparacin de medidas de centralizacin,
anlisis de residuales); homoscedasticidad
Vol. 2, nm. 7, Pg. 3
Curso de estadstica
(comprobacin de la homogeneidad de la
varianza);
2.3. Regresin. Regresin no linear. Regresin
mltiple;
2.4. Alternativas al ANOVA convencional: ANOVA
no equilibrado. ANOVA no paramtrico;
2.5. Comparaciones mltiples. Contrastes;
2.6. Anlisis de la covarianza (ANCOVA).
3. Diseos factoriales
3.1. Conceptos, ventajas y desventajas,
aplicaciones;
3.2. Modelo de efectos fijos;
3.3. Diseo anidado, diseo de dos factores,
diseo split-plot;
3.4. Estadstica inferencial en experimentos
factoriales.
4. Diseo de bloques al azar
4.1. Conceptos, ventajas y desventajas,
aplicaciones;
4.2. Estadstica inferencial en el diseo de
bloques al azar: hiptesis y estimacin de
parmetros.
5. Cuadrados latinos y grecolatinos, mediciones
repetidas, tablas para variables categricas y
otros diseos
5.1. Conceptos, ventajas y desventajas,
aplicaciones;
5.2. Estadstica inferencial en el diseo de
cuadrados latinos y otros diseos.
Objetivos
Al terminar esta parte del curso, los
participantes deben ser capaces, en el apartado
de muestreo, de:
Describir las diferentes formas de obtener
muestras de una poblacin;
Describir las diferentes formas
probabilsticas y sus aplicaciones de obtener
muestras de una poblacin;
Describir y aplicar los mtodos estadsticos
(tabla de nmeros aleatorios, simulacin
Monte-Carlo...) para asegurar la aleatoriedad
de una seleccin muestral;
Describir y aplicar procedimientos de
inferencia estadstica para verificar la
aleatoriedad de una muestra.
Y por lo que hace referencia al diseo
experimental,
Conocer los fundamentos y conceptos del
diseo de estudios bioestadsticos y su
relacin con los mtodos inferenciales
(estimacin y contraste de hiptesis) como
base del razonamiento cientfico;
Saber leer y comprender en artculos o
informes de investigacin el apartado que
describe el anlisis estadstico de
investigaciones experimentales;
Saber planificar una investigacin
experimental;
Aplicar adecuadamente los mtodos estadsticos
utilizados en el anlisis de investigaciones
experimentales;
Conocer y utilizar herramientas informticas
utilizadas para analizar los datos obtenidos en
una investigacin experimental;
Presentar adecuadamente de manera verbal o
escrita los resultados estadsticos obtenidos en
una investigacin experimental.
Bibliografa
Existe una inmensa cantidad de bibliografa
dedicada a estos temas. De forma clsica se ha
tomado en consideracin en mbitos como la
econometra y la sociologa. Tambin en la
quimiometra y biometra. En todos los libros de
texto de estadstica, cualquiera que sea su nivel,
son tratados de forma suficiente. Existe, no
obstante campos especialmente debatidos por su
trascendencia, como puede ser los ensayos clnicos,
que debern ser estudiados con literatura
especializada.
A continuacin se aporta una serie de literatura
tradicionalmente recomendada en los cursos
monogrficos sobre muestreo y diseo
experimental, especialmente en lengua espaola.
(a) Muestreo
Abad de Servin, A. Introduccin al muestreo.
Mxico: Limusa,1978.
Alberdi J. Metodologa de investigacin por
sampling; Madrid: Euroamericana, 1969.
Azorn F. Curso de muestreo y aplicaciones. Madrid:
Aguilar, 1969.
Azorn F, Snchez Crespo JL. Mtodos y aplicaciones
del muestreo. Madrid: Alianza, 1986.
Barnett V. Elements of sampling theory. London:
The English Universities Press; 1974.
Fernndez Garca R. Muestreo en poblaciones finitas
curso bsico. Barcelona: EUB, 1995.
Chambers RL, Skinner CJ, eds. Analysis of survey
data. New York: Wiley, 2003.
Cochran WG. Sampling techniques. 3 ed. New York:
Wiley, 1977; (Tcnicas de muestreo; Mxico:
Continental, 1986)
Deming WE. On probability as a basis for action. Am
Stat, 1975; 29: 146-52.
Deming WE. Sample design in business research.
New York: Wiley, 1960.
Escuder Valls R. Manual de teora de probabilidades
con nociones de muestreo e inferencia. Valencia:
Tirant lo Blanc, 1992
Fernndez Trocniz A. Probabilidad estadstica
muestreo. Madrid: Tebar Flores, 1987.
Flyvbjerg B. Five misunderstandings about case
study research. Qualitative Inquiry. 2006; 12: 219-
45.
Gy PM. Sampling of heterogeneous and dynamic
material systems: Theories of heterogeneity,
Vol. 2, nm. 7, Pg. 4
Curso de estadstica
sampling and homogenizing. Amsterdam:
Elsevier, 1992.
Kish L. Survey sampling. New York: Wiley, 1995.
Korn EL, Graubard BI. Analysis of health surveys.
New York: Wiley, 1999.
Levy PS, Lemeshow S. Sampling of populations:
methods and applications. New York: Wiley,
1991.
Lohr, SL. Sampling: Design and analysis. Pacific
Grove, CA: Duxbury Press, 1999
Prez Lpez C. Tcnicas de muestreo estadstico
teora, prctica y aplicaciones informticas.
Madrid: Ra-MA, 1999.
Snchez Crespo JL. Esquema de muestreo con
reposicin parcial. Estadstica Espaola, 1994;
36: 143-60.
Snchez Crespo JL. A sampling scheme with
partial replacement. J Off Statis, 1997; 13: 327-
39.
Srndal CE, Swenson. A general view of
estimation in survey sampling. Int Stats Rev,
1987; 55: 279-94.
Srndal CE, Swenson B, Wretman J. Model
assisted survey sampling. New York: Springer-
Verlag, 1992.
Scheaffer RL, Mendenhall W, Ott L. Elementary
survey sampling. Boston, MA: PWS-Kent
Publishing Co, 1990 (Elementos de muestreo.
Mxico: Iberoamericana, 1987).
Stevens DL, Olsen AR. Variance estimation for
spatially balanced samples of environmental
resources. Environmetrics. 2003; 14: 593-610.
Stevens DL, Olsen AR. Spatially balanced
sampling of natural resources. J Am Stat Assoc
2004; 99: 262-78.
Strayer DL, Smith DR. A guide to sampling
freshwater mussel populations. Amer Fisheries
Soc Monograph 8, 2003.
Stuart A. Basic ideas of scientific sampling. New
York: Hafner Publishing Co, 1962.
Thompson SK. Sampling. 2 ed. New York: Wiley,
2002.
(a) Diseo de experimentos
Anderson VL, McClean RA. Design of
experiments. A realistic approach. New York:
Marcel Dekker, 1974.
Borrs F, Ferrandis E, Snchez A, Segura JV.
Cuadernos de bioestadstica II. Alicante: Club
Universitario, 1996.
Box GEP, Hunter WG, Hunter JS. Statistics for
experimenters. An introduction to design, data
analysis, and model building. New York: John
Wiley, 1978 (Estadstica para investigadores.
Introduccin al diseo de experimentos, anlisis
de datos y construccin de modelos. Barcelona:
Reverte, 1988).
Box GEP, Draper NR. Empirical model-building
and response surfaces. New York: Wiley, 1987.
Canavos G. Probabilidad y estadstica. Aplicaciones
y mtodos. Mxico: McGrawHill, 1987.
Cochran WG, Cox GM. Experimental designs. 2 ed.
New York: Wiley, 1977. (Diseos experimentales.
Mxico: Editorial Trillas, 1981).
Dean A, Voss D. Design and analysis of experiments.
New York: Springer-Verlag, 1999.
Federer WT. Experimental design. Theory and
application. New York: Macmillan, 1955.
Freund JE, Williams F, Perles BM. (Estadstica para
la administracin, con enfoque moderno. 5 ed.
Mxico: Prentice Hall Hispanoamericana, 1990).
Freund JE, Perles BM. Statistics: a first course. 12
ed. Upper Saddle River, NJ: Pearson Prentice-Hall,
2006.
Grove DM, Davis TP. Engineering quality and
experimental design. London: Longman, 1992.
Hernndez R, Fernndez C, Baptista P. Metodologa
de la investigacin. Mxico: McGraw-Hill, 1998.
Hinkelman K, Kempthorne O. Design and analysis of
experiments. Vol I. New York: Wiley, 1994.
Kenett R. Zacks Z. Modern industrial statistics:
design and control of quality and reliability
Belmont, CA:
Duxbury Press, 1998 (Estadstica industrial moderna.
Diseo y control de la calidad y la confiabilidad.
Mxico: Thomson Learning, 2000).
Li CC. Introduccin a la estadstica experimental.
Barcelona: Omega, 1969.
Little TM, Hills FJ. Statistical methods in
agricultural research. 2 ed. New York: Wiley, 1980.
(Mtodos estadsticos para la investigacin en la
agricultura. 1 ed. Mxico: Trillas, 1976).
Martnez Garza, A.. Diseos experimentales.
Mtodos y elementos de teora. Mxico: Trillas,
1988.
Mendenhall W. Sincich T. Statistics for engineering
and the sciences, 4 ed. Englewood Cliffs, NJ:
Prentice Hall, 1995 (Probabilidad y estadstica para
ingeniera y ciencias. Mxico: Prentice-Hall
Hispanoamericana, 1997).
Mendenhall W. The design and analysis of
experiments. Belmont, CA: Wadsworth, 1968.
Montgomery DC. Design and analysis of experiments.
6 ed. New York: Wiley, 2004. (Diseo y anlisis de
experimentos. Mxico: Iberoamericana, 2001).
Myers RH. Montgomery DC. Response surface
methodology. Process and product optimization
using designed experiments. 2 ed. New York: Wiley,
2002.
Ostle B. Statistics in research. Ames, lA: lowa State
University Press, 1963 (Estadstica aplicada. Mxico:
Limusa-Wiley, 1973).
Pea D. Estadstica, modelos y mtodos. Madrid:
Alianza, 1987.
Rios S. Mtodos estadsticos. Madrid: Castillo, 1987.
Romero R, Znica L.. Estadstica. Diseo de
experimentos. Modelos de regresin. Valencia:
SPUPV, 1994.
Vol. 2, nm. 7, Pg. 5
Curso de estadstica
Ruiz P. Estadstica aplicada a la investigacin
agraria. Madrid: Ministerio de Agricultura, 1980.
Scheaffer R, Mendenhall W, Ott L. Elementary
survey sampling. 2
nd
ed. North Scituate, MA:
Duxbury, 1979 (Elementos de muestreo. Mxico:
Iberoamericana. 1987).
Snedecor GW, Cochran WG. Statistical methods.
8 ed. Ames, IA: Iowa State University Press,
1989. (Mtodos estadsticos. Mxico: Compaa
editorial Continental, 1977).
Snedecor GW. Statistical methods applied to
experiments in. agriculture and biology. 5 ed.
Ames, IA: Iowa State University Press, 1956).
Metodos estadsticos aplicados a la investigacin
agrcola y biologa. Mxico: Continental, 1966).
Sokal RR, Rohlf FJ. Biometry: The principles and
practice of statistics in biological research. 3
ed. New York: WH Freeman & Co, 1995.
(Biometra. Madrid: Blume, 1989).
Steel RGD, Torrie JH. Principles and procedures
of statistics. A biometrical approach. 2 ed. New
York: McGraw-Hill, 1980 (Bioestadstica:
principios y procedimientos. Mxico: McGraw-
Hill, 1989),
Tabachnick B, Fidel L. Using multivariate
statistics. 2 ed. New York: Harper Collins
Publishers, 1989.
Walpole R, Myers R. Probability and statistics for
engineers and scientists. 5 ed.. New York:
MacMillan, 1993 (Probabilidad y estadstica.
Mxico: McGraw-Hill, 1992).
Zar JH. Biostatistical analysis. New Jersey:
Prenctice-Hall, 1996.
Recursos en Internet
Los recursos en Internet son tambin muy
abundantes. Como muestra, los siguientes
Artculos y material sobre muestreo
http://www.socialresearchmethods.net/kb/sam
pling.php
http://www2.uiah.fi/projekti/metodi/252.htm
http://www.geocities.com/ResearchTriangle/Fa
cility/1075/principi.htm
Artculos y material sobre diseo de
experimentos
http://tarwi.lamolina.edu.pe/~ivans/aspgen.pdf
http://www.tesisenxarxa.net/TESIS_URV/AVAILA
BLE/TDX-0809102-131116//m%E8todes.pdf
http://www.cema.edu.ar/publicaciones/downlo
ad/documentos/258.pdf
http://www.rdg.ac.uk/ssc/publications/guides/
doe.pdf
Artculos y material sobre nmero de casos
necesario
http://www.itl.nist.gov/div898/handbook/ppc/sect
ion3/ppc333.htm
http://ravenanalytics.com/Articles/Sample_Size_Ca
lculations.htm
http://www.osra.org/itlpj/bartlettkotrlikhiggins.pd
f
http://bioinformatics.oxfordjournals.org/cgi/reprin
t/18/9/1184.pdf
http://biostatistics.oxfordjournals.org/cgi/reprint/
6/1/27.pdf
http://www.biomedcentral.com/content/pdf/1471-
2164-5-87.pdf
http://www.saem.org/download/lewis4.pdf
http://www.stat.uiowa.edu/techrep/tr303.pdf
Calculadoras on line y software gratuito
Tambin son abundantes los recursos para realizar
clculos de potencia y nmero de casos necesarios.
Ya que obviamente no existen garantas de
exactitud, ni muchas veces se indica el algoritmo de
clculo, es recomendable siempre verificar los
resultados con ms de una aplicacin. Algunas de
ellas son:
http://www.psycho.uni-
duesseldorf.de/aap/projects/gpower/
http://www.stat.uiowa.edu/~rlenth/Power/
http://www.graphpad.com/quickcalcs/NNT1.cfm
http://www.dssresearch.com/toolkit/sscalc/size_a
1.asp
http://www.raosoft.com/samplesize.html
http://www.surveysystem.com/sscalc.htm
http://www.macorr.com/ss_calculator.htm
http://home.ubalt.edu/ntsbarsh/Business-
stat/otherapplets/SampleSize.htm
Vol. 2, nm. 7, Pg. 6
Curso de estadstica
Vol. 2, nm. 7, Pg. 6
Curso de estadstica
Nombres propios
Pierre de Fermat
(1601-1665)
Jurista y matemtico francs nacido en
Beaumont-de-Lomagne, a menos de 60 km de
Toulouse y fallecido en Castres
Hijo de Dominique Fermat, un comerciante
burgus acomodado e interesado en la poltica
local. Estudi en Toulouse y derecho en Orleans.
En 1631, ao en que despos a Louise de Long,
de la que tuvo cinco hijos, adquiri un cargo de
consejero real o magistrado, en la Chambre des
Requtes del parlamento de Toulouse.
Medr rpidamente hasta lograr el cargo de
funcionario de la Chambre Criminelle y de la
GrandChambre. En 1648, adems, fue nombrado
miembro de la cmara de la poblacin vecina de
Castres.
Tambin fue miembro de la Acadmie des
Sciences Inscriptions et Belles-Lettres de
Toulouse.
Su formacin como matemtico parece ser que
fue autodidacta, mediante el estudio de las
obras del clebre matemtico francs Franois
Viete (1540-1603) que le prest un amigo.
Dotado de un prodigioso talento matemtico lo
ejerci como aficionado, al margen de su trabajo
de magistrado y jurista. No public ningn
artculo o libro. Sus escritos matemticos se
limitan a las anotaciones en textos clsicos y a la
correspondencia con otros cientficos del siglo
XVII. Es particularmente famoso el ltimo
teorema de Fermat cuya enunciacin aparece
en un margen de su texto de la Aritmtica de
Diofanto. Entre sus amigos matemticos,
Roverbal, Torricelli, Huygens..., destacan
Mersenne, su mentor, Descartes con quien
mantuvo polmicas y Pascal. La correspondencia
mantenida entre ambos el verano de 1656 se
considera el nacimiento formal de la teora de la
probabilidad
Su hijo public pstumamente en 1670 la
Aritmtica de Diofanto anotada por Pierre de
Fermat (vase la siguiente ilustracin)y en 1679
una antologa de escritos y correspondencia bajo
el ttulo de Varia opera mathematica.
Fermat comparte con Descartes el mrito de
haber aplicado el lgebra a la geometra, fue el
precursor del clculo diferencial al utilizar por
primera vez el concepto y la frmula de
derivada, hizo contribuciones decisivas a la
teora de los nmeros, y como se mencion
anteriormente, es cofundador de la moderna
teora de la probabilidad.
Tests para evaluar la
aleatoriedad de una muestra
(1)
(a) Test de la diferencia de signos
(b) Test de las rachas en diferencias
sucesivas
(c) Test de las rachas
Objetivo
Comprobar que las fluctuaciones de una muestra
son aleatorias, es decir, independientes del
orden o secuencia con que fueron obtenidas.
Vol. 2, nm. 7, Pg. 7
Curso de estadstica
Limitaciones
Las observaciones se habrn producido en
circunstancias similares.
Para el test (a), el nmero n de observaciones
debe ser grande.
Hiptesis nula
0
H : las observaciones se han obtenido
aleatoriamente
1
H : las observaciones no se han obtenido
aleatoriamente
Mtodo
1. Obtener los valores reseados en la tabla 1.
2. Para los tests (a) y (b), obtener una secuencia
con las diferencias entre observaciones
sucesivas, es decir, sustrayendo cada valor de su
precedente
( )
1 i i
x x

;
3. Para el test (c) obtener una secuencia con las
diferencias entre las observaciones y la mediana
Me muestral
( )
i
x Me .
4. Para el test (a) Contar el nmero p de
diferencias positivas, q de diferencias
negativas. Para los tests (b) y (c), contar las
rachas de valores positivos y negativos en las
correspondientes secuencias obtenidas en el paso
3.
5. Calcular los valores descritos en la tabla 2.
6. Establecer la regin crtica segn la tabla 3.
(a) (b) (c)
Me mediana =
1
2
n
m

=
2 1
3
n
m

= 1 m n = +
1
12
n
v
+
=
16 29
90
n
v

=
( )
( )
2 2
2 2 1
n n
v
n

=

Tabla 1
(a) (b) (c)
0, 5 p m
p
v

=
( ) ( ) k rachas p rachas q = + ( ) ( ) k rachas p rachas q = +
Tabla 2
(a) (b) (c)
Se asume que p sigue una
distribucin normal de media m y
varianza v : ( ) , N m v . Por ello se
estandariza el valor p y se
compara con los valores crticos
de la distribucin normal (tabla 4)
Para tamaos muestrales
5 40 n obtener los valores
crticos de la tabla 5.
Para tamaos muestrales 40 n>
se asume que k sigue una
distribucin normal de media m
y varianza v : ( ) , N m v . Por
ello se estandariza el valor p y
se compara con los valores
crticos de la distribucin normal
(tabla 4)
Para tamaos muestrales 30 n<
obtener los valores crticos de la
tabla 6.
Para tamaos muestrales 30 n>
se asume que k sigue una
distribucin normal de media m
y varianza v : ( ) , N m v . Por
ello se estandariza el valor p y
se compara con los valores
crticos de la distribucin normal
(tabla 4)
Tabla 3
Decisin
Cuando el test estadstico cae dentro de la regin crtica, se rechaza la hiptesis nula
0
H
Vol. 2, nm. 7, Pg. 8
Curso de estadstica
Ejemplos
Sean cuatro conjuntos de observaciones ( ) , , , A B C D a los que se ha aplicado los tres tests descritos. En
la tabla siguiente se presentan los valores y los clculos intermedios:
A B C D
x x
i
-x
i-1
x
i
-Me x x
i
-x
i-1
x
i
-Me x x
i
-x
i-1
x
i
-Me x x
i
-x
i-1
x
i
-Me
1 7,60 -0,49 7,4 -2,43 9,0 -12,77 7,8 -36,21
2 13,13 -5,54 5,05 15,6 -8,2 5,78 15,4 -6,4 -6,35 14,9 -7,1 -29,15
3 8,65 4,49 0,56 9,9 5,7 0,05 15,1 0,3 -6,65 20,3 -5,4 -23,75
4 4,43 4,22 -3,65 13,4 -3,5 3,57 15,4 -0,3 -6,35 24,2 -3,9 -19,85
5 8,42 -3,99 0,34 10,8 2,6 0,96 15,6 -0,3 -6,08 26,0 -1,8 -18,05
6 5,02 3,40 -3,06 7,8 3,0 -1,99 14,9 0,8 -6,84 26,0 0,0 -18,05
7 9,04 -4,02 0,96 10,1 -2,3 0,27 19,8 -4,9 -1,93 33,1 -7,1 -10,95
8 7,02 2,02 -1,07 8,6 1,5 -1,23 17,2 2,6 -4,50 28,1 5,0 -15,95
9 4,36 2,65 -3,72 9,1 -0,5 -0,70 18,2 -1,0 -3,53 33,3 -5,2 -10,75
10 13,90 -9,53 5,81 8,8 0,3 -0,99 24,8 -6,6 3,02 42,8 -9,5 -1,25
11 6,27 7,62 -1,81 13,1 -4,2 3,25 21,0 3,7 -0,71 42,0 0,8 -2,05
12 4,93 1,34 -3,15 10,8 2,2 1,04 16,6 4,4 -5,15 45,3 -3,3 1,25
13 10,22 -5,29 2,14 9,8 1,1 -0,05 22,4 -5,9 0,71 57,8 -12,5 13,75
14 11,95 -1,73 3,87 10,4 -0,7 0,64 28,4 -6,0 6,68 59,0 -1,2 14,95
15 12,20 -0,25 4,12 10,3 0,1 0,54 34,8 -6,3 13,03 64,0 -5,0 19,95
16 6,41 5,79 -1,67 10,4 0,0 0,56 27,2 7,5 5,50 65,5 -1,5 21,45
17 9,26 -2,84 1,17 8,6 1,7 -1,16 29,7 -2,5 7,98 65,6 -0,1 21,55
18 7,74 1,51 -0,34 8,2 0,4 -1,57 24,8 4,9 3,04 64,0 1,6 19,95
19 9,96 -2,21 1,88 9,5 -1,2 -0,32 28,5 -3,7 6,74 57,8 6,2 13,75
20 11,26 -1,30 3,18 9,5 0,0 -0,28 40,1 -11,6 18,35 66,0 -8,2 21,95
21 5,53 5,73 -2,56 8,9 0,7 -0,94 28,4 11,6 6,71 67,2 -1,2 23,15
22 5,40 0,13 -2,68 10,6 -1,8 0,83 26,7 1,8 4,95 67,3 -0,1 23,25
Tabla 5
Los correspondientes estadsticos son:
test (a) test (b) test (c)
n 22 22 22
1 2
n n = 11 11 11
x m 10,500 14,333 23,000
2
s
1,917 3,589 10,744
Valor crtico ( ) 0, 05 1,64 10 y 18
Valor crtico ( ) 0,10 7 y 17
Tabla 6
Finalmente, la interpretacin de los resultados de los tests estadsticos son:
A B C D
Me 8,08 9,80 21,73 44,05
p
11 13 9 5
p p' 0,000 1,445 1,445 -4,334
rachas test (b) 14 15 14 9
rachas test (c) 15 10 4 2
Tabla 7
Vol. 2, nm. 7, Pg. 9
Curso de estadstica
Tablas
nivel de significacin () valor crtico
0,0010 3,29
0,0020 3,09
0,0026 3,00
0,0100 2,58
0,0200 2,33
0,0456 2,00
0,0500 1,96
0,1000 1,64
0,2000 1,28
0,3180 1,00
Tabla 8. Distribucin normal
unidireccional 0,01 0,05 unidireccional 0,01 0,05
bidireccional 0,02 0,10 bidireccional 0,02 0,10
n mn mx mn mx n1=n2 mn mx mn mx
5 1 5 2 10 3 9
6 1 1 6 2 12 3 11
7 1 2 7 3 13 4 12
8 2 2 8 4 14 5 13
9 2 3 8 9 4 16 6 14
10 3 3 9 10 5 17 6 16
11 3 4 10 11 6 18 7 17
12 4 4 11 12 7 19 8 18
13 4 5 12 13 7 21 9 19
14 5 13 6 12 14 8 22 10 20
15 5 14 6 13 15 9 23 11 21
16 6 15 7 14 16 10 24 11 23
17 6 16 7 15 17 10 26 12 24
18 7 17 8 15 18 11 27 13 25
19 7 17 8 16 19 12 28 14 26
20 8 18 9 17 20 13 29 15 27
21 8 19 10 18 21 14 30 16 28
22 9 20 10 18 22 14 32 17 29
23 10 21 11 19 23 15 33 17 31
24 10 21 11 20 24 16 34 18 32
25 11 22 12 21 25 17 35 19 33
26 11 23 13 21 26 18 36 20 34
27 12 24 13 22 27 19 37 21 35
28 12 24 14 23 28 19 39 22 36
29 13 25 14 24 29 20 40 23 37
30 13 26 15 24 30 21 41 24 38
31 14 27 16 25
32 15 27 16 26
33 15 28 17 27
34 16 29 17 27
35 16 30 18 28 35 25 46 28 43
36 17 30 19 29
37 18 31 19 29
38 18 32 20 30
39 19 33 20 31
40 19 33 21 32 40 30 51 33 48
45 34 57 37 54
Vol. 2, nm. 7, Pg. 10
Curso de estadstica
unidireccional 0,01 0,05 unidireccional 0,01 0,05
bidireccional 0,02 0,10 bidireccional 0,02 0,10
n mn mx mn mx n1=n2 mn mx mn mx
50 38 63 42 59
55 43 68 46 65
60 47 74 51 70
65 52 79 56 75
70 56 85 60 81
75 61 90 65 86
80 65 96 70 91
85 70 101 74 97
90 74 107 79 102
95 79 112 84 107
100 84 113 88 117
Tabla 9. Las columnas mn denotan los lmites inferiores de la zona crtica
o el valor crtico a la izquierda,
las columnas mx denotan los lmites superiores de la zona crtica
o el valor crtico a la derecha.
Vol. 2, nm. 7, Pg. 11
Curso de estadstica
Problemas
1. Un fabricante de material volumtrico afirma que sus matraces estn aforados exactamente a 1 L.
Un investigador, a la vista de sus resultados, ponen en duda tal afirmacin y rene una muestra de 20
matraces adquiridos a este fabricante y comprueba mediante pesada su volumen. Qu conclusiones
puede alcanzar a partir de los resultados obtenidos?:
970,7 1006,3 996,0 980,5 980,5
1003,3 992,4 970,5 1008,0 967,2
1016,9 974,1 1007,1 988,1 1009,5
996,9 974,9 997,8 988,7 989,3
Solucin
La regla de decisin o contraste para decidir si una
muestra aleatoria sencilla cumple o no una
determinada hiptesis (que se denomina hiptesis
nula,
0
H ) se basa en establecer una regin crtica
o regin de rechazo de dicha hiptesis asociada a
la regla:
Si
observada
t (siendo t un estadstico genrico)
pertenece a la regin crtica entonces se rechaza
la hiptesis
0
H , en caso contrario no se rechaza:
0
0
observada
observada
t regin de rechazo rechazar la H
t regin de rechazo no rechazar la H


En este caso,
0
1
: 1.000
: 1.000
H m mL
H m mL

<

Cuando se rechaza la
0
H siendo cierta se incurre
en un error denominado de tipo I. La probabilidad
de cometer este error es el nivel de
significacin y se representa por . Es frecuente
fijar esta probabilidad en 0,05.
Cuando no se rechaza la
0
H siendo falsa, se
incurre en un error denominado de tipo II. La
probabilidad de cometer este error se representa
por . La cantidad complementaria 1 se
denomina potencia del contraste o del test
permite conocer qu tests es mejor para un
dado para descartar o no una
0
H para un nivel de
significacin determinado.
Si se cumple la
0
H , con un nivel de significacin
de 0, 05 = , la media en cuestin se distribuye
normalmente con media 1.000 mL y varianza
2

conocida.
La media muestral obtenida con 20 n=
observaciones, tiene 990, 94 m= y desviacin
tpica 14, 93 s = . Si m est dentro de la regin
crtica, deber rechazarse la hiptesis de que
aforo de los matraces es de 1.000 mL. Por el
contrario, si m est fuera de esta regin crtica,
deber aceptarse la afirmacin del fabricante.
La regin crtica se establece en funcin del nivel
de significacin, es decir, el rea delimitada por el
origen inferior de la funcin de distribucin hasta
un valor k que depende del nivel de significacin.
Por tanto la regin crtica debiera ir desde
hasta este valor k .
Los valores negativos no son posibles, por lo que se
considera, de forma ms prctica e igualmente
vlida, la regin comprendida entre 0 y k .
( )
( )
0
0
Pr | 0, 05
1 0, 05
H
x regin crtica H
f
=
=
En este caso se admite que la funcin con que se
distribuye la media,
0
H
f , sea la normal y que el
valor k sea el habitual nivel de significacin,
0,05:
1 0, 05
0, 95
k m
n
k m
n

| |
|

= |
|
|
\ .
| |
|

= |
|
|
\ .
El valor de la distribucin normal para este nivel
de significacin es 1,645:
1, 645
1, 645
k m
n
k m
n

=
= +
k
Vol. 2, nm. 7, Pg. 12
Curso de estadstica
En el presente caso,
( ) ( )
0
0
Pr |
1.000
0, 05
14, 93
20
1.000
1, 645
14, 93
20
996, 4
H
x regincrtica H f k
k
k
k
=
| |
|

= = |
|
|
\ .

= =
=
La regin crtica ser, pues:
( ) ( ) 0 , 0 , 996, 4 k =
Al ser la media observada 990,94 queda dentro de
la regin crtica y, consecuentemente, debe
rechazarse la hiptesis nula
0
H y admitir que el
investigador estaba acertado en sospechar una
infravaloracin media del aforado.
2. En una publicacin se afirma que la determinacin analtica de un compuesto biolgico permite
diagnosticar una enfermedad en el 76 % de pacientes. Para comprobar esta afirmacin un investigador
selecciona una muestra aleatoria de 144 pacientes de esta misma enfermedad y realiza la
determinacin propuesta. El resultado es positivo en 104 individuos. Con un nivel de significacin de
0,05, puede afirmar que ha confirmado las conclusiones de la publicacin?
Solucin
Las hiptesis de trabajo son:
0
1
| 0, 76
| 0, 76
H p
H p

<

La proporcin de resultados positivos obtenidos


por el investigador es
0
104
0, 72
144
p = = . La
hiptesis nula no se rechazar (se confirmaran los
resultados de la publicacin) si
0
p cae fuera de la
regin crtica.
Por tanto el problema se reduce a construir una
regin crtica con un nivel de significacin deseado
(0,05). La regin crtica es la fraccin de rea bajo
la curva de la funcin de densidad de probabilidad
delimitada por 0 y un valor k que depende del
nivel de significacin.
( ) ( ) ( )
0 0
Pr | Pr 0, |
0, 05
r regincrtica H r k H =
=
El contingente de pacientes es razonablemente
grande como para asumir que la distribucin
muestral es la distribucin normal:
( )
0
1
,
p p
p N p
n
| |
|
\ .

Expresado formalmente:
( )
( ) ( )
( )
( )
( )
0 0
0 0
Pr |
Pr 0, | 0, 05
1
0, 76
0, 05
0, 76 1 0, 76
144
k
H
p regincrtica H
p k H
k p
f k
p p
n
k
=
= =
| |
|

|
= =
|

|
\ .
| |
|

|
= =
|

|
\ .
Para un nivel de significacin de 0,05 la
distribucin normal establece una abscisa de -
1,645, por tanto,
( )
0, 76
1, 645
0, 76 1 0, 76
144
0, 76
1, 645
0, 036
0, 70
k
k
k

=
=
Es decir, la regin crtica es ( ) 0 , 0, 70 . Puesto
que la proporcin observada por el investigador,
0, 72 , cae fuera de la regin crtica, puede
afirmase que, con una confianza del 95 %, los
resultados de la publicacin son reproducibles.
Vol. 2, nm. 7, Pg. 13
Curso de estadstica
Vol. 2, nm. 7, Pg. 13
Curso de estadstica
3. La estancia media de los pacientes de determinada enfermedad en un Hospital es de 10,2 das con
una desviacin tpica de 2,2 das. La introduccin de una nueva prueba de laboratorio pretende
acortar dicha estancia media. Para evaluar la influencia de la prueba de laboratorio se toma una
muestra aleatoria sencilla de las estancias de 153 pacientes a los que se realiz la prueba de
laboratorio, y se obtuvo una media de 9,1 das. El gerente del Hospital deseara saber si la
introduccin de la prueba de laboratorio fue estadsticamente satisfactoria (95 %) para reducir la
estancia media.
Solucin
Hiptesis de trabajo
0
1
| 10, 2
| 10, 2
H x
H x

<

La hiptesis nula se rechazar (se aceptar la


eficacia de la prueba de laboratorio) si x cae
dentro de la regin crtica.
De nuevo el problema se reduce a construir una
regin crtica con un nivel de significacin deseado
(0,05). La regin crtica, la fraccin de rea bajo
la curva de la funcin de densidad de
probabilidad, estar delimitada por 0 y el valor
k que depende del nivel de significacin.
( )
( ) ( )
0
0
Pr |
Pr 0, | 0, 05
x regincrtica H
x k H

= =
Tratndose de estimaciones de la media
aritmtica, se puede asumir que la distribucin
muestral es la distribucin normal, formalmente:
( )
( )
2
10, 2
0, 05
4, 84
153
10, 2
1, 645
4, 84
153
1, 645 0,178 10, 2 9, 90
k
H
k x k
f k
n
k
k

| |
| |
|
|

|
|
= = =
|
|
| |
\ .
\ .

=
= + =
Es decir, la regin crtica es ( ) 0 , 9, 90 . Puesto
que la estancia media observada despus de
introducir la determinacin, 9,1, cae fuera de la
regin crtica, puede afirmase que, con una
confianza del 95 %, la nueva prueba reduce la
hospitalizacin mnima de los pacientes.
Introduccin a : Regresin
no linear en
En experimentos de biologa se producen
ocasionalmente respuestas que presentan
curvaturas de tipo exponencial, sigmoideo, etc.
que no pueden ser modeladas con el
procedimiento habitual de regresin lineal. En el
modelo linear de regresin, observaciones y
predictores se relacionan mediante una funcin
lineal sencilla puede escribirse, en notacin
matricial (ms compacta y prctica):
i i i
y = + x
donde:
i
x es un vector fila de predictores de la
i -sima observacin ( ) 1, 2, , i n = .
Por lo general el primer elemento es
un 1 que representa la constante de
regresin;
es el vector (de la misma dimensin
que
i
x ) de parmetros de regresin
que debern ser estimados,
1
y
2
;
es el error aleatorio, que se supone
distribuido normal y mutuamente
independientemente, con media 0 y
varianza constante
2
.
En el modelo general, la funcin que relaciona
y
i
x no es necesariamente linear y ambos
vectores no tienen las mismas dimensiones
5
.
( )
,
i i i
y f = + x
As, por ejemplo, la funcin logstica constituye un
modelo utilizado con frecuencia en biologa
2 3
1
1
i
i i x
y
e

= +
+
La verosimilitud del modelo de regresin no lineal
es:

5
Para casos especiales existen paquetes de extensin de
especializados. Por ejemplo, para estudios dosisrespuesta,
existe el paquete drc. Vase
http://apt.allenpress.com/perlserv/?request=get-
abstract&doi=10.1614%2FWT-06-161.1
Vol. 2, nm. 7, Pg. 14
Curso de estadstica
( )
( )
( ) ( )
2
1 2
2
2
1
, exp
2
2
n
i
i
n
y f
L
n

=
| |

|
|
=
|
|
\ .
i
, x
La mxima verosimilitud se alcanza minimizando
la suma de cuadrados residuales,
( ) ( )
2
1
,
n
i i
i
x f x
=

mediante el procedimiento habitual de igualar a


cero las derivadas parciales.
En la funcin nls realiza la estimacin no
linear por el procedimiento de los cuadrados
mnimos. Los argumentos de nls son parecidos a
los de la funcin que estima el modelo lineal,
lm. La diferencia ms importante es que hay que
aportar la funcin concreta que se desea utilizar.
Ms informacin acerca de esta funcin puede
obtenerse escribiendo
en el escritorio de .
Supngase que se desea ajustar a una curva
logstica la concentracin de un constituyente
bioqumico determinado mensualmente a lo largo
de un ao. Se puede tabular estos datos en una
hoja de clculo:
grupo tiempo resultado
1 1 20,1
1 2 20,3
1 3 21,0
1 4 23,1
1 5 28,7
1 6 40,0
grupo tiempo resultado
1 7 53,9
1 8 63,5
1 9 67,7
1 10 69,3
1 11 69,8
1 12 69,9
2 1 20,2
2 2 20,9
2 3 22,9
2 4 29,1
2 5 43,7
2 6 63,9
2 7 78,0
2 8 83,9
2 9 85,9
2 10 86,4
2 11 86,6
2 12 86,6
3 1 20,2
3 2 20,8
3 3 22,8
3 4 28,3
3 5 39,2
3 6 50,5
3 7 56,7
3 8 59,0
3 9 59,7
3 10 59,9
3 11 60,0
3 12 60,0
O bien simular directamente los datos en el escritorio de : los grupos:
los tiempos:
los resultados:
y agruparlo en un objeto que puede denominarse, por ejemplo, datos:
Vol. 2, nm. 7, Pg. 15
Curso de estadstica
La representacin grfica de la concentracin observada en cada uno de los grupos respecto al tiempo se
obtiene mediante las siguientes instrucciones:
Que tienen como resultado el diagrama:
2 4 6 8 10 12
2
0
3
0
4
0
5
0
6
0
7
0
8
0
TIEMPO
R
E
S
U
L
T
A
D
O
1 1
1
1
1
1
1
1
1
1 1 1
2
2
2
2
2
2
2
2
2 2 2 2
3 3
3
3
3
3
3
3
3 3 3 3
DIAGRAMA DE LOS RESULTADOS FRENTE AL TIEMPO
La funcin de ajuste nls requiere introducir la frmula de la curva a la que se desea ajustar la regresin.
Para ajustar una curva logstica R dispone de las funciones getInitial y SSlogis que proporcionan
valores iniciales para los parmetros de la frmula
El paso final es ajustar la curva logstica a las observaciones, primero creando un vector con los
parmetros iniciales (parametros0) y seguidamente ajustando al objeto datos:
Vol. 2, nm. 7, Pg. 16
Curso de estadstica
Para visualizar el ajuste,
que produce el diagrama siguiente:
2 4 6 8 10 12
2
0
3
0
4
0
5
0
6
0
7
0
8
0
datos$tiempo
d
a
to
s
$
r
e
s
u
l
ta
d
o
1 1
1
1
1
1
1
1
1
1 1 1
2
2
2
2
2
2
2
2
2 2 2 2
3 3
3
3
3
3
3
3
3 3 3 3
Uso del foro del curso de
estadstica
Manuel Otero
Santiago de Compostela
Sugerencias para la participacin en el
Foro del Curso de Estadstica
Las siguientes sugerencias pueden hacer que
participar en el foro sea una experiencia ms
placentera y productiva para todos:
Ttulos adecuados. Los ttulos claros y ajustados
al contenido son tan importantes en los foros
como lo son en los correos electrnicos. La mejor
forma de conseguir soporte no es gritar "AYUDA"
en la lnea de ttulo. La gente que contesta y
proporciona ayuda en los foros no suele tener
tiempo para leerlos todos, sino que prioriza su
tiempo intentando contestar sobre los temas que
conoce, para lo cual suelen guiarse por los ttulos
que aparecen en la lista de temas activos o
nuevos. As que un ttulo como "Duda X en la
cuestin 12" es ms probable que atraiga a
alguien que pueda ayudar con el problema.
Consultas detalladas. A menudo, para poder
contestar a una cuestin es necesario conocer los
detalles del problema. Las consultas poco
concretas terminan necesitando un montn de
preguntas y respuestas adicionales, haciendo que
lleve ms tiempo contestarlas.
Ignorar las provocaciones y los tonos rudos
Aunque tengamos una lengua comn, a veces se
dan respuestas rpidas en los foros, sin leer dos
veces lo que se escribe. As que, ante palabras
que puedan parecer rudas o inadecuadas, lo
mejor es ignorarlas y continuar buscando
soluciones productivas.
Respetar el esfuerzo voluntario. Aunque es muy
fcil sentirse frustrado intentando resolver un
problema, recuerda que los miembros de esta
comunidad invierten gratuitamente su tiempo
para ofrecer soporte. Es ms fcil conseguir
respuestas pidiendo ayuda educadamente que
exigindola o quejndose.
Con soporte voluntario, no siempre se obtiene
una respuesta. Si tu cuestin no ha sido
contestada, quiz sea porque nadie que lo ha
ledo tiene la respuesta al problema, o quiz el
ttulo no es lo bastante claro. Si piensas que el
tiempo de respuesta debera ser mejor,
considera dedicar algo de tu tiempo para
Vol. 2, nm. 7, Pg. 17
Curso de estadstica
contestar las cuestiones de otros usuarios
hagamos del foro algo dinmico. En un esfuerzo
voluntario como este, la nica forma de mejorar
el soporte es participando.
En resumen, plantea tus cuestiones
adecuadamente, tmatelo con calma y s
respetuoso con los dems usuarios. Gracias por
participar y bienvenido al Foro del Curso de
Estadstica.
Condiciones de uso del foro
El ingreso del usuario a este Foro identificndose
con su nombre de usuario y clave, implica la
aceptacin sin reservas de las presentes
condiciones.
1. Este foro ha sido creado para debatir e
intercambiar ideas dentro de un marco de
respeto, cordialidad y buena voluntad.
2. Antes de hacer una consulta, por favor
BUSCA DETENIDAMENTE si ese tema ha sido
tratado previamente.
3. El idioma castellano es tremendamente rico.
Por favor cuidemos el lenguaje.
4. Al escribir un mensaje utiliza MAYSCULAS y
minsculas. Escribir todo en MAYSCULAS en
Internet equivale a GRITAR.
5. Si te quieres comunicar con el administrador
de los foros no dejes un mensaje en el foro.
6. En estos foros NO PERMITIMOS:
No permitimos publicidad (explcita o
encubierta, positiva o negativa);
No permitimos usar los foros para comprar o
vender;
No permitimos agravios, insultos,
provocaciones, descalificaciones personales o
lenguaje impropio de un lugar pblico, sean
stos dirigidos a un participante de los foros
o no. Tampoco permitimos denuncias ni
acusaciones de ningn tipo;
No permitimos la promocin de actividades
ilegales (pornografa infantil, terrorismo,
etc.), ni comentarios, alegatos o denuncias
de tipo poltico;
Publica tu mensaje en UN solo tema. No
permitimos publicar un mensaje en varios
temas, ya que todos los mensajes son igual
de importantes;
No permitimos mensajes de alerta de virus,
cadenas, felicitaciones de cumpleaos o
Navidades, o cualquier otro tema que no
tenga relacin con el curso;
El administrador de los foros se reserva el
derecho de editar o eliminar cualquier
mensaje, o impedir el acceso a estos foros de
cualquier usuario que incumpla estas
normas, sin necesidad de aviso previo.
Preguntas frecuentes
Cmo me registro en el Foro?
En la parte superior, a la derecha, hay un enlace
para registrarse.
Los nicos datos obligatorios son el alias con que
se te conocer en el foro, la contrasea y una
cuenta de correo. En esta cuenta de correo
recibirs todos los avisos concernientes al foro
(correo de bienvenida, mensajes privados,
correos de otros usuarios...), por lo que es
conveniente asegurarse de que esa cuenta estar
activa.
Cmo entro en el Foro? CAMBIAR
Justo debajo del enlace para registrarse hay un
enlace para logearse, es decir, identificarse con
nombre y contrasea para poder acceder al foro.
Cmo est organizado el Foro?
DECIDIR
El foro se divide en secciones (General, Primer
mdulo...).
Estas secciones contienen los temas. Los foros
que se encuentran en la seccin General son
Avisos y Novedades, Actividades, Docencia...
Dentro de cada foro hay una serie de hilos.
En cada hilo hay una serie de posts o mensajes.
Cmo uso el Foro?
Leer
Leer el foro es tan sencillo como ir visitando los
enlaces hasta llegar al que te interese.
Normalmente los foros son de acceso pblico,
pero en algunos casos, los accesos estn
restringidos a un grupo especial.
En ese caso se te avisar que no dispones de
permisos.
Avisos
Hay ciertos avisos visuales para ayudarte en la
navegacin.
Si te encuentras logeado, las imgenes a la
izquierda de los ttulos de los foros adquirirn
una apariencia u otra segn en el tema haya
mensajes nuevos o no.
Escribir
Por poltica del foro, excepto fallo temporal, es
obligatorio estar logeado para poder escribir en
cualquier foro.
Vol. 2, nm. 7, Pg. 18
Curso de estadstica
Nuevo hilo
Para crear un nuevo hilo tan solo tendrs que
entrar en el tema en que desees crearlo y darle
al botn "nuevo tpico".
En ese momento te aparecer la ventana de
edicin, que te permitir definir el ttulo y
contenido del primer mensaje del hilo.
Respuesta en un hilo
Para responder en un hilo simplemente te tienes
que situar en dicho hilo y calcar sobre el botn
"responder al mensaje".
La ventana de edicin que sale es idntica a la
que sale cuando se crea un nuevo hilo.
Adjuntar ficheros AADIR
La ventana de edicin te da la opcin de agregar
ficheros (como imgenes o enunciados).
Tras el hueco para escribir el texto se ve una
seccin llamada "aadir fichero". Mediante el
botn BROWSE se le puede indicar donde se
encuentra el fichero. Al enviar el mensaje se
enva el fichero, que queda colgado en el foro.
Para qu usar el foro?
Para ensear a nuestros alumnos a
argumentar habilidad cognitiva de nivel
superior;
Para ejercitar el pensamiento crtico y
creativo. Hay que educar para que las
opiniones se fundamenten con argumentos
slidos;
Para enriquecer los roles que
desempeamos: aqu todos podemos ser co
maestros, codiscpulos y coalumnos;
Para que todos los alumnos puedan participar
ms. Con un foro electrnico, ponemos los
medios para que todos den su opinin las
veces que sea necesario;
Para ahorrar tiempo como profesor: Cuntas
veces has tenido que responder la misma
pregunta planteada por alumnos diferentes?
Si utilizamos el foro para responderlas,
ahorraremos tiempo y repeticiones.
Finalmente pueden ser recopiladas en un
glosario;
Poner un foro social (un lugar donde hablar
libremente sobre el curso), suele ser una
buena manera de conocerse mejor y de
entender y valorar las diferencias.
Por qu usar el foro?
Porque la interaccin permite el aprendizaje
entre iguales de manera privilegiada;
Porque permite un tratamiento reflexivo que
en un aula puede ser escurridizo por la
presin del escaso tiempo y los
compaeros/as;
Porque obliga al alumno a escribir, a
ordenar su pensamiento de manera
autnoma;
Porque permite tratar temas de la misma
manera que expresan e intercambian
opiniones en la vida cotidiana, favoreciendo
la integracin tecnolgica.
Sugerencias
El xito de un foro depende en buena medida
del moderador del mismo. El profesor
mediador ha de intervenir para asegurar el
avance en la argumentacin. Esto
pretendemos;
Invitar a participar en el foro a algn experto
en temas concretos que ests tratando (otro
profesor, gente del mundo de la empresa).
Se puede proponer a los alumnos que enven
sus preguntas al foro y que luego voten,
mediante una consulta o calificndolas, las
ms interesantes para remitrselas al experto
por correo electrnico;
Como apoyo al hbito lector y al hbito
prctico. Partiendo de un tema, artculo,
cuestin, problema se puede proponer
DEBATES sobre cuestiones variadas.
Vol. 2, nm. 7, Pg. 19
Curso de estadstica
Segunda prueba de
evaluacin
Instrucciones
Responda al mximo nmero posible de
cuestiones y problemas.
Antes del 15 de Noviembre, remita las soluciones
al correo electrnico del Curso de Estadstica,
indicando que se trata de la segunda evaluacin
del II Curso, o por correo ordinario a la oficina de
la SEQC, enviando un correo electrnico
indicando que se ha realizado este envo.
A vuelta de correo recibirn un e-mail con la
solucin a los ejercicios.
1 Verdadero o falso?
1. Una vez planteada la estructura de la prueba
de hiptesis, el rango del estadstico de prueba
queda dividido en dos regiones, denominadas
regin crtica y regin de aceptacin. Las
fronteras entre ambas regiones reciben el
nombre de valores crticos.
2. Se denomina nivel de significacin a la
probabilidad de cometer un error un error tipo I
y se denota por la letra griega .
3. Al nivel de significacin tambin suele
llamarse tamao de la regin crtica.
4. Idealmente, debera utilizarse un
procedimiento de prueba en el que los errores
tipo I y II sean pequeos.
5. Para calcular la probabilidad de cometer un
error tipo II no es necesario plantear una
hiptesis alternativa especfica.
6. Si el nivel de significacin de una prueba de
hiptesis es 0, 01 = , significa que, si la
hiptesis nula es cierta, existe una probabilidad
igual a 0, 01 de rechazarla.
7. El tamao de la regin crtica y, en
consecuencia, la probabilidad de cometer un
error tipo I, siempre pueden reducirse mediante
una seleccin apropiada de los valores crticos.
8. Establecidos el o los valores crticos, en
general, un aumento del tamao de la muestra
aumenta tanto como .
9. Cuando la hiptesis nula es falsa, aumenta
a medida que el valor verdadero del parmetro
se acerca al valor hipottico propuesto por la
hiptesis nula. Mientras mayor sea la diferencia
entre el valor real del parmetro y el hipottico,
ser menor.
10. La potencia de una prueba es la probabilidad
de rechazar la hiptesis nula dado que alguna
alternativa especfica es verdadera.
11. La potencia de una prueba es una medida
muy descriptiva y concisa de la sensibilidad de
una prueba estadstica, donde se entiende por
sensibilidad a la capacidad de una prueba para
detectar diferencias.
12. Las pruebas de hiptesis slo son aplicables a
distribuciones normales.
13. Para un tamao de muestra dado, al pasar de
un nivel de significacin de 0,01 a 0,05 aumenta
el riesgo de cometer un error tipo I y disminuye
el riesgo de cometer un error tipo II.
14. Al disear una prueba de hiptesis, el
investigador slo puede controlar el error tipo I o
el error tipo II, pero no hay modo de controlar
los dos simultneamente.
15. A veces, la regin crtica para la hiptesis
alternativa
0
> se encuentra a la derecha de
la distribucin de la estadstica de prueba.
16. Al observar el smbolo de la desigualdad de la
hiptesis alternativa, ste apunta en la direccin
de la regin crtica.
17. Para determinar qu hiptesis se establecer
como
0
H y cul como
1
H , si la afirmacin
sugiere una sola direccin como mayor que,
menor que, superior a, inferior a, entonces
1
H
se debe establecer con el usos del smbolo de
desigualdad que corresponde a la direccin
sugerida (< o >).
18. Si no se tiene en mente un nivel de
significacin preseleccionado, es imposible
sacar conclusiones en una prueba de hiptesis.
19. La aproximacin del valor p se disea para
dar al usuario una alternativa, en trminos de
probabilidad, a la simple conclusin de rechazo o
no rechazo.
20. Un valor p es el nivel de significacin ms
bajo en el que el valor observado de la
estadstica de prueba es significativo.
Vol. 2, nm. 7, Pg. 20
Curso de estadstica
2. Cuestiones
2.1. Al aumentar el nivel de confianza, para un
tamao muestral n dado:
(a) disminuye el error de tipo I
(b) disminuye el error de tipo II
(c) aumenta el error de tipo I
(d) no se modifica el error de tipo II
(e) disminuye la amplitud del intervalo de
confianza
2.2. Para disminuir la amplitud del intervalo de
confianza, puede:
(a) incrementarse el tamao muestral
(b) disminuirse la varianza muestral
(c) aumentarse el nivel de confianza
(d) (a) y (b)
(e) (a), (b) y (c)
2.3. Si se busca disminuir el margen de error en
la estimacin del intervalo de confianza de una
media, cul de las siguientes posibilidades
permite realizarlo en mayor cuanta?
(a) disminuir la varianza muestral
(b) aumentar la varianza muestral
(c) aumentar el tamao muestral y la confianza
(d) aumentar la confianza
(e) aumentar el tamao muestral y disminuir la
confianza
2.4. Una estimacin confidencial para un nivel de
confianza fijado, da por respuesta
(a) una aproximacin de la mediana
(b) un nivel de significacin
(c) un intervalo
(d) una probabilidad
(e) una aproximacin de la media
2.5. El tamao mnimo de muestra necesario
estadsticamente significativo para comparar dos
medias aumenta cuando:
(a) aumenta la media poblacional
(b) disminuye el error estndar de la media a
nivel poblacional
(c) aumenta el error
(d) aumenta el error
(e) disminuye la diferencia entre las medias
2.6. Qu diferencia hay entre el intervalo que
estima la media poblacional y el intervalo que
estima la mediana poblacional?
(a) el intervalo que estima la media es mayor
que el que estima la mediana, incluso dos
veces cuando se estudian muestras
pequeas
(b) no existen diferencias entre ambos
intervalos
(c) el intervalo que estima la mediana es menor
que el que estima la media
(d) el intervalo que estima la mediana es mayor
que el que estima la media
(e) (a) y (c) son ciertas
2.7. Se pretende demostrar que un nuevo
tratamiento frente al cncer de pulmn es mejor
que el tratamiento convencional. Se asignan 100
pacientes al nuevo tratamiento y otros 100 al
tratamiento convencional, cul es la hiptesis
nula?
(a) los dos grupos de 100 pacientes presentan las
mismas caractersticas de edad, gravedad,
evolucin de la enfermedad, etc., antes de
empezar cualquiera de los dos tratamientos
(b) el tratamiento convencional es mejor que el
nuevo
(c) ambos tratamientos producirn el mismo
nmero de curaciones
(d) el nuevo tratamiento es mejor que el
convencional
(e) no hay hiptesis nula en este estudio
2.8. Si a partir de los datos de una muestra se
calcula el intervalo de confianza al 90 % para la
media...
(a) el error ser del 10 %
(b) el error ser del 10 %
(c) el error ser del 5 %
(d) habr un 5 % de individuos de la muestra que
estarn situados por encima del lmite
superior del intervalo de confianza
(e) si se calculasen 100 intervalos de confianza,
10 de ellos estaran por debajo del
verdadero parmetro poblacional y los otros
90 lo abarcaran
2.9. En una prueba estadstica la probabilidad de
rechazar una hiptesis nula que es falsa, se
denomina
(a) eficiencia
(b) error tipo I
(c) error tipo II
(d) potencia
(e) especificidad
2.10. Una vez se ha rechazado la hiptesis nula,
cul es la probabilidad de cometer un error tipo
II?
(a) 1
(b) depender de la potencia
(c) depender del tamao de la muestra
(d) 0
(e) (b) y (c) son ciertas
Vol. 2, nm. 7, Pg. 21
Curso de estadstica
3 Problemas
3.1. En la calibracin de una pipeta de valor
nominal es de 0,5 mL se pesa el resultado de
dispensar 10 n= veces agua y se obtienen las
siguientes observaciones (en mg):
0,492 0,501 0,494
0,495 0,500 0,491
0,502 0,504 0,505
0,492
Se desea saber, con un nivel de confianza del 90
%, si la pipeta est en condiciones de ser
utilizada.
3. 2. Un investigador desea publicar los
resultados de la determinacin de la
concentracin cataltica de AST en una serie de
126 n= pacientes de una enfermedad ocular,
obteniendo los siguientes estadsticos:
38, 6
4, 30
x UI
s UI
=
=
(a) El revisor de la revista le requiere que
facilite el intervalo de confianza, al 95%, de
la media de estos resultados, qu datos
debe facilitar el autor?
(b) Cuando el investigador remite el original con
el intervalo de confianza pedido, al revisor le
parece excesivamente dilatado y le solicita
que, mediante procedimientos
cientficamente honestos, lo reduzca a una
amplitud de 0,70. Qu puede hacer el
investigador?
3.3. Para cumplir con un requisito de
certificacin, el director de la calidad de un
laboratorio clnico realiza una encuesta de
satisfaccin entre una muestra aleatoria sencilla
de pacientes usuarios de los servicios del
laboratorio. El indicador de calidad fija en un 2 %
la proporcin de usuarios descontentos. De las
500 encuestas realizadas, 488 de ellas se
manifestaban satisfechas con los servicios del
laboratorio y 12 insatisfechas. Qu conclusiones
debe sacar el director de la calidad?
3.4. Calcular un intervalo de confianza al nivel
0, 05 = para la probabilidad de p de que un
recin nacido sea nio si en una muestra de
tamao 123 se han obtenido 67 nios.
3.5. Calcular un intervalo de confianza al nivel
0, 001 = para el peso exacto mediante los
resultados obtenidos con 10 balanzas:
7,20 7,11 7,22
7,01 7,12 7,03
7,36 7,03 6,91
7,05
3.6. Calcular qu tamao muestral se debe
tomar para obtener con una precisin de
0, 001 a partir de una muestra de una poblacin
( ) , 3 N .
3.7. Se ha hecho un estudio sobre la proporcin
de enfermos de cncer de pulmn detectados en
hospital que fuman, obtenindose que de 123
enfermos 41 de ellos eran fumadores. Obtener
un intervalo de confianza para dicha proporcin.
Estudiar si dicha proporcin puede considerarse
igual a la proporcin de fumadores en la
poblacin si sta es de un 29 %.
3.8. Se sospecha que un cromatgrafo est
averiado, y se desea determinar si los resultados
que proporciona son lo suficientemente precisos.
Para ello, se realiza una serie de 8 mediciones
del contenido de una solucin de referencia que,
se sabe que contiene 90 % de un determinado
compuesto. Los resultados que se obtienen son:
92,3 94,9 90,4 93,3
96,5 91,6 90,1 86,8
Construir un intervalo de confianza al nivel de 95
% para la varianza poblacional. Qu conclusiones
se pueden extraer?
3.9. En el departamento de control de calidad de
una empresa, se quiere determinar si ha habido
un descenso significativo de la calidad de su
producto entre las producciones de dos semanas
consecutivas a consecuencia de un incidente
ocurrido durante el fin de semana. Deciden
tomar una muestra de la produccin de cada
semana, si la calidad de cada artculo se mide en
una escala de 100, obtienen los resultados
siguientes:
Semana
1
93 86 90 90 94 91 92 96
Semana
2
93 87 97 90 88 87 84 93
Suponiendo que las varianzas de la puntuacin en
las dos producciones son iguales, construya un
intervalo de confianza para la diferencia de
medias al nivel de 95 %.Interprete los resultados
obtenidos.
3.10. Para evaluar una vacuna para la gripe se
selecciona un grupo de 200 individuos de riesgo.
Se eligen 100 de ellos y se les suministra la
vacuna; de ellos 10 pasan la gripe. Construir un
intervalo de confianza al 95 % para la
probabilidad de pasar la gripe si se est
vacunado. En los otros 100 pacientes sin vacunar
la pasan 20. Construir tambin el mismo
intervalo de confianza para los no vacunados.
3.11. La efectividad en das de un determinado
antibitico, sigue una distribucin normal de
Vol. 2, nm. 7, Pg. 22
Curso de estadstica
media 14 das y desviacin tpica desconocida.
Fue administrada a 16 enfermos, obtenindose
una cuasidesviacin tpica muestral de 1,4 das.
Determinar la probabilidad de que la efectividad
media en la muestra no supere los 13 das, que
es el tiempo mnimo de efectividad requerido.
Preocupados por una posible subestimacin de la
varianza poblacional que podra llevar a
subestimar la probabilidad de que no se alcance
la efectividad mnima, se desea determinar la
probabilidad de que con una muestra de 16
enfermos se subestime la varianza en ms de un
20 %. Si la muestra es de 61 pacientes, esta
probabilidad aumenta o disminuye?
3.12. Se registraron los siguientes datos en das,
que representan los tiempos de recuperacin de
pacientes tratados aleatoriamente con uno de
dos medicamentos para aliviarlos de graves
infecciones en la vescula:
medicamento 1 medicamento 2
1
14 n =
1
116 n =
1
17 x =
1
19 x =
2
1
1, 5 s =
2
1
1, 8 s =
Encuentre un intervalo de confianza del 99 %
para la diferencia
1 2
en el tiempo de
recuperacin para los medicamentos, suponiendo
poblaciones normales con varianzas diferentes.
3.13. Para estudiar la efectividad de un
medicamento contra la diabetes se mide la
cantidad de glucemia en sangre antes y despus
de la administracin de dicho medicamento
antes 7,2 7,3 6,5 4,2 3,1 5,3 5,6
despus 5,2 5,4 5,3 4,7 4,1 5,4 4,9
Estimar la reduccin producida por el
medicamento.
3.14. Qu tamao ha de tener la muestra para
estimar la estatura media, , de la poblacin
con un error menor de 0,5 cm y con un nivel de
confianza del 95 %?
3.15. Se desea estimar la proporcin p de
individuos daltnicos de una poblacin a travs
del porcentaje observado en una muestra
aleatoria de individuos, de tamao n .
(a) Si el porcentaje de individuos daltnicos en la
muestra es igual al 30 %, calcula el valor de n
para que, con un nivel de confianza de 0,95, el
error cometido en la estimacin sea inferior al
3,1 %.
(b) Si el tamao de la muestra es de 64
individuos, y el porcentaje de individuos
daltnicos en la muestra es del 35 %, determina,
usando un nivel de significacin del 1 %, el
correspondiente intervalo de confianza para la
proporcin de daltnicos de la poblacin.
3.16. Se exponen los resultados de un estudio de
seguimiento donde 853 mujeres estuvieron
pasivamente expuestas al humo del tabaco
durante la gestacin y 1620 no lo estuvieron, y su
asociacin con el bajo peso al nacer.
recin nacido de
bajo peso
s no total
s 20 833 853
no 14 1606 1620
exposicin
pasiva al
tabaco total 34 2439 2473
Calcular el riesgo relativo y su intervalo de
confianza del 95%
3.17. En un estudio de casos y controles se
quiere determinar si el consumo de fibra es o no
un factor de proteccin para el cncer de colon.
Los datos se exponen en la tabla siguiente:
casos controles
expuestos 92 160
no expuestos 108 140
total 200 300
(a) Calcule un estimador del riesgo asociado a la
variable independiente consumo de fibra.
(c) Qu significa este resultado?
Prximo nmero
2008: vol 2, nmero 8
Fecha aproximada de aparicin:
segunda quincena de Septiembre
Gua de estudio (9)
Mdulo IV: Estadstica avanzada (I): series
temporales: anlisis clsico y modelos ARIMA.
Problemas
Regresin y correlacin
Nombres propios
Bruno de Finetti
Tests estadsticos
Test de aleatoriedad (2)
Introduccin a :
Tablas de contingencia

Vous aimerez peut-être aussi