Vous êtes sur la page 1sur 37

Apuntes sobre Estadstica Elemental

1. Generalidades Es generalizada la prctica de empezar a abordar un concepto nuevo a partir de la definicin del mismo. No obstante, en ocasiones, conocer la definicin no aporta elementos que ayuden a conocerlo mejor o simplemente a concebirlo y entenderlo. Sera el caso de que un profesor iniciara la disertacin acerca de Fsica Cuntica proporcionando una definicin de la misma. En este caso se corre el riesgo de que la definicin pudiese caer en el vaco, toda vez que el estudiante carecera de los elementos bsicos con los cuales asociar los conceptos subyacentes en tal definicin. En el mejor de los casos podra memorizarse la definicin y hasta repetirla todas las veces que fuese necesario, pero este conjunto de palabras no necesariamente producen el efecto deseado. Esto es, que el estudiante automticamente reproduzca en su mente el concepto u objeto definido. Contrario a la aseveracin del prrafo precedente, si al estudiante se le pidiese una definicin de un concepto u objeto con el cual tenga cierta familiaridad, es probable que pueda hacerlo con relativa facilidad. Por ejemplo, si se le pidiese que defina lo que entiende es una silla rpidamente respondera que se trata de un objeto que sirve para sentarse. Si a seguidas se le preguntase por la fuente de esa definicin es muy probable que su respuesta sea que ninguna, nunca ha visto u odo una definicin de silla. La discusin precedente podra estar sugiriendo que desde la perspectiva enseanzaaprendizaje, comenzar el abordaje de un concepto nuevo, como el de Estadstica o de otra rea del conocimiento cualquiera, tratando de entender sus orgenes y evolucin podra ser mucho ms provechoso que hacerlo a partir de su definicin.

1.1. Breve bosquejo histrico sobre los orgenes de la Estadstica


Existe abundante informacin a travs de la cual es posible construir un trozo de texto, donde se proporcione una idea del proceso seguido por una serie de prcticas que inicialmente podran tipificarse como simples ejercicios de contabilidad social, cuya evolucin a travs del tiempo dieron origen a lo que hoy da se conoce como Estadstica. Experiencias derivadas de revisiones bibliogrficas y discusiones sobre el origen y trayectoria de la Estadstica permiten inferir que el estado actual de esta disciplina es el producto prcticas milenarias. Desde la aparicin de los primeros conglomerados humanos cohesionados por cierto grado de organizacin social surgieron formas sencillas de registrar hechos relacionados con la vida cotidiana de los grupos humanos. En rocas, paredes de grutas, guijarros y otros objetos se han encontrado evidencias relativas al conteo de personas, animales y eventos. El conteo sobre la poblacin y las riquezas existentes en el territorio del Egipto antiguo data de tiempos tan remotos como el ao 3,050 antes de nuestra era. Esa prctica, de acuerdo al historiador griego Herdoto, constitua un ejercicio orientado a la construccin de la Pirmides. Esa experiencia ganada por los egipcios le permiti al gobierno del faran Ramss II la realizacin de un censo de naturaleza agraria, destinado a verificar un reparto de tierras. En aos inmediatamente posteriores, hacia el ao 3,000 antes de nuestra era, en los pueblos de Babilonia, una de las importantes civilizaciones de la antigedad, ya se utilizaban piezas de arcilla para grabar inscripciones relativas a datos

acerca de la produccin agrcola y las cantidades vendidas o cedidas a travs de trueques 1 . Un evento de naturaleza considerado de alta trascendencia en el desarrollo histrico de la Estadstica es recuento de poblacin ordenado por el Emperador Yao, de la China hacia el ao 2,238 antes de nuestra era. Ese operativo estuvo destinado a establecer el tamao de la poblacin del imperio y algunas de sus caractersticas, con el objeto de determinar el nmero de subditos del imperio y algunas de sus caractersticas. A su vez, hacia Siglo VI antes de nuestra era, los griegos hacan levantamientos peridicos de informacin acerca de la poblacin del territorio, con propsitos de determinar los recursos disponibles, determinar los derechos al voto, fijar impuestos y determinar la cantidad de hombres disponibles para formar parte del ejrcito. El nivel de organizacin social alcanzado por el Imperio Romano hizo que su nivel de requerimientos de informacin fuese elevado. Por esta razn se considera a los romanos como la civilizacin de la antigedad que lleg ms lejos en relacin al empleo de prcticas estadsticas. A los funcionarios al servicio del imperio se les exiga registrar algunos eventos relacionados con el ciclo vital de las personas como: nacimientos, defunciones y casamientos. En forma adicional, en los territorios conquistados se hacan inventarios peridicos del ganado, los esclavos y otras riquezas existentes. En pleno apogeo de este Imperio Romano, cada cinco aos se hacan recuentos en la poblacin. Uno de estos eventos, del cual tambin se da cuenta en el Nuevo Testamento, fue el recuento de poblacin levantado en el ao I de la Era Cristiana, a partir de un edicto del Emperador Cesar Augusto. De acuerdo al Nuevo Testamento, durante este recuento poblacional se produjo el nacimiento de Cristo, en momentos en que sus progenitores se trasladaron a Beln, su lugar de residencia habitual, para empadronarse. Este evento estuvo destinado a cuantificar la poblacin del imperio, determinar el nmero de propietarios y las propiedades que posean como: tierras, cabezas de ganado, esclavos y otras riquezas, por que, entre otras utilidades, sirvi para fijar impuestos. Este levantamiento de informacin, de naturaleza universal, pues se aplic en todo el imperio, fue conocido con el nombre de censere. Esta palabra sirvi como antecedente para denominar como censo a todo aperativo destinado a recabar informacin a cerca de una poblacin completa. Durante el perodo de cerca de 10 siglos que sigui a la cada del Imperio Romano se considera que hubo pocos eventos de naturaleza estadstica de envergadura. Las excepciones las constituyen las recopilaciones de informacin acerca de las tierras propiedad de la iglesia catlica desarrolladas por Pipino el Breve en el ao 758 y por Carlomagno en el ao 762; adems de algunos recuentos de poblacin que de manera parcial se levantaron en Francia en el Siglo IX. En las postrimeras del Siglo XI, el rey Guillermo I, conocido como Guillermo el Conquistador, encarg en el ao 1086, la realizacin de un conteo de la poblacin, las propiedades, as como de la extensin y el valor de las tierras en Inglaterra. Esta recopilacin se recoge en un importante documento conocido como Domesday Book, o

Hernndez Gonzlez, Sergio. Historia de la estadstica. In: Revista de divulgacin cientfica y tecnolgica de la Universidad Veracruzana, Volumen XVIII, No. 2. Mayo-Agosto de 2005. Veracruz, 2005.

Libro del Gran Catastro, el cual se considera como el primer compendio estadstico britnico, y uno de los primeros del mundo.
Aunque Carlomagno en Francia y Guillermo el Conquistador en Inglaterra trataron de revivir la tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV, XVI y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo Galilei, William Harvey, Francis Bacon y Ren Descartes hicieron grandes operaciones con base en el mtodo cientfico, de tal forma que cuando se crearon los Estados nacionales y surgi como fuerza el comercio internacional, haba ya un mtodo capaz de aplicarse a los datos econmicos. Debido al temor que Enrique VII tena de la peste, en el ao 1532 empezaron a registrarse en Inglaterra las defunciones causadas por esta enfermedad. En Francia, ms o menos por la misma poca, la ley exiga a los clrigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareci a fines del siglo XVI, el gobierno ingls comenz a publicar estadsticas semanales de los decesos. Esa costumbre continu muchos aos, y en 1632 los llamados Bills of Mortality (Cuentas de Mortalidad) ya contenan datos sobre los nacimientos y fallecimientos por sexo. En 1662, el capitn John Graunt compil documentos que abarcaban treinta aos, mediante los cuales efectu predicciones sobre el nmero de personas que moriran de diversas enfermedades, as como de las proporciones de nacimientos de hombres y mujeres que caba esperar. El trabajo de Graunt, condensado en su obra Natural and political observations made upon the Bills of Mortality (Observaciones polticas y naturaleshechas a partir de las Cuentas de Mortalidad), fue un esfuerzo de inferencia y teora estadstica. Alrededor del ao 1540, el alemn Sebastin Muster realiz una compilacin estadstica de los recursos nacionales, que comprenda datos acerca de la organizacin poltica, instrucciones sociales, comercio y podero militar. Durante el siglo XVII se aportaron indicaciones ms concretas sobre los mtodos de observacin y anlisis cuantitativo y se ampliaron los campos de la inferencia y la teora estadstica. Los eruditos del siglo XVII demostraron especial inters por la estadstica demogrfica como resultado de la especulacin sobre si la poblacin aumentaba, disminua o permaneca esttica. En los tiempos modernos, tales mtodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos pases. El primer empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los aos terminados en 7 mora ms gente que en los restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad. Despus de revisar miles de partidas de defuncin, pudo demostrar que en tales aos no fallecan ms personas que en los dems. Los procedimientos de Neumann fueron conocidos por el astrnomo ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio de la vida humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compaas de seguros. Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del gobernante consciente. La raz remota de la palabra se halla en el trmino latino s t a t u s, que significa estado osituacin. Esta etimologa aumenta el valor intrnseco de la palabra por cuanto que la estadstica revela el sentido cuantitativo de las ms variadas situaciones. Uno de los primeros trabajos sobre las probabilidades corresponde al matemtico italiano del siglo XVI Girolano Cardano, aunque fue publicado 86 aos despus de su fallecimiento. En el siglo XVII encontramos correspondencia relativa a la probabilidad en los juegos de azar entre los matemticos franceses Blaise Pascal y Pierre de Fermat, fundamentos sobre los que

Christian Huygens, fsico, matemtico y astrnomo dans, publicara un libro en 1656. Durante ese mismo siglo y principios del XVIII, matemticos como Bernoulli, Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante, durante cierto tiempo la teora de las probabilidades limit su aplicacin a los juegos de azar, y no fue sino hasta el siglo siguiente que comenz a aplicarse a los grandes problemas cientficos. Durante el sigo XVIII empieza el auge de la estadstica descriptiva en asuntos sociales y econmicos, y es a finales de ese siglo y comienzos del XIX cuando se comienzan a asentar verdaderamente las bases tericas de la teora de probabilidades con los trabajos de Joseph Louis Lagrange y Pierre Simon de Laplace, del brillantsimo y ubicuo matemtico y astrnomo alemn Carl Friedrich Gauss, y de Simen-Denis Poisson. Previamente, cabe destacar el descubrimiento de la distribucin normal por Abraham de Moivre, distribucin que ser posteriormente redescubierta por Gauss y Poisson. Jacques Qutelect es quien aplica la estadstica a las ciencias sociales. Interpret la teora de la probabilidad para su uso en esas ciencias y aplic el principio de promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en efectuar la aplicacin prctica de todo el mtodo estadstico entonces conocido a las diversas ramas de la ciencia. En el periodo de 1800 a 1820 se desarrollaron dos conceptos matemticos fundamentales para la teora estadstica: la teora de los errores de observacin, aportada por Laplace y Gauss, y la teora de los mnimos cuadrados, realizada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Galton ide el mtodo conocido como c o r r e l a c i n, que tena por objeto medir la influencia relativa de los factores sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin creado por Karl Pearson y otros cultivadores de la ciencia biomtrica, tales como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones. Una vez sentadas las bases de la teora de probabilidades, podemos situar el nacimiento de la estadstica moderna y su empleo en el anlisis de experimentos en los trabajos de Francis Galton y Kurt Pearson. Este ltimo public en 1892 el libro The Grammar of Science (La gramtica de la ciencia), un clsico en la filosofa de la ciencia, y fue l quien ide el conocido test de Chi -cuadrado. El hijo de Pearson, Egon, y el matemt ico nacido en Polonia Jerzy Neyman pueden considerarse los fundadores de las pruebas modernas de contraste de hiptesis. Pero es sin lugar a dudas Ronald Arnold Fisher la figura ms influyente de la estadstica, pues la situ como una poderosa herramienta para la planeacin y anlisis de experimentos. Contemporneo de Pearson, desarroll el anlisis de varianza y fue pionero en el desarrollo de numerosas tcnicas de anlisis multivariante y en la introduccin del mtodo de mxima verosimilitud para la estimacin de parmetros. Su libro Statistical Methods for Research Workers (Mtodos estadsticos para los investigadores), publicado en 1925, ha sido probablemente el libro de estadstica ms utilizado a lo largo de muchos aos. Mientras tanto, en Rusia, una activa y fructfera escuela de matemticas y estadstica aport asimismo como no poda ser de otro modo su considerable influencia. Desde finales del siglo XVIII y comienzos del XIX cabe destacar las figuras de Pafnuty Chebichev y Andrei Harkov, y posteriormente las de Alexander Khinchin y Andrey Kolmogorov. En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadores vieron la necesidad de reducir la informacin a valores numricos para evitar la ambigedad de las descripciones verbales. En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en interpretar esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden estudiar con gran exactitud utilizando

determinadas distribuciones probabilsticas. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico.

1.2 Cmo surgi la Estadstica? Si se toma en cuenta la forma como diferentes responsables por la conduccin de colectivos humanos usaron algunos ejercicios de contabilidad social como forma de generar informacin til en su quehacer cotidiano, podra afirmarse que la Estadstica naci de la necesidad que tenan los pueblos de contar con informacin acerca de sus recursos econmicos y sociales. De esta forma, cuando se estableca el nmero de habitantes de un territorio y sus caractersticas, como el sexo y la edad, se haca una cuantificacin referida a recursos sociales, pues la poblacin constituye un recurso social, el ms valioso de todos. A su vez, cuando se determinaba el nmero de propietarios y el tamao de las propiedades que posean (tamao de las explotaciones agrcolas, nmero de cabezas de ganado, nmero de esclavos, etc.) se haca una medicin de los recursos econmicos existentes en el territorio. 1.3 Cmo surge la Estadstica Matemtica en el Siglo XVII? Como se infiere a partir de las discusiones subyacentes en la evolucin seguida por la estadstica desde sus orgenes, la orientacin que inicialmente tuvo esta prctica era netamente de carcter administrativo. Estaba destinada a producir informacin para ser utilizada como insumo en la toma de decisiones relacionadas con el arte de gobernar. No obstante, hacia mitad del Siglo XVII se produce un importante acontecimiento en el desarrollo de la Estadstica. Se trata del surgimiento de una rama nueva de esta disciplina, a la cual se le denomin Estadstica Matemtica. Esquema 1 Origen y evolucin de la Estadstica

Surgimiento de la Estadstica
Siglo XVII

Tiempos remotos

Epoca actual
Estadstica Matemtica

Sin embargo, esta nueva rama de la Estadstica naci de una prctica de los nobles ingleses de la poca durante sus momentos de ocio. Los hombres pertenecientes a la casta social de mayor estatus, entre otras formas de entretenimiento, con frecuencia eran dados a la prctica de juegos de azar. Mientras jugaban observaron que en los resultados de este tipo de ejercicio se producan ciertas regularidades. As por ejemplo, al lanzar una moneda al aire, el resultado al caer era cara o cruz, pues eran las estampas que posean las monedas existentes en la poca en los dos lados. Sin embargo, despus de estar jugando durante un perodo largo

observaban que el nmero de veces que la moneda haba cado con la cruz hacia arriba era similar al nmero de veces en que el resultado haba sido cara. De igual forma, a lanzar el dado una vez su resultado era cualquiera de los nmeros del 1 al 6, dado que este objeto tiene 6 caras, las cuales estn numeradas en forma correlativa desde 1 hasta 6. No obstante, despus de un nmero grande de jugadas, en que el dado el dado haba sido lanzado un nmero grande de veces, se observaba que cada uno de los nmeros haba salido aproximadamente un sexto (1/6) de las veces. Este tipo de comportamiento fue observado por los nobles ingleses de mediados del Siglo XVII cuando practicaban otros juegos de azar. Ante las interrogantes surgidas a los nobles jugadores supusieron que estos fenmenos podan estar relacionados con cuestiones de ndole matemtica, por esa razn expusieron la situacin ante algunos matemticos de la poca. Estos cientficos hicieron experimentos de laboratorio y comprobaron las observaciones de los nobles jugadores, llegando a la conclusin de que estas regularidades seguidas por los juegos de azar obedecen a leyes matemticas, nominadas posteriormente como leyes de las probabilidades. A su vez, las leyes de las probabilidades constituyen la base de la Teora de las Probabilidades. Finalmente, la Teora de las Probabilidades constituyen la piedra angular sobre la cual se basa la Estadstica Matemtica. En resumen: La Estadstica Matemtica surgi a partir del desarrollo de la Teora de las Probabilidades, la cual a su vez se origin a partir de las respuestas que los matemticos de la poca dieron a los problemas asociados a los juegos de azar.
Esquema 2 Surgimiento de la Estadstica Matemtica
Regularidades observadas por los nobles jugadores del Siglo XVII en los juegos de azar

Respuestas de los matemticos de la poca a los problemas asociados a los juegos de azar

Teora de las Probabilidades

Estadstica Matemtica

2. Concepto de Estadstica y Estadsticas Desde el momento en que, en las Generalidades, se planteaba la inconveniencia de empezar el abordaje de la Estadstica a partir de su definicin, se ha suscitado una discusin que ha permitido adentrarse en el conocimiento de esta prctica, inicialmente a cargo de los gobernantes, que hoy se conoce como el nombre de Estadstica. En

consecuencia, si en este momento se diera una definicin, los trminos envueltos en la misma no le resultaran ajenos al estudiante, toda vez que en su acervo de conocimientos ya posee un concepto al cual asociarla. Ahora bien, definir Estadstica obliga a establecer su diferenciarla con el concepto estadsticas. Inicialmente podra pensarse que apenas se alude al mismo tpico, solo que el primer caso se presenta en singular, mientras que en el segundo est en plural. Sin embargo no es as, pues se trata de dos conceptos completamente diferentes. 2.1 Estadsticas 2.1.1 Concepto bsico Tomando en consideracin la naturaleza de las informaciones subyacentes en el concepto, en principio podran existir una amplia gama de definiciones del mismo. Una forma simple y hasta burda de definir estadsticas podra referirla a un conjunto de datos numricos relativos a un determinado fenmeno, los cuales se presentan clasificados en funcin de una determinada caracterstica. Para ser analizada estadsticamente, la informacin debe estar expresada en forma cuantitativa o en una forma que pueda convertirse a la forma cuantitativa. No obstante, no toda informacin cuantitativa constituye un dato estadstico. Los datos estadsticos son conjuntos de nmeros referidos a una misma caracterstica y recogidos de tal forma que puedan ser comparados, analizados e interpretados. Por ejemplo, un nmero no constituye un dato estadstico a menos que se le compare o que muestre una relacin significativa con otros nmeros. De este modo, los datos relacionados con el rendimiento escolar de un alumno no constituyen un dato estadstico. Sin embargo, los datos correspondientes al rendimiento escolar de los estudiantes del curso s constituyen datos estadsticos, porque a partir del anlisis estadstico de los mismos se pueden derivar medidas y relaciones a travs de las cuales es posible tipificar las caractersticas del rendimiento escolar y as poder contribuir con la solucin de este tipo de problema. 2.1.2 Tipos de estadsticas Las estadsticas pueden ser de naturaleza muy diversa, en funcin del tema o materia a la cual hagan referencia. De esta forma se tienen: a) Estadsticas educativas, las cuales se refieren a datos relacionados con el quehacer educativo como es el caso de: nmero de estudiantes inscritos en funcin de la provincia; nmero de estudiantes inscritos en funcin del nivel de instruccin; nmero de maestros en funcin de la provincia; nmero de aulas construidas en funcin de los aos; nmero de inscritos en funcin del grado; etc. b) Estadsticas judiciales, las cuales hacen referencia a datos relacionados con las actividades del rea judicial, como es: nmero de personas sometidas a la justicia durante el ao 2009 en funcin de la provincia; nmero de personas sometidas a la justicia durante el ao 2009 en funcin del tipo de infraccin cometida; nmero de tribunales existentes en la Repblica Dominicana en funcin de la provincia; nmero de magistrados existentes en la repblica Dominicana en funcin de la

edad; nmero de reos sentenciados en la Repblica Dominicana en funcin de la edad; etc. c) Estadsticas industriales, las cuales se refieren a los datos relacionados con la industria tales como: nmero de industrias de acuerdo clasificadas por tipo actividad al cual se dedica; nmero de industrias clasificadas por nmero de trabajadores que posee; nmero de industrias clasificadas por monto de capital invertido; volumen de las exportaciones clasificadas por tipo de actividad al cual se dedica la industria; etc. d) Estadsticas agropecuarias, referidas al quehacer agropecuario como: nmero de fincas clasificadas por provincia; nmero de fincas clasificadas por tamao; nmero de tareas cultivadas clasificadas por provincia; nmero de tareas cultivadas clasificadas por tipo de cultivo; nmero de cabezas de ganado clasificadas por provincia; nmero de animales existentes en las explotaciones pecuarias clasificados por tipo de animal; etc. De la misma forma que se hace referencia a las estadsticas educativas, judiciales, industriales y agropecuarias tambin puede aludirse a las estadsticas: de construcciones, de transporte y comunicaciones, de comercio interno, de comercio exterior, de moneda y finanzas, de precios y salarios, de empleo y laborales, demogrficas, de salubridad y de justicia, entre otras. 2.1.3 Diferencia entre estadsticas y dato Cuando se defina el concepto de Estadsticas se aluda a un conjunto de informaciones numricas que representan la ocurrencia o presencia de un fenmeno, las cuales se presentan clasificadas de acuerdo a las categoras de una caracterstica. Un ejemplo de estadsticas puede estar constituido por las informaciones contenidas en los cinco arreglos siguientes: 1) nmero de docentes de la Repblica Dominicana en el ao 2007 clasificados por nivel educativo; 2) nmero de estudiantes matriculados la Repblica Dominicana en el ao 2007 clasificados por nivel educativo; 3) nmero de estudiantes matriculados la Repblica Dominicana en el ao 2007 clasificados por provincia; 4) nmero de estudiantes matriculados en la Educacin Superior en la Repblica Dominicana en el ao 2007 clasificados por centro educativo; 5) nmero de estudiantes egresados de la Educacin superior en la Repblica Dominicana en el ao 2007 clasificados por centro educativo. La situacin expuesta en el prrafo precedente indica que se dispone de cinco series de datos relativas a las estadsticas educativas; por tanto al hacer referencia a este conjunto de informaciones puede aludirse a estadsticas educativas. Sin embargo, si apenas se dispusiera del nmero de docentes de la Repblica Dominicana en el ao 2007; del nmero de estudiantes matriculados en la Repblica Dominicana en el ao 2007; del nmero de estudiantes matriculados en la Educacin Superior en la Repblica Dominicana en el ao 2007; y del nmero de estudiantes egresados de la Educacin superior en la Repblica Dominicana en el ao 2007, entonces apenas se dispondra de cuatro datos. En consecuencia, en este caso no podra hablarse de estadsticas.

Estadstica 2.2.1 Concepto bsico La Estadstica es una disciplina cientfica dedicada al desarrollo y aplicacin de la teora y las tcnicas apropiadas para la recoleccin, clasificacin, presentacin, anlisis e interpretacin de informacin cuantitativa obtenida por observacin o experimentacin. La estadstica se concibe como una rama de las Matemticas Aplicadas, pero tambin incluye elementos tericos y tcnicas propias. En contraste con otros cientficos, cuyos datos vienen de su propia disciplina, los estadsticos toman sus datos de todos los campos. 2.2.2 Usos de la Estadstica La Estadstica se utiliza en todas las reas del quehacer humano. En funcin de lo anterior, es frecuente el uso de la Estadstica para producir conocimiento que permite tomar decisiones en los negocios, la industria, las ciencias sociales, ciencias biolgicas, humanidades, planificacin y en las ciencias de la salud, entre otros campos del conocimiento. 1) Uso en los negocios: Factibilidad de un nuevo tipo de spaguettis Un inversionista est interesado en producir spaguettis con ajo, para lo cual requiere saber si por lo menos el 10% de la poblacin estara dispuesto a consumirlo. Con tales propsitos decide hacer un estudio en todo el pas, para lo cual selecciona una muestra de 5,000 hogares distribuidos en todo el territorio nacional. En esos hogares entrevista al ama de casa, por ser la persona que comnmente determina qu se consume en el hogar. Si por lo menos un 10% de estas amas manifiesta su disposicin a consumir los spaguettis con ajo, entonces el inversionista decidir fabricar el producto. 2) Uso en las ciencias sociales: Eficacia de una campaa de alfabetizacin El Ministerio de Educacin del pas est desarrollando un programa de alfabetizacin con el propsito de reducir el analfabetismo entre las personas de 15 aos y ms a un mximo de 5%. Con ese propsito, un ao despus de haberse completado el referido programa, el Departamento de Estadstica del ministerio levantar una encuesta en 10,000 hogares distribuidos a lo largo y ancho del pas. Mediante esta encuesta se entrevistar a todas las personas de 15 aos y ms residentes en esos 10,000 hogares y cada una se le preguntar si saba leer y escribir. Si al analizar los resultados se determina que quienes no saben leer y escribir no pasan de un 5%, entonces se concluye que la campaa de alfabetizacin habr sido eficaz. 3) Uso en el rea de la salud: Eficacia de un medicamento A travs de estudios epidemiolgicos se ha determinado que el 50% de las personas residentes en las cinco comunidades del municipio de Agua Dulce se enferma de gripe cada ao. Conociendo esta situacin, un investigador del rea de la medicina est desarrollando un medicamento para prevenir la gripe, para lo cual selecciona una muestra de 300 personas de la comunidad I y le aplica el medicamento. A su vez,

selecciona una muestra de 300 personas de la comunidad II, quienes tienen caractersticas similares a los residentes en la comunidad I, y les suministra un placebo (una simple pastilla de almidn con la misma forma, color y sabor que el medicamento). Al completarse el ao despus de haber aplicado el tratamiento a ambas comunidades entrevista a ambos grupos y le pregunta a cada persona si tuvo gripe durante los ltimos 12 meses. A partir del anlisis de los datos determina que el 50% de los residentes en la comunidad II tuvo gripe y que solo el 25% de quienes residen en la comunidad I la tuvieron, entonces concluir que el medicamento reduce el riesgo de gripe a la mitad. 4) Uso en las ciencias biolgicas: Herencia mendeliana Gregor Mendel descubri las bases de la gentica hace ms de un siglo, por mtodos esencialmente estadsticos. Trabajando con guisantes, not las caractersticas de los padres y cont el nmero de hijos con determinadas caractersticas. Las regularidades que observ lo condujeron a formular sus teoras. 2.2.3 Usos equivocados de la Estadstica Se ha escuchado la frase: Con estadstica se puede probar cualquier cosa. Esto sin embargo es falso. Lo que ocurre es que se puede hacer uso equivocado de la Estadstica como en los casos siguientes: a) Aludir a definiciones diferentes. Por ejemplo: Severidad de enfermedades: Los grados de severidad de una enfermedad pueden ser definidos en forma diferente de un hospital a otro. As, las comparaciones entre hospitales y la combinacin de cifras de varios hospitales se hacen difciles. b) Errores debidos al mtodo de seleccin de los casos: Enfermedades mentales en hombres y mujeres. La incidencia de enfermedades mentales y nerviosas parece ser mayor en los hombres que en las mujeres. Sin embargo, es ms probable que los hombres sean detectados y recluidos en instituciones de salud, pues ellos en proporcin mayor obtienen sus ingresos de actividades para las cuales quedan inhabilitados, y es menos probable que puedan ser mantenidos por otros miembros de la familia que no pueden mantenerse ellos mismos. c) Errores de cambio en la composicin de los grupos. Cambio en el promedio de un grupo. Los graduados en cierto ao en una universidad en una fecha tenan en promedio 87 aos de edad y un ao despus el promedio era 85 aos. No se hicieron ms jvenes, simplemente murieron los ms viejos. d) Errores debidos a la mala interpretacin de asociacin de correlacin En una ciudad se observ una correlacin positiva entre los salarios de los maestros y el consumo de licor. Puede parecer que esto implica que los maestros al recibir ms una salario ms alto compran ms licor. Se observ,

sin embargo, que el aumento de los salarios de los maestros era parte de un aumento general de salarios, lo cual explica la correlacin. e) Errores debidos a la no consideracin de la nocin de dispersin. Temperatura promedio. La temperatura promedio del ao en una ciudad es 22 grados celsius. Por lo tanto, debe ser muy agradable vivir ah. Aqu la conclusin es claramente adecuada, pues bien puede suceder que las temperaturas sean muy altas y muy bajas, obtenindose un promedio de 22 grados Celsius, sin que esa temperatura se haya observado ni un solo da. f) Afirmaciones que engaan. Estudiantes se casan con profesores. La afirmacin: un tercio de las mujeres estudiantes en la Universidad de John Hopkins durante su primer ao se casan con profesores, crea una impresin equivocada. Haba solamente tres estudiantes mujeres. En forma similar: Treinta y tres por ciento de las mujeres se casaron con dos por ciento de los hombres. 2.2.4 Clasificacin de la Estadstica En funcin del universo utilizado para la observacin, la Estadstica se clasifica en dos tipos: descriptiva e inductiva o inferencial. Estadstica descriptiva est constituida por un conjunto de tcnicas o instrumentos que se emplean cuando se desea describir un conjunto de datos, sin importar la profundidad y detalle con que se haga, ya que no se pretende hacer generalizaciones o inferencias para un conjunto mayor. Se puede definir como un conjunto sistemtico de procedimientos para observar y describir numricamente el fenmeno, y descubrir las leyes que regulan la aparicin, transformacin y desaparicin del mismo. 2.2.5 Herramientas de anlisis de la Estadstica descriptiva Para fines de anlisis, la Estadstica descriptiva se basa en tres tipos de herramientas. Utiliza instrumentos como grficos y cuadros; adicionalmente usa los denominados nmeros relativos como: las proporciones, porcentajes, razones y las tasas; y tambin recurre al uso de medidas como: los ndices, las medidas de tendencia central y las medidas de variabilidad.. Dado que ms adelante se abordan los promedios, las medidas de variabilidad y algunos ndices, especficamente los nmeros ndices, as como las medidas de tendencia central y las medidas de variabilidad, entonces conviene que los nmeros relativos sean tratados brevemente en este captulo. i) Proporcin Las proporciones se obtienen como el cociente entre el valor correspondiente a una parte del grupo en consideracin y el valor correspondiente al total de elementos que forman el referido grupo. Las proporciones tienen ms utilidad como medida,

cuando los valores analizados corresponden a variables que se expresan en unidades monetarias, como es el caso del ingreso y el gasto. Ejemplo 1: En el cuadro 1 se presenta la informacin correspondiente al valor de los ingresos mensuales (en dlares) percibidos por los cuatro miembros del hogar de la familia Gmez durante el mes de junio del 2005.
Cuadro 1 Valor de los ingresos percibidos por los cuatros miembros de la familia Gmez durante el mes de junio del 2005 (En dlares) Valor de los ingresos
Miembros de la familia Total Por concepto de salarios 3,050 900 700 850 600 Provenientes de donaciones, regalos y bonificaciones 550 300 100 50 100

Total Padre Madre Hijo Hija

3,600 1,200 800 900 700

La lectura de estos valores puede resultar bastante fcil, sin embargo, la interpretacin podra implicar algn grado de complejidad, toda vez que se trata de valores absolutos. Sin embargo, si esas cifras son convertidas en proporciones, como se expresa en el cuadro 2, la interpretacin podra simplificarse sustancialmente.
Cuadro 2 Proporcin de los ingresos percibidos por los cuatros miembros de la familia Gmez por concepto de salarios y provenientes de donaciones regalos y bonificaciones, durante el mes de junio del 2005 (En dlares) Valor de los ingresos
Miembros de la familia Total Por concepto de salario 0.85 0.75 0.87 0.94 0.86 Provenientes de donaciones, regalos y bonificaciones 0.15 0.25 0.13 0.06 0.14

Total Padre Madre Hijo Hija

100.0 100.0 100.0 100.0 100.0

Entonces puede concluirse que, en general, de cada dlar que ingres al hogar de la familia Gmez en el mes de junio del 2005, 85 centavos provinieron del salario percibido por cada uno de sus cuatro miembros, mientras que 15 centavos correspondieron a las entradas provenientes de donaciones, regalos y bonificaciones. Mientras tanto, de cada dlar que le ingres al padre en durante el mes, 75 centavos llegaron por concepto de salario, mientras que 25 centavos provinieron de donaciones, regalos y bonificaciones, y de esta misma forma se pueden interpretar las dems proporciones. Siguiendo el mismo procedimiento de anlisis se puede abordar la el origen de los ingresos de la madre, el hijo y la hija. Ejemplo 2: En el cuadro 3 se presenta la informacin relativa al valor del gasto mensual de los hogares dominicanos, clasificado por destino del mismo. En este

caso solo se consideran dos categoras del destino del gasto, por un lado, los alimentos y bebidas no alcohlicas, y por el otro, los dems gastos, es decir, los gastos en otros bienes y servicios.
Cuadro 3 REPUBLICA DOMINICANA: Valor del gasto mensual de los hogares en alimentos y bebidas no alcohlicas y en otros bienes y servicios, segn regin geogrfica, 2007 Valor del gasto mensual de los hogares
Regin geogrfica Total Regin Ozama o Metropolitana Regin Norte o Cibao Regin Sur Regin Este Total 51,637,308,855 21,152,615,621 18,353,750,634 6,707,685,474 5,423,257,126 En alimentos y bebidas 11,036,578,616 3,704,577,019 4,098,582,180 1,921,363,875 1,312,055,542 En otros bienes y servicios 40,600,730,239 17,448,038,602 14,255,168,454 4,786,321,599 4,111,201,584

Fuente: Oficina Nacional de Estadstica: Encuesta Nacional de Ingresos y Gastos de los Hogares, 2007. Santo Domingo, 2009.

De la misma forma que en el caso de los ingresos de los miembros del hogar de la familia Gmez, la interpretacin de los componentes del gasto de los hogares segn regin se hace ms fcil a travs de proporciones como las expuestas en el cuadro 4.
Cuadro 4 REPUBLICA DOMINICANA: Proporcin del valor del gasto mensual de los hogares en alimentos y bebidas no alcohlicas y en otros bienes y servicios, segn regin geogrfica, 2007 Proporcin del gasto mensual de los hogares
Regin geogrfica Total Regin Ozama o Metropolitana Regin Norte o Cibao Regin Sur Regin Este Total 1.00 1.00 1.00 1.00 1.00 En alimentos y bebidas no alcohlicas 0.21 0.18 0.22 0.29 0.24 En otros bienes y servicios 0.79 0.82 0.78 0.71 0.76

De los valores de este cuadro se concluye que, en el ao 2007, de cada peso gastado mensualmente por los hogares dominicanos, 21 centavos se destinaban a la compra de alimentos y bebidas no alcohlicas, mientras que los otros 79 centavos se gastaban en la compra de otros bienes y servicios. A su vez, mientras que en los hogares de la Regin Sur, de cada peso gastado, 29 centavos eran usados para comprar alimentos y bebidas no alcohlicas, en la Regin Ozama o Metropolitana, de cada peso gastado, solo 18 centavos iban a la compra de estos bienes. Mientras tanto, en el Cibao Norte se destinaban 22 centavos de cada peso se destinaban a estas compras y en el Este 24 centavos. ii) Porcentaje Los porcentajes constituyen una forma de expresin relativa de valores que forman parte de un total. Esto es, la representacin de las partes del total mediante unidades del 100 por ciento. Ejemplo: En el Cuadro 3 se presenta el nmero de hogares existentes en la Repblica Dominicana de acuerdo al VIII Censo Nacional de Poblacin y Vivienda del 2002, en funcin de la existencia de computador de acuerdo a zona de residencia. El cuadro muestra que en el ao 2002, en la Repblica Dominicana existan 2,193,848 hogares,

entre los cuales, en 119,609 haba computador, mientras en los 2,074,239 restantes no exista ese tipo de artefacto. A su vez, en la zona urbana, en el mismo ao haba un total de 1,398,614 hogares, entre los cuales en 108,613 haba computador y en 1,290,001 no exista. Mientras tanto, que en la zona urbana haba 795,234 hogares, de los cuales 10,996 tenan computador y en los 784,238 restantes no exista este tipo de aparato.
Cuadro 3 REPUBLICA DOMINICANA: Nmero de hogares, por tenencia de computador, segn zona, 2002 Zona Total Total Urbana Rural
2,193,848 1,398,614 795,234

Nmero de hogares Tiene computador


119,609 108,613 10,996

No tiene
2,074,239 1,290,001 784,238

Fuente: Oficina Nacional de Estadstica: VIII Censo Nacional de Poblacin y Vivienda, 2002.

Comprender el significado de esos valores puede hacerse mucho ms fcil si se llevaran a sus equivalencias en porcentajes. En el cuadro 4 se presenta la composicin porcentual de los hogares, por tenencia de computador, segn zona, 2002. En este caso lo que se ha hecho es calcular el porcentaje de hogares de cada zona (Urbana y Rural) y del pas en su conjunto (Total), en los cuales existe computador. De estos resultados se deduce que, al ao 2002, en el 5.5% de los hogares del pas haba computador. Sin embargo ese porcentaje presentaba diferencias importantes entre el campo y la ciudad, pues mientras casi un 8% de los hogares urbanos tena computador, solo el 1.4% de los hogares rurales dispona de ese artefacto. En otras palabras, mientras ocho de cada 100 hogares urbanos tenan computador, en la zona rural apenas uno de cada 100 tena este tipo de aparato.
Cuadro 4 REPUBLICA DOMINICANA: Composicin porcentual de los hogares, por tenencia de computador, segn zona, 2002 Zona Total Urbana Rural Total 100.0 100.0 100.0 Porcentaje de hogares Tiene No tiene 5.5 94.5 7.8 92.2 1.4 98.6

Fuente: Oficina Nacional de Estadstica: VIII Censo Nacional de Poblacin y Vivienda, 2002.

Cuando se trabaja con valores porcentuales, no es lo mismo calcularlos en funcin del total obtenido a partir de la suma de los valores de las columnas, que obtenerlos a partir del total obtenido a partir de la suma de las filas. Para hacer esta distincin se ha convenido denominar composicin porcentual a los primeros y distribucin porcentual a los segundos. Las cifras relativas expuestas en el cuadro 4 constituyen un ejemplo de lo que es una composicin porcentual. Mientras tanto, la forma de colocar las informaciones en el cuadro 5 constituye un ejemplo tpico de lo que se denominara distribucin porcentual.

Cuadro 5 REPUBLICA DOMINICANA: Distribucin porcentual de los hogares, por tenencia de computador, segn zona, 2002 Porcentaje de hogares Tiene No tiene 100.0 100.0 90.8 62.2 9.2 37.8

Zona Total Urbana Rural

Total 100.0 63.8 36.2

Fuente: Oficina Nacional de Estadstica: VIII Censo Nacional de Poblacin y Vivienda, 2002.

De la lectura del cuadro 5 se deduce que el 63.8% de los hogares del pas estaban en la zona urbana, mientras el 36.2% restante estaba en la zona rural. A su vez, entre los hogares que disponan de computador, el 90.8% esta en la zona urbana y el 9.2% en la rural. Mientras tanto, de los hogares donde no haba computador, el 62.2% estaba en la zona urbana y el restante 37.8% en la zona rural. El porcentaje tambin es til al momento de hacer comparaciones de dos o ms situaciones representadas por valores de rdenes de magnitud diferentes. Un ejemplo de esto se presenta al momento de querer relacionar la tenencia de computador en los hogares del municipio de La Vega con los del municipio de Sosa. En el primero de estas unidades geogrficas, un total de 1,718 hogares poseen computador, mientras que ese tipo de artefacto es posedo por 642 hogares en el municipio de Sosa. Sin embargo, esto no significa en modo alguno que los hogares veganos posean ms este tipo de tecnologa informtica, pues esto debe relacionarse con el nmero total de hogares, el cual es de 53,342 en el municipio de La Vega y de 12,187 en Sosa. De esta forma, si el nmero de hogares que dispone de computador se lleva a valores relativos, se encontrar que el 5.0% de los hogares de Sosa posee el artefacto en cuestin, mientras que esa proporcin es de solo 3.1% en el caso de los hogares del municipio de La Vega. Por consiguiente, en este ltimo municipio, los hogares que disponen de computador son menos frecuentes que en el primero. iii) Razn La razn es la relacin por cociente entre dos valores. Por lo general, se utiliza para establecer la magnitud de un valor frente a otro. Ejemplo: Si se toman los datos del cuadro 3 y se dividen los de la columna tres entre los de la columna dos entonces se obtendr la razn del nmero de hogares que no tiene computador en relacin al de aquellos hogares que s tiene. De esta forma se generaron los resultados expuestos en el cuadro 6.
Cuadro 6 REPUBLICA DOMINICANA: Razn entre el nmero de hogares que no tiene computador y el que s tiene, segn zona, 2002 Zona Total Urbana Rural Razn (No tiene/Tiene) 17.34 11.88 68.05

Fuente: Oficina Nacional de Estadstica: VIII Censo Nacional de Poblacin y Vivienda, 2002.

De acuerdo a las razones exhibidas en el cuadro 6, a nivel nacional, por cada hogar que tena computador un total de 17 no disponan de este artefacto. A vez, la zona urbana, por cada hogar que tena, 12 no disponan del mismo; mientras que en la zona rural, por cada hogar con computador haban 68 que no tenan. Uno de los usos ms frecuentes que se da a la proporcin es su aplicacin en el concepto epidemiolgico de riesgo relativo. Se trata del cociente entre dos porcentajes, dos tasas, dos proporciones, dos ndices, etc., de modo que se puede establecer el exceso del valor de uno con relacin al otro. Cuando se alude al exceso se hace referencia a cunto mayor que un valor es el otro, y no cuntas veces es una valor con respecto al otro. De esta forma, si A=3 y B=3, la razn ser: 3/3=1. Esto significa que si ambos valores son iguales, entonces no hay exceso de un valor con respecto al otro, por tanto, la diferencia con respecto a uno (1) ser el exceso. Normalmente, como base para la comparacin suele tomarse al valor que representa la mejor situacin. Ejemplo 1: Si el porcentaje de hogares donde hay computador es 7.8% en la zona urbana 1.4% en la zona rural, la razn de hogares con computador en la zona urbana con respecto a la rural es: 7.8/1.4=5.6. Esto significa que la posibilidad o probabilidad de que en un hogar urbano exista computador es 5.6 veces la de la zona rural; o la posibilidad o probabilidad de que en un hogar urbano exista computador es 4.6 veces mayor que en la zona rural. Ejemplo 2: Si la tasa de analfabetismo (Porcentaje de personas de 15 aos y ms que no sabe leer y escribir) en la zona urbana es 10% y en la zona rural es 30%, el riesgo relativo de ser analfabeto en la zona rural con respecto a la urbana es: 30/10=3. Esto es, el riesgo que tiene una persona que vive en la zona rural de ser analfabeto es el triple del que tiene quien vive en la zona urbana; o dos (2) veces mayor que el de quien reside en la zona urbana. Ejemplo 2: En el cuadro 7 se expone el porcentaje de personas de 10 aos y ms que al ao 2007 nunca haba asistido a la escuela, clasificado en funcin de la regin geogrfica de residencia. Adems se presentan los valores del riesgo relativo de no haber asistido a la escuela para las personas de cada regin con relacin a aquellas residentes en Santo Domingo.
Cuadro 7 REPUBLICA DOMINICANA: Porcentaje de personas de 10 aos y ms de edad que no asistieron a la escuela, segn regin de residencia, 2007

Regin de residencia Santo Domingo Cibao Central Valdesia Yuma Cibao Occidental Enriquillo El Valle

Porcentaje 3.1 6.1 6.7 6.9 9.2 10.5 11.5

Riesgo relativo 1.97 2.16 2.22 2.97 3.39 3.71

Fuente: Cesdem-Macro Internacional. Encuesta Demogrfica y de Salud, 2007 (ENDESA-2007). Santo Domingo, 2008.

En este caso se ha tomado el porcentaje correspondiente a Santo Domingo como base para la comparacin por ser el valor ms bajo, el que representa la situacin ms positiva. De esta forma, los valores del riesgo relativo indican que quienes viven en el Cibao

Central poseen un riesgo de no haber asistido nunca a la escuela un 97% mayor que quienes residen en Santo Domingo; quienes viven Valdesia tienen un riesgo de no haber asistido nunca a la escuela 116% mayor que quienes viven en Santo Domingo, es decir, ms del doble. En forma similar se interpretan los valores del riesgo relativo correspondiente a las restantes regiones de residencia. Otros usos que se da a la razn es el clculo de los ndices simples, pertenecientes al campo de los nmeros ndices. As, cuando se alude al precio relativo, cantidad relativa o al valor relativo, se hace referencia a la razn entre el precio, la cantidad o el valor de un bien o servicio en un perodo dado con respecto al precio, cantidad o valor de ese mismo bien o servicio en un perodo base. iv) Tasa La tasa es un indicador de la intensidad con que se produce un fenmeno en una poblacin dada durante un perodo determinado. Las tasas se obtienen como cociente entre el nmero de hechos ocurridos durante un determinado perodo y la poblacin donde se producen esos hechos, multiplicado por una constante que puede ser: 100; 1,000; 10,000, etc. Las tasas poseen la caracterstica denominada intensidad, que es la fuerza con que se produce el fenmeno en la poblacin. En este caso ser: uno por cada cien, uno por cada mil, uno por cada diez mil, etc. Ejemplos: 1) La tasa de desempleo de la Repblica Dominicana en abril del 2011 era 14%. Eso significa que en ese momento, en la Repblica Dominicana, 14 de cada 100 personas en condiciones para trabajar se encontraban desempleadas. Por tanto, la intensidad del desempleo era de 14 de cada 100. 2) La tasa de analfabetismo de la Repblica Dominicana de acuerdo a la Encuesta Nacional de Hogares de Propsitos Mltiples (ENHOGAR-2011) era 11.6%. Ese valor indica que en el 2011, en la Repblica Dominicana, de cada 100 personas de 15 aos o ms de edad no saban leer y escribir. En consecuencia, la intensidad es de 12 de cada 100. 3) La tasa de mortalidad infantil de la Repblica Dominicana, de acuerdo a la Encuesta Nacional de Hogares de Propsitos Mltiples (ENHOGAR-2009-2010) era 28%0. Ese valor indica que en los aos inmediatamente anteriores al 2010, en la Repblica Dominicana, por cada mil 1,000 nios que nacan, 28 moran antes de cumplir el primer ao de vida. En consecuencia, la intensidad es de 28 de cada 1,000. 2.3 Conceptos utilizados en estadstica relacionados con la exactitud de los datos En el anlisis estadstico con frecuencia se manejan cifras contentivas de valores decimales. Este tipo de cifra puede tener diferentes orgenes. Podra derivarse de valores de una variable expresados con un elevado nivel de exactitud, como sera el resultado de pesar a una persona en una balanza electrnica, la cual normalmente posee un elevado grado de precisin. Los valores con decimales tambin pueden derivarse de clculos, donde una cifra cualquiera se multiplica por otra que contiene decimales. Un ejemplo de

este tipo lo constituye el nmero de casos que se obtiene para una variable cualquiera en una encuesta, al multiplicar por factores de ponderacin que pueden contener varios valores decimales. Una tercera forma a travs de la cual se pueden generar cifras con valores decimales es cuando realizan clculos para obtener medidas estadsticas como proporciones, porcentajes, tasas, promedios o ndices. Ante situaciones como las anteriores, con frecuencia se requiere de la reduccin de la cantidad de cifras decimales. Este tipo de objetivo se puede alcanzar recurriendo al concepto de redondeo o al de truncamiento. 2.3.1 Redondeo Se entiende como redondeo al procedimiento mediante el cual se lleva un valor a la unidad ms cercana. En el caso de valores decimales existen tres criterios para redondear, los cuales se relacionan con el dgito 5. Primera regla: Si el dgito a eliminar es menor que 5, entonces simplemente se descarta y se le suma 1 al dgito anterior. Ejemplos: 1) Si se quiere redondear el nmero 123.564 a dos cifras decimales, se elimina el dgito 4, quedando as el nmero 123.56. 2) Si se quiere redondear el nmero 8.23 a una cifra decimal, se elimina el 3, quedando entonces el nmero 8.2. Segunda regla: Si el dgito a eliminar es mayor que 5, entonces se descarta y se le suma 1 al dgito anterior. Ejemplos: 1) Si se quiere redondear el nmero 12.567 a dos cifras decimales, se elimina el dgito 7 y se le suma 1 al dgito 6, quedando as el nmero 12.57. 2) Si se quiere redondear el nmero 19.28 a una cifra decimal, se elimina el 8 y se le suma 1 al dgito 2, quedando entonces el nmero 19.3. Tercera regla: Si el dgito a eliminar es igual a 5 y el anterior es un nmero par, entonces simplemente se descarta y si la cifra anterior es impar, se le suma 1 a sta y se descarta el 5. Ejemplos: 1) Si se quiere redondear el nmero 16.765 a dos cifras decimales, se elimina el dgito 5, quedando as el nmero 16.76. 2) Si se quiere redondear el nmero 5.35 a una cifra decimal, se elimina el 5 y se le suma 1 al dgito 3, quedando entonces el nmero 5.4.

2.3.2 Truncamiento Se podra denominar truncamiento al procedimiento que consiste en tomar solo la parte entera de un nmero, independientemente de la magnitud de los valores decimales que se estn descartando. Ejemplos: El valor truncado de 287.4 es 287. A su vez, el valor truncado de 85.8 es 85. En el primer caso se ha eliminado el valor 0.4, el cual tambin se habra eliminado si el valor 287.4 se hubiese redondeado a un nmero entero. A su vez, en el segundo caso se ha eliminado el valor 0.8, el cual habra sido elevado a 1 si se hubiese estado redondeando y entonces se habra obtenido un valor redondeado de 86, diferente al valor truncado de 85.. Debe tenerse cuidado al momento en que se decide truncar, pues si se hace con nmeros grandes no tiene mayores consecuencias. Por ejemplo, si se trunca el nmero 387.8, entonces se convertir en 587. La prdida es de apenas es de 0.8, lo cual representa apenas un 0.2%. Sin embargo si se truncase el nmero 2.8, se estara despreciando un valor de 0.8 que representa casi un 29%. 2.4 Estadstica inductiva o inferencial Estadstica inductiva, tambin llamada estadstica inferencial es aquella que busca dar explicaciones al comportamiento de un conjunto de observaciones, probar la significacin o validez de los resultados; intenta descubrir las causas que lo originan, con gran aplicacin en el campo del muestreo, logrndose de esta manera conclusiones que se extienden ms all de las muestras estadsticas mismas. Uno de los principales objetivos de la estadstica inductiva es hacer inferencias acerca de los valores estadsticos de la poblacin, denominados parmetros, a travs de la informacin obtenida en una muestra, que permite el clculo de estimadores. 2.3.1 Conceptos asociados con la Estadstica inductiva o inferencial Incursionar en una definicin de Estadstica inferencial lleva a la mencin de una serie de conceptos asociados a la misma, los cuales requieren ser abordados. i) Poblacin. Es el universo en el cual se hace el estudio estadstico. Podra definirse como un conjunto de individuos, objetos o mediciones que poseen una caracterstica comn. Ejemplos: 1) Los estudiantes de la Universidad Autnoma de Santo Domingo en el semestre 2012-1.

2) Las vacas de la Regin Este de la Repblica Dominicana en el mes de febrero del 2012. 3) Las plantas de cacao de la provincia Duarte en el mes de abril del 2010. 4) El nmero de viviendas de la Repblica Dominicana en diciembre del 2010. 5) Las estaturas de los estudiantes de la Seccin 29 de Estadstica General de la UASD en el semestre 2011-2. A juzgar por los las situaciones expuestas a travs de los ejemplos precedentes, las poblaciones pueden ser de naturaleza muy diversa. Pueden estar constituidas por individuos, como las correspondientes a los ejemplos 1, 2 y 3; por objetos, como la del ejemplo 4; o por mediciones, como la del ejemplo 5. Toda poblacin est definida en funcin las dimensiones: espacio y tiempo. De esa forma, en el ejemplo 1, el espacio es la Universidad Autnoma de Santo Domingo y el tiempo es el semestre 2012-1; en el ejemplo 2, el espacio es la Regin Este de la Repblica Dominicana y el tiempo es el mes de febrero del 2012; y as sucesivamente. Por su naturaleza, las poblaciones pueden ser de dos tipos: finitas e infinitas. Poblacin es finita es aquella que posee un nmero de elementos que puede ser contado o estudiado. Es el caso, por ejemplo, de los estudiantes de la Universidad Autnoma de Santo Domingo en el semestre 2012-1 o el nmero de viviendas de la Repblica Dominicana en diciembre del 2010. En ambos casos, bastara con hacer un censo de cada poblacin y se podra contar a todos los elementos. Poblacin infinita es aquella cuyo nmero de elementos no puede ser contado o estudiado. Ejemplos de esta naturaleza seran los nmeros reales, los nmeros pares y los nmeros reales, entre otras series. No obstante, rara vez interesar este tipo de poblacin desde la perspectiva de la Estadstica. Por tanto, cuando en Estadstica se alude a poblacin infinita normalmente se hace referencia a grupos de elementos que desde la perspectiva matemtica pueden ser finitos, pero que en trminos prcticos es imposible estudiarlos a todos. Ejemplo: Un ambientalista est interesado en estudiar la contaminacin con metales en los peces del Ro Ozama. El nmero de peces existentes en este universo acutico, desde la perspectiva matemtica es finito, no importa cuan grande pueda ser. Sin embargo, resultara estudiar a cada uno de los peces de este entorno, porque se trata de una poblacin que se torna incontrolable. Por tanto, dado que no es posible estudiarlos a todos, entonces esta poblacin es considerada como infinita desde el punto de vista estadstico. ii) Muestra. Es una parte representativa de la poblacin, la cual se toma con el propsito de derivar resultados de sta sin la necesidad de estudiarla completa. La representatividad se torna en una propiedad inherente a toda muestra y consiste en que los elementos de sta ltima posean las mismas caractersticas que el conjunto de elementos de la poblacin. Por tanto, la muestra ser representativa en la medida que est compuesta por elementos pertenecientes a todos los grupos que componen la poblacin.

Ejemplo 1: Juan Snchez es un investigador del rea social quien est interesado en determinar el porcentaje de jefes de hogar analfabetos en la ciudad de Aguas Claras. En esta ciudad existe un total de 350,000 hogares, por tanto, existen 350,000 jefes de hogar. La ciudad est compuesta por 120 barrios; 60 de ellos compuestos por hogares de clase baja donde reside el 50% de los hogares de la ciudad; 40 barrios constituidos por hogares de clase media, donde reside el 35% de los hogares; mientras que los 20 barrios restantes pertenecen a clase alta, y all reside el 15% de los hogares de Aguas Claras. Dado el tamao de la poblacin a estudiar, 340,000 hogares, el seor Snchez ha decidido hacer el estudio utilizando una muestra de solo 1,200 hogares, los cuales ha distribuido en los 60 barrios de clase baja. El equipo de investigacin del seor Snchez recorre los 60 barrios y en cada uno de ellos visita a un conjunto de hogares que han sido seleccionados y a cada jefe de hogar le pregunta si sabe leer y escribir. De esta forma, al haber concluido el recorrido por los 60 barrios habrn entrevistado los 1,200 jefes de hogar. Una vez concluida la recoleccin de los datos se cuenta el nmero de jefes de hogar que sabe leer y escribir y se determina que son 240, mientras los que saben leer y escribir son 960. Esto indicara que el 20% de los jefes de hogar estudiados es analfabeto. A partir del resultado anterior podra decirse que el 20% de los jefes de hogar de la ciudad de Aguas Claras es analfabeto? La respuesta es NO, porque la muestra no es representativa, dado solo toma en cuenta hogares pertenecientes a la clase baja y resulta que el analfabetismo es diferencial por clase social. Es decir, es ms elevado, cuanto ms bajo es el grupo social al cual pertenecen las personas. Ejemplo 2: Pedro Gonzlez es un investigador del rea educativa y tambin est interesado en determinar el porcentaje de jefes de hogar de la ciudad de Aguas Claras que no sabe leer ni escribir. Considerando el tamao de la poblacin, el seor Gonzlez ha decidido hacer su estudio, igual que el seor Snchez, a partir de una muestra de 1,200 hogares, los cuales ha distribuido en los 20 barrios de clase alta. Despus de visitar los 20 barrios y en cada uno haber preguntado a un grupo de jefes de hogar si saben leer y escribir se cont el nmero de aquellos que saben leer y escribir y se determin que son solo 24, mientras los que saben leer y escribir son 1,176. Esto indicara que el 2% de los jefes de hogar estudiados es analfabeto. Tomado en cuenta el resultado anterior podra decirse que el 2% de los jefes de hogar de la ciudad de Aguas Claras es analfabeto? En este caso la respuesta tambin es NO, porque la muestra no es representativa, dado solo toma en cuenta hogares pertenecientes a la clase alta. Ejemplo 3: Mara Garca, tambin investigadora del rea educativa, est interesada en establecer el porcentaje de jefes de hogar de la ciudad de Aguas Claras que no sabe leer ni escribir. Para su investigacin, la seora Garca, de la misma forma que Snchez y Gonzlez, tom una muestra de 1,200 hogares, solo que ella tom la decisin de estudiar los cuales ha distribuido en los 20 barrios de clase alta. Dado que en los barrios de clase baja reside el 50% de la poblacin de la ciudad, la seora Garca decidi estudiar el 50% de la muestra de los 1,200 hogares en los 60

barrios de clase baja, es decir, tom 600 hogares y los distribuy en esos 60 barrios. Del mismo modo, dado que el 35% de los hogares de la ciudad reside barrios de clase media, tom el 35% de la muestra, es decir 420 hogares, en los 40 barrios de clase media. Adems, dado que 15% de la poblacin de la ciudad reside en barrios de clase alta, reserv el 15% de la muestra, es decir 180 hogares, para estudiarlos en los 20 barrios de clase alta. Despus de visitar los 120 barrios de la ciudad y entrevistar all los 1,200 jefes de hogar encontr que 156 de ellos no saben leer y escribir, mientras que los 1,044 restantes s saben. Esto indicara que 13% de los jefes de hogar estudiados es analfabeto. Tomado en cuenta el resultado anterior podra decirse que el 13% de los jefes de hogar de la ciudad de Aguas Claras es analfabeto? Dado que se trata de una muestra autoponderada, es decir, est formada por hogares de los tres grupos sociales en la misma proporcin que stos estn representados en la poblacin, si la seleccin de cada hogar se hizo respetando principios estadsticos de aleatoriedad, entonces s podra hacerse la afirmacin de que el 13% de los jefes de hogar de la ciudad de Aguas Claras son analfabetos, puesto que la muestra es representativa. 3. El muestreo: uso de la Estadstica inductiva o inferencial El uso ms frecuente de la Estadstica inductiva o inferencial son sus aplicaciones en el campo del muestreo. Cuando se alude al muestreo se hace referencia a las tcnicas utilizadas para disear y seleccionar muestras. A travs del muestreo se estudia solo a una parte de la poblacin, con la intencin de obtener un valor que se espera sea de magnitudes similares al de ese mismo valor de la poblacin. A este proceso se le denomina inferencia o induccin, es decir, procedimiento a travs del cual se le atribuye a la poblacin la propiedad observada en la muestra.

Poblacin Muestra
Extraccin de la muestra

Inferencia o induccin

Anlisis
En el muestreo se trabaja con los resultados derivados del estudio de muestras y con frecuencia tambin se alude a medidas estadsticas obtenidas a partir de los datos de una poblacin completa. De esa forma, hace referencia los conceptos de estimador y parmetro.

i) Estimador. Es toda medida obtenida a partir del estudio de una muestra. De esta forma, si con los datos de una muestra se calcula un porcentaje, ese valor ser el estimador del porcentaje; si en cambio se obtiene una proporcin, entonces ese valor ser el estimador de la proporcin, y si lo que obtiene es el promedio, entonces se habr obtenido el estimador del promedio, y as para cada medida. Ejemplo: Pedro Snchez, investigador del rea de la salud est interesado en determinar el porcentaje de hogares de la Repblica Dominicana que usan agua embotellada para beber. Con esos propsitos, en vez de estudiar los 2,663,000 hogares existentes en el pas, selecciona una muestra nacional de 3,000 hogares. Luego determina que en 1,930 de esos 3,000 hogares se consume agua embotellada. El valor 64.3% representa el estimador del porcentaje de hogares de la Repblica Dominicana que usa agua embotellada para beber. En este caso se afirmara que en el 64.3% los hogares del pas se consume agua embotellada. A pesar de haberse estudiado apenas una muestra se est haciendo referencia a todos los hogares del pas, por cual se est haciendo un proceso de inferencia, en la medida que a la poblacin se le est atribuyendo lo que se ha observado en la muestra. ii) Parmetro. As como el estimador es la medida calculada a partir de los datos de una muestra, el correspondiente valor en la poblacin se le llama parmetro, por tanto, las medidas calculadas a partir de los datos de toda la poblacin son parmetros. Por tanto, si a partir de los datos de la poblacin completa se calcula el porcentaje, entonces se habr obtenido el parmetro del porcentaje; si en cambio, lo que se calcula es la proporcin, se habr obtenido el parmetro de la proporcin; y si lo que se calcula es el promedio se habr obtenido el parmetro del promedio. Ejemplo: Juana Castro, estudiosa del tema de las comunicaciones est interesada en establecer el porcentaje de hogares de la ciudad de Las Lavas que posee internet. En la ciudad existe un total de 4,000 hogares y ella decide hacer un censo, es decir, los estudiar a todos, de modo que visitar a cada hogar y all preguntar si existe servicio de Internet. Luego de la visita a los hogares cont aquellos donde le informaron que poseen, as como los que no poseen. Los que poseen son 800, mientras que los que no poseen son 3,200. Esto significa que el 20% de los hogares de la ciudad de Las Lavas dispone de servicios de internet. El 20% obtenido en forma previa se deriva de los datos de la poblacin completa. En consecuencia, representa el parmetro del porcentaje de hogares de la ciudad de Las Lavas que posee servicio de Internet. 3.1 Tipos de muestreo Para usar muestreo lo primero que debe hacerse es construir el marco de muestreo, el cual consiste en la lista o mapa contentivo de todas las unidades que constituyen la poblacin a ser estudiada. Como parte de la construccin del marco muestral, conviene que cada elemento de la poblacin est identificado con un nmero nico e irrepetible. Por esta razn, lo que se hace es numerar las unidades en forma correlativa desde 1 hasta n, siendo n el nmero total de elementos que componen la poblacin en estudio.

Dependiendo de que la seleccin de la muestra se haga o no mediante procedimientos basados en el azar, el muestreo puede ser de dos tipos: aleatorio y no aleatorio. 3.1.1 Muestreo aleatorio, tambin llamado muestreo probabilstico o muestreo al azar es aquel en el cual los elementos que formarn parte de la muestra son seleccionados de forma tal que su inclusin depende exclusivamente del azar. Este tipo de muestreo, a su vez se subdivide en cuatro formas diferentes: 1) Muestreo aleatorio simple, probabilstico simple o simple al azar. Se define como aquel mediante el cual las unidades se seleccionan de modo que todas tienen la misma probabilidad de seleccin. Es decir, las unidades seleccionadas tienen la misma probabilidad de ser seleccionadas que aquellas que no fueron. En el muestreo aleatorio simple, las unidades que forman parte de la muestra se pueden seleccionar usando dos procedimientos, dependiendo del tamao de la poblacin a ser estudiada. a) Poblacin pequea. Si la poblacin no es grande, las unidades muestrales pueden seleccionarse mediante un simple sorteo. Ejemplo: La profesora Hernndez est interesada en determinar el gusto por la msica clsica de los 50 estudiantes de su curso. Ella decide no estudiarlos a todos, por lo que decidi seleccionar una muestra aleatoria simple de 10 estudiantes. En este caso la profesora proceder de la forma siguiente: Primero. Elabora una lista con los nombres de los 50 estudiantes del curso y le coloca un nmero a cada estudiante, comenzando con el 1 al lado del nombre del primer estudiante, el 2 al lado del nombre del segundo estudiante, el 3 al lado del nombre del tercer estudiante hasta terminar con el nmero 50 al lado del nombre del ltimo estudiante. De esta forma habr construido el marco de muestreo, como se muestra a continuacin:
No. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. Nombre Ana Mara Prez Jos Rafael Santos Juan Daniel Martnez Pedro Quezada Pamela Paredes Ktherine Gonzlez Rosa Mara Snchez Roberto Antonio Prez Kelvin Javier Pea Paola Altagracia Garca Johanna Fermn Iluminada Hernndez Antonio Glass Cesar Solano Magnolia Ubiera Cesareo Oller Margarita DOleo Angela Sang Michel Donoso Mayra Moronta Fermn Decamps Feliciano Graciano Jos Miguel Sala Alejandra Mena Donaida Pea No. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. Nombre Roberto Rosa Mnica Fernndez Aurelio Faa Alberto Bonnelly Gumercindo Soler Juan Reyes Donalda Brea Brenda Pea Agustn Nova Pedro Bobea Adalberto Henrquez Dolores del Ro Anastacia Gmez Viviana Camacho Persio Mota Manuel Gmez Mauricio Prez Belarminio Pea Justiniano Prez Ciro Gmez Alcides Duverg Jos Antonio Garca Delcio Ramrez Petra Disla Altagracia Bueno

Segundo. Corta 50 pedacitos de papel de igual tamao y en cada uno anota un nmero hasta haber anotado el nmero 50 en el ltimo pedacito de papel y luego los dobla. Tercero. Coloca los 50 papelitos en una bolsa, los agita y luego extrae uno. Si el nmero resultante es el 15 indica que el primer estudiante a incluir en la muestra es Magnolia Ubiera, Al extraer el segundo papelito result el nmero 43, lo cual indica que el tercer estudiante de la muestra es Belarminio Pea. Extrae el tercer papelito y result el nmero 4, lo cual indica que el tercer estudiante a formar parte de la muestra es Pedro Quezada. As continuar hasta haber extrado los siete nmeros restantes y as completar la seleccin de la muestra de 10 estudiantes. Finalmente, la profesora Hernndez le preguntar a cada uno de esos 10 estudiantes si le gusta escuchar msica clsica. Tres de ellos responden positivamente, por tanto, si considera que esta muestra es representativa de toda la poblacin, entonces concluir que al 30% de los estudiantes del curso le gusta la msica clsica. b) Poblacin grande. En el caso en que la poblacin sea grande o relativamente grande, ya el sorteo no resulta prctico. Por ejemplo: El seor Eladio Prieto, Encargado de la Direccin Regional Central de Educacin est interesado en determinar el nivel acadmico de los directores de los 1,500 centros educativos de esa jurisdiccin educativa, para lo cual decide hacerlo a travs de una muestra de 40 centros. En este caso sera extremadamente complicado cortar 1,500 papelitos, numerarlos y luego hacer las 40 extracciones. En casos como el anterior, primero se construye el marco de muestreo, asignando un nmero al lado de cada centro educativo, desde 1, al lado del nombre del primer centro educativo de la lista, hasta 1,500, al lado del nombre del ltimo establecimiento escolar. Luego se usa una tabla de nmeros aleatorios para hacer la seleccin de los 40 centros educativos a ser estudiados. Para usar la tabla de nmero aleatorios se puede proceder de dos formas diferentes. Una forma es a travs de un sorteo y la otra es mediante un procedimiento ms simple, pero tambin aleatorio. Uso del sorteo. Esta vez se trata del uso de un procedimiento aleatorio para seleccionar la fila y la columna en cuya interseccin se inicia la seleccin de la muestra. Ejemplo: El seor Prieto, Encargado de la Direccin Regional Central de Educacin, puede seleccionar la muestra de 40 centros educativos para su estudio, utilizando la tabla de nmeros aleatorios de la pgina siguiente, la cual contiene 50 filas y 50 columnas. En este caso puede cortar 50 pedacitos de papel los cuales debe numerar de 1 a 50 y colocarlos en una bolsa de papel para escoger el nmero correspondiente a la fila de inicio. Considere que al hacer la extraccin saliera el papelito con el nmero 18. Eso indica que la seleccin se inicia en la fila 18.

Tabla de nmeros aleatorios o tabla de dgitos al azar Columnas


01 a 05 06 a 10 11 a 15 16 a 20 21 a 25 26 a 30 31 a 35 36 a 40 41 a 45 46 a 50

Filas 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

54463 15389 85941 61149 05219 41417 28357 17783 40950 82995 96754 34357 06318 62111 47534 98614 24856 96887 90801 55165 75884 16777 46230 42902 81007 68089 20411 58212 70577 94522 42626 16051 08244 59497 97155 98409 45476 89300 50051 31753 79152 44560 68328 46939 83544 91621 91896 55751 85156 07521

22662 85205 40756 69440 81619 98326 94070 00015 84820 64157 17676 88040 37403 52820 09243 75993 03648 12479 21472 77313 12952 37116 43877 66892 00333 01122 67081 13160 42866 74358 86819 33763 27647 04392 13428 66162 84882 69700 95137 85178 53829 38750 83378 38689 86141 00881 67126 62515 87689 56898

65905 18850 82414 11286 10651 87719 20652 10806 29881 66164 55659 53364 49927 07243 67879 84460 44898 80621 42815 83666 84318 58550 80207 46134 39693 51111 89950 06468 24969 71659 85651 57194 33851 09419 40293 95763 65109 50741 91631 31310 77250 83635 63369 58625 15707 04900 04151 21108 95493 12236

70639 39226 02015 88218 67079 92294 35774 83091 85966 41180 44105 71726 57715 79931 00544 62846 09351 66223 77408 36028 95108 42958 88877 01432 28039 72373 16944 15718 61210 62038 88678 16752 44705 89964 09985 47420 96597 30329 66315 89642 20190 56540 71381 08342 96256 54224 03795 80830 88842 60277

79365 42249 13858 58925 92511 46614 16249 91530 62800 10089 47361 45690 50423 89292 23410 59844 98795 86085 37390 28420 72305 21460 89380 94710 10154 06002 93054 82627 76046 79643 17401 54450 94211 51211 58434 20792 25930 11658 91428 98364 56535 64900 39564 30549 23068 46177 59077 02263 00664 39102

67382 90669 78030 03638 59888 50948 75019 36466 70326 41757 34833 66334 67372 84767 12740 14922 18644 78285 76766 70219 64620 43910 32992 23474 95425 74373 87687 76999 67699 79619 03252 19031 46716 04896 01412 61527 66790 23166 12275 02306 18760 42912 05615 85863 13782 55309 11848 29303 55017 62315

29085 96325 16269 52862 84502 64886 21145 39981 84740 78258 86679 60332 63116 85693 02540 48730 39765 02432 52615 81369 31318 01175 91380 20423 39220 96199 96693 05999 42054 44741 99547 58580 11738 72882 69124 20441 65706 05400 24816 24617 69942 13953 42451 20781 08467 17852 12630 37204 55539 12239

69831 23248 65978 62733 72095 20002 05217 62481 62660 96488 23930 22554 48888 73947 54440 73443 71058 53342 32141 41943 89872 87894 03164 60137 19774 97017 87236 58680 12696 05437 32404 47629 55784 17805 82171 39435 61203 66669 68091 09609 77448 79149 64559 09284 89469 27491 98375 96926 17771 07105

47058 60933 01385 33451 83463 97365 47286 49177 77379 88629 53249 90600 21505 22278 32949 48167 90368 42846 30268 47366 45375 81378 98656 60609 31782 41273 77054 96739 93758 39038 17918 54132 95374 21896 59058 11859 53634 48708 71710 83942 33278 18710 97501 26333 93842 89415 52068 30506 69448 11844

08186 22927 15345 77455 75577 30976 76305 75779 90279 37231 27083 61113 80182 11551 13491 34770 44104 94771 18106 41067 85436 10620 59337 13119 49037 21546 33848 63700 03283 13163 62880 60631 72655 83864 82859 41567 22557 03887 33258 22716 48805 68618 65747 91777 55349 23466 60142 09808 87530 01117

Una vez seleccionada la fila de inicio, se selecciona el nmero de la columna cuya interseccin con la fila 18 determinar el punto de partida de la seleccin de la muestra. Dado que la tabla tambin tiene 50 columnas, pueden usarse los mismos papelitos. Considere que al hacer la extraccin se sac el papelito cuyo nmero es 12. Esto indica que la seleccin inicia a partir del nmero correspondiente a la fila 18 y columna 12, es decir, con el dgito 0 marcado en la tabla. Resulta que se quiere seleccionar 40 nmeros de cuatro dgitos debido a que el tamao de la poblacin es 1,500. Entonces, partiendo del dgito 0 ya marcado, se completa un nmero de cuatro cifras. En este caso, el nmero de inicio de la seleccin es el 0621. Esto indica que el primer centro educativo seleccionado es el correspondiente al nmero 621 en el marco muestral. Luego contina seleccionando nmeros de cuatro dgitos hacia abajo (debajo del 0621), de modo que el siguiente centro seleccionado es el correspondiente al nmero 0207 (en la fila 23), el siguiente ser 1111 (FILA 26), y as continuar hasta haber seleccionado los 40 centros que constituyen la muestra. Procedimiento aleatorio alternativo. Una forma muy simple de seleccionar el nmero de inicio de la seleccin es, con los ojos cerrados, se coloca la punta del lpiz en la tabla de nmeros aleatorios. El dgito sobre el cual queda la punta del lpiz es el nmero de inicio. Luego, a partir de ese dgito se completa el primer nmero de la seleccin y para la obtencin de los nmeros restantes se procede de la misma forma que en el procedimiento basado en el sorteo. 2) Muestreo aleatorio sistemtico. Es un procedimiento mediante el cual, la primera unidad de la muestra se selecciona en forma aleatoria, mientras las restantes se obtienen sumando de manera sucesiva una cantidad constante al nmero correspondiente a la primera unidad seleccionada. El procedimiento para seleccionar la muestra sigue los siguientes pasos: Primero. Clculo del intervalo de seleccin (I), el cual se obtiene como el cociente entre el tamao de la poblacin (N) y el tamao de muestra (n). Segundo. Seleccin del nmero inicial de seleccin (#), el cual se obtiene en forma aleatoria simple entre 1 y el intervalo inicial de seleccin. Este nmero corresponde a la primera unidad muestral seleccionada, as, si el nmero seleccionado fuese el 3, eso indica que la unidad a la cual se le asign el nmero 3 en el marco muestral es la primera que formar parte de la muestra. Tercero. Seleccin de las n-1 unidades muestrales faltantes, las cuales se obtienen sumando, en forma sucesiva, el intervalo de muestreo al nmero inicial de seleccin, de modo que: La segunda unidad ser: #+I. La tercera unidad ser: #+2I. La cuarta unidad ser: #+3I.

Y as sucesivamente, de modo que la ltima unidad ser: #+(k-1)I, donde K es el tamao de la muestra a ser estudiada. Ejemplo: Para determinar el gusto de sus estudiantes por la msica clsica, la profesora Hernndez tambin puede usar muestreo aleatorio sistemtico. En este caso proceder de la siguiente forma: Calcula el intervalo de seleccin: cada cinco estudiantes. I=50/10=5, es decir, estudiar uno de

Selecciona el nmero inicial de seleccin: 1< # < I, en este caso, 1< # < 5 Si al seleccionar un nmero aleatorio entre 1 y 5 resultara el nmero 2, entonces indica que Jos Rafael Santos es el primer estudiante seleccionado como parte de la muestra, de modo que ahora falta seleccionar los nueve restantes. Para seleccionar los nueve estudiantes restantes y as completar la muestra se procede de la forma siguiente: El segundo ser: 2+5=7, Rosa Mara Snchez. El tercero: 7+5=12, Iluminada Hernndez. El cuarto: 12+5=17, Margarita De leo. El quinto: 17+5=22, Feliciano Graciano. El sexto: 22+5=27, Mnica Fernndez. El sptimo: 27+5=32, Donalda Brea. El Octavo: 32+5=37, Dolores del Ro. El noveno: 37+5=42, Mauricio Prez. Y el dcimo: 42+5=47, Jos Antonio Garca. Finalmente, a cada uno de estos 10 estudiantes le preguntar si le gusta escuchar msica clsica. 3) Muestreo aleatorio estratificado Cuando se quiere seleccionar una muestra para estudiar un fenmeno que se supone con un comportamiento diferente de un grupo poblacional a otro, entonces el muestreo aleatorio simple o muestreo aleatorio estratificado podra no garantizar la representatividad. En este caso conviene seleccionar una muestra estratificada en funcin de aquellos grupos poblacionales segn los cuales se espera un comportamiento diferenciado del fenmeno. Es decir, conviene usar muestreo aleatorio estratificado. Para seleccionar una muestra usando muestreo aleatorio estratificado se procede en varios pasos. Primero. Se definen los estratos, los cuales no son ms que grupos de unidades en cuyo interior se supone que el fenmeno se comporta sin variaciones de consideracin. Segundo. Se construye un marco muestral para cada estrato. Es decir, se elabora la lista de unidades que componen cada estrato y luego, cada una

es enumerada en forma correlativa de 1 a n. Por tanto, habr tantos marcos muestrales como estratos se han definido. Tercero. Se divide la muestra en tantas submuestras como estratos se han definido en la poblacin. Esta divisin se puede hacer en funcin de los porcentajes representados por cada estrato en la poblacin. Cuarto. Se selecciona la submuestra correspondiente a cada estrato, lo cual puede hacerse usando muestreo aleatorio simple o muestreo aleatorio sistemtico. Ejemplo. Juan Gonzlez, encargado del rea de cultura de cultura del Ministerio de Educacin, est interesado en estudiar la existencia de bibliotecas en las 2,400 escuelas de la Regin Norte. De estos 2,400 establecimientos educativos, 800 estn localizados en la zona urbana y los 1,600 restantes en las ciudades de la regin; es decir, el 33.33% es urbano y el 66.7% rural. El seor Gonzlez ha decidido hacer su estudio a partir de una muestra de 300 escuelas. Se sabe que la existencia de biblioteca es ms frecuente en las escuelas de la zona urbana. En consecuencia, para garantizar la representatividad de la muestra debe usarse muestreo aleatorio estratificado por zona. Por tanto, los pasos a dar para la seleccin de la muestra son los siguientes: Primero. Se define un estrato poblacional urbano y otro rural. Segundo. Se construye una marco muestral de escuelas rurales numerados desde 1 hasta 800 y se construye una marco muestral de escuelas urbanas numeradas desde 1 hasta 1,600. Tercero. Se divide la muestra de 300 escuelas en dos submuestras, una rural de 100 establecimientos, equivalente al 33.3% y otra urbana de 200 centros educativos, equivalente al 66.7%. Cuarto. En el marco de muestreo de las 800 escuelas rurales se selecciona una submuestra de 100 establecimientos, mientras que en el marco de muestreo de las 1,600 escuelas urbanas se selecciona una submuestras de 200 centros educativos. Este procedimiento de seleccin se puede hacer mediante muestreo aleatorio simple, muestreo aleatorio sistemtico o muestreo aleatorio estratificado. 4) Muestreo aleatorio por conglomerados Esta forma de obtener muestras es diferente a las tres anteriores, porque esta vez, en vez de seleccionar unidades se obtienen grupos de unidades, llamadas conglomerados. Los conglomerados son agrupamientos naturales de unidades, es decir, no hay que construirlos porque ya existen, los cuales se suponen relativamente homogneos. Para seleccionar la muestra utilizando este procedimiento se procede de la forma siguiente:

Primero. Se definen los conglomerados, tomando en cuenta el concepto de agrupamiento natural de unidades, es decir, agrupamiento ya existente de unidades. Segundo. Se construye un marco de muestreo cuyos elementos son los conglomerados que se hayan definido. Tercero. Se selecciona una muestra de conglomerados, los cuales, en conjunto, contienen el nmero de unidades de estudio que componen la muestra. Ejemplo: Augusto Ocampo, investigador del rea comercial, est interesado en estudiar la existencia de Internet en los hogares de la ciudad de Los lamos. El nmero de hogares de la ciudad, de acuerdo al ltimo censo es de 6,000 y el seor Ocampo quiere estudiarlos a partir de una muestra de 525 viviendas. Para la seleccin de la muestra, el seor Ocampo de agotar el procedimiento siguiente: Primero. Deber procurar un mapa de la ciudad de Valle Verde donde consten las viviendas, es decir, que estn dibujadas en el mapa. Segundo. Deber definir los conglomerados de viviendas. En este, caso el conglomerado puede ser la manzana, dado que las viviendas se encuentran agrupadas en manzanas. Tercero. Deber construir un marco muestral de manzanas. En este caso se numeran las manzanas desde 1 hasta n. En este caso, al contar las manzanas existentes en el mapa se determin que son 400, por tanto, se numeran de modo que la primera levar el nmero 1, segunda el nmero 2 y as por delante, de modo que la ltima llevar el nmero 400. Cuarto. Deber seleccionar la muestra de manzanas necesaria para poder entrevistar los 525 hogares. En este caso hay que saber cuntas viviendas en promedio contiene cada manzana. Este valor se obtiene dividiendo el nmero total de viviendas de la ciudad entre el nmero total de manzanas.

Viviendas/Manzana=6,000/400=15 viviendas por manzana. Esto es,


cada manzana contiene un promedio de 15 viviendas. Si cada manzana posee un promedio de 15 viviendas, para obtener una muestra de 525 viviendas se requerir seleccionar una muestra de manzanas que contengan ese nmero de viviendas que es igual al cociente entre el tamao de la muestra de viviendas necesaria y el tamao promedio de la manzana. Entonces:

nmanzanas=525/15=35 manzanas. Es decir para obtener una muestra de 525


viviendas se precisar seleccionar una muestra de 35 manzanas.

Estas 35 manzanas se seleccionan en el marco muestral de 400 manzanas, utilizando muestreo aleatorio simple, muestreo aleatorio sistemtico o muestreo aleatorio estratificado. Luego, el equipo de trabajo del seor Ocampo visitar a todos los hogares existentes en cada una de las 35 manzanas seleccionadas y en ellos preguntar Existe en este hogar servicio de internet? Dado que cada manzana contiene en promedio 15 viviendas y son 35 manzanas a entrevistar 15x35=525 que es el tamao de la muestra. 3.1.2 Muestreo no aleatorio es el modo de seleccin de muestras mediante procedimientos no aleatorios, no probabilsticas o no al azar. Los distintos modos de seleccionar muestras no aleatorias pueden resumirse en dos: intencional y por conveniencia. 1) Muestreo por conveniencia es aquel en el cual las unidades a ser estudiadas se seleccionan en funcin de su disponibilidad, de su facilidad para conseguirlas. Esta forma de seleccionar muestras no garantiza la representatividad, toda vez que es muy posible que las unidades estadsticas ms fciles de conseguir son diferentes a las otras. Ejemplo: Antonio Snchez, investigador del rea de mercado, est interesado en estudiar el consumo lecha descremada en los hogares de la ciudad de Santo Domingo. Dado que es un producto que se consume en los hogares, la unidad de estudio sera el hogar y en l preguntara al ama de casa, quien es la persona que maneja mejor ese tipo de informacin. El seor Snchez decide hace su estudio a partir de una muestra de 500 hogares. Dado que el estudio supone entrevistar a 500 amas de casa, l decide entrevistar ese nmero de personas en los supermercados de la ciudad, pues es un lugar donde estas personas concurren a hacer sus compras, y por tanto es fcil de conseguirlas. Distribuye la muestra en 25 supermercados localizados en diferentes partes de la ciudad y en cada uno de stos entrevistar a 20 amas de casa. De esas 500 amas de casa entrevistadas, 100 dicen que en su hogar se consume leche descremada. Sin embargo, a partir de se resultado no podra asegurase que en el 20% de los hogares de la ciudad de Santo Domingo se consume ese producto, puesto que es posible que la muestra no sea representativa, dado que las amas de casa que compran en el supermercado sean diferentes a las que compran en colmados u otro tipo de establecimiento. Es posible que quienes compran en el supermercado pertenezcan a un estrato social un poco ms elevado que aquellas que compran en otro tipo de establecimiento, por tanto, la muestra no sera representativa. 2) Muestreo intencional es aquel en el cual las unidades que componen la muestra se seleccionan el juicio o criterio de una persona con experiencia y conocimiento acerca de la poblacin estudiada. Esta forma de seleccionar

las unidades a ser estudiadas tambin puede estar afectada por problemas que atentan contra la representatividad, pues el criterio de una persona podra llevarlo a una seleccin que favorece a un grupo en particular. Ejemplo: Luis Jimnez, investigador del rea de recursos humanos, est interesado en estudiar el nivel de satisfaccin en el trabajo de los empleados del Ministerio de Agricultura de la Repblica Dominicana. Para esto selecciona una muestra nacional de 2,000 empleados. Con la intencin de que su muestra sea lo ms representativa posible distribuye la muestra en las 32 provincias, de modo que a aquellas provincias con ms empleados le corresponder una parte mayor de la muestra, y por consiguiente, a las provincias donde el Ministerio tiene menos empleados, entonces le corresponder una parte ms pequea de la muestra. El seor Jimnez piensa que una forma gil de conducir su estudio es pedirle al Director de Agricultura en cada provincia, que le seleccione las personas que l debe entrevistar en cada una. As, si la distribucin que l hizo de la muestra le dice que debe entrevistar 10 empleados en Barahona, entonces le pedir al Director Provincial de Agricultura en Barahona que le seleccione 10 empleados, pues su equipo de trabajo ir a entrevistarlos all en una fecha convenida. Despus de haber entrevistado a los empleados que corresponden a cada provincia y as haber completado la muestra de 500, determina que 450 de ellos dicen estar satisfechos y solo 50 manifestaron estar insatisfechos en su trabajo. Esto significara que el 90% de los empleados del Ministerio de Agricultura de la Repblica Dominicana estara satisfecho en su trabajo. Sin embargo no existe seguridad de se pueda hacer esta afirmacin, puesto que no hay garantas de que esta muestra sea representativa, pues existe la posibilidad de que, por inters propio, el Director Provincial de Agricultura haya seleccionado empleados que l entienda que podran estar satisfechos en su trabajo. De esa forma el estudio lo hara quedar muy bien, pues estara mostrando lo bien que su institucin trata a los empelados y por eso su alto grado de satisfaccin en el trabajo. 3.2 Errores inherentes al muestreo Cuando una poblacin es estudiada a travs de una muestra existen riesgos de cometer errores. Es decir, es posible que el valor que se obtenga para una medida no sea exactamente igual al que se obtendra si se estudiase la poblacin completa. Estos errores son de dos tipos: error de muestreo y sesgo. Error de muestreo. Es la discrepancia producida por la seleccin al azar entre el resultado derivado de una muestra y el valor que se obtendra si se estudiara a toda la poblacin. Sesgo. Es un error que generalmente se produce al seleccionar muestras en forma intencional. Tambin puede producirse al seleccionar muestras aleatorias, pero concentradas en un segmento poblacional no representativo del universo.

El sesgo es un error que se produce en un solo sentido y puede ser de seleccin o de medicin. El sesgo de seleccin solo se produce cuando se utilizan muestras, mientras que el sesgo de medicin se presenta tanto cuando se estudian muestras como cuando se estudia a toda la poblacin. Un ejemplo de sesgo de medicin se presenta en los datos sobre los ingresos familiares o personales declarados por las personas en los censos y en las encuestas por muestreo. Es comn que las personas tiendan a no declarar el verdadero valor del ingreso, pues generalmente informan valores inferiores a los reales. Si se conociera el sentido y la magnitud del sesgo podra corregirse. Por ejemplo: Si se midiera a los nios de segundo curso de una escuela Primaria con un metro al cual le faltan tres centmetros. Al terminar de hacer las mediciones si se descubriese el error podran corregirse fcilmente las mediciones. No obstante, la realidad muestra que los sesgos casi nunca se conocen, por lo cual resulta imposible o al menos muy difcil su evaluacin y correccin. A su vez, los errores de muestreo, por su naturaleza aleatoria no se pueden predecir individualmente, es decir, en una muestra determinada. Sin embargo, pueden ser estudiados y evaluados en muestras sucesivas utilizando modelos matemticos proporcionados por la Teora de las probabilidades. 3.3 Factores que determinan el tamao de la muestra De la discusin seguida en la seccin 3.2 se deduce que siempre que se estudien muestras se obtendrn estimadores asociados a error. Este tipo de error, si embargo, se reduce en la medida que se seleccionan muestras de tamao adecuado, es decir, muestras suficientemente grandes. Las consideraciones subyacentes en el prrafo precedente llevan a la formulacin de la pregunta siguiente: De qu depende el tamao de la muestra? La respuesta sera que depende de dos factores: 1) El tamao de la muestra a ser utilizada depende de la homogeneidad mostrada por los elementos de la poblacin en relacin a la caracterstica estudia. Ejemplo 1: En la sala A hay 200 estudiantes pertenecientes a una misma carrera, pero se desconoce cul es la carrera a la cual pertenecen. Mientras en la sala B hay 60 estudiantes pertenecientes a cuatro (4) carreras diferentes, las cuales se desconocen. Si se desea saber cul es esa carrera a la cual pertenecen los 300 estudiantes de la sala A bastara con seleccionar una muestra de un (1) estudiante y preguntarle a cul carrera pertenece. Es decir, con n=1 es suficiente. Por la respuesta que ofrezca ese estudiante se puede inferir cul es la carrera de pertenencia de los otros 199 estudiantes. Sin embargo, si se quisiera saber cules son las cuatro (4) carreras de pertenencia de los

60 estudiantes de la sala B se requerira una muestra de por lo menos cuatro (4) estudiantes. Es decir, n=>4. Ejemplo 2: Empresas dedicadas a las encuestas electorales en los Estados Unidos realizan estudios sobre preferencias partidarias con muestras nacionales de 600, 700 u 800 personas en condiciones de votar. En cambio, en la Repblica Dominicana, las encuestas de intencin de voto se hacen a partir de muestras de 1200, 1400 o 1600 electores, etc. Lo que ocurre es que en este ltimo pas, a pesar de que la poblacin electoral es mucho menor que la de los Estados Unidos, la poblacin es ms heterognea en cuanto a la caracterstica preferencia partidaria, pues existe una amplia gama de partidos polticos, mientras que en los Estados Unidos solo existen dos (2). 2) El tamao de la muestra a ser utilizada tambin depende del grado de confianza que se quiere tener en la inferencia. Un mayor grado de confianza requerir de una muestra ms grande que si el nivel de confianza requerido fuese menor. Ejemplo: Un investigador est interesado de seleccionar una muestra para estimar el ingreso promedio mensual de las familias de un municipio. Por un estudio realizado anteriormente en el municipio se sabe que la desviacin estndar de los ingresos familiares es 300 pesos. El investigador quiere tener un 95% de confianza de que la discrepancia entre el ingreso promedio que l obtenga a travs de la muestra, y aquel que se obtuviera si se estudiase la poblacin completa no fuese mayor de 20 pesos. En este caso requerira una muestra de 865 familias. Sin embargo, si el investigador se conformara con 90% de confianza solo precisara de una muestra de 609 familias. 3.4 Razones para usar muestras Existe consenso en relacin a que estudiar una poblacin a travs de una muestra conduce a la obtencin de estimadores asociados a errores de muestreo cuya magnitud es inversamente proporcional al tamao de la muestra. Esto supone que no hay forma de eliminar el error de muestreo y que a lo mximo que podra aspirarse es a reducir el tamao del error, seleccionando muestras suficientemente grandes. En este contexto cabra preguntase Por qu no estudiar la poblacin completa s de esta forma se puede evitar el error de muestreo? La respuesta ira en el sentido de que existen razones que, independientemente del deseo de estudiar la poblacin completa, obligan a usar muestras. Entre esas razones se distinguen las cuatro siguientes: 1) Cuando la poblacin es infinita o muy grande y, por tanto, es materialmente imposible estudiar a todos los elementos que la componen. Ejemplo: Omar Rugama, investigador del rea de la biologa, est interesado en estudiar la contaminacin con metales en los peces del Ro Ozama. En este caso, dado que se trata de una poblacin infinita desde el

punto de vista estadstico, el investigador obligatoriamente tendr que basar su estudio en una muestra que seleccionar en varios lugares del ro. 2) Financieras. En este caso la poblacin es finita, pero por su tamao, estudiarla en forma completa podra implicar gastos muy elevados, por lo cual se decide seleccionar una muestra para estudiarla a travs de sta. Ejemplo: Juan Snchez, investigador del rea de mercado, est interesado en estudiar la aceptacin de la pasta de tomate La Cocinera en la poblacin de la ciudad de Puerto Montero, donde existen 2,100,000 hogares y residen 5,600,000 personas. Un estudio para entrevistar 2,100,000 amas de casa conllevara un presupuesto bastante elevado. En este caso, el seor Snchez no estara en condiciones de solventar un estudio con un presupuesto de esa magnitud solo para saber el grado de aceptacin del producto entre los hogares, por lo tanto est obligado a recurrir a una muestra para realizar su estudio. 3) Tiempo. Existen ocasiones donde se est frente a una poblacin finita y donde los recursos financieros no constituyen problema alguno, sin embargo los resultados del estudio son requeridos con cierta urgencia. Este es un caso tpico donde el tiempo se constituye en el elemento que obliga al uso de muestras para realizar las investigaciones. Ejemplo: El departamento de mercado de un partido poltico vinculado a grupos econmicamente poderosos y que, adems ha detentado el poder durante un largo perodo, est interesado en realizar un estudio con el objeto de determinar el posicionamiento de su candidato, de frente a las elecciones nacionales a realizarse dos meses ms tarde. Obviamente se trata de una poblacin finita, constituida por todos los habitantes del pas habilitados para ejercer el sufragio y, a dems, es probable que lo financiero no constituya restriccin alguna. Sin embargo, el partido requiere saber en pocos das cul es la situacin de su candidato para as saber que estrategia seguir en los prximos dos meses. Esta es una situacin que el departamento de mercado del partido est obligado a usar una muestra para realizar su investigacin. 4) Las unidades estudiadas se transforman o se destruyen al ser estudiadas. Existen situaciones en que se est frente a una poblacin finita, no existen limitaciones de tipo financiero y no hay restricciones en cuanto al tiempo, pero los elementos se transforman o se destruyen al estudiarlos. En este caso se est obligado a estudiar una muestra, puesto que el estudio de la poblacin completa implicara su destruccin, y no tendra sentido hacer un estudio y sacar conclusiones acerca de una poblacin que ya no existe. Ejemplo: Un fabricante de fsforos est obligado a mantener el nivel de calidad de 95% establecido por el ministerio de industria. Con estos propsitos debe hacer estudios de control de calidad en los fsforos fabricados para asegurarse de que la proporcin de palitos con algn defecto no sobrepasa el 5% del nmero total fabricado.

En aras de supervisar la calidad, el departamento de control de calidad de la fbrica toma una muestra de los palitos de fsforos fabricados en una hora. Luego lleva esa muestra al laboratorio y raya cada uno de los palitos de la muestra; los que encienden sin defectos los coloca en una bandeja y los que presentan problemas para el encendido los coloca en otra. Al final del proceso de prueba cuenta los que presentaron defectos y calcula el porcentaje que stos representan con relacin al total. Si el porcentaje es 5% o menos indica que la produccin est bien, por tanto avisa al rea de produccin que puede continuar fabricando. Obviamente este es un caso tpico en el cual hay que recurrir a una muestra para estudiar la poblacin.

Vous aimerez peut-être aussi