Vous êtes sur la page 1sur 73

ESTADSTICA GENERAL ================================================================ PRIMERA UNIDAD: INTRODUCCIN Y CONCEPTOS BSICOS OBJETIVOS: Conocer la importancia de la Estadstica y su campo de aplicacin.

in. Analizar los conceptos bsicos de la estadstica. Definir el trmino Estadstica DESARROLLO Lema: UNA IMAGEN DICE MS QUE MIL PALABRAS 1. INTRODUCCIN: Poco despus de que se cerraron las urnas el da de las elecciones, un comentarista de televisin inform al teleauditorio, que se pronostic, por anlisis matemtico, que uno de los candidatos obtendra una victoria aplastante. Lo que es ms, el pronstico se llev a cabo despus de tabular solamente el 2% de los votos. 2. La oficina de metereologa nos informa que hay un 30% de probabilidades de que llueva el da de hoy. 3. El gobierno informa que el ingreso medio de una familia de cuatro miembros en el casco urbano de Nueva Guinea es superior en un 5% al del ao pasado. 4. El 75% de los adolescentes cree justificado el divorcio si los padres disputan con frecuencia, si interviene la violencia fsica, o si uno o ambos padres cometen infidelidad. 5. Siete de cada diez estudiantes de secundaria han fumado mariguana. 6. El 60% de los estudiantes estudia slo para aprobar, no para aprender. El 55% admite haberse copiado en los exmenes. 7. Ms de 8 de cada 10 estudiantes cuya madre trabaja se sienten contentos y orgullosos de ella. 8. Un profesor explica a su clase que la calificacin promedio de mitad del semestre fue 70. Estas son algunas de las formas como se emplea la estadstica. Qu es la estadstica? La estadstica es el lenguaje universal de las ciencias. La estadstica es ms que solamente un juego de herramientas. Como usuarios potenciales de la Estadstica, necesitamos dominar el arte de emplear las herramientas correctamente. La utilizacin cuidadosa de los 1 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ mtodos estadsticos permite (1) describir con precisin los hallazgos de la investigacin cientfica, (2) tomar decisiones, y (3) efectuar estimaciones. La estadstica maneja informacin, utilizando ciertas medidas numricas para resumirla e interpretarla. La palabra estadstica tiene significados diferentes para gente de preparacin e intereses diversos. Para algunos es una bolsa de trucos cuyo conocimiento permite a un iniciado engaar a un lego. Para otros es una forma de recopilar presentar grandes cantidades de informacin numrica. Para otro de personas es una forma de tomar decisiones en condiciones de incertidumbre. Cada uno de estos puntos de vista es correcto desde la perspectiva adecuada. El campo de la Estadstica puede dividirse aproximadamente en dos reas: Estadstica Descriptiva y Estadstica Inferencial. La Estadstica Descriptiva es en lo que piensa la mayor parte de la gente cuando escucha la palabra Estadstica; incluye la recopilacin, presentacin y descripcin de datos. El trmino Estadstica Inferencial se refiere a la tcnica de interpretar los valores resultantes de las tcnicas descriptivas, y a su utilizacin posterior para tomar decisiones. La Estadstica es algo ms que slo nmeros: es lo que se hace a, o con, esos nmeros. Se utilizar la siguiente definicin: Estadstica Es la ciencia de la recopilacin, clasificacin, presentacin e interpretacin de datos. Antes de comenzar a estudiarla con detalle, se vern algunos ejemplos sobre cmo y cundo aplicar la estadstica. Ejemplo 1. La universidad BICU recinto Ciudad Rama, tiene en sus planes, la ampliacin de sus instalaciones fsicas. A fin de elaborar un plan de accin efectivo, el consejo de administracin decide preguntar lo siguiente: cuntos estudiantes universitarios se har necesario atender durante los prximos 10 aos? Esta pregunta puede descomponerse inmediatamente en otras: cuntos estudiantes universitarios habr en el pas?, Cuntos desearn asistir a la universidad BICU? Para contestar estas preguntas el Consejo necesitar datos que le indiquen qu proporcin de futuros egresados del bachillerato desearn asistir a la BICU. As el consejo necesitar proyectar o predecir de algn modo el nmero de egresados de bachillerato que habr en los prximos 10 aos. Considrese la pregunta sobre la proporcin de egresados de bachillerato que desearn asistir a la universidad BICU. La mejor forma de contestar esta pregunta es averiguar la proporcin de los que han asistido en el pasado. Esta mejor respuesta supone que existe una relacin entre el pasado y el futuro. Sin 2 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ embargo, esto no siempre se cumple. Eventos como guerras o depresiones econmicas modificarn el desarrollo natural de dicha relacin. Como puede verse, muchos problemas deben resolverse cuando se desean respuestas exactas. Un problema obvio es cmo obtener datos histricos. Es necesario considerar cada estudiante que haya egresado del bachillerato en los ltimos aos? Deben considerarse todas las escuelas dentro de un radio de 800 kilmetros? Las respuestas a estas preguntas son negativas; sera imposible contestarlas cabalmente. Por esta razn slo se obtendr, informacin acerca de una parte de esta poblacin, es decir, se obtendr una muestra de la poblacin. Tambin existen otras consideraciones: qu tan exactos son los resultados?, Cul es la probabilidad de que haya una mayor proporcin de estudiantes que deseen asistir a la universidad BICU? No se ha comenzado a plantear exhaustivamente las preguntas que pueden ser relevantes. Ejemplo 2. Todos quieren a Ricardo Bromas! Bueno, eso es lo que afirma el propio Ricardo, y es por ello que ha decidido a postularse como Diputado por la villa La Tigra (cuya poblacin votantes es de 8000). Sin embargo, el jefe de su campaa electoral no est seguro de entender exactamente lo que cree Ricardo Bromas. Cree ste que la totalidad de los habitantes aptos para votar simpatizan con l o que la mayora (al menos el 51%) lo acepta?. O bien, qu agrada al menos a la mitad de los habitantes en edad de votar?. Ricardo puede creer todas o algunas de estas afirmaciones, y lo que l crea puede significar una gran diferencia en la campaa electoral. (Por ejemplo, supngase que un cierto porcentaje a quienes simpatiza son nios y no pueden votar.) Si se le contratara a usted como experto independiente en sondeos de opinin, qu hara para corroborar la exactitud de la afirmacin de Ricardo Bromas? Ejemplo 3. Qu tan grande de estatura son los conductores de automviles deportivos?. Esta es la pregunta formulada por los propietarios del Cup Deportivo Especial (CDE), el automvil deportivo ms fino del mundo, de acuerdo con una opinin. El fabricante desea disear y construir un nuevo modelo que sea realmente cmodo para el conductor. Su modelo actual est diseado para admitir personas cuya estatura est entre 1.57 y 1.73 metros. Al fabricante le preocupa un rumor que dice que su automvil es incmodo para una gran proporcin de aficionados a los autos deportivos. (Segn el rumor, el Cup Deportivo Especial est construido para personas de corta estatura y de cuello corto.) Qu hara usted para responder a tan original pregunta? Qu consideraciones especiales plantara en el proceso de obtencin de informacin muestral?

3 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Cada uno de estos ejemplos formula preguntas que deben hacer pensar acerca de la situacin y al mismo tiempo dar una idea acerca de la utilidad de la estadstica. Sobre la base de lo planteado anteriormente resumimos que la estadstica comprende: La rama descriptiva, La teora de la probabilidad y el muestreo. Las tres ramas de la estadstica utilizan el mtodo cientfico, que consiste en cinco pasos bsicos: 1. Definir cuidadosamente el problema. Asegurarse de que est claro el objeto de estudio o anlisis. 2. Formular un plan para recopilar los datos necesarios. 3. Reunir los datos. 4. Analizar e interpretar los mismos. 5. Anotar las conclusiones y otros descubrimientos, de manera que sean fcilmente comprendidos por los que utilizarn los resultados al tomar decisiones. POR QU ESTUDIAR ESTADSTICA? Sera conveniente hacerse la pregunta: por qu debo molestarme en aprender estadsticas? Evidentemente, esto requerir un esfuerzo de su parte y quiz se pregunte qu beneficio le traer. En la actualidad es comn que los estudiantes crean que los cursos deben tener cierta utilidad. Usted ser el que juzgar al final. Pero por ahora, se debe considerar lo siguiente: 1. Los mtodos estadsticos se utilizan ampliamente, tanto en el gobierno como en la empresa privada, de manera que es posible que en el futuro usted obtenga un empleo o sea ascendido, debido a sus conocimientos de estadstica. 2. En muchas circunstancias, los gerentes requieren saber estadsticas para tomar decisiones acertadas y evitar ser abrumados por la presentacin de datos estadsticos. 3. En cursos subsecuentes se utilizar el anlisis estadstico.

4 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 4. En la mayora de las revistas para profesionales y otro tipo de literatura se hacen continuas referencias a estudios estadsticos. 5. Las noticias proporcionadas por los medios de comunicacin masiva permiten la interpretacin estadstica, y lo mismo con las experiencias cotidianas. Ejemplo 1.2: Al requerir el nivel nutricional de una poblacin humana delimitada, informacin relevante a recabar de personas podra ser: peso, altura, sexo y edad, los parmetros prefijados agruparan las personas de acuerdo a los distintos grados desde desnutricin hasta obesidad.

CONCEPTOS BSICOS Para estudiar Estadstica se necesita estar en condiciones de hablar su lenguaje. A continuacin se definen algunos trminos bsicos que se emplean en el presente documento. Estas definiciones son de naturaleza descriptiva y no necesariamente son matemticamente formales. Poblacin Conjunto o cmulo de individuos u objetos cuyas propiedades se han de analizar. La poblacin es el conjunto completo de individuos u objetos que interesan a quien selecciona muestra. El concepto de poblacin es la idea fundamental en estadstica. La poblacin de inters debe definirse cuidadosamente, y se considera definida por completo slo cuando se especifica una lista de sus miembros. El conjunto de todos los estudiantes que han asistido a la universidad BICU es un ejemplo de poblacin bien definida. Generalmente se entiende poblacin un conjunto de personas. Sin embargo, en Estadstica una poblacin puede ser un conjunto de animales u objetos. Por ejemplo, el conjunto de todos los rboles de la especie casia magna en Ciudad Rama, es asimismo una poblacin. Muestra: Un subconjunto de una poblacin. Una muestra se compone de los individuos, objetos, medidas u observaciones seleccionados de la poblacin. 5 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Variable (o bien, variable de respuesta) Caracterstica de inters acerca de cada elemento de una poblacin o muestra. Son variables la edad de un estudiante al ingresar a la universidad, el color de su cabello, su estatura, peso, etc. Dato: Valor de la variable asociado a un elemento de una poblacin o muestra. Por ejemplo, Lucinio Arrliga ingres a la universidad a los 28 aos, su cabello es negro, mide 1.64 metros, y pesa 60 kilogramos. Cada una de estas cuatro mediciones es un valor individual o dato para cada una de las variables de respuesta de las medidas de Lucinio. Datos: Conjunto de valores de la variable repuesta medidos a partir de cada uno de los elementos de una poblacin o muestra. El conjunto de las 25 estaturas medidas a igual nmero de estudiantes es un ejemplo de un conjunto de datos. Experimento: Actividad realizada segn un plan definido cuyos resultados producen un conjunto de datos. Parmetro: Caracterstica numrica de una poblacin. La edad promedio al momento de la admisin de todos los estudiantes que hayan asistido a la BICU, o los que tenan ms de 21 aos al ser admitidos, son ejemplos de dos parmetros poblacionales. Un parmetro es un valor que describe a toda una poblacin. Una prctica comn en Estadstica es el uso de letras griegas para simbolizar los parmetros. Tales smbolos se asignarn conforme se estudie cada parmetro. Estadstica: Caracterstica numrica de una muestra. Un ejemplo de estadstica muestral es la estatura promedio calculada a partir de un conjunto de 25 medidas de estatura. Una estadstica es un valor que describe a una muestra. La mayora de las estadsticas muestrales se calculan con ayuda de frmulas y se representan con smbolos literales tomados del alfabeto latino (por ejemplo, x, r, s.) 6 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Ejemplo 4. Un estudiante de estadstica desea tener una idea aproximada acerca del valor (en unidades monetarias) del automvil tpico que poseen los profesores de su universidad. Para este caso, a continuacin se aplica cada uno de los ocho trminos bsicos que se acaban de definir. 1. La poblacin es el conjunto de todos los vehculos de los profesores de la universidad. 2. Una muestra es una porcin o parte de una poblacin. Por ejemplo, el nmero de automviles cuyos propietarios son los profesores del departamento de matemticas, es una muestra. 3. La variable es el valor real de cada automvil. 4. Un dato es el valor de un vehculo en particular. Por ejemplo, el coche del profesor Eugenio Mairena est valuado en 2000 dlares. 5. Los datos son el conjunto de valores que corresponden a la muestra obtenida (30 mil, 40 mil, ...). 6. El mtodo utilizado para seleccionar los automviles que componen la muestra, as como el que sirve para determinar el valor de cada uno, recibe el nombre de experimento. Se llevara a cabo preguntando directamente a cada profesor del departamento de matemticas, o bien de alguna otra manera. 7. El parmetro acerca del cual se busca informacin es el valor promedio en la poblacin. La Estadstica que se encontrar es el valor promedio de la muestra. 1.2.2 Tipos de Datos y Escalas de Medicin.

La informacin extrada de cada individuo se clasifica de acuerdo a su naturaleza, y

Tipo de Datos Cualitativos Cuantitativos Nominal Ordinal Discreta Continua

segn sta, cada conjunto de datos extrados se denomina Cualitativo (Categrico) o Cuantitativo (Numrico).

Datos Cualitativos son aquellos que pueden agruparse en categoras distintas; describen los atributos o cualidades de los individuos u objetos, si no dependen de 7 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ un ordenamiento primario su escala de medicin es Nominal, en otro caso, Ordinal. Datos cualitativos binarios (dos nicas opciones complementarias) se denotan como Dicotmicos. Datos Cuantitativos son aquellos que resultan de un proceso que cuantifica o mide, pueden ser de un proceso de conteo (discretos a escala entera) o estar asociados a una unidad de medida (continuos, a escala de intervalo o de razn: pueden tomar valores reales o fraccionarios). Si a un objeto se le asocia unidad de medida con subdivisiones: libra, onza, litro, gramo, metro, minuto,... la medicin es cuantitativa continua.

Ejemplos 1.4: En una empresa pueden obtenerse datos sobre distintos procesos. En Produccin: cada producto o artculo que elabora, presentacin de cada uno, su unidad de medida, niveles de produccin y niveles de demanda de cada producto para cada poca del ao. En Administracin las Bases de Datos (BD) conteniendo los registros de trabajadores en las distintas categoras laborales, BD de proveedores y BD de clientes; cada una con informacin relevante de cada persona (natural o jurdica). Datos especficos en sus distintos tipos podran ser: Presentacin del producto (bolsa, botella, caja, quintal,...) de tipo Nominal. Cantidad o volumen de producto (litro, libra, gramo,) es cuantitativa continua. Tipo de trabajador (temporal, permanente) de tipo Nominal. Sexo (masculino, femenino) de tipo Nominal dicotmico. Categora laboral (Gerencia, Ventas, Seguridad, Conserjera) a nivel Ordinal. Nivel Acadmico (Universitaria, Tcnica, Secundaria, Primaria, Alfabetizado) a nivel ordinal. Edad y Aos de Antigedad se consideran cuantitativa discretas.

Ejemplos 1.5: La poblacin de vacas para el ao 2000 de la regin centroamericana, es una poblacin muy general, para realizar estudios sobre las mismas debera delimitarse aquella por: Raza, Edad, Pas, etc., luego extraemos una muestra por regin y finca y extraemos de cada vaca la informacin pertinente, las mediciones sobre las mismas y sus atributos conforman las unidades estadsticas. La poblacin econmicamente activa (PEA) de un pas en el ao 2008, es un grupo humano delimitado, en principio, por edad, luego se la puede delimitar por: sexo, estado civil, situacin laboral, escolaridad (mxima alcanzada), nmero de hijos, etc., extraeramos una muestra segn nuestro objetivo primordial y medimos las unidades estadsticas fijadas a cada persona incluida en la muestra.

8 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Ejercicios 1.1 Supngase que ha obtenido la siguiente informacin entre los estudiantes que salan de la biblioteca de URACCAN durante la primera semana de clases: Cantidad de dinero que utiliza para adquirir libros. Nmero de textos que se adquieren. Tiempo empleado para comprar en la librera. Especialidad acadmica. Hombre o mujer. Posesin de computadora personal. Nmero de asignaturas que cursa en le semestre actual. Si adquiri o no alguna prenda de vestir recientemente. Forma de pago Clasifique cada variable como categrica o numrica. Si es numrica, determine si es discreta o continua.
1.

Suponga que la siguiente informacin se obtuvo de la solicitud de un prstamo hipotecario que Diana Isabel Carranza entreg a Fondos Cooperativos de Nueva Guinea: Lugar de residencia: Zona Nmero cinco Nueva Guinea. Tipo de vivienda: unifamiliar. Fecha de nacimiento: 15 de junio de 1982 Pagos mensuales. 1427.00 crdobas Ocupacin: administradora Empresa donde labora: La exquisita Antigedad en el empleo: 5 aos Nmero de empleos en los ltimos 5 aos: 1 Ingreso familiar anual: 66,000.00 crdobas Otros ingresos: 16,000.00 crdobas Estado civil: casada Nmero de hijos: 1 Prstamo hipotecario solicitado: 120,000.00 crdobas Plazo para el pago del prstamo: 30 aos Otros prstamos; automvil Importe de otros prstamos: 8,000.00 crdobas

a. b. c. d. e. f. g. h. i. j. k. l. m. n. o. p.

Clasifique cada una de las respuestas por tipos de datos


2.

Suponga que el director de investigacin de mercado de una gran cadena de tiendas departamentales desea realizar una encuesta en el rea metropolitana para determinar el tiempo mensual que invierten en adquirir ropa las mujeres que trabajan.

a. Describa la poblacin y la muestra de inters, e indique el tipo de datos que el director est interesado en recolectar. 9 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ b. Desarrolle un primer borrador del cuestionario requerido en el inciso (a): Escriba una serie de preguntas categricas y numricas que sean apropiadas para la encuesta. 8. Elabore un resumen fundamentando la diferencia entre estadstica descriptiva e Inferencial EJERCICIO NMERO DOS 1. Un fabricante de medicamentos desea conocer la proporcin de personas cuya hipertensin (alta presin sangunea) puede ser controlada con un nuevo producto fabricado por la compaa. Al realizar un estudio en 5000 individuos hipertensos se encontr que 80% de ellos pudo controlar su hipertensin utilizando el nuevo medicamento. Suponiendo que esas 5000 personas son representativas del grupo de pacientes de hipertensin, conteste las siguientes preguntas. a. b. c. d. e. Cul es la poblacin? Cul es la muestra? Identifique el parmetro de inters. Identifique la estadstica e indique cul es su valor. Se conoce el valor del parmetro?

2. Siguiendo las instrucciones expuestas a continuacin, lleve a cabo con una baraja cinco veces el experimento primer as. En cada una de las cinco realizaciones del experimento observe los valores de tres variables. Variable 1: El color del primer as que aparece. Variable 2: La mayor distancia medida a lo largo del montn o pila de cartas que se han visto. Variable 3: La cantidad de cartas que se toman de la baraja hasta obtener el primer as. Para realizar el experimento del primer as se baraja un mazo de 52 naipes que contenga 4 ases. Se selecciona una carta a la vez y se apilan hasta que aparezca el primer as. Despus de haberlo obtenido se registra su color. Luego se mide y se registra la mayor distancia a lo largo de la pila de cartas. Se cuenta y se anota el nmero de cartas apiladas incluyendo al primer as. Se repite el experimento cuatro veces. ENSAYO X = COLOR DEL D = DISTANCIA A Y = CUENTA DE PRIMER AS LO LARGO DE LA LAS CARTAS, PILA DE CARTAS INCLUYENDO AL PRIMER AS X1 = D1 = Y1 = 10 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 2 3 4 5 D2 = Y2 = D3 = Y3 = D4 = Y4 = D5 = Y5 = 5 5 Di = Yi = i=1 i=1 2.1 Cada una de las tres variables en el experimento del primer as produce un tipo de dato diferente. Qu tipo es en cada variable? 3. Un tcnico de control de calidad selecciona partes de una lnea de ensamblaje y anota para cada una de ellas la siguiente informacin: a. Si est defectuosa. b. El nmero de identificacin de la persona que arm la pieza. c. El peso de la pieza. Clasifique las respuestas para cada parte como atributo, dato de variable discreta, o dato de variable continua. 4. Se quiere saber el costo de la educacin. Uno de los gastos que hace un estudiante es la compra de sus libros de texto. Sea x el costo de todos los libros comprados este semestre por cada estudiante de BICU. Descrbase cuidadosamente: a. La poblacin. b. La variable. 5. Un departamento de servicios escolares desea valuar el costo promedio de los libros por estudiante y por semestre (Vase el ejercicio 4). a. Describa el parmetro poblacional. b. El departamento identific a 50 estudiantes admitidos y les pidi que tomaran nota de sus gastos en libros de texto y que informaran la cantidad total. Las 50 cantidades resultantes forman una muestra. Describa la estadstica muestral que interesa al departamento de servicios escolares. c. Describa como utilizara los 50 datos de la muestra para calcular el valor de la estadstica muestral descrita en (b). 6. Identifique cada uno de los siguientes casos como ejemplo de variable: (1) de atributo, (2) discreta, o (3) continua. a. La resistencia a la ruptura de un determinado tipo de cuerda. b. El color del cabello de los nios que estn viendo por televisin una pelcula. 11 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004 X2 = X3 = X4 = X5 =

ESTADSTICA GENERAL ================================================================ c. El nmero de seales de trnsito en poblados con menos de 500 habitantes. d. Si una llave de lavabo est defectuosa o no. e. El nmero de preguntas contestadas correctamente en un examen. f. El tiempo que se necesita para contestar una llamada telefnica en una oficina de bienes races. 7. Identifique cada uno de los siguientes casos como ejemplos de variable: (1) de atributo, (2) discreta, o (3) continua. a. El resultado de la encuesta hecha a un grupo de votantes posibles acerca del candidato de su preferencia. b. El tiempo necesario para que una herida cicatrice cuando se utiliza un nuevo medicamento. c. El nmero de llamadas telefnicas recibidas en un conmutador cada 10 minutos. d. La distancia a la que puede llegar un baln de ftbol al ser pateado por las jvenes de segundo ao de contabilidad. e. El nmero de pginas escritas por cada trabajo en una impresora de computadora. f. La clase de rbol utilizado como smbolo navideo. 8. Suponga que un nio de doce aos quiere saber la diferencia entre muestra y poblacin. a. Qu informacin dara como respuesta? b. Qu razones se le daran sobre el por qu se debe tomar una muestra en vez de estudiar a cada miembro de la poblacin? MEDIBILIDAD Y VARIABILIDAD Siempre se espera que ocurra variabilidad en un conjunto de datos experimentales. Si aparece muy poca o ninguna variacin, se conjeturara que el instrumento de medicin no es suficientemente preciso. Por ejemplo, tmese una caja con 24 barras de chocolate y anote el peso de cada una. Se observa que cada barra pesa 30 gramos, redondeando a enteros. Significa esto que 12 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ las barras tienen un peso idntico?. Realmente no. Si se pesan en una balanza analtica que mide miligramos, los pesos presentarn variabilidad. No importa de que variable de respuesta se trate, siempre existir VARIABILIDAD en la respuesta numrica si el instrumento de medicin es suficientemente preciso. Uno de los principales objetivos en el anlisis estadstico es la medicin de la variabilidad. Por ejemplo, en estudios de control de calidad eso es absolutamente esencial. El control o la reduccin de la variabilidad en un proceso de fabricacin es una rea de actividad bien definida (por ejemplo, el llamado control estadstico del proceso). EJERCICIOS 1. Supngase que se miden los pesos (en kilogramos) de los individuos que integran cada uno de los siguientes grupos: a) Grupo 1: nios varones de un ao de edad. b) Grupo 2: Hombres adultos de ms de 20 aos. En cul grupo habra mayor variabilidad?

2. Supngase que hay que decidir cul de dos mquinas debe comprarse, considerndose la longitud de corte para cierta pieza. Si ambas mquinas producen partes que tienen la misma longitud en promedio. Qu otra consideracin relativa las longitudes sera importante? Por qu?

MTODOS DE RECOLECCIN DE DATOS Es importante destacar que los mtodos de recoleccin de datos, se puede definir como: al medio a travs del cual el investigador se relaciona con los participantes para obtener la informacin necesaria que le permita lograr los objetivos de la investigacin. De modo que para recolectar la informacin hay que tener presente: 13 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 1.Seleccionar un instrumento de medicin el cual debe ser valido y confiable para poder aceptar los resultados 2. Aplicar dicho instrumento de medicin 3. Organizar las mediciones obtenidas, para poder analizarlos Dentro de los mtodos para la recoleccin de datos estn: Observacin: Es el registro visual de lo ocurre es una situacional real, clasificando y consignando los acontecimientos pertinentes de acuerdo con algn esquema previsto y segn el problema que se estudia Al igual con los otros mtodos, previamente a la ejecucin de la observacin el investigador debe definir los objetivos que persigue, determinar su unidad de observacin, las condiciones en que asumir la observacin y las conductas que debern registrarse. Cuando se decide utilizarla hay que tomar en cuenta ciertas consideraciones. Como mtodo de recoleccin de datos, debe ser planificado cuidadosamente para que rena los requisitos de validez y confiabilidad. Se le debe conducir de manera hbil y sistemtica y tener destreza en el registro de datos, diferenciando los aspectos significativos de la situacin y los que no tienen importancia. Tambin se requiere habilidad para establecer las condiciones de manera tal que los hechos observables se realicen en la forma ms natural posible y sin influencia del investigador u otros factores. Cuando se decide usar este mtodo es requisito fundamental la preparacin cuidadosa de los observadores, asegurndose as la confiabilidad de los datos que se registren y recolecten. Posibles errores con el uso del mtodo de observacin. Sobre el uso del mtodo de observacin, Quinteros comenta que, "las condiciones de una investigacin puede ser seriamente objetables si el diseo de la misma no se ha tomado en cuenta los posibles errores de observacin" Estos errores estn relacionados con:

Los Observadores El instrumento utilizado para la observacin El fenmeno observado

Respecto a los errores relacionados con el observador, estos se asocian al hecho de la participacin de otras personas, adems del investigador, en el proceso de la observacin de los hechos o fenmenos en estudio. Esta situacin puede conducir a una falta de consistencia de los resultados, ya que los observadores pueden diferir en la cuantificacin y registro que se haga de los aspectos observados. El problema se suscita por la falta de una definicin operacional y precisa de la manera en que ser medida y observada la variable y el registro de tales observaciones, siendo necesario tomar precauciones para asegurar no solo que la 14 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ observacin sea correcta, sino tambin que el registro de los hechos rena esas condiciones. Conviene que haya instrucciones escritas y verbales que orienten al observador sobre como se llevara a cabo todo el proceso y que haya demostracin y practica de las observaciones que se realicen. Tambin se considera que segn el papel que ajusta el observador se puede incurrir en mayores o menores errores; este papel puede ser el de observador no participante o participante. La observacin participante implica que el investigador o el responsable de recolectar los datos se involucre directamente con la actividad objeto de la observacin, lo que puede variar desde una integracin total del grupo o ser parte de ste durante un periodo. Algunos errores que suelen cometerse estn relacionados con las emociones del observador, ya que al involucrarse en la situacin pierde la objetividad en la observacin y en el registro, anlisis e interpretacin de los hechos o fenmenos. La observacin no participante ocurre cuando el investigador no tiene ningn tipo de relaciones con los sujetos que sern observados ni forma parte de la situacin en que se dan los fenmenos en estudio. En esta modalidad, al no involucrarse el investigador, los datos recogidos pueden ser ms objetivos, aunque, por otro lado, al no integrarse al grupo puede afectar el comportamiento de los sujetos en estudio y los datos que se observan podran no ser tan reales y veraces. Los errores referentes al instrumento de observacin se relacionan con los desaciertos en que se incurre en su elaboracin y lo que se desea medir. Esto se evita con una definicin operacional y libre de ambigedades e imprecisiones de las variables en estudio, especificando en el instrumento los criterios o indicadores de la medicin de tales variables. La especificidad de ese instrumento esta relacionada con el problema, objetivos y forma en que se va a hacer la observacin. Una de esas formas es la denominada observacin simple, no regulada o no controlada, en la que solo se tienen unos lineamientos generales para la observacin sobre los aspectos del fenmeno que le investigador tienen inters en conocer. La otra forma es la sistemtica, regulada o controlada, en la que se dispone de un instrumento estandarizado o estructurado para medir las variables en estudio de una manera uniforme. El primero se usa mas en estudios exploratorios y el segundo esta dirigido a quienes desean probar hiptesis en que se debe especificarse claramente qu se observara, cmo se observara y cmo se har el registro de datos. Los errores relacionados con el objeto que se observa se dan cuando los aspectos que deben ser conocidos de las unidades o fenmenos de observacin no se presentan en igualdad de condiciones para todos ellos, ya sea porque varen las circunstancias en que se observa el fenmeno o a la propia variabilidad del sujeto en estudio. A manera de ejemplo, se puede citar que si existe inters en evaluar el desempeo de un agente de salud en las zonas rurales de las regiones sanitarias, puede ser que la situacin donde labore una gente sea diferente en una u otra regin, ya sea por carencia o disposicin de equipos y materiales u otros 15 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ factores. La variacin de circunstancias de las regiones sanitarias puede conducir a errores de medicin, de anlisis o interpretacin de los hechos observados. La variabilidad en el sujeto se dara ante la situacin de que unos agentes de salud tengan mayor experiencia que otros o que hayan egresado recientemente de un programa educativo; estos ltimos probablemente tendrn menos destreza en el desempeo de su labor. Por lo tanto, es necesario buscar mecanismos para que las unidades en estudio estn en igualdad de condiciones durante esa medicin y que se definan las caractersticas del fenmeno que se pretende observar, procurando que en la muestra esos elementos renan caractersticas similares. En general, el mtodo de observacin es sumamente til en todo tipo de investigacin: descriptiva, analtica y experimental. En el rea de investigacin educacional, social y psicolgica, es un mtodo de mucha utilidad, en particular cuando se desea conocer aspectos del comportamiento: relaciones maestroalumno, el desempeo de los agentes de salud, relacin del uso de ciertas tecnologas educativas y grado de aprendizaje cognoscitivo y prctico del personal de salud. La encuesta: Este mtodo consiste en obtener informacin de los sujetos de estudio, proporcionada por ellos mismos, sobre opiniones, actitudes o sugerencias. Hay dos maneras de obtener informacin con este mtodo: la entrevista y el cuestionario. La entrevista Es la comunicacin establecida entre el investigador y el sujeto de estudiado a fin de obtener respuestas verbales a las interrogantes planteadas sobre el problema propuesto. Se estima que este mtodo es ms eficaz que el cuestionario, ya que permite obtener una informacin mas completa. A travs de ella el investigador puede explicar el propsito del estudio y especificar claramente la informacin que necesita, si hay una interpretacin errnea de la pregunta permite aclararla, asegurando una mejor respuesta. Best afirma "es tambin posible buscar la misma informacin por distintos caminos en diversos estadios de la entrevista", obtenindose as una comprobacin de la veracidad de las respuestas. Como tcnica de recoleccin de datos la entrevista tiene muchas ventajas; es aplicable a toda persona, siendo muy til con los analfabetas, los nios o con aquellos que tienen limitacin fsica u orgnica que les dificulte proporcionar una respuesta escrita. Tambin se presta para usarla en aquellas investigaciones sobre aspectos psicolgicos o de otra ndole sonde se desee profundizar en el tema, segn la respuesta original del consultado, ya que permite explorar o indagar en la medida que el investigador estime pertinente. Hay dos tipos de entrevista: la estructurada y la no estructurada, la primera se caracteriza por estar rgidamente estandarizada, replantean idnticas preguntas y 16 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ en el mismo orden a cada uno de los participantes, quienes deben escoger la respuesta en 2, 3 o ms alternativas que se les ofrecen. Inclusive los comentarios introductorios y finales se formulan de la misma manera en todas las situaciones. Para orientar mejor la entrevista se elabora un formulario que contenga todas las preguntas. Sin embrago, al utilizar este tipo de entrevista el investigador tiene limitada libertad de formular preguntas independientes generadas por la interaccin personal. Algunas ventajas que presenta este tipo de entrevista son: La informacin es ms fcil de procesar, simplificando el anlisis comparativo El entrevistador no necesita ser entrenado arduamente en la tcnica Hay uniformidad en el tipo de informacin obtenida

Pero tambin tiene desventajas, tales como: Es difcil obtener informacin confidencial Se limita la posibilidad de profundizar en un tema que emerja durante la entrevista

La entrevista no estructurada es ms flexible y abierta, aunque los objetivos de la investigacin rigen a las preguntas, su contenido, orden profundidad y formulacin se encuentra por entero en manos del entrevistador. Si bien el investigador, sobre las bases del problema, los objetivos y las variables, elabora las preguntas antes de realizar la entrevista, modifica el orden, la forma de encauzar las preguntas o su formulacin para adaptarlas a las diversas situaciones y caractersticas particulares de los sujetos de estudio. Este tipo de entrevista es muy til en los estudios descriptivos y en las fases de exploracin para el diseo del instrumento de recoleccin de datos. Las ventajas de este mtodo son: Es adaptable y susceptible de aplicarse a toda clase de sujetos en situaciones diversas Permite profundizar en los temas de inters Orienta a posibles hiptesis y variables cuando se exploran reas nuevas.

Entre las desventajas se cita: Se requiere mas tiempo Es mas costosa por la inversin de tiempo con los entrevistadores Se dificulta la tabulacin de datos Se requiere de mucha habilidad tcnica para obtener la informacin y mayor conocimiento del tema

Aun con esas desventajas y dada la utilidad de la entrevista, en sus dos formas, todo investigador debe familiarizarse con su uso, ya que es probable que la aplique en cualquier tipo de investigacin. 17 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Cuestionario Es el mtodo que utiliza un instrumento o formulario impreso, destinado a obtener repuestas sobre el problema en estudio y que el investido o consultado llena por si mismo. El cuestionario puede aplicarse a grupos o individuos estando presente el investigador o el responsable del recoger la informacin, o puede enviarse por correo a los destinatarios seleccionados en la muestra. Debido a su administracin se puede presentar problema relacionados con la cantidad y calidad de datos que pretende obtener para el estudio. Algunos problemas asociados con el envo de los cuestionarios podran ser: que no fuese devuelto; los consultados pueden evadir la respuesta a alguna pregunta o no darle la importancia necesaria a las respuestas proporcionadas. Por ello y otros factores ms, el instrumento que se use para la recoleccin de datos debe ser objeto de una cuidadosa elaboracin. Algunas ventajas del cuestionario son: su costo relativamente bajo, su capacidad para proporcionar informacin sobre un mayor nmero de personas en un periodo bastante breve y la facilidad de obtener, cuantificar, analizar e interpretar los datos. Dentro de las limitaciones de este mtodo figuran las siguientes: es poso flexible, la informacin no puede variar ni profundizarse, si el cuestionario es enviado por correo se corre el riesgo de que no llegue al destinatario o no se obtenga respuesta de los encuestados; adems, resulta difcil obtener una tasa alta de complecin del cuestionario. Debido a esa posible prdida de informacin se recomienda cuando se use este mtodo una muestra ms grande de sujetos de estudio. En general, en el proceso de recoleccin de datos para una investigacin, estos mtodos e instrumentos y fuentes suelen combinarse; cada una con sus ventajas y desventajas, sus caractersticas propias y la informacin que se requiera, dan flexibilidad para que el investigador determine su uso apropiado segn el estudio a realizar. Consideraciones generales para la elaboracin del formulario Si el investigador decide utilizar la observacin regulada, la entrevista o el cuestionario u otra fuente de informacin secundaria como mtodo de recoleccin de datos, debe elaborar un instrumento para obtener la informacin se requiere, siendo el formulario el que se emplea ms frecuentemente. Elaborar el formulario de recoleccin de datos para medir las variables en estudio o para verificar una hiptesis no es tarea fcil. Para disear correctamente un formulario es necesario tomar en consideracin algunos criterios relacionados con su organizacin, las preguntas a plantear segn los objetivos propuestos en la investigacin y las caractersticas fsicas de los formularios. 18 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Organizacin del formulario. Todo formulario debe contener elementos bsicos tales como:

Titulo Instrucciones Identificacin del encuestado y del formulario Servicio o reas especificas Observaciones Identificacin del encuestador

Todo formulario debe tener un nombre o tirulo indicando a que se refiere o que es lo que contiene; en algunos casos debe tenerse precaucin con el titulo que se le d, ya que a veces este prejuicio al encuestado, lo que puede influir en sus respuestas y en los resultados que se desea obtener. Las instrucciones se refieren a las orientaciones que se brindan al consultado sobre como se debe llenar el formulario. Estas deben ser lo suficientemente amplias acerca del tipo y profundidad de la informacin que se desea recoger, as como el lugar y manera en que deben anotarse las respuestas, lo anterior es ms importante cuando se utiliza el cuestionario a distancia o si no est presente el investigador en el momento en que el encuestado contesta el formulario. Cuando participan otras personas en el proceso de recoleccin de datos tambin es necesario elaborar estas instrucciones para que se orienten dnde y cmo anotar las respuestas de los entrevistados; en algunos casos amerita tener un manual de instrucciones por separado o al final del formulario. Cuando se usa el cuestionario auto administrado, adems de las instrucciones es recomendable anexar al formulario una nota o circular dirigida al encuestado, en donde se informe sobre el propsito del estudio, la institucin que patrocina la investigacin y toda otra informacin que despierte por aportar datos exactos y confiables. La identificacin del formulario y del encuestado es otro elemento clave que debe considerarse en su diseo. El formulario debe contener informacin escrita para su identificacin, como: numero, fecha y lugar en que fue o ser llenado; igualmente necesaria es la identificacin de la persona o unidad de estudio, su nmero o clave correspondiente, direccin u otro dato general que facilite su ubicacin. Es frecuente que se presente el interrogante acerca si debe o no aparecer el nombre de la persona encuestada en el instrumento, se estima que ello debe estar sujeto al criterio del investigador o si se necesita esa informacin para los objetivos de su estudio. Al respecto, algunos autores opinan que en los cuestionarios auto administrado el anonimato generalmente contribuye a obtener datos ms veraces y por consiguiente confiables. Otro de los componentes ms importantes del formulario lo constituye su cuerpo central, donde se incluyen las preguntas o "tem" referentes a las variables que medir segn el problema y objetivos del estudio. Este generalmente se organiza en reas o secciones, dependiendo de los aspectos que sean incluidos; en la ubicacin de las reas debe seguirse un orden lgico, agrupando todas las preguntas que se refieren a un mismo tema y continuando secuencialmente con 19 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ las otras reas, por ejemplo, puede iniciarse con el rea referente a datos generales del encuestado o fenmeno que se investigara y continuar con aquellas especificas a las variables en estudio. Tambin es recomendable incluir al final del formulario una seccin para observaciones, donde se registre informacin particular relacionada con el encuestado, con las respuestas al instrumento u otro dato que sirva de referencia para la tabulacin, anlisis e interpretacin de datos. Finalmente, los formularios deben contener como dato de identificacin del investigador el nombre de la persona que recoger la informacin, adems debe registrarse la fecha y lugar donde se aplique el formulario. Preguntas del formulario. Uno de los aspectos relevantes a considerar en el diseo del formulario es el de las preguntas o "tem" del mismo; estas determinan en ltima instancia el alcance y logro de los objetivos de investigacin, y a travs de ellas se medirn las variables en estudio, obteniendo la informacin pertinente. As mismo, debe considerarse, entre otras: tipo de preguntas, su redaccin, nmero y orden. Referente al tipo de preguntas se consideran dos: dicotmicas y las de respuestas mltiples. Las primeras son las que tienen dos alternativas; un ejemplo de estas puede ser aquella cuya respuesta es s_____ o no_____. La de respuestas mltiples son las preguntas con varias alternativas, donde el encuestado debe recoger mltiples alternativas, ya que con una pregunta se obtiene mayor informacin que con las dicotmicas. Lo anteriormente expuesto se aclara con el siguiente ejemplo: Dicotmica Posee casa propia si_________ no________ La casa donde vive es alquilada si_________ no________ La casa donde vive la est pagando si_________ no________ Respuesta Mltiple La casa donde vive: Es propia ______ La esta pagando ______ Es alquilada ______ A las preguntas dicotmicas y de seleccin mltiples se les llama cerradas o estructuradas, ya que al lado de ellas se anotan varias respuestas posibles entre las que el sujeto de estudio o entrevistado deber optar. En la elaboracin de este tipo de preguntas debe tenerse presente que las alternativas de respuesta deben ser mutuamente excluyentes. Este tipo de preguntas tienen la ventaja de requerir menos tiempo y menos destreza del entrevistador, as como facilitar la tabulacin de la informacin obtenida. 20 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Tambin existen las preguntas abiertas, donde no se le da al encuestado las posibles respuestas, permitindole responder libremente sobre la base de marco de referencia; as, el encuestador se limita a registrar las respuestas segn fue brindada. Se les llama tambin preguntas no estructuradas, y tienen la desventaja de dificultar la tabulacin de los datos por la diversidad de respuestas que se obtienen. Entre los formularios es frecuente observar el uso de ambos tipos de preguntas; sin embargo, se estima que con las preguntas cerradas es necesario tener un conocimiento amplio sobre el tema y las posibles respuestas; cuando se carece de este conocimiento es recomendable formular preguntas abiertas. Respecto a la redaccin de la preguntas, se considera que es uno de los aspectos que deben tratarse muy cuidadosamente, para ello se proporcionan algunas recomendaciones: Las preguntas deben redactarse lo ms claramente posible, sin dejar dudas acerca del grado de precisin que se espera de las respuestas. A manera de ejemplo, si se indaga sobre el sueldo de una persona debe aclararse si se desea conocer el "nominal" o el "efectivo", "sueldo semanal", "quincenal" o "mensual". El lenguaje usado debe ser simple y comprensible por los encuestados, no se deben usar tecnicismos o palabras desconocidas por ellos, as como tener precaucin con el uso de palabras que tienen significado diferentes para cada persona como "mucho", "poco", "frecuentemente". Las preguntas deben ser especficas, conteniendo una sola idea y evitando las interrogantes dobles o mltiples. Por ejemplo: "Planea usted estudiar este ao y trabajar el prximo?", si la respuesta es "no", cabe preguntarse a que aspecto de la interrogante esta respondiendo la persona negativamente. Las peguntas deben formularse de una manera neutral o imparcial, evitando las interrogantes negativas o positivas que induzcan o favorezcan una respuesta.

Ejemplos de preguntas incorrectas son las siguientes: Se opone usted a que el personal se capacite a travs del mtodo de educacin a distancia? Favorece usted que el personal se capacite a travs del mtodo de educacin a distancia?

Probablemente estara mejor redactado de la siguiente manera: Cul es su opinin sobre la aplicacin del mtodo de educacin a distancia para capacita el personal?

Es de observarse que no induce ni negativa ni positivamente la respuesta; es neutral e imparcial. Esta pregunta convendra que se dejara abierta

21 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Las preguntas no deben sugerir que una respuesta es ms deseable que otras. Hay interrogantes que plantean directa e indirectamente las respuestas probables que desea el encuestador. Ejemplo: "esta de acuerdo con el trabajo actual, no es cierto?". Aunque el consultado este inconforme se le induce a decir que si est de acuerdo con el mismo. Las preguntas requieren plantearse de tal manera que se obtenga la informacin amplia y completa para los fines del estudio. Si se desea conocer las revistas o referencias que reciben o leen los distintos agentes de salud para su capacitacin y formacin general, probablemente no bastar saber el nombre de las revistas sino tambin la frecuencia y que secciones o reas lee de esas revistas.

Existe otra serie de consideraciones, aunque se estima que se han planteado algunas de las relevantes. Otro aspecto referente a las preguntas es el orden de ubicacin segn las secciones a reas del formulario. Conviene ubicar primero las preguntas simples y neutrales y posteriormente las mas difciles y las de ndole personal; las iniciales deben ser fciles de contestar y no despertar reacciones negativas en el encuestado, ya que pueden afectar las respuestas y la disposicin a responder el resto del formulario. El orden psicolgico debe tenerse muy en cuenta, ubicando en el centro o al final de las secciones o del formulario las preguntas personales sobre datos que usualmente no son brindados por las personas, tales como ingreso econmico y vida sexual. En relacin con nmero de preguntas que deben incluirse en el formulario, no se tiene una cantidad determinada, aunque cabe tener presente que este debe mostrar una extensin y mbito ilimitado, lo cual estar supeditado al tipo de problema y la medicin de las variables en estudio. Tambin depende de los recursos disponibles, la calidad de la informacin requerida y las caractersticas del encuestado. Caractersticas fsicas del formulario. El aspecto externo de un formulario puede influir favorablemente en las respuestas de un entrevistado, as como facilitar el manejo de estas para la tabulacin de los datos. Es recomendable que sea de un tamao que facilite su uso, no debiendo ser mayor de 22 cm. x 33 cm.; el tipo de letra y el tamao deber ser legible y contener espacios apropiados que faciliten la lectura y respuesta de las preguntas. Si los datos recolectados han de ser procesados mecnicamente, el formulario debe estar diseado de tal forma que facilite las diferentes etapas del proceso. Sobre las caractersticas del formulario cabe mencionar el uso del papel de diferentes colores, lo cual es recomendable cuando se tiene una muestra muy grande, y esta ser clasificada por estratos u otra variable en particular, ya que facilita la identificacin de los formatos y manipulacin de los mismos. La calidad del papel tambin debe tomarse en cuenta en el diseo del formulario; se estima que si los instrumentos sern manejados continuamente en el 22 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ procesamiento, tabulacin y anlisis de datos, o si se van a conservar formularios durante un periodo prolongado, es necesario considerar el uso de papel de buena calidad que asegure su durabilidad y resistencia. Requisitos de un instrumento de medicin Al elaborar los instrumentos de recoleccin de datos es necesario analizar en que forma dicho instrumento de medicin cumple con la funcin para la cual ha sido diseado. Este anlisis debe realizarse antes de iniciar la recoleccin de datos, lo que permitir introducir las modificaciones necesarias antes de su aplicacin. Las caractersticas de cada instrumento de medicin pueden ser mltiples; sin embargo, hay dos que pos su relevancia son fundamentales, ya que si los instrumentos no llenan estos requisitos, los datos recolectados tendrn limitaciones importantes. Estas cualidades son: confiabilidad y validez. El termino confiabilidad se refiere a la capacidad del instrumento para arrojar datos o mediciones que corresponden a la realidad que se pretende conocer, o sea, la exactitud de la medicin, as como a la consistencia o estabilidad de la medicin en diferentes momentos. Se dice que un instrumento es confiable si se obtienen medidas o datos que representen el valor real de la variable que se esta midiendo y si estos datos o medidas son iguales al ser aplicados a los mismos sujetos u objetos en dos ocasiones diferentes, o al ser aplicados por diferentes personas. Por ejemplo, se dice que una prueba es confiable si, al administrar a una persona en condiciones similares en dos ocasiones se obtienen resultados semejantes, o si el mejor estudiante en la primera aplicacin de la prueba tambin obtiene la nota mas alta en la segunda. Al elaborar instrumentos es necesario tener en cuenta las recomendaciones para aumentar la confiabilidad; algunas de stas se mencionan a continuacin: 1. Aplicar las reglas generales de elaboracin de instrumentos, de tal forma que se eliminen los errores de medicin (preguntas ambiguas). 2. Aumentar el nmero de preguntas sobre determinado tema. 3. Elaborar instrucciones claras que orienten el llenado o utilizacin de los instrumentos. 4. Aplicar los instrumentos o realizar las mediciones en condiciones similares. La validez es otra caracterstica importante que deben poseer los instrumentos de medicin, entendida como el grado en que un instrumento logra medir lo que se pretende medir. O sea: cuando una prueba para evaluacin del aprendizaje mide el grado en que han sido alcanzados los objetivos educacionales establecidos previamente, esta prueba ser valida.

23 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Esta caracterstica se considera fundamentalmente para un instrumento, pues es requisito para lograr la confiabilidad. La situacin opuesta no es necesariamente cierta, es decir, un instrumento puede ser confiable sin ser valido. De modo que, si se desea determinar el grado de conocimiento de un grupo de estudiantes sobre epidemiologa bsica y la prueba contiene una gran cantidad de preguntas sobre el enfoque de riegos (que no es tratado en epidemiologa bsica), la prueba se considera confiable porque seria constante en resultados bajos, pero no valida por cuanto no mide lo que se desea. Hay muchas formas de determinar y aumentar la validez de un instrumento; si embargo, a los efectos prcticos se considere que lo mas importante es construir los instrumentos una vez que las variables han sido claramente especificadas y definidas, para que sean stas las que aborden en el instrumento y no otras; tambin se puede recurrir a la ayuda de personas expertas en el tema que se esta investigando para que revisen el instrumento, a fin de determinar si cumple con la finalidad establecida. Pasos que deben seguirse en la elaboracin de instrumentos. Una vez que han sido elegido el tipo de instrumento que se utilizar en la recoleccin de datos, lo cual se hace de acuerdo con una serie de consideraciones, puede pasarse a la elaboracin del instrumento propiamente dicha, lo que puede facilitarse siguiendo una series de pasos que se explican a continuacin: Paso 1. decidir cul ser la unidad a la se aplicar el instrumento Paso 2. considerar las caractersticas importantes de la unidad de observacin o sujeto con relacin al instrumento Paso 3. determinar la informacin que se recoger Paso 4. Determinar la estructura del instrumento:
o o o o

reas o secciones Formato general Paso 5. Disear el instrumento: Elaboracin de preguntas o tem Anlisis de preguntas o tem segn alcance y estructura Paso 6. Probar el instrumento Paso 7. Revisar y reproducir el instrumento

Explicacin de los pasos en la elaboracin de instrumentos: Paso 1: Una ver determinado el tipo de instrumento que ser utilizado, es necesario decidir a quienes se aplicara para la obtencin de datos, ya que no siempre se aplica a la unidad de estudios. Por ejemplo, un instrumento puede estar diseado para recabar informacin sobre los hbitos nutricionales del nio; sin embargo, quien dar la informacin ser la madre.

24 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Paso 2: Antes de iniciar la aplicacin del instrumento es indispensable precisar las caractersticas del grupo de individuos al cual ser aplicado. Esto se hace con el fin de tomar en consideracin en el instrumento aspectos condicionantes de la fuente de informacin, tales como nivel cultural, accesibilidad y otros. Paso 3: Para determinar la informacin que se obtendr es necesario establecer los aspectos de las variables que se desea incluir en el instrumento. Paso 4: Es importante considerar el formato general del instrumento, aso como decidir las reas o secciones que deben tener, tales como instrucciones, datos generales y datos especficos, segn las variables que se estn estudiando. Paso 5: En esta etapa se procede a la construccin del cuerpo del instrumento segn el formato decidido, o sea, a la elaboracin de las preguntas o incisos, si es un instrumento de observacin. A continuacin debe analizarse cada una de la partes en relacin con los objetivos y las variables, considerando si cada pregunta abarca la informacin que se espera obtener.

Tomando en cuenta que este es el paso que asegura la calidad del instrumento y la validez del estudio, es necesario destacar, por su importancia que amerita toda la atencin del investigador. Paso 6: Antes de aplicar el instrumento debe hacerse una prueba de campo a fin de determinar su calidad y los ajustes que amerite. La calidad del instrumento se determina en funcin de:
o o o o o

Claridad de las preguntas o tem y del lenguaje Cantidad de preguntas e tem Formato y cuerpo Ordenamiento y secuencia de las preguntas Claridad de las instrucciones

La prueba de campo sirve, adems, para determinar otros aspectos, como:


Costo y duracin de la aplicacin del instrumento Necesidad de preparacin del personal a cargo de la recoleccin de datos

La prueba de campo debe ser aplicada a un grupo de sujetos que tengan caractersticas similares a las de la poblacin que ser estudiada, pero no es conveniente que sujetos que han participado en la prueba sean incluidos en la etapa de recoleccin definitiva de informacin. Paso 7: La revisin final se hace con posterioridad a la prueba de campo; hecha esta, procede la impresin o reproduccin del instrumento.

Aspectos Importantes sobre: Las Entrevistas y los Cuestionarios. 25 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Los conceptos que interesan al investigador deben traducirse en fenmenos observables y registrables. De aqu que la definicin de la variables de investigacin y la seleccin o desarrollo de mtodos adecuados para recabar datos, constituye una de las tareas ms excitantes del proceso de investigacin, ya que si el experimentador no cuenta con mtodos de alta calidad para recolectar datos, deber siempre cuestionar la precisin y pertinencia de sus conclusiones. As como sucede en el caso del diseo de la investigacin y el muestreo, el investigador debe con frecuencia elegir a partir de un conjunto de alternativas para decidir de qu modo habr de recabar la informacin. Los mtodos de recoleccin de datos difieren en varios aspectos importantes: Estructura. Los datos de una investigacin suelen recabarse de acuerdo con un plan estructurado que indica el tipo de informacin que debe reunirse y la forma exacta en la que habr de recolectarse. Sin embargo, a veces resulta adecuado establecer un mnimo de estructura y ofrecer al sujeto la oportunidad de revelar informacin pertinente de manera natural, como sucede en el caso de los estudios de campo. Posibilidad de cuantificar. Los datos que se sometan a anlisis estadsticos deben recabarse de tal forma que sea posible cuantificarlo. Por otra parte, valga considerar que los datos que habrn de cuantificarse a menudo se recaben de manera narrativa. Los enfoques de recoleccin estructurada de datos, por lo general, aportan los que pueden cuantificarse con mayor facilidad, si bien, suele ser igualmente posible intil cuantificar informacin no estructurada. Intervencin del investigador. Los mtodos de recoleccin de datos difieren conforme el grado en que los sujetos se percaten de su propia categora de sujetos ya que es posible que al estar plenamente conscientes de la funcin que desempean en el estudio no exhiban comportamiento y respuestas "normales". No obstante, en la recoleccin discreta pueden surgir problemas ticos. Objetividad. Algunos de los enfoques para la recoleccin precisan mayor nmero de juicios subjetivos que otros. Pese a que el cientfico generalmente se esfuerza por obtener mtodos que sean lo mas objetivos posible, en algunas investigaciones (particularmente las que se fundamentan en observaciones fenomenolgicas) el criterio subjetivo del investigador constituye un valioso componente de la recoleccin de datos. A veces la naturaleza del planteamiento de la investigacin dicta en qu parte de estos cuatro puntos se ubicara el mtodo de recoleccin de datos. Por ejemplo, las preguntas requeridas para un estudio de campo, por lo general, no satisfacen completamente las cuatro condiciones anteriores, en tanto que los planteamientos formulados en encuestas se acatan en su mayor parte a ellas. Sin embargo, el investigador suele contar con considerable flexibilidad para seleccionar o disear un plan adecuado de recoleccin de datos.

26 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ SEGUNDA UNIDAD: ORGANIZACIN Y REPRESENTACIN DE DATOS OBJETIVOS: Despus de estudiar est unidad se estar en condiciones de: Explicar la diferencia entre dato e informacin. Analizar la necesidad de organizar y resumir datos. Utilizar e interpretar la notacin de suma con sigma. Identificar, comparar y contrastar mtodos numricos para resumir datos. Elaborar una distribucin de frecuencia para cada tipo de datos.

Lema: La sabidura se nos da gota a gota mezclada con sangre, sudor y lgrimas. REPRESENTACIN GRFICA DE LOS DATOS GRFICAS Y REPRESENTACIONES TALLO HOJA Una vez recopilados los datos muestrales, uno debe familiarizarse con ellos. Una de las formas ms tiles para lograr este objetivo es la utilizacin de una tcnica exploratoria inicial que es el resultado de una representacin grfica de los datos. Dicha representacin revela en forma visual los patrones de comportamiento de la variable estudiada. Existen varios tipos de grficas para describir datos. El mtodo que se utilice estar determinado por el tipo de datos y lo que se quiere encontrar. Nota: desde el principio hay que percatarse de que no hay una respuesta correcta nica cuando se construye una representacin grfica. La experiencia del analista y las circunstancias que rodean el problema jugarn un papel primordial en la construccin del diagrama. GRFICAS CIRCULARES Y DE BARRAS A menudo se utilizan las grficas llamadas circulares y de barras para representar datos cualitativos o atributos. Seguramente se conocen ya varios ejemplos de este tipo de diagramas. En la siguiente tabla se enlista el nmero de casos de cada tipo de operacin quirrgica realizada el ao pasado en un cierto Hospital General. Representar los mismos datos en un grfica circular, donde cada tipo de operacin se represente proporcional y porcentualmente. Tabla nmero 1: Operaciones realizadas en el Hospital General. 27 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Tipo de operacin Torcica Huesos y articulaciones Ojos, odos, nariz y garganta. General Abdominal Urolgica Proctolgica Neurociruga TOTAL GENERAL REPRESENTACIONES TALLO HOJA La tcnica para compendiar datos numricos conocida como representacin tallo hoja en ingls (stem and leaf) ha ganado popularidad recientemente. Estas representaciones son idneas para aplicarse en el uso de la computadora. Dicha tcnica es una combinacin de dos procedimientos: uno grfico y otro de ordenacin. (ordenar datos es formar una lista de ellos en un orden dado de acuerdo con su valor numrico.) Los valores de los datos se utilizan para efectuar tal ordenacin. El tallo se forma con el (los) primer (os) dgito (s) del dato, mientras que la hoja se forma con los dems dgitos siguientes. Por ejemplo, el valor numrico 458 se dividira en 45 8 como se muestra a continuacin. Dgitos Iniciales Utilizados en la ordenacin Dgitos Sucesivos 45 8 Mostrados en la representacin. Casos 20 45 58 98 115 74 65 23 498

Ejemplo: Construir una representacin tallo hoja para el siguiente conjunto de 20 calificaciones. 82 62 74 68 88 72 66 92 58 86 74 76 78 52 84 76 96 82 76 78

En una inspeccin rpida se observa que hay valores en los grupos de 50, 60, 70, 80 y 90. El primer dgito de cada valor debe utilizarse como tallo, y el segundo como hoja. La representacin tallo hoja que resulta es: 20 calificaciones de examen 5 8 2 6 6 2 8 7 4 4 8 6 2 6 6 8 8 2 8 4 6 2 9 6 2

28 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================

Grficas estadsticas 1 INTRODUCCIN Grficas estadsticas, representaciones grficas de los resultados que se muestran en una tabla estadstica. Pueden ser de formas muy diversas, pero con cada tipo de grfica se cumple un propsito. Por ejemplo, en los medios de comunicacin, libros de divulgacin y revistas especializadas se encuentran multitud de grficas estadsticas en las que, con notable expresividad, se ponen de manifiesto los rasgos de la distribucin que se pretende destacar. Los diagramas de barras, los diagramas de sectores, los histogramas y los polgonos de frecuencias son algunas de ellas. 2 DIAGRAMA DE BARRAS En este tipo de grfica, sobre los valores de las variables se levantan barras estrechas de longitudes proporcionales a las frecuencias correspondientes. Se utilizan para representar variables cuantitativas discretas. El diagrama de barras siguiente representa la distribucin del nmero de hijos de 43 familias:

3 HISTOGRAMA Y POLGONO DE FRECUENCIAS Los histogramas se utilizan para representar tablas de frecuencias con datos agrupados en intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de un rectngulo cuya altura es proporcional a la frecuencia correspondiente. El histograma que se muestra a continuacin es el 29 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ correspondiente a la tabla de frecuencias con intervalos adjunta (1.200 calificaciones distribuidas en 10 intervalos):

Si se unen los puntos medios de la base superior de los rectngulos se obtiene el polgono de frecuencias. 4 HISTOGRAMA Y POLGONO DE FRECUENCIAS ACUMULADAS Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polgono. He aqu los que se obtienen de la tabla de 1.200 calificaciones:

5 DIAGRAMA DE SECTORES

30 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ En un diagrama de este tipo, los 360 de un crculo se reparten proporcionalmente a las frecuencias de los distintos valores de la variable. Resultan muy adecuados cuando hay pocos valores, o bien cuando el carcter que se estudia es cualitativo. El diagrama de sectores siguiente refleja el resultado de una encuesta (realizada a 300 personas) sobre los tipos de pelcula preferidos por el pblico en general:

Microsoft Encarta 2009. 1993--2008 Microsoft Corporation. Reservados todos los derechos. EJERCICIOS 1. En un curso donde se utilizaron computadoras se distribuy un cuestionario a 200 estudiantes. Una de las cuestiones era Me gusta utilizar las computadoras. Las apreciaciones a esta interrogante fueron: Respuestas Nmero Totalmente de acuerdo 50 De acuerdo 75 Apenas de acuerdo 25 Apenas en desacuerdo 15 En desacuerdo 15 Totalmente en desacuerdo 20 Trace una grfica de barras que represente las respuestas. 2. Una compaa de gas y electricidad utiliza varias fuentes para generar energa. En el cuadro siguiente se presentan las fuentes y los porcentajes de energa obtenidos de cada una el ao pasado y los diez aos atrs. Fuente de energa Carbn Nuclear Gas Otro (Incluye en Hace 10 aos 16.8 % 26.9 % 55.9 % 0.4 % El ao Pasado 62.6 % 34.1 % 2.9 % 0.4 % 31 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

el

ESTADSTICA GENERAL ================================================================ petrleo) TOTAL 100.0 % 100.0 %

Elabore una grfica de barras horizontales para estos datos. Site los porcentajes en el eje horizontal y las fuentes de energa en el eje vertical. 3. La distribucin del nmero de acciones en poder de los accionistas de una compaa de gas y alumbrado es la siguiente: Nmero de acciones que poseen 1 99 100 249 250 999 1000 o ms Proporcin del total 0.43 0.41 0.14 0.02 1.00

Construya una grfica circular que muestre la distribucin del nmero de acciones que tienen por los accionistas. 4. En la siguiente representacin tallo hoja se indica el nmero de das que pasa un paciente bajo tratamiento, de acuerdo con una muestra aleatoria seleccionada de los registros de una clnica. 1 2 3 4 5 5 0 4 1 0 1 2 4 3 5 5 0

a. Cuntos pacientes estn representados? b. Cul fue el perodo de tratamiento ms corto? c. Cul fue el perodo de tratamiento ms largo? d. Cul fue el perodo de tratamiento ms frecuente? 5. Construya una representacin tallo hoja para los datos siguientes: 13.7 14.0 13.7 10.5 15.6 12.4 11.3 11.2 11.7 12.8 11.2 11.4 13.9 15.1

32 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 6. Se utiliz un contador Geiger electrnico para contar el nmero de emisiones radiactivas en un perodo de 10 segundos. El experimento fue repetido 22 veces, obtenindose las cuentas siguientes: 8 22 23 21 18 37 22 19 22 22 15 22 21 12 23 27 25 16 18 26 24 32

Construya una representacin tallo hoja de estos datos. 7. En el primer da de clases del semestre pasado se pregunt a 50 estudiantes de administracin y contabilidad acerca del tiempo requerido para desplazarse de su casa a la URACCAN. Los datos resultantes fueron los siguientes: 20 35 25 15 5 20 25 30 20 20 30 15 15 20 20 25 25 20 20 10 20 25 45 20 5 25 40 25 25 20 30 25 35 20 30 15 30 25 20 10 10 5 10 15 25 40 25 10 20 15

Construya una representacin tallo hoja de estos datos. DISTRIBUCIN DE FRECUENCIAS Una simple lista de un conjunto de datos grande no le dice gran cosa a un lector. Algunas veces se desea condensar los datos en una forma ms manejable. Esto puede lograrse con la ayuda de una distribucin de frecuencias. DISTRIBUCIONES DE FRECUENCIAS Utilcese el siguiente conjunto de datos para mostrar el concepto de distribucin de frecuencias. 3 4 4 2 4 3 2 1 2 3 2 0 2 2 2 33 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 2 1 3 3 1

Una distribucin de frecuencias representa este conjunto de datos si cada valor se denota por x junto con sus frecuencias respectivas. Por ejemplo, el valor 3 ocurre tres veces en la muestra; por lo tanto, la frecuencia para x = 1 es 3. La frecuencia f es el nmero de veces que ocurre el valor de x en la muestra. Esta es una distribucin de frecuencias no agrupada. No agrupada significa que los valores de x no se combinan para formar grupos, sino que cada x es un grupo en s. La representacin tallo hoja siguiente, muestra grficamente una distribucin de frecuencias agrupadas. A cada tallo corresponde una clase. X 0 1 2 3 4 F 1 3 8 5 3

El procedimiento tallo hoja se puede utilizar para construir una distribucin de frecuencias; sin embargo, la representacin del tallo no es compatible con todos los anchos de clase. Por ejemplo, es complicada la utilizacin de anchos de clase iguales a 3, 4, o 7. Por lo tanto, en ocasiones ser ventajoso tener otro procedimiento para construir una distribucin de frecuencias agrupadas. Utilicemos una muestra de 50 calificaciones obtenidas en un examen final de estadstica para ilustrar este mtodo de agrupacin (o clasificacin). Las 50 calificaciones ordenadas de manera ascendente se muestran en la tabla siguiente : 27 43 43 44 47 49 50 54 58 65 68 71 71 71 73 73 74 75 76 77 1. 2. 79 80 81 82 82 84 84 86 88 88 91 91 93 94 94 94 96 97 103 106 107 108 108 116 120 120 122 123 127 128

Cada clase debe tener la misma amplitud. Las clases deben establecerse de manera que no se traslapen (que sean ajenas) y por tanto, cada dato debe permanecer exclusivamente a una clase. 34

============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================

Otros tres pasos adicionales tiles (aunque no necesarios) son: 3. 4. 5. Es deseable que en los ejercicios propuestos se consideren entre 5 y 12 clases. Con frecuencia es conveniente que el ancho de clase sea un nmero impar. Para garantizar precisin, utilcese un procedimiento aritmtico que asegure un patrn numrico reconocible fcilmente. (Esto se mostrar en el ejemplo siguiente.)

Procedimiento: 1. Identifique los puntajes mximo y mnimo ( H = 128, L = 27) y obtenga la amplitud. Amplitud = H L = 128 27 = 101 2. Seleccione un nmero de clases ( m = 10 ) y un ancho de clase ( c = 11 ) de manera que el producto ( mc = 110 ) sea un poco mayor que la amplitud o intervalo total ( amplitud = 101 ) 3. Elija un valor inicial. Este valor inicial debe ser un poco ms pequeo que el puntaje mnimo L. Supngase que inicia en 22; contando en mltiplos de 11 (ancho de la clase) a partir de este nmero inicial, obtenemos 22, 33, 44, 55, ... , 132. Estos ltimos valores se llaman lmites inferiores de clase. (Como son mltiplos de once, su regla de formacin es fcilmente reconocible.) El lmite inferior de clase es el valor ms pequeo que puede asignarse en cada clase. Lmites superiores de clase son los valores de mayor magnitud que pueden asignarse a cada clase. En el presente ejemplo las clases son:

22 32 33 43 44 54 55 65 66 76

77 87 88 98 99 109 110 120 121 131

35 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Notas 1. 2. El ancho de clase es la diferencia entre un lmite inferior de clase y el lmite inferior de la siguiente clase. (No es la diferencia entre los lmites superior e inferior de la misma clase.) Las fronteras de clase son nmeros que no estn presentes en los datos muestrales, sino que se localizan en medio del lmite superior de una clase y del lmite inferior de la clase siguiente. En el ejemplo anterior, las fronteras de clase son 21.5, 32.5, 43.5, 54.5, ... , 120.5, y 131.5 La diferencia entre las fronteras inferior y superior de una clase se denomina tambin ancho de la clase. Una tabla estndar es til cuando se clasifican datos.

3.

Presentacin de una distribucin de frecuencias en una tabla estndar. Nmero de clase 1 2 3 4 5 6 7 8 9 10 Lmites de clase 22 - 32 33 - 43 44 - 54 55 - 65 66 - 76 77 - 87 88 - 98 99 - 109 110 - 120 121 - 131 Cuenta datos 1 2 5 2 9 9 10 5 3 4 de los Frecuencia (f) 1 2 5 2 9 9 10 5 3 4 50

Una establecidas las clases es necesario registrar los datos (tabla anterior). Si han sido ordenados este registro es innecesario; en caso contrario, se deben registrar cuidadosamente. La frecuencia f de cada clase es el nmero de datos que pertenecen a dicha clase. La suma de las frecuencias debe ser exactamente igual al nmero n de datos (n = f ) Esta suma constituye una buena forma de verificacin. En la tabla siguiente hay una columna para la marca de clase, x. La marca de clase (llamada algunas veces punto medio de clase) es el valor numrico situado exactamente en la parte central de cada clase.

Nmero de clase

Lmites de clase

Marca de clase (x) 36

============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 1 2 3 4 5 6 7 8 9 10 22 - 32 33 - 43 44 - 54 55 - 65 66 - 76 77 - 87 88 - 98 99 - 109 110 - 120 121 - 131 1 2 5 2 9 9 10 5 3 4 50 27 38 49 60 71 82 93 104 115 126

En la tabla anterior las marcas de clase son: X1 = 22 + 32 = 27, 2 X2 = 33 + 43 2 = 38, etc.

37 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Notas: 1. 2. La moda es el valor del dato que ocurre con la mayor frecuencia. La clase modal es la clase con la frecuencia mayor. EJERCICIOS 1. Los cambios porcentuales mensuales en el ndice de precios al consumidor despus del 10 de enero del presente ao (2001) y en los doce primeros das fueron: 1.0 a. 2. 21 19 21 20 18 19 20 19 20 21 a. 3. 0.6 0.4 0.7 0.7 1.2 0.8 1.2 0.4 0.5 0.4

0.7

Elabore una distribucin de frecuencias de esos valores.

Las edades de 50 bailarinas que se presentaron a un concurso de seleccin para comedia musical fueron: 22 21 21 19 19 19 22 21 21 18 18 21 19 21 22 20 20 19 22 21 23 22 20 19 24 19 20 19 19 20 19 21 19 21 24 20 20 19 19 17

Construya una distribucin de frecuencias no agrupadas de estas edades.

Una prueba de aptitud en ciencias de la computacin fue aplicada a 50 estudiantes; obtenindose la siguiente distribucin de frecuencias de sus calificaciones o puntaje. Frecuencia 4 8 8 20 6 3 1

Puntaje en la prueba 0-3 4-7 8 - 11 12 - 15 16 - 19 20 - 23 24 - 27 a. b. c.

Obtenga todas las fronteras de clase asociadas a esta distribucin de frecuencias. Calcule todas las marcas de clase asociadas a esta distribucin. Cul es el ancho de la clase?

38 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================

TERCERA UNIDAD: NDICES ESTADSTICOS Lema: El amor hacia los dems comienza con el amor a aprender OBJETIVOS: 1. 2. Determinar las diferentes medidas de tendencia central de datos de una muestra: media, mediana y moda. Calcular las diversas medidas de dispersin de datos muestrales: amplitud de variacin, desviacin estndar, variancia y desviacin absoluta media. Calcular las medidas de resumen para la tendencia central y la dispersin para datos agrupados. DESARROLLO MEDIDAS DE TENDENCIA CENTRAL: Media, Mediana y Moda. Las medidas de tendencia central son valores numricos que tienden a localizar, en algn sentido, la parte central de un conjunto de datos. A menudo el trmino promedio se asocia a estas mediciones. Cada una de las diferentes medidas de tendencia central puede recibir el nombre de promedio. MEDIA: Para encontrar la media X (lase x con raya), el promedio con el que probablemente est ms familiarizado, se suman todos los valores de la variable x (simbolizada por x) y se dividen entre n, el nmero de esos valores. Se expresa con la frmula: Media muestral = X = x n

3.

Ilustracin: un conjunto de datos consiste en los cinco valores 6, 3, 8, 5 y 3. Obtener la media. Solucin: al utilizar la frmula anterior resulta:

X= 6+3+8+5+3 5 La media de la muestra es 5.

25

=5

39 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Tambin puede calcularse la media mediante el uso directo de la distribucin de frecuencias, obteniendo los productos o extensiones xf multiplicando cada valor de x por la frecuencia f correspondiente, resultando as el total. Esta cantidad es la suma de los datos. Por lo tanto puede encontrarse la media de una distribucin de frecuencias dividiendo la suma de los datos, xf entre el tamao de la muestra, f de esta manera la frmula de la media puede escribirse de la forma siguiente: X = xf f En el ejemplo anterior resultara: x 3 5 6 8 X 3 5 6 8 Total X= F 2 1 1 1 f 2 1 1 1 5 6 5 6 8 25 xf

25 5

=5

MEDIANA: La mediana x es el valor ocupado por la posicin central cuando los datos se ordenan de acuerdo con su magnitud. Ejemplo: 3 5 6 8

x=5 Nota: observe que el 5 est en la tercera posicin, o sea la central, de los cinco nmeros. Por lo tanto, la mediana es 5. La posicin de la mediana se determina por la frmula: Posicin de la mediana = d(x) = n+1 2 40 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ donde 1 es la posicin del dato con el valor ms pequeo, y n es la posicin del dato con el valor ms grande. As, la posicin de la mediana se obtiene sumando las posiciones de los datos mayor y menor y dividiendo posteriormente entre 2. La mediana ser exactamente el valor central del conjunto de datos cuando n sea un nmero impar. Sin embargo, la posicin de la mediana ser siempre la mitad de algn nmero cuando n es par. OTROS PROMEDIOS La moda es el valor de x que ocurre con mayor frecuencia. En el conjunto de datos 3, 3, 5, 6, 8, la moda es 3. La moda en la muestra 6, 7, 8, 9, 9, 10, es igual a 9. Si sucede que dos o ms valores tienen la misma frecuencia ms alta, se dice que no existe la moda. Por ejemplo, en la muestra 3, 3, 4, 5, 5, 7, tanto 3 como 5 aparecen igual nmero de veces. No hay un valor nico que aparezca con mayor frecuencia. Por tanto, esta muestra carece de moda. Otra medida de tendencia central es el centro de amplitud (en ingls midrange). Un conjunto de datos siempre tiene un extremo inferior L y otro superior H. El punto medio o centro de amplitud es un nmero situado entre ellos, exactamente en la parte central. Se le encuentra promediando los extremos inferior y superior: Punto medio de la amplitud = L + H 2 Para la muestra 6, 7, 8, 9, 9, 10 se tiene que L = 6 y H = 10 Por lo tanto, el centro de la amplitud es: 6 + 10 2 =8

Las cuatro medidas de tendencia central vistas hasta aqu representan cuatro mtodos para describir el centro de un conjunto de datos. Estudio de un Caso. EL TRMINO PROMEDIO TIENE DIFERENTES SIGNIFICADOS En trminos de conveniencia, pocas cosas pueden instrumento matemtico llamado promedio. igualar a ese maravilloso

41 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Qu til es! Mediante un promedio, se puede tomar un puado de cifras sobre cualquier tema Temperatura, ingresos, velocidades, poblaciones, aos luz, anchos de cabello, cualquier cosa que pueda ser medida y calcular una cifra que representar al conjunto por completo. Sin embargo debe recordarse una cosa. Existen varias clases de mediciones conocidas comnmente como promedios. Y cada uno presenta un panorama diferente sobre las cifras que representa. Como ejemplo, tomemos los ingresos anuales (dlares) de diez familias: $ 45000 $ 39000 $ 37500 $ 36750 $ 32250 $ 31500 $ 31500 $ 31500 $ 31500 $ 22500

Cul es el ingreso tpico en este grupo? Promediar podra proporcionar la respuesta, as que calculemos el ingreso tpico por los tipos promedios ms simples y de uso ms frecuente. La media (aritmtica). Cuando alguien se refiere a un promedio sin especificar el tipo, muy probablemente se refiere a la media aritmtica. Es la forma de promedio ms comn, y se obtiene sumando los elementos de una serie de nmeros y dividiendo entre el nmero de elementos. En el ejemplo, la suma de los diez ingresos dividida entre 10 es $ 33,900. La mediana. Como se puede haber observado, seis familias ganan menos que la media, mientras que cuatro ganan ms. Podra representarse este grupo con el ingreso de la familia que est situado exactamente en la parte central de todos los ingresos. Para esto se necesita determinar la mediana. Sera fcil si hubiera 11 familias en el grupo. Al ordenar los ingresos de menor a mayor ( o de mayor a menor), la familia con el sexto ingreso de la ordenacin tendra la mediana de los ingresos. Sin embargo con diez familias no se tiene una familia de enmedio. Por tal razn se suman los dos ingresos centrales (31500 y 32250) y se dividen entre 2. La mediana es igual a $ 31875, menor que la media. El centro de amplitud. Es claro que la mediana es el elemento central en la serie de nmeros. Otro nmero que puede ser utilizado para representar al grupo es el punto central de la amplitud, calculado como la cifra que est a la mitad entre el ingreso ms alto y el ms bajo: para calcular esta cifra se suman los ingresos mayor y menor ($ 45000 y $ 22500), se divide entre 2 y resulta la cantidad $ 33750, que est a la mitad de los extremos. 42 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ La moda. Hasta ahora se han obtenido tres clases de promedios y ninguna familia tiene un ingreso igual a alguno de los valores hallados. Ahora se quiere representar al grupo estableciendo el ingreso que ocurre con mayor frecuencia. Esa clase de representatividad recibe el nombre de moda. En este ejemplo el ingreso modal es $ 31500. Se han obtenido cuatro promedios diferentes, cada uno es vlido, correcto e informativo a su manera. Pero que distintos son! Media aritmtica Mediana Centro de amplitud Moda Notas: 1. Cuando se vea o se escuche algo sobre un promedio, debe averiguarse de qu clase se trata. Entonces se sabr que clase de aspecto se considera. Obsrvese las cifras que se promedian de manera pueda juzgarse si el promedio es el apropiado. Cada que alguien diga promedio no debe suponerse que se implica una cuantificacin matemtica. A menudo se habla de la persona promedio sin que ello se refiera a una media, mediana o moda. Todo lo que se quiere significar es la idea de gente que en muchos aspectos se asemeja bastante al resto. EJERCICIOS DIVERTIDOS PARA GENTE DIEVERTIDA 1. 2. 3. 4. Considere la muestra 2, 4, 7, 8, 9. Determine lo siguiente: la media, la mediana, la moda y el punto medio de la amplitud. Considere la muestra 6, 8, 7, 5, 3, 7. Calcule lo siguiente: la media, la mediana, la moda y el punto medio de la amplitud. Considere la muestra 7, 6, 10, 7, 5, 9, 3, 7, 5, 13. Obtenga lo siguiente: la media, la mediana, la moda y el punto medio de la amplitud. A 15 estudiantes contabilidad de URACCAN seleccionados aleatoriamente, se les pidi que dijeran el nmero de horas que haban dormido la noche anterior. Los datos resultantes fueron 5, 6, 6, 8, 7, 7, 9, 43 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004 $ 33900 $ 31875 $ 33750 $ 31500

2.

3.

ESTADSTICA GENERAL ================================================================ 5, 4, 8, 11, 6, 7, 8,7. Obtenga lo siguiente: la media, la mediana, la moda y el punto medio de la amplitud.

5. X 0 1 2 3 4 6.

Utilice la frmula para obtener la media de la siguiente distribucin de frecuencias. f 1 3 8 5 3 Los siguientes datos son los aumentos de peso (en gramos) de pollos alimentados con una dieta rica en protenas. Frecuencia 2 6 22 29 12 4 b. d. Calcule la mediana Obtenga el punto medio de la amplitud.

Aumento de peso 12.5 12.7 13.0 13.1 13.2 13.8

a. Obtenga la media c. Calcule la moda

NDICES DE VARIABILIDAD: desviacin media, varianza y desviacin tpica. Desviacin con respecto a la media: Para desarrollar una medida de dispersin referente a dicha media. Un valor individual de x se desva de la media en una cantidad igual a (x x ). Esta desviacin es igual a cero cuando x es igual a la media. La desviacin (x x ) es positiva si x es mayor que x, y negativa si x es menor que x 44 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Considrese la muestra 6, 3, 8, 5, 3 Utilizando la frmula x = (x)/n, encontramos que la media es 5. Entonces cada desviacin se obtiene restando 5 de cada valor de x. X Xx 6 1 3 -2 8 3 5 0 3 -2

Observe que la suma de las desviaciones es igual a cero. De hecho siempre ser igualo a cero. Sin embargo si la suma de las desviaciones es siempre igual acero, no ser de valor en la descripcin de un conjunto particular de datos. No obstante, se quiere poder utilizar la idea de desviacin respecto a la media, ya que la media es el promedio ms utilizado frecuentemente. Podemos lograr esto utilizando el valor absoluto de dicha desviacin. En el ejemplo anterior las desviaciones absolutas para los datos son: 1, 2, 3, 0, 2. Las sumas de estas desviaciones absolutas es igual a 8. As se define un valor conocido como desviacin media absoluta. Desviacin absoluta media = x x n De modo que en el ejemplo la desviacin media absoluta es 8/5 o sea 1.6 Aunque esta magnitud particular no se utiliza a menudo es una medida de dispersin. Indica a que distancia promedio est un dato respecto de la media. LA VARIANZA, s de una muestra es el valor numrico que se obtiene con la frmula: S = ( x x ) n-1 Donde n es el tamao dela muestra, o sea el nmero de elementos que contiene. La varianza de una muestra es una medida de la dispersin de los datos con respecto a la media. La varianza de la muestra 6, 3, 8, 5, 3 se obtiene con la tabla siguiente: Paso 1. x 6 3 8 5 3 25 Paso 2. X = x = 25 n 5 Paso 3. X x 1 -2 3 0 -2 0 =5 Paso 4. (X x ) 1 4 9 0 4 18

45 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Paso 5. s = ( x x ) = 18 n- 1 4 DESVIACIN ESTNDAR = 4.5

La desviacin estndar de una muestra, s es la raz cuadrada positiva de la varianza: Desviacin estndar muestral = s = s = (x- x) n-1 Para la muestra sealada anteriormente la desviacin estndar es 4.5 o sea 2.1 Posteriormente se estudiar el Uso y manejo de la calculadora para el clculo de estos ndices. Otra forma de calcular la varianza es con la frmula s = xf (xf)/f f 1 Por analoga se entiende que de aqu se puede tambin calcular la desviacin estndar. Utilizando el ejemplo de las 50 calificaciones de un examen final de estadstica calcularemos estos ndices. Nmero de Lmites de f Marcas de xf xf clase. clases. clase, x 1 22 32 1 27 27 729 2 33 43 2 38 76 2888 3 44 54 5 49 245 12005 4 55 65 2 60 120 7200 5 66 76 9 71 639 45369 6 77 87 9 82 738 60516 7 88 98 10 93 930 86490 8 99 109 5 104 520 54080 9 110 120 3 115 345 39675 10 121 131 4 126 504 63504 Totales 50 4144 372456 Si utilizamos la frmula anterior tenemos que: S = 591.86 y S = 24.3

EJERCICIOS 1. Considere las muestras (2, 4, 7, 8, 9), (6, 8, 7, 5, 3, 7), (7, 6, 10, 7, 5, 9, 3, 7, 5, 13), y obtenga para cada una de ellas lo siguiente: 46 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ a. La amplitud. b. La varianza (s). c. La desviacin estndar (s). 2. Una compaa especializada en la fabricacin de ejes para mquina est planeando la compra de una mquina de corte controlada por computadora. El ingeniero de la compaa prueba dos mquinas de diferentes fabricantes. Los dimetros (en centmetros) de las barras cortadas por las mquinas fueron los siguientes: Fabricante 1: 2.001, 2.000, 2.004, 1.998, 1.997 Fabricante 2: 2.002, 2.008, 1.995, 1.990, 2.005 Calcule la media y la desviacin estndar para cada caso y comente acerca de los resultados obtenidos de las dos mquinas. 3. Durante los ltimos aos una Compaa Elctrica General ha solicitado incremento en sus tarifas. Como resultado de los incrementos autorizados se obtendrn las siguientes utilidades (en dlares). $ 34.5 millones 13.3 22.0 41.5 $ 62.3 millones 83.8 58.3 10.8

Cul es la varianza de utilidades?. 4. Calcule la varianza y la desviacin estndar de la siguiente distribucin de frecuencias agrupadas: Lmite de clase 35 68 9 11 12 14 15 17 f 2 10 12 9 7 MEDIDAS DE POSICIN Las medidas de posicin sirven para describir la localizacin de un dato especfico con relacin al resto de la muestra. Dos de las medidas de posicin ms populares son los llamados Cuartiles y los Centiles. Cuartiles: son nmeros que dividen a los datos ordenados en cuatro partes; cada conjunto de datos tiene tres cuartiles. El primer cuartil, Q1, es un nmero 47 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ tal que a lo ms una cuarta parte de los datos tiene un valor ms pequeo que Q1 y a lo ms tres cuartas partes tienen un valor mayor. El segundo cuartil, Q 2 es la mediana. El tercer cuartil, Q3 es un nmero tal que a lo ms tres cuartas partes de los datos tienen un valor ms pequeo que Q3y a lo ms una cuarta parte tiene un valor mayor. DATOS ORDENADOS DE MENOR A MAYOR 25 % L Q1 25 % Q2 25 % Q3 25 % H

CENTILES: Los centiles (o porcentiles) son nmeros que dividen en 100 partes iguales un conjunto de datos ordenados; Tal conjunto tiene 99 centiles (ver tabla siguiente). El K simo centil, PK, es un valor tal que a lo ms K por ciento de los datos tienen valores ms pequeos que P K, y a lo ms (100 K) por ciento son mayores. 1% L Notas: 1. El primer cuartil y el 25 centil coinciden; es decir, Q 1 = P25, similarmente, Q3 = P75. 2. La mediana, el segundo cuartil y el 50 centil son iguales: X = Q2 = P50 Por tanto, utilcese este mtodo para obtener la mediana cuando se trata de hallar P50 o Q2. El procedimiento para determinar el valor de cualquier centil (o cuartil) K simo comprende tres pasos bsicos: 1. Los datos deben de ordenarse. Se comienza con el dato ms pequeo y se prosigue en orden hasta incluir el dato ms grande. 2. Debe determinarse la posicin (o profundidad) del K simo centil. Si K es menor que 50, primero se calcula el valor de nK/100, donde n es el tamao de la muestra. Si el valor calculado no es un nmero entero (es decir, si contiene una fraccin) entonces la posicin es igual al siguiente entero ms grande; por ejemplo, si nK/100 = 17.2 entonces d(PK) = 18 . Si el valor calculado es un entero, entonces la posicin es igual a (nK/100) + 0.5 Por ejemplo, si nK/100 = 25, entonces d(PK) = 25.5; por otra parte, si K es mayor que 50 se resta K de 100 y se emplea el valor (100 K) en vez de K en el paso anterior. Por ejemplo, si K = 80, entonces (100 K) = 100 80 = 20, por lo que la posicin del K simo centil se determina utilizando K = 20. 48 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004 1% P1 1% P2 1% P3 1% P4 1% P97 1% P98 1% P99 1% H

ESTADSTICA GENERAL ================================================================ 3. Localcese el valor de PK cuando K < 50, se comienza a contar a partir del dato menor hasta encontrar el dato que est en la posicin d(P K)- sima. (Si K > 50 inciese la cuenta a partir del dato mayor). Si d(PK) es un nmero entero, el dato localizado ser el valor de PK. Si d(PK) no es un entero, es decir, si contiene la fraccin y el valore de PK est entre los datos (nK/100) simo y (nK/100) + 1 simo, entonces sume estos dos valores y divida entre dos. Ejemplo: se tom una muestra de 50 calificaciones de una poblacin de resultados de un examen final de Estadstica Elemental. Estos puntajes se listan en la tabla siguiente en el orden en que fueron reunidos. Obtener el primer cuartil Q1, y el 56 simo centil P56, y el tercer cuartil Q3.

Tabla I. 75 97 71 65 84 27 108 91 122 82 96 58 94 43 116 123 91 120 94 43 74 73 68 54 50 49 81 128 103 76 120 94 79 80 82 71 88 88 47 73 71 106 86 108 84 93 77 107 44 127

SOLUCIN: el primer paso consiste en ordenar los datos. La tabla II muestra el ordenamiento resultante en columnas uniformes (es decir, cada columna contiene el mismo nmero de elementos). 27 43 43 44 47 49 50 68 71 71 71 73 73 74 79 80 81 82 82 84 84 91 91 93 94 94 94 96 107 108 108 116 120 120 122 49 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 54 58 65 75 76 77 86 88 88 97 103 106 123 127 128

Para obtener Q1 es necesario determinar su posicin mediante nK/100, en donde: n = 50 pues hay 50 datos; k = 25 puesto que Q1 = P25. nK/100 = (50)(25)/100 = 12.5 Por lo tanto, d(Q1) = 13. De modo que Q1 es el decimotercer valor contado a partir de L, es decir, Q1 = 71 Para hallar P56 se necesita determinar su posicin mediante nK/100, de donde n = 50, K = 56 y utilizando (100 K) como K tenemos que (100 56 ) = 44 nK/100 = (50)(44)/100 = 22 Contando a partir de H se obtiene d(P56) = 22.5 As, P56 es el valor central entre los nmeros 22 y 23, contando a partir de H, de donde obtenemos: P56 = (86 + 88)/2 = 87 Para calcular Q3 es necesario determinar su posicin mediante nK/100 en donde n = 50 y K = 25, puesto que Q3 = P75. En consecuencia d(Q3) = 13, por lo que Q3 es el decimotercer valor contado a partir de H. Por tanto Q3 = 97 Cuartil intermedio: Es el valor numrico situado exactamente a la mitad de los cuartiles (del ingls midquartile) primero y tercero. Cuartil intermedio = Q1 + Q3 2 Ejemplo: Determine el cuartil intermedio correspondiente al conjunto de los totales del ejercicio anterior. Solucin: De acuerdo con lo obtenido con antelacin tenemos que: Q 1 = 71 y Q3 = 97. Por lo tanto, Cuartil Intermedio = 71 + 97 2 = 168 2 = 84

50 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Nota: La mediana, el centro de amplitud y el cuartil intermedio no son necesariamente el mismo valor. Son valores de en medio, pero con diferentes definiciones de este concepto. EJERCICIO Dado el conjunto de datos, hallar: (a) La media, la mediana, desviacin tpica, la varianza, Q1, Q3, Qi, P60. 125 120 130 127 120 129 123 120 136 131 141 138 131 140 134 130 125 120 130 127 120 129 123 120 134 129 139 142 135 144 138 130 140 135 145 142 135 144 138 130 141 136 146 143 136 145 139 130 142 137 146 143 136 145 139 130 143 138 148 145 138 147 141 140 138 133 143 140 133 140 134 130 139 134 144 141 134 141 135 130

CUARTA UNIDAD: CONCEPTOS DE PROBABILIDAD Lema: Se debe aprender a pensar y aprender a convivir, antes de instruirse y educarse. Objetivos: i) ii) iii) iv) Definir probabilidad. Explicar a lo que se refiere el trmino experimento. Definir los trminos espacio muestral y evento. Manejar y aplicar la regla de Laplace para la suma, la multiplicacin y de probabilidad condicional. PROBABILIDAD Segn Patricia Waller, directora asociada para estudio sobre conductores de vehculos en el Centro de Investigacin sobre Seguridad en Autopistas de la Universidad de Carolina del Norte, Dios cuida a los nios, a los tontos y a los borrachos. Sin embargo creo que los borrachos deben eliminarse de la lista. 51 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Tal vez ya se tenga familiaridad con algunas ideas sobre probabilidad, pues esta nocin es parte de la cultura diaria. Constantemente se escucha a la gente haciendo aseveraciones de tipo probabilstico, tales como: i) ii) iii) iv) v) vi) Probablemente nuestro equipo ganar esta noche. Existe un 40 % de posibilidad de lluvia esta tarde. Es casi probable que tenga una cita el fin de semana. Tengo una posibilidad del 50 % de aprobar en el examen de estadstica. Es posible que Gilma acepte la propuesta de Javier. Es probable que los hermanos no se salven.

Toda persona ha hecho o escuchado este tipo de aseveraciones. Qu es lo que significan realmente? Significan en efecto lo que afirman? Algunas de estas aseveraciones pueden estar respaldadas con informacin cientfica, y otras con juicios sujetivos. Cualquiera que sea el caso, son inferencias probabilsticas son hechos, sino conjeturas. NATURALEZA DE LA PROBABILIDAD Considrese un experimento donde se tiran dos monedas simultneamente y se anota el nmero de caras (anversos) que resultan. Los nicos resultados posibles son: 0C (cero caras), 1C (una cara), y 2C (dos caras). Se tiran las monedas 10 veces y se anotan los resultados: 2C, En resumen: 1C, 1C, 2C, 1C, 0C, 1C, 1C, 1C, 2C

Resultados 2C 1C 0C 3 6 1

Frecuencia

Qu sucede si este experimento se repite o contina? Cambiarn las frecuencias relativas?. En caso afirmativo, Cunto?.

52 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Si este experimento continuase por varios cientos de tiradas adicionales, qu se espera que suceda en relacin con las frecuencias relativas de esos eventos?. Estas frecuencias relativas reflejan el concepto de probabilidad de manera precisa.

Probabilidad de que ocurra un Evento Frecuencia relativa con la que puede esperarse que ocurra un evento.

Experimento Todo proceso que produce un resultado u observacin. Resultado: Consecuencia de un experimento. Espacio Muestral o Conjunto de Resultados: Conjunto de todos los resultados posibles de un experimento. Por lo general se llama S al espacio muestral y puede ser de varias formas: una lista, un diagrama de rbol o dendograma, una cuadrcula, etc. Los valores individuales en espacio muestral se llaman puntos muestrales o resultados; n(S) es el nmero de puntos muestrales en el espacio muestral S. Evento: Cualquier subconjunto del espacio muestral. Si A es un evento, entonces n(A) es el nmero de puntos muestrales: que pertenecen al evento A. Experimento: Dos monedas de (de un determinado pas), una de 500 y otra de 1000 se tiran simultneamente, anotndose el resultado de cada una mediante la notacin de pares ordenados (500,1000). En este caso el espacio muestral se ilustra de dos formas. En un diagrama de rbol o arborigrama: Moneda de 500 Moneda de 1000 C C X C Resultado C, C C, X X, C 53 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ X X X, C

(Hay cuatro ramas, y cada rama muestra un posible resultado) En forma de lista: S = {(C, C), (C, X), (X, C), (X, X)} Ntese que ambas representaciones abarcan los mismos cuatro resultados posibles. Por ejemplo, la rama superior del diagrama de rbol muestras caras en ambas monedas, de la misma forma como lo hace el primer par ordenado en la lista. Experimento: Se tira un dado una vez observndose el nmero de puntos en su cara superior. El espacio muestral es: S = {1,2,3,4,5,6} Experimento: Una caja contiene tres fichas de pker (una roja, una blanca y otra verde) y se seleccionan dos de ellas con reposicin (o reemplazo). (Esto significa que se selecciona una ficha, se observa su color, y se repone o devuelve a la caja.) Antes de hacer la segunda seleccin se revuelven bien las fichas. A continuacin se presenta el espacio muestral en dos formas distintas. Representacin en diagrama de rbol: Primera Seleccin Segunda Seleccin R R B V R B B V R Resultados R, R R, B R, V B, R B, B B, V V, R 54 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ V B V En una lista: S = {(R,R), (R, B), (R,V), (B,R), (B, B), (B,V), (V,R), (V,B), (V,V)} EJERCICIOS 1. Un experimento consiste en seleccionar una bola o una canica de una caja que contiene rojas, amarillas y verdes. a) Indique el espacio muestral. b) Se puede tener la seguridad de que cada resultado en el espacio es igualmente probable? 2. Un experimento consiste en dos ensayos. El primero es lanzar una moneda y observar las caras o cruces; el segundo es tirar un dado, registrando los resultados: 1,2,3,4,5,6. Represente el espacio muestral. 3. Se tira una moneda y se observa si cae cara o cruz. Si resulta cara, la moneda se lanza por segunda ocasin. Si resulta cruz, entonces se tira un dado. a) Forme el espacio muestral para este experimento. b) Cul es la probabilidad de que en la segunda parte de este experimento se lance un dado? 4. Una caja guardada en un almacn contiene 100 piezas idnticas, de las cuales 10son defectuosas y 90 no lo son. Se seleccionan tres piezas sin reposicin. Represente el espacio muestral con un diagrama de rbol. 5. Se extraen 2 canicas (chibolas) de la caja del Ejercicio 1. Represente el espacio muestral. EVENTOS COMPLEMENTARIOS, EVENTOS MUTUEAMENTE EXCLUYENTES Y REGLA DE LA ADICIN. Complemento de un evento: Conjunto de todos los puntos muestrales del espacio muestral que no pertenecen al evento A. El complemento de un evento A se indica (lase A complemento). Por ejemplo, fracaso es el complemento del evento xito; cruces es el complemento de caras en el lanzamiento de una moneda; el complemento de al menos una cara en 10 tiradas de una moneda es ninguna cara. 55 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004 V, B V, V

ESTADSTICA GENERAL ================================================================ Combinando la informacin en la definicin de complemento con la propiedad 2, puede decirse que. P(A) + P() = 1.0 para cualquier evento A Se deduce que ... P() = 1- P(A)

Nota: Todo evento A tiene un evento complementario . Las posibilidades complementarias son muy tiles cuando se pide la probabilidad de al menos una. Por lo general sta representa una combinacin de varios eventos, sin embargo el evento complementario ninguno es un resultado simple. Es ms fcil dar la solucin en trminos del evento complementario, y obtener la respuesta con la frmula. Ejemplo. Se lanzan dos monedas. Cul es la probabilidad de que aparezca al menos una cara? Solucin. Sea A el evento definido por la no ocurrencia de caras; Entonces representa la ocurrencia de una o ms caras, es decir, al menos una cara. El espacio muestral es: {(C, C), (C, X), (X, C), (X, X)}. P(A) = = 0.25 P() = 1 P(A) =1 = = 0.75 EVENTOS MUTUEMENTE EXCLUYENTES Son eventos definidos de manera que la ocurrencia de uno imposibilita la ocurrencia de los dems. (Brevemente, si alguno de ellos sucede, los restantes no pueden suceder). Ejemplo. *.* Se sabe que en un grupo de 200 estudiantes, 80 mujeres y 60 hombres, 140 en total son alumnos de tiempo completo y 60 (40 mujeres y 20 hombres) son de tiempo parcial. 200 Estudiantes de Universidad Tiempo Completo Mujeres Hombres 80 60 Tiempo Parcial 40 20 Total 120 80 56 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Total 140 60 200

Considrese el experimento donde un estudiante es seleccionado al azar. Se definen dos eventos. El evento A es: el estudiante seleccionado estudia tiempo completo y el B es el estudiante elegido es de tiempo parcial y adems es hombre. Puesto que ningn estudiante es de tiempo completo y de tiempo parcial simultneamente, los eventos A y B son mutuamente excluyentes. Se define un tercer evento, C, como el estudiante seleccionado es mujer. Considrense ahora los eventos A y C. Ya que hay 80 estudiantes que adems de estudiar tiempo completo son mujeres, los eventos A y C no son mutuamente excluyentes. REGLA DE LA ADICIN Considrese ahora la probabilidad compuesta de P(A o B), donde A y B son eventos mutuamente excluyentes. Ejemplo. Utilizando el espacio muestral y los eventos definidos en el ejemplo *.* encuntrese la probabilidad de que el estudiante seleccionado sea mujer o de tiempo completo, P(A o C). Solucin: Si se observa el espacio muestral, se nota que P(A) = 140/200, o 0.7, y que P(C) = 120/200 , o 0.6. Al sumar estos dos nmeros se obtiene: 1.3, cifra que es mayor que 1. Se sabe, por las propiedades bsicas de la probabilidad, que esta ltima nunca puede ser mayor que uno. Qu ha sucedido? Al revisar nuevamente el espacio muestral se observa que de los 200 estudiantes 80 han sido contados 2 veces si se suman 140/200 y 120/200. Slo hay 180 estudiantes que son tiempo completo o mujer. En consecuencia la probabilidad de A o C es: P(A o C) = 180/200 = 0.9

Pueden sumarse probabilidades para hallar la probabilidad de un evento compuesto o sin embargo, debe hacerse un ajuste en casos como el del ejemplo anterior.

Regla de la adicin, caso general Sea A y B dos eventos definidos en un espacio muestral S. P(A o B) = P(A) + P(B) P(A o B) 57 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================

Regla de la adicin, caso especial

Sean A y B dos eventos definidos en un espacio neutral. Si A y B son eventos mutuamente excluyentes, entonces: P(A o B) = P(A) + P(B) La clave de esta frmula es la propiedad mutuamente excluyentes. Si dos eventos la poseen, no hay una doble cuenta de puntos muestrales. Si los eventos REGLA DE LA ADICIN, CASO GENERAL no son mutuamente excluyentes entonces cuando se suman probabilidades ocurre el doble conteo. A continuacin se examinan algunos ejemplos. Sean A y B dos eventos definidos en un espacio muestral S. Se lanzan un dado blanco y uno negro. Hallar la probabilidad de que el dado blanco sea un nmeroP(A o B)que 3, o que la P(A o B) los dados sea mayor menor = P(A) + P(B) suma de que 9. REGLA DE LA ADICIN, CASO ESPECIAL Solucin 1: A = el dado blanco muestra un 1 o un 2; B = la suma de los dados es 10, 11 o 12. Sean A Y B dos eventos definidos= 6/36espacio neutral. Si A y B son P(A) = 12/36 = 1/3 y P(B) en un = 1/6 eventos mutuamente excluyentes, entonces: P(A o B) = P(A) + P(B) P(A y B) P(A o B) = P(A) + P(B) = 1/3 + 1/6 0 = Esto puede generalizarse a mas de dos eventos mutuamente excluyentes: (P(A o B) = 0, puesto que los eventos no se interecan.) P(A o B o C o ... o X) = P(A) + P(B) + P(C) + ... P(X) Solucin 2: P(A o B) = n(A o B) = 18 = 1 n(S) 36 2 Se lanzan un par de dados . Se define en el evento T como la ocurrencia de un total de 10 u 11, y el evento D como la ocurrencia de nmeros dobles. Hallar la probabilidad P(T o D).

Solucin. Obsrvese que el espacio muestral se compone de 36 pares ordenados asociado al lanzamiento de los dos dados. El evento T ocurre si sucede cualquiera de los 5 pares ordenados (4,6), (5,5), (6,4), (5,6), (6,5). En consecuencia, P(T) = 5/36. El evento D ocurre si sucede cualquiera de 6 pares ordenados: (1,1), (2,2), (3,3), (4,4), (5,5), (6,6). As, P(D) = 6/36 . Sin embargo ntese que esos dos eventos no son mutuamente excluyentes. Los dos 58 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ eventos comparten el punto (5,5). Por esta razn la probabilidad P(T y D) = 1/36. Como resultado de lo anterior, la probabilidad P(T o D) se obtiene con la frmula (4 - 4a). P(T o D) = P(T) + P(D) P(T y D) = 5/36 +6/36 1/36 = 10/26 = 5/18. EJERCICIOS 1. Determine si cada una de las parejas de eventos siguientes son o no eventos mutuamente excluyentes. a. Se tiran cinco monedas se observa una cara, se observa al menos una cara. b. Un vendedor llama por telfono a un cliente y realiza una venta: La venta es superior a $ 100 US, la venta es superior a $ 1000 US. c. Un estudiante es seleccionado aleatoriamente de una sociedad estudiantil: La persona elegida es hombre o es mayor de 21 aos. d. Se lanzan dos dados: el total de puntos que aparece es menor que 7, mayor que 9. impares, son ambos pares, son siete en total o suman once en total. 2. Determine si cada uno de los siguientes conjuntos de eventos es o no mutuamente excluyente. a. Se lanzan cinco monedas: no se observa ms de una cara, se observan dos caras, se observan tres o ms caras. b. Un vendedor se pone en contacto con un cliente y logra una venta: el monto de la venta es menor a $100 US, est entre $ 100 y $1000 US, es mayor a 500. c. Se selecciona un estudiante al azar entre el estudiantado. El estudiante elegido es mujer, es hombre o tiene ms de 21 aos. 3. Si P(A) = 0.3 y P(B) = 0.4, y si A y B son eventos mutuamente excluyentes, obtngase lo siguiente. a. P() b. P(B) c. P(A o B) d. P(A y B)

59 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ 4. Una negociacin vende partes de repuestos nuevas y usadas. El 60% de las refacciones en existencias son usadas, y al mismo tiempo el 61% de ellas son usadas o defectuosas. Si el 5 % de las piezas son defectuosas, Qu porcentajes de esas partes son usadas o defectuosas? Los dirigentes de un sindicato dicen que 60% de los trabajadores de una fbrica pertenecen al sindicato, que el 90% gana ms de $5 (dlares) por hoja; y que el 40% pertenece al sindicato y gana ms de 5$ por hora. Son crebles estos porcentajes? Explique.

5.

REGLA DE LA MULTIPLICACIN Caso General Sean A y B dos eventos definidos en el espacio muestral S. Entonces: P(A y B) = P(A) P(B | A) O bien P(Ay B) = P(B) P(A | B)

Si los eventos A y B son independientes, el caso general de la regla de la multiplicacin, se reduce al siguiente caso especial. Regla de la Multiplicacin, Caso Especial. Sean A y B dos eventos definido en el espacio muestral. S. Si A y B son eventos independientes, entonces: P(A y B) = P(A) P(B) Esta frmula puede ser generalizada. Si A, B, C, D,... ,G son eventos independientes, P(A y B y C y D y ...,G) = P(A) P(B) P(C) P(D)...,P(G)

Ejemplo. Se lanzan un dado blanco y otro negro. Hallar la probabilidad de que la suma de los nmeros sea 7 y que el nmero correspondiente al dado negro sea mayor que el del dado blanco. 60 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Solucin: A = La suma es igual a 7; B = el nmero del dado negro es mayor que el del blanco el Y requiere del empleo de la regla de la multiplicacin. Sin embargo, an no se sabe si los eventos A y B son independientes. Se observa que P(A) = 6/36 = 1/6. As mismo, P(A | B) se obtiene del espacio muestral reducido, el cual incluye 15 puntos muestrales por encima de la lnea diagonal. De los 15 puntos igualmente probables, 3 (1,6), (2,5), y (3,4) satisfacen el evento A. En consecuencias, P(A | B) = 3/15 = 1/5. puesto que este ltimo valor es distinto de P(A), los eventos son independientes. Por ende debe usarse la frmula del caso general. P(A y B) = P(B) P(A | B) = 15/36 3/15 = 3/36 = 1/12 Notas: Independencia y exclusin mutua son conceptos diferentes. El trmino mutuamente excluyente describe si los eventos pueden ocurrir simultneamente, mientras que independencia indica el efecto que tiene un evento sobre la probabilidad de ocurrencia de otro. Si dos eventos no son mutuamente excluyentes, entonces sus correspondiente conjuntos de puntos muestrales se intersecan INDEPENDENCIA Y PROBABILIDADES CONDICIONALES Eventos Independientes Dos eventos son independientes si la ocurrencia o no ocurrencia de uno no afecta la probabilidad asignada a la ocurrencia del otro. Algunas veces es sencillo determinar la independencia, por ejemplo si los dos eventos considerados se refieren a ensayos no realizados, tales como el lanzamiento de dos monedas de diferente denominacin. En consecuencia, los resultados asociados con ambas monedas son independientes. De manera semejante, si se lanzan una moneda y un dado, simultneamente o uno despus del otro, los resultados correspondientes a uno de ellos son independientes de los del otro. Puede considerarse que la moneda y el dado constituyen ensayos separados. Sin embargo, si se definen eventos como combinaciones de resultados de esos dos ensayos separados, la independencia puede o no determinarse en forma sencilla. Los resultados de cada ensayo por separado pueden ser independientes, pero los eventos compuestos definidos en trminos de ambos ensayos (ambos dados) pueden o no ser independientes. La falta de independencia, o sea la dependencia, es demostrada por el siguiente experimento. Se lanzan dos dados y se observan los dos eventos la suma es igual a 10 y nmero doble. Como ya fue establecido, P(10) = 3/36 = 1/12, y P(doble) = 6/36 = 1/6. La ocurrencia de 10 afecta la probabilidad del doble? Considrese esta pregunta de la manera siguiente: Ha ocurrido una suma igual a 10; debe haber 61 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ ocurrido uno de los resultados siguientes: {(4,6), (5,5),(6,4)}. Una de esas tres posibilidades es un numero doble. En consecuencia debe concluirse que P(doble sabiendo que ha ocurrido un 10), escrita P (doble | 10), es igual a 1/3. Ya que 1/3 es distinta a la probabilidad original de un doble, 1/6, puede concluirse que el evento 10 afecta la probabilidad de un nmero doble. As, doble y 10 son eventos dependientes. El que los eventos sean o no independientes a menudo resulta claro al examinar los eventos en cuestin. El lanzamiento de un dado no afecta el resultado de un segundo lanzamiento. Sin embargo, en muchos casos, la independencia no es evidente, y puede ser de inters especial el asunto de la independencia misma. Considrense los eventos tener una cuenta bancaria de cheques, y haber recibido un prstamo en el mismo banco. El que una persona tenga una cuenta de cheques en un banco puede aumentar la probabilidad de que el banco le otorgue un crdito. Esto tiene implicaciones de tipo prctico. Por ejemplo, tendr sentido anunciar lneas de crditos a los clientes que tengan cuentas de cheques, si es ms probable que stos las soliciten en comparacin con las personas que no son cuenta habientes del banco.

Probabilidad Condicional: El smbolo P(A|B) representa la probabilidad de que ocurra A dado que B ya ha ocurrido. Esta probabilidad recibe el nombre de PROBABILIDAD CONCDIONAL. Ahora puede escribirse la definicin de eventos independientes de manera ms formal.

Eventos Independientes. Dos eventos A y B son independientes si: P(A|B) = P(A), o si P(B|A) = P(B). Ejemplo: En una muestra de 150 residentes, se pregunt a cada persona si estaba a favor de la propuesta de contar con un solo cuerpo policaco en un distrito. El distrito est formado por una ciudad grande y varios poblados suburbanos. En la tabla siguiente se resume el lugar de residencia (dentro o fuera de la ciudad) y las respuestas de los residentes. Si se selecciona al zar uno de estos residentes, cul es la probabilidad de que la persona: (a) est a favor de la propuesta, (b) est a favor y resida en la ciudad, (c) est a favor y viva fuera de la ciudad?, (d) Son independientes los eventos F (favorece la propuesta) y C (reside en la ciudad)? Resultados muestrales del ejemplo anterior OPININ 62 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Lugar de Residencia En la ciudad (C) Fuera de la ciudad (C) TOTAL SOLUCIN: (a) P(F) es la proporcin de la muestra total que est a favor de la propuesta. En consecuencia: P(F) = n(F)/n(S) = 100/150 = 2/3 (b) P(F|C) es la probabilidad de que la persona seleccionada favorezca la propuesta dado que vive en la ciudad. El espacio muestral queda reducido a las 120 personas de la muestra que residen en la ciudad. De stas, 80 favorecen la propuesta; as, P(F|C) = n(F y C)/n(C) = 80/120 = 2/3 (c) P(F|C) es la probabilidad de que la persona seleccionada favorezca la propuesta y viva fuera de la ciudad. El espacio muestral queda reducido a los 30 no residentes; as, P(F|C) = n(F y C)/n(C) = 20/30 = 2/3 (d) Las probabilidades anteriores tienen el mismo valor, 2/3. Por esta razn puede decirse que los eventos F (a favor) y C(reside en la ciudad) son independientes. El lugar donde se reside no tuvo efecto sobre P(F). A Favor (F) 80 20 100 En Contra (F ) 40 10 50 TOTAL 120 30 150

EJERCICIOS SENCILLOS DE FCIL RESOLUCIN 1. Se tiran dos monedas al aire. Cul es la probabilidad de que ambas caigan caras? 2. Un tercio de los votantes registrados en una comunidad rural son mujeres, y 40% de ellas votaron en la ltima eleccin presidencial. Suponiendo que estos dos eventos son independientes, hallar la probabilidad de seleccionar 63 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ aleatoriamente de una lista global, a una mujer que haya votado en la ltima eleccin presidencial. 3. Javier llega tarde a su casa para cenar el 25% de las veces. La cena se retrasa el 10% de las veces. Si los dos sucesos no estn relacionados, Qu probabilidad hay de que ambos ocurran? 4. Se va inspeccionar un enorme cargamento de cajas de boletas para votacin. Los informes indican que el 2% de las cajas no estn completamente llenas. De seleccionar dos cajas, Cul es la probabilidad de que ambas estn incompletas, suponiendo que este cargamento sea igual al anterior (es decir, 2% de cajas incompletas). 5. En los Estados Unidos, 15 de cada 100 nacimientos requieren de operacin cesrea. En tales casos sobreviven 96 de cada 100 bebs. Cul es la probabilidad de que una mujer embarazada elegida al azar necesite cesrea y que su hijo sobreviva?. 6. Obtenga la probabilidad de que Marisol y Antonio hayan nacido el mismo da de la semana. 7. A la venta hay dos camisas. Una roja y la otra roja combinada. La primera tiene un 20 % de probabilidad de que no se venda y la segunda u 30 % de la misma condicin. Encuentre la probabilidad de que ninguna se venda (b) determine la probabilidad de que slo se venda una de ellas. 8. Se vendieron 200 boletos para una rifa y usted compr dos de ellos. El premio es una docena de pltanos congelados. Los boletos se mezclarn muy bien en una gran urna y un chimpanc amaestrado sacar los dos boletos ganadores. (a) Cul es la probabilidad de que una persona que compr un boleto gane? (b) Cul es la probabilidad de que usted obtenga un premio?. 9. De los estudiantes de una preparatoria, 30 % son de primer ao, 35 % de segundo, 20 % de tercer ao y el resto son repetidores. Si uno de los alumnos gan un milln de crdobas en la lotera, calcule: (a) la probabilidad de que el alumno sea de tercer ao. (b) la probabilidad de que el alumno sea de primer o de segundo ao. (c) la probabilidad de que el alumno no sea de primer ao. 10. Las descomposturas de mquinas son independientes entre s. Si se tienen cuatro mquinas, cuyas respectivas probabilidades de avera son: 1 %, 2 %, 5 % y 10 % en un da en particular, calcule las siguientes probabilidades: (a) Todas se descomponen el mismo da (b) Ninguna se descompone.

64 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ QUINTA UNIDAD: DISTRIBUCIN NORMAL Lema: Si las riquezas de nuestra naturaleza, las distribuyramos entre todos los humanos equitativamente, erradicaramos las pobreza y la discriminacin racial. Objetivos: 1. 2. 3. 4. 5. Describir las caractersticas principales de una distribucin normal. Convertir cualquier distribucin normal en una distribucin normal estndar. Utilizar la tabla de reas de distribucin normal para obtener probabilidades. Calcular el rea bajo una curva normal entre dos puntos cualesquiera. Resolver problemas en los que intervenga la distribucin uniforme o exponencial.

CARACTERSTICA S DE LAS DISRTRIBUCIONES NORMALES Las curvas normales tienen ciertas caractersticas especiales en trminos de su configuracin y de la forma como estn especificadas y como se utilizan para obtener probabilidades. Distribuciones probabilsticas continuas

Son infinitas las combinaciones de media y desviacin estndar.

65 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================

P(a < x < b) = rea bajo la curva entre a y b.

La probabilidad de que una variable aleatoria tenga un valor entre dos puntos cualesquiera es igual al rea bajo la curva normal entre esos dos puntos.

EJERCICIOS 1. Trace una curva norma, sombree el rea deseada y obtenga la informacin requerida a continuacin: a. Encuentre el rea a la derecha de z = 1.0 b. Obtenga el rea a la izquierda de z = 1.0 c. Calcule el rea a la derecha de z = - 0.34 d. Determine el rea entre z = 0 y z = 1.5 e. Halle el rea entre z = 0 y Z = - 2.88 f. Encuentre el rea entre z = - 0.56 y Z = - 0.20 g. Obtenga el rea entre z = - 0.49 y z = 10.49 h. Calcule el rea entre z = 2.5 y Z = 2.8

UNIDAD SEIS: CORRELACIN Y REGRESIN LINEAL 66 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ TECNICAS DE MUESTREO Uno de los primeros problemas que debe de resolver un estadstico es la obtencin de datos. Los datos no surgen de la nada. Deben de ser recopilados. Debe tenerse presente la importancia de contar con buenas tcnicas de muestreo, pues las inferencias obtenidas finalmente estarn basadas en las estadsticas calculadas a partir de los datos muestrales. La obtencin de datos para el anlisis estadstico es un proceso integral que incluye las siguientes etapas importantes: 1. Definicin de los objetivos del estudio observacional o experimento. Ejemplos: (a) la comparacin de la efectividad de un medicamento que se ha utilizado por algn tiempo, frente a la de otro producto nuevo, (b) la estimacin del ingreso promedio familiar en el centro urbano de Nueva Guinea, (c) El consumo promedio per cpita de bebidas alcohlicas en la zona cuatro de Nueva Guinea. Definicin de la variable y la poblacin de inters. Ejemplos: (a) el tiempo de recuperacin de los pacientes que padecen cierta enfermedad, (b) el ingreso familiar total en el centro urbano de Nueva Guinea. Definicin de los mtodos para la obtencin y la medicin de los datos. Esto incluye los procedimientos de muestreo, la determinacin del tamao de la muestra, y la forma como se obtendrn los datos (por cuestionario, telfono, fax, Internet, etc.). Determinacin de las tcnicas descriptivas o inferenciales que sean apropiadas para el anlisis de datos. EJEMPLOS Ilustracin 1: El departamento de servicios escolares de BICU desea valuar el costo de la educacin universitaria. Uno de los componentes del costo total por semestre es el costo de los libros de texto. El departamento deseara valorizar en especial el costo promedio actual de los libros por semestre y por estudiante. La poblacin de inters es el conjunto de alumnos inscritos para el semestre actual. Ilustracin 2: El costo de un anuncio comercial en televisin de un minuto de duracin, vara considerablemente dependiendo del canal o estacin, del da y de la hora. La tarifa se basa en la cantidad de televidentes potenciales que sintonizan un canal en particular a una hora en especial. Una cadena comercial est inaugurando una tienda en una ciudad cercana y quiere elegir las horas cuando se anunciar por la estacin. Adems desea que las horas seleccionadas atraigan 67 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

2.

3.

4.

ESTADSTICA GENERAL ================================================================ nuevos clientes de manera efectiva y un costo apropiado. La poblacin de inters la determina el hbito diario de ver televisin por parte de los espectadores que residen dentro del rea de transmisin. Marco de Muestreo Es una lista de elementos pertenecientes a la poblacin de donde extrae la muestra. El marco de muestro debe ser idntico a la poblacin. De manera ideal el marco debe enlistar cada elemento de la poblacin slo una vez. Sin embargo, no siempre es posible porque resulta imprctico o imposible seleccionar la poblacin total en forma directa. Es importante que el marco de muestreo sea representativo de la poblacin, ya que slo los elementos del marco tienen oportunidad de ser seleccionados como parte de la muestra. Una vez establecido un marco de muestreo representativo, es posible proceder a seleccionar los elementos muestrales a partir de dicho marco. Este proceso de seleccin es definido por el diseo dela muestra. Diseo de la Muestra o Plan de Muestreo Es el conjunto de procedimientos utilizados para seleccionar los elementos de la muestra. Hay muchos tipos de diseo de la muestra. Sin embargo, todos ellos producen muestras que se clasifican en dos categoras: no probabilsticas y probabilsticas. Muestras No Probabilsticas Son las que se seleccionan a partir de su consideracin como Tpicas. Una persona obtiene una muestra no probabilstica cuando elige elementos que, en su opinin, son representativos de la poblacin. La validez de los resultados obtenidos con una muestra no probabilstica refleja la solidez de quien la selecciona. Muestras Probabilsticas Son las muestras donde los elementos por seleccionar se toman de acuerdo con leyes probabilsticas. Cada elemento en una poblacin tiene cierta probabilidad de ser seleccionado como parte de la muestra. Nota: Los procedimientos de la Estadstica Inferencial (contraste de hiptesis y estimaciones mediante intervalos de confianza) requieren muestra probabilsticas. 68 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ A continuacin se vern algunos de los diseos de muestras ms simples y sencillos de emplear. El muestreo aleatorio simple es uno de los mtodos utilizados con mayor frecuencia para seleccionar muestra probabilsticas. Muestras Aleatoria Simple Es aquella seleccionada de manera que cada elemento de la poblacin tiene la misma probabilidad de ser seleccionado. De manera equivalente, todas las muestras de tamao n tienen la misma probabilidad de ser seleccionadas. Debe realizarse el esfuerzo necesario para asegurar que cada elemento tenga igual probabilidad de ser seleccionado cuando se extrae una muestra aleatoria simple. A menudo se cometen errores porque el trmino aleatorio (con probabilidad igual) se confunde con fortuito (sin un patrn definido). El empleo de un generador de nmeros aleatorios o de una tabla de nmeros aleatorios es el procedimiento idneo para seleccionar una muestra aleatoria simple. Se elige, para integrar la muestra cada elemento numerado en el marco de muestreo que corresponda a un nmero aleatorio seleccionado. Ilustracin 3: El seor Antonio Cerros quien trabaja en el departamento de servicios escolares, ha obtenido un listado de computadora acerca de los estudiantes de tiempo completo inscritos en el primer semestre. Hay 4265 nombres en la lista. El seor Cerros numer a los estudiantes como sigue: 0001, 0002, 0003, .... , 4265. As, utilizando nmeros aleatorios de cuatro dgitos, l identific una muestra. Muestras Sistemtica Es aquella donde se selecciona todo k simo elemento en el marco de muestreo despus de una inicio aleatorio entre los primeros k elementos. Este mtodo de seleccin utiliza la tabla de nmeros aleatorios slo una vez, para encontrar el punto inicial (el primer elemento que se observa). Muestras Estratificada Es aquella que se obtiene estratificando primero el marco de muestreo y seleccionando despus un nmero fijo de elementos de cada estrato mediante un muestreo aleatorio simple. Cuando se de ha de tomar una muestra estratificada la poblacin se subdivide en varios estratos, extrayndose luego un submuestra de cada estrato. Dichas submuestras pueden seleccionarse de cada estrato aleatoria o sistemticamente. Las submuestras se analizan en forma separada y, posteriormente, se combina toda la informacin para obtener conclusiones acerca de toda la poblacin. 69 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ Otro mtodo de muestreo en el que se hace una estratificacin de la poblacin es el muestreo por conglomerados. Muestra Por Conglomerado Es aquella que se obtiene estratificando primero el marco de muestreo y seleccionando despus todos los elementos de algunos estratos (no todos los estratos.) La muestra por conglomerado se obtiene utilizando nmeros aleatorios, o un procedimiento sistemtico para identificar primeramente los estratos (conglomerados) que sern muestrados, y empleando despus todos los elementos que se encuentran en dichos estratos. EJERCICIOS 1. 2. 3. Qu es un marco de muestreo? Qu utiliz el seor Cerros como marco de muestreo en la ilustracin 3? Considere una poblacin sencilla que se compone nicamente de los enteros 1, 2 y 3 (con un nmero ilimitado de cada uno). Pueden seleccionarse nueve muestras distintas de tamao 2 (dos dgitos) de esta poblacin: (1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3). a. Si la poblacin consta de los nmeros 1, 2, 3 y 4, enliste todas las muestras posibles de tamao 2 que podran seleccionarse. b. Si la poblacin se compone de los nmeros 1, 2 y 3, enliste todas las muestras posibles de tamao 3 que podran seleccionarse. c. Si la poblacin se compone de los nmeros 1, 2, 3 y 4, presente todas las muestras posibles de tamao 3 que podran seleccionarse. 4. El sistema de cmputo de un gran hospital contiene registros para 30000 pacientes. Los registros estn numerados del 1 al 30000. Si se obtuvo una muestra de los registros seleccionando a los pacientes cuyos nmeros son 100, 200, 300, ... 30000, obteniendo as 300 enfermos, cmo puede llamarse el tipo de muestreo utilizado?. Un comerciante mayorista en alimentos en una gran rea metropolitana desea conocer la demanda que existe por un nuevo producto, para lo cual desea enviar muestras de ese alimento a cinco grandes cadenas de supermercados. El mayorista selecciona una muestra de tiendas de cada cadena, en las que pone a prueba el producto nuevo. Qu tipo de muestreo es ste?. 70 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

5.

ESTADSTICA GENERAL ================================================================ 6. Un candidato a ocupar un cargo pblico asegura que ganar la eleccin. Un sondeo de opinin indica que 35 de 150 electores votarn por l, 100 favorecern a su oponente y 15 estn indecisos. a. Cul es el parmetro poblacional de inters? b. Tomando como base los resultados del sondeo, cree que es cierta la afirmacin del candidato?. 7. Una pequea encuesta consta de tres preguntas: a. Cul es su religin: cristiana, juda, musulmana, u otra? b. A cuntos ritos religiosos asiste usted anualmente? c. Cunto dinero don a organizaciones religiosas el ao pasado? Clasifique las respuestas como datos cualitativos o atributos, datos de variable discreta o datos de variable continua. 8. Un investigador que est estudiando los hbitos de consumo le pregunta a cada vigsima persona que entra en un supermercado acerca del nmero de veces que va de compras semanalmente. El investigador anota la respuesta como T. a. Es T = 3 un ejemplo de: (1) una muestra, (2) una variable, (3) una estadstica, (4) un parmetro, o (5) un dato?. Suponga que el investigador interroga a 427 consumidores en su estudio observacional. b. Mencione un ejemplo de pregunta que pueda ser contestada utilizando los medios de la Estadstica Descriptiva. c. Mencione un ejemplo de pregunta que pueda ser contestada utilizando los medios de la Estadstica Inferencial. 9. Describa con sus propias palabras cada uno de los trminos siguientes, dando adems un ejemplo diferente de los que se han visto en esta unidad. b. Dato Parmetro. c. Muestra d. Poblacin.

a. Variable

e. Estadstica. F. 10.

Encuentre un artculo, o un anuncio de peridico o revista, que ejemplifique el empleo de la Estadstica. 71

============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ a. Describa e identifique una poblacin de inters (si hay ms de una, mencione slo una en su respuesta). b. Describa e identifique una variable utilizada en el artculo. c. Describa e identifique una estadstica registrada en el artculo. 11. Conteste Verdadero si la afirmacin es siempre correcta. En caso contrario reemplace las palabras en tipo negro por otras que hagan que la aseveracin resultante sea siempre cierta. a. La Estadstica Inferencial es el estudio y descripcin de los datos resultantes de un experimento. b. La Estadstica Descriptiva es el estudio de una muestra que permite hacer proyecciones o estimaciones acerca de la poblacin de la cual procede tal muestra. c. Tpicamente, una Poblacin es un conjunto de personas u objetos muy grande, a partir del cual se desea obtener informacin. d. Una estadstica es una medida calculada de alguna caracterstica de una poblacin. e. Un parmetro es la medida de alguna caracterstica de una muestra. f. En una encuesta con 50 estudiantes de primer ao de la carrera administracin se encontr que en su poca de bachillerato 16 ellos participaron en actividades deportivas, 23 fueron ayudantes cursos y 18 realizaron actividades artsticas. Este es un ejemplo datos numricos discretos. de de de de

g. Abrir una caja de manzanas recibida y contar las que estn en mal estado es un ejemplo de datos numricos continuos. h. El espesor de la lmina metlica utilizada por una compaa en su proceso de fabricacin es una ilustracin de datos cualitativos o atributos. i. Una muestra representativa es la que se obtiene de manera que todos los individuos u objetos tiene la misma posibilidad de ser seleccionados.

72 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

ESTADSTICA GENERAL ================================================================ j. El objeto de la Estadstica es la obtencin de muestra, inspeccionarla e inferir acerca de caractersticas desconocidas de la poblacin de la cual procede.

73 ============================================================= ROJAS ROBLES NAPOLEN RAAS 2004

Vous aimerez peut-être aussi