1. CONCEPTOS Y DEFINICIONES 1. 1 Historia de la Estadstica Se sabe que 2000 a 2500 aos antes de Cristo, los chinos y los egipcios efectuaron censos que eran simples inventarios elementales. Adolph Quetelet (1796-1874) se consideraba como el padre de la Estadstica moderna por sus valiosas contribuciones a la prctica y metodologa estadstica. Sus trabajos cubrieron campos tales como censos, desarrollo de la uniformidad y comparabilidad de estadstica entre naciones y organiz la primera conferencia internacional de Estadstica. Se considera fundador de la estadstica a Godofredo de Achenwal, profesor y economista alemn (1719-1772), quien siendo profesor de la Universidad de Leipzig, escribi sobre el descubrimiento de una nueva ciencia que llam Estadstica y que defini como el conocimiento profundo de la situacin respectiva y comparativa de cada estado. Achenwall y sus seguidores estructuraron los mtodos estadsticos que se orientaron a investigar, medir y comparar las riquezas de las naciones. Karl Friederich Gauss estudi la curva normal o campana de Gauss, demostrando su valor prctico. Francis Galton y Charles Darwin desarrollaron mtodos estadsticos como la regresin y correlacin que aplicaron en el estudio de la herencia. Karl Pearson desarrollo la distribucin CHI CUADRADO que se considera la ms importante de su investigacin. William S. Gosset, dedujo la distribucin T.
1.2 Definicin de estadstica La estadstica se trata de la teora y aplicacin de mtodos para coleccionar datos, organizarlos, analizarlos y hacer deducciones a partir de ellos. Tambin se puede decir que la estadstica es una agrupacin de datos ordenados en forma sistemtica en cuadros y/o grficos. Es el conjunto de mtodos que permite recolectar, organizar, resumir y analizar datos para sacar conclusiones y tomar decisiones. La palabra estadstica viene del nombre griego Statero, que significa balanza, del latn Satatus, que significa situacin o estado, y del alemn Staat, que significa estado.
Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 2
1.2.1 Estadstica Descriptiva o Deductiva Es el mtodo para obtener, de un conjunto de datos, conclusiones sobre los mismos y que no sobrepasan el conjunto de conocimientos que proporcionan esos datos. Su estudio incluye las tcnicas para recolectar, analizar e interpretar los datos. 1.2.2 Estadstica Inferencial o Inductiva o Simplemente Inferencial Estadstica Es el mtodo y conjunto de tcnicas que se utilizan para obtener conclusiones que sobrepasan los lmites de los conocimientos aportados por los datos. En otras palabras busca obtener informacin sobre un colectivo mediante un metdico procedimiento de los datos de una nueva muestra tomada de l. Ejercicio. Ubicar en estadstica descriptiva o estadstica inferencial los siguientes aspectos: a. Promedios de estaturas de los alumnos de 6 grado de un colegio.
b. Determinar la probabilidad de que muestras de observaciones sean solo el resultado de variaciones al azar.
c. Encontrar una diferencia consistente entre dos mtodos especficos de enseanza.
d. Determinar la vida media de lmparas producidas por determinados fabricantes.
1.3 Poblacin o Universo Colectivo (M) Es el conjunto de todos los elementos, medidas, individuos u objetos que tiene una caracterstica comn. Ejemplo: Estudiantes de Ingeniera civil de la Universidad Francisco de Paula Santander. 1.4 Muestra (m) Pequea parte del grupo, que es representativo de la poblacin. Conjunto de medidas o recuento de una parte de los elementos pertenecientes a la poblacin. Ejemplo. Estudiantes de Ingeniera Civil que tienen entre 18 a 20 aos. Ejemplo. En la construccin de un edificio existen 300 empleados de los cuales 5 son Ingenieros Civiles, 10 Ingenieros Elctricos, 10 Calculistas, 20 Tecnlogos en Obras Civiles, 5 secretarias, 10 almacenistas y 240 empleados. La poblacin es el total de los empleados de la construccin del edificio que son 300. Una muestra de esa poblacin 5 Ingenieros Civiles o los 10 ingenieros elctricos o 5 calculistas o 10 tecnlogos, etc. Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 3
Nota: Los datos obtenidos de una poblacin pueden contener toda la informacin que se desee de ella. De lo que se trata es de extraerle esa informacin a la muestra, es decir a los datos mustrales sacarle toda la informacin de la poblacin. La muestra debe obtener toda la informacin deseada para tener la posibilidad de extraerla, esto slo se puede lograr con una buena seleccin de la muestra y un trabajo muy cuidadosos y de alta calidad en la recogida de los datos. Es bueno sealar que en un momento una poblacin puede ser muestra en una investigacin y una muestra puede ser poblacin, esto est dado por el objetivo del investigacin, por ejemplo en el caso de determinar la estatura media de los estudiantes universitarios en Cuba una muestra poda ser escoger algunas universidades del pas y realizar el trabajo, si por el contrario se quiere saber la estatura promedio de los estudiantes de una universidad en especifico en Cuba, entonces el conjunto formado por todos los estudiantes de esta universidad sera la poblacin y la muestra estara dada por los grupos, carreras o aos seleccionado para realzar el experimento. para que una muestra sea representativa de la poblacin, sta deber contener aproximadamente entre el 5 % y el 10 % de los datos de la poblacin cuando sta es finita, adems los elementos de la muestra deben ser escogidos al azar (a la suerte) y se deben observar todas las caractersticas que se observan en la poblacin.
1.5 Parmetros Son todas aquellas medidas que describen numricamente las caractersticas de una poblacin. Se les conoce tambin como valor verdadero, ya que una caracterstica poblacional tendr solo un parmetro (varianza, media, etc). 1.6 Datos Son medidas, valores o caractersticas susceptibles de ser observados y contados. Se le llama Datos a las agrupaciones de cualquier nmero de observaciones relacionadas. Para que se considere un dato estadstico debe tener dos caractersticas:
a) Que sean comparables entre s. b) Que tengan alguna relacin.
La recoleccin de informacin o recopilacin de datos estadsticos se divide en: 1.6.1 Datos Internos
Son aquellos datos que no necesitan de observaciones adicionales al experimento; es decir, no es necesario buscar caractersticas que proporcionen informacin adicional acerca del experimento. Ejemplo: Las calificaciones de un grupo, un experimento qumico, etctera.
1.6.2 Datos Externos Estos datos pueden ser de dos tipos:
Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 4
1.6.2.1 Datos Bibliogrficos
Son aquellos ya conocidos y que podemos encontrar fcilmente utilizando bibliografa, registros, actas, etctera, como los datos histricos, censos y otros.
b) Datos Originales: son aquellos que podemos obtener mediante mtodos de recoleccin, como las encuestas, plebiscitos, referndum, y nos proporcionan datos reales y certeros.
Para Organizar los datos: existen muchas formas de clasificarlos, en general pueden ser determinados de acuerdo a cuatro elementos que son: Tiempo, lugar, cantidad y cualidad.
Presentacin de Datos: despus de la organizacin de los datos, la informacin se resume en Tablas Estadsticas con base en arreglos formados de renglones y columnas, adecuados segn cronologa, geografa, anlisis cuantitativo o cualitativo.
Los principales elementos de una tabla estadstica son: Ttulo, unidades, encabezado, cuerpo o contenido, nota de pie y referencias; la informacin contenida en una tabla estadstica tambin se puede presentar mediante graficas, siendo las ms comunes las de lneas, barras, pictogrficas, cronogramas, circulares o de pastel, histograma y polgono de frecuencias.
1.7 Variables o caractersticas o caracteres Son ciertos rasgos, cualidades que poseen los elementos de una poblacin o muestra. Las variables se clasifican en: Cualitativas y Cuantitativas. Se le llama Variable a la cualidad o cantidad medible de cualquier suceso o accin que presente o experimente un cambio, la podemos representar mediante un smbolo (X, Y, Z, , , , ) y al cual se le puede asignar un valor cualquiera de un conjunto determinado de datos.
Le llamamos Variable Aleatoria a aquella variable cuyos cambios no pueden ser determinados antes de que estos se presenten; es decir, estn destinados a la suerte. Tambin se le conoce como Variable Probabilista, Cabalstica, de Azar o a la Suerte.
1.7.1 Tipos de Variables Para su estudio, las variables aleatorias se han clasificado segn la naturaleza de los valores que toman en:
1. Variables Numricas: a) Variables Numricas Discretas b) Variable Numrica Continua 2. Variables Categricas: a) Variables Categricas Nominales b) Variables Categricas Ordinales 1.7.1.1 Variables Numricas o Cuantitativas Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 5
Son aquellas que se identifican o se les puede asignar un valor numrico o que corresponden a aspectos que son medibles.
Ejemplo: Tiempo de uso, precio, tamao, velocidades, nmero de hijos de una familia, nmero de carros que circulan por determinada calle, alturas, pesos, tallas, temperaturas, tiempo de vida de una persona, cantidad de azcar para endulzar un caf, medida de sombreros, etctera.
Las variables numricas se dividen en:
1.7.1.1.1 Variables Numricas Discretas
Son aquellas que solamente toman valores enteros con rango finito.
Ejemplo: Nmero de hijos en cada familia de una colonia de la ciudad, talla de calzado de cada alumno de un grupo escolar, la cantidad de alumnos por grupo, etc.
1.7.1.1.2 Variable contina Es cuando tericamente puede tomar cualquier valor entre dos valores dados. Ejemplo: El volumen de agua de un tanque. La medida de la cantidad de pintura para un saln. La duracin de una pelcula.
1.7.1.2 Variables Categricas o Cualitativas
Son aquellas a las que no se les puede asignar o identificar con un valor numrico, sino con un aspecto, cualidad o caracterstica que las distinga y que no se pueden medir sino solo observar, a ese aspecto, cualidad o caracterstica se le llama categora.
Son las que se expresan mediante palabras y dan origen a los atributos (sexo, profesin, estado civil, etc).
Ejemplos: Marca, tipo de sangre, deporte preferido, el estado en general de cualquier cosa, idioma, nacionalidad, colores, cabello o piel, himnos nacionales, sexo, estado de nimo, clima, etctera.
En las variables categricas, un elemento no puede estar en dos o ms categoras a la vez, lo cual las hace excluyentes y adems no puede haber elementos de la poblacin que no pertenezcan a alguna categora, lo cual las hace exhaustivas.
Las variables categricas se dividen en:
Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 6
1.7.2 Variables Categricas Nominales
Son aquellas a las que no se les puede asignar un orden, es decir que slo permite clasificacin en categoras por mencin de sta.
Ejemplo: La nacionalidad de una persona, idioma, sexo, himnos nacionales.
1.7.3 Variables Categricas Ordinales
Son aquellas que adems de clasificar a los elementos en distintas categoras les podemos asignar un orden o que podemos ordenar de acuerdo a cierta caracterstica.
Ejemplo: El estado de salud de una persona; que podemos ordenarla segn la urgencia del caso, el color de algn objeto segn la tonalidad desde muy clara a ms oscuro; que podemos ordenarlo de acuerdo a la intensidad del color, el grado militar, puesto en la empresa, da de la mam, meses del ao, etctera.
Ejercicios. Frente a cada variable escriba una C si es continua y una D si es discreta. 1. El volumen de agua de una piscina. 2. Longitud de 1000 cerrojos producidos por una fbrica. 3. Nmero de acciones vendidas de un edificio. 4. Periodo de duracin de los transistores producidos por una compaa. 5. El nmero de alumnos de cada semestre de carrera de Administracin de Empresas. 1.8 Proporciones. Una proporcin es la igualdad de dos razones por cociente. Es una razn en la cual los elementos del numerador estn incluidos en el denominador. Se utiliza como estimacin de la probabilidad de un evento. El rango es de 0 a 1 (o de 0 a 100%). Ejemplo. En el ao 2005 se declararon 1295 casos de legionelosis en Espaa (datos del Instituto Nacional de Estadstica). Ejemplos de proporcin: Casos de legionelosis en Andaluca en relacin al total de casos en Espaa: 83/1295= 0,064. El 6,4% de los casos de legionelosis en Espaa se declararon en Andaluca. Casos de legionelosis en Canarias en relacin al total de casos en Espaa: 11/1295= 0,0085. El 0,85% de los casos de legionelosis en Espaa se declararon en Canarias.
1.9 Razones Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 7
Una razn es una relacin entre dos cantidades que permite compararlos; esta comparacin se puede efectuar por la diferencia o por cociente. Sean a y b dos nmeros, con ellos podemos establecer las siguientes razones. a-b En este caso se dice que la razn es aritmtica. a/b La razn es geomtrica o por cociente. Ejemplo. En el ao 2005 se declararon 83 casos de legionelosis en Andaluca, 11 en Canarias y 34 en Asturias (datos del Instituto Nacional de Estadstica). Ejemplos de razn: Razn casos de legionelosis en Andaluca/casos de legionelosis en Canarias: 83/11= 7,55. Por cada caso de legionelosis declarado en Canarias hay 7,55 casos declarados en Andaluca. Razn casos de legionelosis en Andaluca/casos de legionelosis en Asturias: 83/34= 2,44. Por cada caso de legionelosis declarado en Asturias hay 2,44 casos declarados en Andaluca. 1.9 Unidad de Investigacin Es el elemento de la poblacin que origina la informacin y puede ser una persona, un hogar, una industria, etc. La unidad debe ser clara en su definicin, fcilmente identificable y mesurable. 1.9.1 Recoleccin de la informacin Que puede ser por observacin, por encuesta o simplemente obtenida de publicaciones y/o fuentes confiables que han efectuado la investigacin estadstica. 1.9.2 Procesamiento de informacin Que consiste en ordenar la informacin, filtrarla eliminado posibles errores y analizar la informacin mediante los mtodos y normas de la estadstica. 1.9.3 Publicacin Es la etapa final de entrega de la informacin despus de revisado, ya sea para uso propio o ajeno. Los datos se deben presentar en forma adecuada. 1.10 Experimento estadstico Es en general, el estudio de una situacin creada, en donde la poblacin es inexistente o mejor dicho hipottica; el objeto del experimento es establecer, por mtodos estadsticos, algunas caractersticas de la poblacin si esta existiera. Fuentes de Informacin: Primarias y Secundarias Definicin Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 8
1.10.1Fuentes Primarias
Son aquellas en las que la informacin se encuentra en su origen, y por lo tanto debe ser elaborada por primera vez y de forma especfica.
1.10.2Fuentes Secundarias
Son aquellas que presentan informacin ya elaborada, o existente, que fue generada anteriormente con otra finalidad que no tiene porqu coincidir con la nuestra. Podemos distinguir entre Estadsticas y Metodolgicas.
1.11 Estratificacin: El criterio a seguir en la formacin de los estratos ser formarlos de tal manera que haya la mxima homogeneidad en relacin a la variable a estudio dentro de cada estrato y la mxima heterogeneidad entre los estratos. 1.12 Experimento
Se le llama Experimento a toda accin o prueba que se realiza con el fin de observar su resultado. Existen dos tipos de experimentos, que son:
1.12.1 Experimento Determinista
Son aqullos en los que se puede predecir con certeza su resultado antes de que ste se presente.
Ejemplo: Al lanzar en un cuarto un libro al aire con el fin de determinar si flota, se queda unido al techo o cae al suelo, sabemos con certeza que el libro caer al suelo, lo cual lo hace un experimento determinista.
1.12.2 Experimento Aleatorio, Probabilista, casual o de azar
Hablar de aleatorio, probabilista, casual o azar es hablar de algo que est determinado a la suerte. As, decimos que un Experimento Aleatorio ocurre cuando no es posible asegurar el resultado que se va a presentar.
Ejemplo: Al lanzar una moneda al aire no sabemos si el resultado va a ser guila o sello, lanzar un dado, etctera.
1.13 Muestreo
Se llama Muestreo al estudio que se hace de una poblacin por medio de muestras representativas, debidamente elegidas de manera que posea todas las caractersticas de una poblacin y de tamao determinado segn la precisin que de ella se quiere obtener en las decisiones y conclusiones estadsticas posteriores.
Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 9
1.14 Valores Estadsticos
Se le llama valores estadsticos, estadsticos mustrales o simplemente estadsticos a los valores o cantidades desconocidas que son obtenidas de, o que hacen referencia a las caractersticas de una muestra.
1.15Aplicaciones de la Estadstica. Las primeras aplicaciones de la estadstica fueron asuntos del gobierno, luego las utilizaron en compaas de seguros y los empresarios de juegos de azar, a los anteriores siguieron los comerciantes, los industriales, los educadores, etc. Biologa: Agricultura, Gentica, Medicina, Biometra (Estudio de la vida por medio de la estadstica). Tcnicas de Estado: Transporte, Salud Pblica, Educacin, Vivienda, Hacienda Pblica, Planificacin y administracin. Sociologa: Opinin Pblica, Hechos Humanos y Desempleo. Sicologa: Aplicacin de test, sicometra. Economa: Contabilidad, Mercadeo, Recursos Financieros. Fsica y Qumica: Mecnica. Realice la siguiente Actividad. 1. Utilice los conceptos analizados para completar las siguientes frases:
a. Por medio de una investigacin se recolectan los _____________________
b. Para aprender a procesar datos y extraer conclusiones, se debe estudiar ____________________________________________________________
c. La estadstica que analiza los datos y los describe es _________________
d. Para aprender a hacer inferencia estadstica se debe estudiar __________ ____________________________________________________________
e. El lenguaje que se aprende en estadstica _____________________ las descripciones, correlaciones e inferencias que hacen los investigadores.
f. El grupo de elementos que tienen una caracterstica comn forman una ________________ , _____________________ ____________________
g. Los hechos o caractersticas que toman diferentes valores se llaman ___________________.
h. Si una variable toma cualquier valor, son ______________________
Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 10
i. Si la variable en cambio no toma valores intermedios, es _______________
j. Si los datos recolectados nos muestran o hacen descripciones, esas variables son de tipo ____________________________
k. Si los datos recolectados pertenecen a la cantidad de padres de familia del Colegio Santa Cecilia, la variable es ____________________ y ________________________
2. Investiga tres conceptos diferentes de Estadstica y antalas.
3. Lee cuidadosamente y responde los siguientes cuestionamientos, rellenando el crculo de la opcin que consideres correcta.
3.1. Rama de las matemticas en donde a travs de un conjunto de metodologas se puede observar el comportamiento de un experimento o fenmeno y da una conclusin acertada.
a. Estadstica b. Estadstica diferencial c. Estadstica inferencial d. Estadstica aplicada
3.2. Cules son las dos clasificaciones de la estadstica? a. Inferencial y aplicada b. Aplicada diferencial c. Descriptiva e inferencial d. Descriptiva y diferencial. Conjunto de datos cuya finalidad es suministrar informacin acerca de una poblacin en donde todos los elementos deben tener todas las caractersticas de la poblacin.
a. Poblacin b. Muestra c. Estadstica d. Datos
3.4. Tipo de variable al que se le puede asignar un valor numrico: a. Numricas o cuantitativas b. Categricas o cualitativas c. Numrica contina d. Cabalstica 3.5 As se le llama al estudio que se hace de una poblacin por medios de muestras representativas que posea todas las caractersticas de una poblacin: a. Muestra b. Muestreo c. Experimento d. Organizar Probabilidad y Estadstica
Ing. Miroslava G.Reyes Prada Pgina 11
4. Busque en la web o en la prensa una noticia informativa donde se involucre a la estadstica, anxela, analice y determine: a) La poblacin de estudio. b) La muestra elegida. c) Las variables involucradas.
5. A continuacin se le proporciona una serie de variables estadsticas, clasifique cada una como nominal, ordinal, discreta o continua segn corresponda. a) Peso. b) Promedio escolar. c) Estado civil. d) Semestre que cursa. e) Mes de nacimiento. f) Nmero de hermanos por alumno. g) Deporte favorito. h) Tiempo invertido al da en el chat. 6. Elabora dos ejemplos en donde se desglose la Estadstica descriptiva y la Estadstica inferencial