Vous êtes sur la page 1sur 10

Lic. Mg.

Jorge Enrique Sarmiento Arias

Estadstica

Los inicios de la estadstica Desde el ao 3000 a.C. han existido formas sencillas de estadsticas, pues ya se utilizaban representaciones grficas y otros smbolos tallados en distintos materiales (piedras, pieles, maderas) para contar el nmero de personas o animales. Por ejemplo, los babilonios usaban pequeas tablillas de arcilla para recopilar datos sobre la produccin agrcola y los egipcios analizaban los datos de su poblacin. En China existan registros numricos similares con anterioridad al ao 2000 a.C. Los griegos clsicos realizaban censos cuya informacin se utilizaba hacia el ao 600 a.C. para cobrar impuestos. Muchos aos despus, en 1662, apareci el primer estudio estadstico importante de una poblacin titulado Observations on the London Bills of Mortality (Observaciones sobre las partidas de defuncin en Londres). Con la divulgacin del mtodo cientfico en el siglo XIX, para estudiar los fenmenos de las ciencias naturales y sociales, los investigadores comenzaron a reducir la informacin a valores numricos para una mayor comprensin de los fenmenos observados. Algunos conceptos bsicos El mundo presenta una enorme variabilidad. Por ejemplo, los seres vivos son distintos entre s, y aportan diversidad a la poblacin. Muchas son las caractersticas que pueden variar entre individuos (en el ser humano: altura, color de pelo, sexo, edad, respuesta a tratamientos, entre muchos otros). Se las llama variables y se las puede clasificar como se indica en la siguiente tabla:.
Variables cualitativas No se pueden medir numricamente. No permiten realizar operaciones algebraicas. Pueden ser nominales u ordinales. Variables cuantitativas Tienen valor numrico (edad, altura, ingresos mensuales). Se pueden clasificar en discretas y continuas. Nominales: Sus valores no se pueden ordenar. Por ejemplo: sexo (F o M), grupo sanguneo (A, B, AB, 0, entre otros), religin, nacionalidad, etc. Ordinales: Sus valores se pueden ordenar. Por ejemplo: mejora de un paciente ante un tratamiento (muy mejorado, moderado, poco mejorado, sin mejoras), grado de satisfaccin (muy, medianamente, poco, nada satisfecho), intensidad del dolor, etc. Discretas: slo pueden tomar valores enteros (1, 2, 25, -12, etc.). Por ejemplo: nmero de hijos (puede ser 1, 2, 3, etc., pero nunca podr ser 3,5). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la altura de las personas puede ser 1,65 m; 1,70 m; 1,90 m; etc.

La estadstica se aplica sobre la variabilidad, y se puede utilizar de dos maneras: - la estadstica descriptiva se dedica a la presentacin, organizacin y resumen de los datos observados. - la estadstica inferencial permite generalizar los datos de las muestras a un nmero ms grande de individuos (poblacin). Cuando se estudia el comportamiento de una variable en una poblacin (conjunto sobre el que se desea obtener conclusiones o hacer inferencias) hay que tener en cuenta que sta normalmente es demasiado grande para poder abarcarla. Entonces, se toma una muestra formada por miembros seleccionados de la poblacin (individuos o unidades experimentales) y que es suficientemente representativa (en cantidad y diversidad).

Lic. Mg. Jorge Enrique Sarmiento Arias

Estadstica

Cmo se analizan los datos? Cuando se toman datos de una muestra, stos son inicialmente compilados en bases de datos (tablas de frecuencias), para luego ser presentados en forma grfica. Esto ayuda a visualizar e interpretar la variacin de los datos. La distribucin de frecuencia es la representacin estructurada, en forma de tabla, de la informacin que se ha recogido sobre la variable en estudio, como se muestra en la siguiente tabla, en donde X son los distintos valores que puede tomar la variable, n es el nmero de veces que se repite cada valor, y f es el porcentaje (en relacin con el total) en el que se repite dicho valor.
Variable
(Valor) X1 X2 ... Xn-1 Xn

Frecuencias absolutas
Simple n1 n2 ... nn-1 nn Acumulada n1 n1 + n2 ... n1 + n2 +..+ nn-1 n

Frecuencias relativas
Simple f1 = n1 / n f2 = n2 / n ... fn-1 = nn-1 / n fn = nn / n Acumulada f1 f1 + f2 ... f1 + f2 +..+fn-1 f

Por ejemplo, al medir la altura de los nios de una clase, se obtienen los siguientes resultados (en metros)
Alumno Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5 Alumno 6 Alumno 7 Alumno 8 Alumno 9 Alumno 10 Estatura 1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29 Alumno Alumno 11 Alumno 12 Alumno 13 Alumno 14 Alumno 15 Alumno 16 Alumno 17 Alumno 18 Alumno 19 Alumno 20 Estatura 1,23 1,26 1,30 1,21 1,28 1,30 1,22 1,25 1,20 1,28 Alumno Alumno 21 Alumno 22 Alumno 23 Alumno 24 Alumno 25 Alumno 26 Alumno 27 Alumno 28 Alumno 29 Alumno 30 Estatura 1,21 1,29 1,26 1,22 1,28 1,27 1,26 1,23 1,22 1,21

Extrado de: http://www.aulafacil.com/CursoEstadistica/Lecc-2-est.htm

Lic. Mg. Jorge Enrique Sarmiento Arias


A partir de estos datos, se puede obtener la siguiente tabla de frecuencias:
Variable (Valor) 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 Frecuencias absolutas Simple 1 4 4 2 1 2 3 3 4 3 3 Acumulada 1 5 9 11 12 14 17 20 24 27 30 (total) Frecuencias relativas Simple 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% Acumulada 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

Estadstica

Las frecuencias simples se obtienen contando cuntos nios tienen determinado valor (por ejemplo hay 1 nio que mide 1,20m y 4 que miden 1,22 m.). Las frecuencias relativas simples consideran cada valor en relacin con el total: por ejemplo para el valor 1,20, hay 1 solo nio (de un total de 30) que posee esa altura, entonces la frecuencia (en %) es: 1/30*100= 3,3%

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces es conveniente agruparlos por intervalos, como muestra el histograma (ver ms adelante), ya que de otra manera se obtendra una tabla de frecuencia muy extensa. Una vez obtenida una tabla de frecuencias, se puede representar mediante un grfico. En estadstica se denominan grficos a aquellas imgenes que, combinando la utilizacin de colores, puntos, lneas, smbolos, nmeros, texto y un sistema de referencia (coordenadas), permiten presentar informacin cuantitativa. La utilidad de los grficos es doble, ya que pueden servir no slo como sustituto a las tablas, sino que tambin constituyen por s mismos una poderosa herramienta para el anlisis de los datos, siendo en ocasiones el medio ms efectivo no slo para describir y resumir la informacin, sino tambin para visualizarla y analizarla.

Lic. Mg. Jorge Enrique Sarmiento Arias


Tipos de grficos Grficos para variables cualitativas Diagramas de barras: se representan en el eje de ordenadas (X) las modalidades, y en abscisas (Y) las frecuencias absolutas o relativas. Por ejemplo: el porcentaje de personas que pertenecen a los distintos grupos sanguneos son: B: 7%; A: 44%; AB: 3%; 0: 46%.
50 40 30 20 10 0 AB 3 % 44

Estadstica

46

A 0 B grupos sanguneos

Diagramas de sectores (tambin llamados tortas): Se divide un crculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa. Para los datos del ejemplo anterior se muestra el grfico de torta correspondiente.

7% 3% 44% A 0 AB 46% B

Grficos para variables numricas Hay diferentes tipos de grficos, dependiendo de si las variables son discretas o continuas. En estos grficos se pueden representar tanto frecuencias absolutas como relativas. Diagramas de barras para variables discretas Se deja un hueco entre barras para indicar los valores que no son posibles (por ejemplo, nmeros decimales de hijos)

450 400 350 300 250 200 150 100 50 0 1 2 3 4 5 6 N de hijos

Tomando el ejemplo de las tablas anteriores, se representan la frecuencia de alumnos segn su estatura (agrupada en clases o intervalos)

N de nios

Histogramas para variables continuas El rea que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.

o t n u c e R
9 8 7 6 5 4 3 2 1 0
2 1,

22 1,

24 1,

26 1,

28 1,

2 3 ... 1, 1,3 or ay m y

altura

Lic. Mg. Jorge Enrique Sarmiento Arias

Estadstica

Cada unos de los diagramas anteriores, puede tener su correspondiente diagrama integral, el cual se construye a partir de las frecuencias acumuladas, ya sean absolutas o relativas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo (ver tabla anterior). Generalmente, tras la elaboracin de la tabla y su grfica, en la mayora de las ocasiones resulta ms eficaz resumir la informacin en algunos nmeros que la expresen de forma clara y concisa.

Probabilidades. Algunos conceptos bsicos Si se quieren representar los resultados de un experimento, los mtodos de la estadstica descriptiva son suficientes. Sin embargo, si lo que se pretende es utilizar la informacin obtenida para extraer conclusiones generales sobre todos los objetos del mismo tipo de los estudiados, entonces estos mtodos constituyen slo el principio del anlisis, y se debe recurrir a mtodos de inferencia estadstica, los cuales implican el uso de la teora de la probabilidad. La probabilidad es la posibilidad de que algo pase. Se expresa como fracciones o como decimales que toman valores entre cero y uno. Tener una probabilidad de 0 (cero) significa que algo nuca va a suceder, mientras que una probabilidad de 1 (uno) indica que algo va a suceder siempre. En la teora de la probabilidad, un evento es uno o ms de los posibles resultados de algo. La actividad que origine uno de dichos eventos se conoce como experimento aleatorio. Al conjunto de todos los resultados posibles de un experimento se le llama espacio muestral del experimento. Tipos de probabilidad Existen tres maneras bsicas de clasificar la probabilidad: 1. Frecuencia relativa de presentacin En el siglo XIX, los estadsticos britnicos comenzaron a recoger datos sobre nacimientos y defunciones para poder calcular el riesgo de prdidas en las plizas de seguros de vida. En la actualidad, a este proceso se lo llama frecuencia relativa de presentacin de un evento y define la probabilidad como: La frecuencia relativa observada de un evento durante un gran nmero de intentos, o la fraccin de veces que un evento se presenta a la larga, cuando las condiciones son estables. Con este mtodo se determina qu tan frecuente ha sucedido algo en el pasado y se usa esa cifra para predecir la probabilidad de que suceda de nuevo en el futuro. Aqu, el nmero que se obtiene como probabilidad adquirir mayor precisin a medida que aumentan las observaciones.

Lic. Mg. Jorge Enrique Sarmiento Arias

Estadstica

2. Probabilidades subjetivas Las probabilidades subjetivas estn basadas en las creencias de las personas que efectan la estimacin de probabilidad. La probabilidad subjetiva se puede definir como la probabilidad asignada a un evento por parte de un individuo, basada en la evidencia que se tenga disponible. Las asignaciones de probabilidad subjetiva se dan con ms frecuencia cuando los eventos se presentan slo una vez o un nmero muy reducido de veces. 3. Probabilidad clsica Se define la probabilidad de que un evento X ocurra como: P(X) = Nmero de resultados favorables / nmero total de resultados posibles La probabilidad clsica es conocida como probabilidad a priori, debido a que si se utilizan ejemplos previsibles (como al arrojar monedas o dados), se puede establecer la respuesta de antemano, sin necesidad de lanzar una moneda o un dado. No tenemos que efectuar experimentos para poder llegar a conclusiones. As, la probabilidad de que salga cara al tirar una moneda es de 50% o 0,5, ya que es 1 de 2 posibilidades (cara o ceca). En la resolucin de problemas de probabilidad clsica, se debe tener en cuenta si los sucesos son incompatibles, condicionados o independientes. Dos sucesos X e Y son incompatibles si el hecho de que uno ocurra conlleva la imposibilidad de que lo haga el otro. Un ejemplo muy conocido es el lanzamiento de un dado: cuando sale una de sus caras no puede salir otra al mismo tiempo. Entonces, la probabilidad de que se produzca X o Y es la probabilidad de X ms la probabilidad de Y (Ley de la suma) P (X o Y) = P (X) + P (Y), donde P es la abreviatura estadstica de probabilidad. Por ejemplo, la probabilidad de que salga un 4 o un 6 al arrojar un dado es: P(4) + P(6)= 1/6 + 1/6 = 2/3

Dos sucesos X e Y con condicionados si el hecho de que ocurra Y depende de lo que haya hecho X, o al revs. La probabilidad de que ambos ocurran simultneamente es la probabilidad de X multiplicada por al probabilidad de Y, suponiendo que ya haya sucedido X (Ley de multiplicacin). P (X eY)= P(X) x P(Y/X), donde P(Y/X) designa la probabilidad de Y condicionado a X.

Hay muchos sucesos que no son condicionados ni incompatibles, sino que son independientes entre s. La probabilidad de que dos sucesos independientes ocurran, viene dado por la multiplicacin de las probabilidades de cada uno de ellos. P(X e Y)= P(X) x P(Y) Por ejemplo, la probabilidad de que al arrojar un dado salga un 4 y un 6 es: P(4) x P(6)= 1/6 x 1/6= 1/36

Las probabilidades y la gentica Una parte importante en el trabajo de un genetista es predecir el tipo de progenie que se originar de una cierta cruza y poder calcular la proporcin de los mismos, es decir, determinar sus probabilidades.

Lic. Mg. Jorge Enrique Sarmiento Arias

Estadstica

Los estudios de uno de los genetistas ms famosos, Gregor Mendel, son un ejemplo de una correcta utilizacin del mtodo cientfico. Eligi el material de investigacin ms indicado para resolver el problema propuesto (la herencia de caracteres), dise los experimentos cuidadosamente, recolect una enorme cantidad de datos y utiliz un anlisis estadstico (probabilidades) para demostrar que los resultados obtenidos confirmaban sus hiptesis. Las predicciones de las hiptesis eran posteriormente chequeadas en una nueva serie de experimentos. Los experimentos y las conclusiones obtenidas en los experimentos de Mendel se desarrollan en los Cuadernos N 40 y 41.

CONSIDERACIONES METODOLGICAS Lo primero que se sugiere para trabajar los temas de este Cuaderno es coordinar con los docentes de matemtica, o que se empleen los ejemplos de la biologa y la gentica en las clases de matemtica. La estadstica no es un tema sencillo de trabajar ya que requiere de cierta abstraccin que no es fcil de lograr, especialmente con los alumnos ms pequeos. Por esto, se sugiere comenzar a trabajar el tema a partir de una actividad simple, como la Actividad N4 (Probabilidades y Monedas) que se propone en la seccin de ACTIVIDADES de este Cuaderno. A partir del anlisis de esta actividad se introducen los conceptos de probabilidad terica, el tamao de la muestra, y los resultados. Es importante tomarse el tiempo en clase para hacer la actividad, que los alumnos anoten los resultados, armar tablas de resultados, de frecuencias y analizar estos conceptos en la clase. Para relacionarlo con la gentica se sugiere ejemplificar con el caso de la probabilidad de que se forme un varn o una nena en la reproduccin, se tome el caso de una familia, y los datos de algn censo provincial o nacional, en el cual se toma una muestra ms grande y representativa que se aproxima ms a las probabilidades tericas. Otro tema central en el Cuaderno, que es importante trabajar en clase, se refiere a las representaciones grficas u organizadores grficos. Este tema es importante para abordar muchos contenidos de la ciencia. Los organizadores grficos son herramientas visuales que permiten presentar informacin y exhibir regularidades y relaciones. Pueden ser esquemas, lneas de tiempo, mapas conceptuales, cuadros, tablas, etc. Reflejan datos y sirven para comprimir informacin, focalizar el propsito de la comunicacin, localizar ideas claves y establecer relaciones entre ideas. Son una expresin visual de los datos. Las variables que los constituyen no aparecen en s mismas, sino bajo la forma de cantidades o tamaos representados como grficos de tortas, histogramas, curvas, etc. que requieren de aprendizaje y ejercitacin para su diseo e interpretacin. Los organizadores grficos utilizados comnmente en la enseanza son: Cuadro sinptico: clasificacin en forma de epgrafes comprendidos dentro de llaves de modo tal que el conjunto puede ser abarcado de una vez con la vista. Diagrama: representacin de un fenmeno por medio de figuras geomtricas. Grfico: expresin visual de datos, relaciones y cambios. Mapa: representacin de un territorio sobre una superficie plana. Matriz: cuadro dividido en filas y columnas. Tabla: serie ordenada de valores numricos de cualquier tipo. Mapas conceptuales: representan sistemas jerrquicos desde lo supraordenado a lo subordinado.

Lic. Mg. Jorge Enrique Sarmiento Arias

Estadstica

El uso de organizadores grficos en la enseanza favorece la comprensin de ideas y conceptos en tanto que permiten: Presentar, reorganizar o resumir informacin de un texto Organizar la informacin en forma espacial Visualizar la informacin como un todo significativo Facilitar la interpretacin y la comprensin de la informacin Convertir informacin compleja y desordenada en informacin significativa Localizar y recordar ideas claves Establecer interrelaciones entre ideas Actuar como mapas mentales Exhibir datos Describir objetos y lugares Desplegar el proceso de organizacin de un sistema Mostrar datos cuantitativos a travs de curvas, barras o puntos La ciencia utiliza habitualmente representaciones grficas que presentan algunas caractersticas en comn: - propiedades cuasi-perceptivas que hacen que las ideas ms abstractas puedan encontrarse materializadas; - carcter sinptico y de economa mental que busca la representacin ms simple y ms visual que pueda reunir el mximo de informacin, y que pueda ser captada como un todo con una mirada; - carcter estructurante que favorece la expresin de relaciones entre los elementos que describen y su organizacin. La imagen puede ser vista como una ayuda o como un obstculo en el proceso pedaggico, segn cmo se trabaje en la clase. Por lo cual deben ser utilizadas como una herramienta flexible. Esto significa: - construir equivalencias con otros lenguajes, es decir, hacer traducir los textos en esquemas y los esquemas en textos; - contribuir a tomar conciencia que la representacin de un fenmeno no es el fenmeno mismo sino un modelo que lo interpreta; - explicitar los cdigos y simbolismos que inducen a diferentes trayectos de lectura; - favorecer la explicitacin por parte de los alumnos de las formas utilizadas y de las razones por las cuales se usa una forma grfica y no la otra. Se sugiere presentar el grfico y realizar con los alumnos un anlisis de cada una de las variables que intervienen: - qu representan los ejes, - de dnde se obtienen los datos que se presentan en el grfico, - qu significa una curva ascendente o descendente, o una columna, o una porcin de la torta o la torta entera, etc. - analizar la ventaja del uso de cada tipo de organizador grfico en comparacin con otros, en cuanto a la claridad y visualizacin de la informacin que se pretende transmitir.

Lic. Mg. Jorge Enrique Sarmiento Arias

Estadstica

- resaltar la diferencia entre la informacin que se desprende de la lectura del grfico y las interpretaciones que se desprenden a partir de esa informacin y de la aplicacin de los conocimientos previos.

CONCEPTOS RELACIONADOS Caractersticas de los seres vivos. Variabilidad. Biodiversidad. Estadstica. Probabilidades. Muestras y censos. Frecuencia. Diseo, anlisis e interpretacin de representaciones grficas. Bases de la gentica. Experiencias de Mendel: anlisis y conclusiones. Estadstica en gentica. ACTIVIDADES Actividad 1. Revisin de conceptos Completar el siguiente cuadro, teniendo en cuenta los conceptos introducidos en la seccin terica:
variables nominales Cualitativas -----------------------continuas tipo de grfico ------------------- y ------------------diagramas de barras ---------------------------

Cuantitativas

Actividad 2. Tipos de variables numricas En esta actividad se propone que los alumnos agrupen las siguientes variables, segn el tipo al que pertenezcan: a) El grupo sanguneo b) Nmero de hijos c) Nacionalidad d) Intensidad de dolor e) Peso f) Nmero de sesiones de un tratamiento g) Nmero de hojas de un rbol h) Peso de las semillas recolectadas por planta i) Grado de satisfaccin al comprar un producto j)Sexo k) Longitud del tallo l) N de huevos por gallina

Lic. Mg. Jorge Enrique Sarmiento Arias


Actividad 3. Tablas de frecuencias y grficos
Nota: los datos fueron extrados de http://www.aulafacil.com/CursoEstadistica/Lecc-2-est.htm

Estadstica

Esta actividad tiene por objetivo ejercitar el diseo, interpretacin y anlisis de los resultados de una muestra de estudio, y la obtencin de conclusiones. Se mide la estatura de 30 habitantes de un barrio y se obtienen los siguientes resultados (m):
Habitante Habitante 1 Habitante 2 Habitante 3 Habitante 4 Habitante 5 Habitante 6 Habitante 7 Habitante 8 Habitante 9 Habitante 10 Estatura 1,15 1,48 1,57 1,71 1,92 1,39 1,40 1,64 1,77 1,49 Habitante Habitante 11 Habitante 12 Habitante 13 Habitante 14 Habitante 15 Habitante 16 Habitante 17 Habitante 18 Habitante 19 Habitante 20 Estatura 1,53 1,16 1,60 1,81 1,98 1,20 1,42 1,45 1,20 1,98 Habitante Habitante 21 Habitante 22 Habitante 23 Habitante 24 Habitante 25 Habitante 26 Habitante 27 Habitante 28 Habitante 29 Habitante 30 Estatura 1,21 1,59 1,86 1,52 1,48 1,37 1,16 1,73 1,62 1,01

a) Realizar una tabla de frecuencias absolutas y relativas como se ejemplifica en la seccin terica. b) Realizar el histograma correspondiente, separando al conjunto de datos en 10 clases de entre 1,00 m y 2,00 m. Cul es la columna de la tabla de frecuencias que se emplea para diagramar el histograma?

c) Cul es la estatura que se presenta con mayor frecuencia en esta poblacin? Cmo es posible
darse cuenta a partir del histograma? d) Cmo sera posible evaluar si las conclusiones de esta medicin pueden aplicarse a la poblacin de toda la ciudad? Material de Consulta
Bioestadstica. Norman y Streiner. Ediciones Harcourt S.A. Traducido al espaol. 2000
Apuntes y videos de estadstica de la Universidad de Mlaga http://campusvirtual.uma.es/est_fisio/apuntes/ Aula virtual de bioestadstica de la Universidad Complutense. http://e-stadistica.bio.ucm.es/ Conceptos bsicos en estadstica http://www.e-biometria.com/conceptos_basicos/conceptos_basicos.htm Material docente de la Unidad de Bioestadstica Clnica http://www.hrc.es/bioest/M_docente.html Ejemplos de tipos de grficos http://www.hrc.es/bioest/Ejemplos_histo.html Introduccin a la probabilidad de la Universidad de Alcal, Espaa.

Vous aimerez peut-être aussi