Vous êtes sur la page 1sur 6

Estadstica.

Por estadstica entendemos los mtodos cientficos mediante los cuales podemos recolectar, organizar, resumir y analizar datos numricos relativos a un grupo de observaciones. El objetivo es sintetizar la informacin de manera que se pueda tomar decisiones y reducir la incertidumbre. La estadstica se divide en dos grandes campos, la estadstica inferencial y la estadstica descriptiva. Estadstica descriptiva Es un conjunto de procedimientos para describir, resumir y analizar datos referentes a una determinada caracterstica de la realidad. Las tcnicas descriptivas son porcentajes, promedios, desviaciones est!ndar y coeficientes de correlacin. "entro de la estadstica descriptiva podemos encontrar las medidas de tendencia central #$, $d, $o%, las medidas de orden #$d, cuarteles, deciles y percentiles% y por ultimo las medidas de variabilidad #&t, ', '(, ) y coeficiente de varianza%. Las medidas de tendencia central junto con las medidas de orden forman las medidas de posicin. Estadstica inferencial Estudia como e*traer conclusiones generales para toda la poblacin a partir del estudio de una muestra. +tiliza la tcnica del muestreo. +na muestra es una parte de la poblacin seleccionada aleatoriamente y al azar. +na muestra es aleatoria, cuando en ella cada elemento escogido de la poblacin tiene la misma oportunidad de ser elegido, y en el que la seleccin de cualquier elemento no afecta que pueda seleccionar a cualquier otro. "entro de la estadstica inferencial podemos encontrar dos grandes campos la estimacin de par!metros y la prueba de ,iptesis. La estimacin de parmetros, se obtiene a partir de los resultados muestrales. 'e utiliza con variables cuantitativas. +n par!metro o el valor paramtrico, es el valor que toma un ndice #un porcentaje, media, etc.% en una poblacin. & ste ,ay que diferenciarlo del valor estadstico o muestral, que es el valor que toma un ndice en una muestra de una poblacin. El valor estadstico puede ser muy semejante a su valor poblacional o paramtrico, pero difcilmente sea el mismo. Los par!metros se representan simblicamente con letras griegas, mientras que los valores estadsticos se representan con letras latinas. Por otro lado tenemos la prueba de hiptesis, que se trata de un conjunto de procedimientos para e*aminar diferentes ,iptesis y decidir acerca la verosimilitud o plausibilidad de dos ,iptesis. -ay dos tipos de ,iptesis la hiptesis nula, que es aquella ya aceptada por la sociedad, y la hiptesis alternativa, que es plateada por el investigador y que pretende aspirar a rec,azar la ,iptesis nula. Podemos encontrar hiptesis unidireccionales que adelanta la direccin de la diferencia que se supone. Por ejemplo si -o u./01, la -i va a proponer que u. 2/01 o puede ser que se proponga que u.3/01. Las hiptesis bidireccionales plantean que la -i puede ser u. 3/01 o u. 2/014 en este caso no adelanta la direccin de la diferencia. Las hiptesis exactas, especifican un valor determinado para un par!metro. Por ejemplo u= /01. Las hiptesis inexactas no proponen un valor determinado. Por ejemplo u /01.

Zona de aceptacin de la Ho. Es el conjunto de resultados posibles de un e*perimento que tienen una #relativamente% alta probabilidad de verificarse de ser cierta la -o. Zona de rechazo de la Ho. Es el conjunto de resultados de un e*perimento que tienen poca probabilidad de verificarse s fuera cierta la -o. -ay una probabilidad del 1.15 de que la -o sea cierta y aparezca con valores correspondientes a la zona de rec,azo. Los resultados de la zona de rec,azo pueden observarse porque &. la -o es falsa4 6. la -o es verdadera pero nuestra muestra no es aleatoria4 7. la -o es verdadera y la muestra es aleatoria pero es una de aquellas que constituyen un 58 o /8 que dan lugar a resultados fuera de la zona de aceptacin de la -o. El punto crtico es el lmite entre la zona de rec,azo y la zona de aceptacin de la -o. ' la -i es bidireccional, la prueba ser! de dos e*tremos por lo que tendr! dos puntos crticos que depender!n del nivel de significacin establecido. 'i la -i es de unidireccional solo tendr! un punto crtico. Los niveles de significacin, indican la probabilidad que el investigador esta dispuesto a arriesgar a cometer un error, por lo general suele aceptarse el 58 o el /8. -ay dos tipos de errores que se suelen cometer. El error de tipo o alfa !"#, es que se rec,ace la -o cuando sta es cierta y no debera ,aberse rec,azado. El error de tipo $ o beta !%#, es cuando no se rec,az la -o cuando se tendra que ,aber rec,azado por ser ella falsa. "ecisin estadstica si el resultado obtenido se encuentra en la zona de rec,azo de la -o, sta se rec,aza. "e lo contrario se acepta. En ambos casos se enuncia el nivel de significacin utilizado, para dar a conocer el riesgo de cometer un error de tipo/ o (, in,erente a la decisin. -ay muc,as pruebas de ,iptesis una de ellas es la de 7,i cuadrado, que es un modelo probabilstico. -ay cuatro modelos probabilsticos la curva normal, la t de student, la distribucin binomial y la prueba de 7,i cuadrado. &urva normal es un modelo probabilstico terico porque no representa una curva real. Las variables son cuantitativas continuas. Las observaciones se concentran en el centro y descienden simtricamente a derec,a e izquierda. 'u representacin se realiza con un trazo continuo, es unimodal, mesoc9rtica y es asinttica. :oda curva normal queda caracterizada por la media y la desviacin est!ndar. "entro de la curva normal encontramos los puntajes z, el ; derivado #que sirve para obviar los problemas del puntaje z%4 y la transformacin a percentiles. 'istribucin binomial se usa ante pruebas cuyo resultado puede tomar / solo valor entre ( posibles. 'e utiliza con variables cuantitativas discretas y su grafico es el de barras, sin embargo a medida que < aumenta, la curva que puede dibujarse se ,ace totalmente suave y la distribucin pasa a ser la de una variable cuantitativa continua que se llama distribucin normal. Es una familia de distribuciones, ya que ,ay una diferente para cada valor posible de sus par!metros n y p. es asimtrica con el m!*imo a la derec,a cuando p21.5. p indica la probabilidad de que un ,ec,o ocurra. q indica la probabilidad de que este ,ec,o no ocurra. ( de student se aplica si las ,iptesis implican una comparacin entre medias y se tienen muestras peque=as, tambin cuando se trata de ,iptesis acerca de una media paramtrica y se dispone de una muestra peque=a o cuando se trata de ,iptesis acerca

del valor del coeficiente de Pearson o el de 'pearman en la poblacin. Las variables son cuantitativas. La distribucin de >t? es unimodal y simtrica. Es aplanada en el centro y m!s e*tendida en las regiones e*tremas, estas son las dos caractersticas que la diferencian de la curva normal. 'u forma depende de los grados de libertad #@l%, que est!n relacionados con los n9meros de casos. El )rado de libertad es el n9mero de valores de una serie estadstica que pueden variar libremente despus que se ,an impuesto ciertas restricciones a la serie de datos. El puntaje t critico define la zona de rec,azo de la -o a un nivel de significacin de 1,15 que es igual a :c. A B,/0. Para rec,azar la -o, el t obtenido tiene que ser igual o mayor que B,/0 o igual o menor que CB,/0. 7uando el @l es 2 B1 se puede utilizar la curva normal, ya que a partir de este n9mero las diferencias en las !reas no tienen importancia pr!ctica. Para usar la t, ,ay que establecer el nivel de significacin, que es la probabilidad de observar un resultado en la zona de rec,azo de la -o siendo este verdadero. Este nivel es fijado por el investigador. El error standard de las medias muestrales es la desviacin est!ndar de la distribucin de muestreo de las medias muestrales. El teorema del lmite central dice que la media de todas las medias muestrales coinciden con la media de la poblacin. Los valores de confianza manejados ,abitualmente son del D5 8 o del DD8, quedando un nivel de significacin del / o 58, o lo que es lo mismo una p.1,15 o 1,1/. *rueba de &hi cuadrado permite decidir si ,ay relacin entre dos variables entre dos variables medidas en escalas nominales. Es un coeficiente de asociacin. Es <E P&F&$E:FG7&, por ende, no requiere supuestos tan rigurosos con relacin a los par!metros subyacentes de la poblacin. Es de distribucin libre, por ende, no necesitamos asegurarnos de que los datos de la distribucin preveniente de poblaciones o universos sean distribuciones normales. 'e utiliza con variables cualitativas del nivel nominal y a veces ordinal. E*iste una distribucin de 7,i cuadrado para cada valor de los grados de libertad. 'e supone la ,iptesis de nulidad o alternativa y si el valor de c,i( es mayor o igual al nivel critico utilizado, se rec,aza la ,iptesis nula. Esta prueba tiene dos usos fundamentales como prueba de bondad de adaptacin y como prueba de independencia. &hi$ como prueba de bondad de adaptacin se utiliza para comparar las frecuencias observadas con las frecuencias esperadas tericamente seg9n alg9n modelo. 7,i( es una medida de discrepancia entre las fo y las fe. $ientras mayor sea 7,i( menor concordancia ,abr! entre las fo y las fe4 mientras menor sea 7,i(, mayor concordancia ,abr! entre dic,as frecuencias. &hi$ como prueba de independencia de los atributos se puede probar si dos atributos o variables son independientes o si es probable que estn asociadas. En el primer caso no podemos rec,azar la -o, en el segundo si. 7,i( solo nos dice si ,ay relacinHasociacin, si queremos saber en que grado ,ay asociacin utilizamos el coeficiente I de 7ramer, que es uno de los mas convenientes para tablas de doble

entrada, pues nos indica el grado de asociacin y sus limites son 1 y /, correspondiendo a ausencia de asociacin y asociacin perfecta. Para obtener la fe se utiliza el concepto del teorema de probabilidad compuesta o ley de la multiplicacin, que afirma que la ocurrencia simult!nea de ( o m!s ,ec,os independientes es el producto de sus probabilidades por separado. 'e utiliza cuando tenemos tablas de ( entradas. 'e multiplican las frecuencias marginales y se las divide por el total de casos. El valor de los grados de libertad se va a buscar en la tabla de c,i( para un riesgo de p.1,15 o 58 que nos va a indicar el valor critico. Por ejemplo, para un @l igual a ( el valor crtico es de 5,DD. 'i el valor ,allado por medio de 7,i( es igual o mayor se rec,aza la -o, en caso contrario no se rec,aza. +imites de la prueba de &hi$ /. Los casos o sujetos deben ser seleccionados al azar y de forma independiente. (. Las frecuencias esperadas deben ser 5 o mas, con ( o mas @l. 'i ,ay un solo grado las fe deben ser por lo menos /11. B. Las categoras deben ser simult!neamente e*clusivas y e*,austivas. <inguna observacin puede incluirse en dos celdas y tampoco se deben dejar datos fuera de la tabla. J. 'olo son adecuados los datos nominales. La principal ventaja respecto al coeficiente ) de Kendall es que permite decidir si la asociacin observada es o no significativamente diferente de la que podra registrarse por mero azar. &oeficiente de ,ates cuando los @l en la prueba de 7,i( son /, conviene usar la correccin para continuidad de Lates. Lo que ,ace es restarle 1,5 al valor de la resta de la foCfe antes de elevarlo al cuadrado. La correccin de Lates implica una reduccin del error de tipo / o M. (eora de la probabilidad estudia los fenmenos aleatorios estoc!sticos. Estos son fenmenos que se obtienen como resultado de e*perimentos realizados, otra vez, bajo las mismas circunstancias pero como resultado posible poseen un conjunto de alternativas, por Ej. el lanzamiento de un dado o una moneda. La teora de la probabilidad se ocupa de asignar un cierto n9mero a cada posible resultado que pueda ocurrir en un e*perimento aleatorio, con el fin de cuantificar dic,os resultados y saber si un suceso es m!s probable que otro. *robabilidad a priori fue propuesta por Laplace, que toma como probabilidad al cociente entre los casos favorables sobre los casos posibles, antes de la e*periencia. *robabilidad a posteriori fue propuesta por Kolmogorof, quien tomaba la probabilidad como un cociente entre la cantidad de *itos y la cantidad de intentos. -stadstica param.trica es una rama de la estadstica inferencial que comprende los procedimientos estadsticos y de decisin que est!n basados en las distribuciones de datos reales. Estas son determinadas usando un n9mero finito de par!metros. <os permite estimar datos de la poblacin a partir de la media4 es por esto que se necesita que las variables sean cuantitativas y con un nivel de medicin intercalar o de cocientes. Fesponde a la curva normal. Fesuelve tres tipos de problemas /. Estimacin puntual en la que pretendemos darle un valor al par!metro a estimar. (. Estimacin por intervalos se busca un intervalo

de confianza. B. 7ontraste de ,iptesis, donde se busca contrastar informacin acerca del par!metro. -stadstica no param.trica Es una rama de la estadstica que estudia las pruebas y modelos estadsticos cuya distribucin no se ajusta a los llamados criterios paramtricos. 'u distribucin no puede ser definida a priori, pues son los datos observados los que la determinan. Estas pruebas se utilizan cuando no se puede asumir que los datos se ajusten a la curva normal y cuando el nivel de medidas utilizado sea del nivel nominal y a veces del nivel ordinal. *ruebas no param.tricas las ventajas son que no es necesario ,acer muc,as suposiciones y, tambin, pueden ser aplicadas con rapidez y facilidad, con muy pocos c!lculos. Las pruebas no paramtricas son 7,i(, la ) de Kendall, etc. 7uando no se puede establecer un par!metro es lo mismo que decir que no se puede establecer una medida de la poblacin pues no se conoce el < de la misma. /nlisis de varianza !/012/# El an!lisis de varianza consiste en una tcnica que separa la variacin presente en componentes independientes. Estos componentes se analizan para probar ciertas ,iptesis. Las ,iptesis que se prueban por medio de esta tcnica son si las medias de varias poblaciones son iguales. -ay cierto grado de variacin en cualquier grupo de muestras. El an!lisis de la varianza es la tcnica que separa la variacin total en componentes independientes separados que pueden atribuirse a uno u otro motivo. Estos componentes separados de la varianza se someten a un an!lisis #de a, su nombre% en tal forma que pueda probarse las ,iptesis sobre la igualdad de las medias de la poblacin. Las suposiciones que deben ,acerse son /. que las muestras al azar provienen de distribuciones normales4 y (. que las poblaciones normales tienen todas iguales varianzas. n. n9mero total de observaciones. N. n9mero de muestras. '7:. suma de cuadrados total. '7E*. suma de cuadrados e*plicada. :ambin llamada >entre tratamientos?. '7Fes. suma de cuadrados residual. :ambin llamada >dentro de los tratamientos?. 3ecta 4 ecuacin de la regresin la recta de la regresin es la que mejor se ajusta a un conjunto de datos. La ecuacin de la regresin e*presa cual es la relacin entre las variables * e y. <os dice que la relacin es lineal y nos da su forma precisa. Podemos resumir con esta ecuacin los datos de tablas. &simismo la ecuacin nos indica el sentido de la relacin por medio del signo del coeficiente r. L por 9ltimo nos permite calcular el valor de y que corresponde a un valor de * cualquiera de la variable independiente. Esta estimacin tendr! un cierto error. O es la variable independiente e L la dependiente cuando L. aPb.*. pero puede ser que L sea la variable independiente y O la dependiente cuando O. aPb.y. -ay dos rectas de regresin. La correlacin entre las dos variables est! dada por el !ngulo entre las dos rectas, si vale 1 la correlacin es A /. 7on el error standard podemos dibujar alrededor de la recta de regresin dos lneas de puntos que se llaman camino crtico. &l valor de la media le sumamos y le restamos el error standard y lo mismo se ,ace con el valor estimado.

La regresin la podemos inferir siempre y cuando la correlacin sea alta y siempre en una misma poblacin. &oeficiente de determinacin !r5# es la proporcin de varianza total de L que se puede predecir conociendo O. &oeficiente de no determinacin !65# es la parte de la varianza que no esta predic,a por la recta de regresin. &oeficiente de alienacin !6# indica el grado de falta de relacin, N marca la independencia entre dos fenmenos. 7ndice de eficiencia predictiva !e#8 es el porcentaje de la reduccin del error de prediccin por el ,ec,o de conocer la correlacin que e*iste entre las dos variables. Gndica el margen de acierto.

Vous aimerez peut-être aussi