Vous êtes sur la page 1sur 372

ISCF Manuel Fajardo

GUA DE ESTUDIO




ASIGNATURA ANLISIS DE DATOS


Autores:
Lic. Arnaldo Hererrea Ponce. Introduccin. Tema II.
Probabilidades.

Msc. Rodrigo Manrique Lara Rosell.
Tema I. Anlisis Exploratorio.


Msc. Ramn Folgueira Roque .
Lic. Ins Serret Mesa.
Tema III. Docimasia de hiptesis.

Introduccin.

Esta gua tiene como objetivo ayudar al estudiante a desarrollar un mtodo
correcto de estudio; orientando su esfuerzo hacia aquellos aspectos que son
fundamentales para lograr los objetivos propuestos en la asignatura. En ella
encontrars sugerencias para que te sean ms fciles de comprender los
diferentes contenidos, as como ejercicios propuestos. La misma contribuir
adems, a desarrollar partiendo de los conocimientos tericos, los hbitos y
habilidades necesarios para la comprensin, aplicacin e interpretacin de los
mtodos Estadsticos, tanto descriptivos como inferenciales, que sern
estudiados, ayudando de esta forma a desarrollar en el estudiante, hbitos de
trabajo independiente.

Objetivos generales de la asignatura.
Objetivo Educativo: Contribuir a que los estudiantes desarrollen convicciones
sobre el rigor, la honestidad cientfica y la esttica al solucionar problemas
vinculados a la Cultura Fsica, manifestndose en la validez de los mtodos; y la
objetividad en el tratamiento y anlisis de la informacin.
Objetivo Instructivo: Aplicar las tcnicas y procedimientos estadsticos
relacionados con la organizacin, presentacin e interpretacin de los datos
primarios vinculados a la cultura Fsica con principios cientficos que les permitan
organizar, describir y analizar la informacin estadstica para tomar decisiones.

Plan temtico.
La asignatura se imparte en 32 horas distribuidas estas en tres temas segn el
cuadro siguiente:

No Tema Horas
1- Anlisis Exploratorio 12
2- Probabilidad 6
3- Pruebas de Hiptesis 14
Total 32

Bibliografa
Texto Bsico: Guerra, C. W. (1987). Estadstica. Pueblo y Educacin. La Habana.
Texto Complementario: Freund, J. E. (1971). Estadstica Elemental Moderna.
Pueblo y Educacin. La Habana.
Textos de Consulta:
Zatsiorski, I. (1983). Metrologa Deportiva.
Valdes, H. Et al (1990). Introduccin a la Investigacin Cientfica Aplicada a la
Educacin Fsica y el Deporte. Pueblo y Educacin : La Habana.
Siegel, S. (1972). Diseo Experimental No Paramtrico. Edicin
Revolucionaria: La Habana.
Ayudas de los Sofware estadsticos.
Manrique de Lara Rosell Rodrigo. Pginas Web Anlisis Exploratorio.
Manrique de Lara Rosell Rodrigo. Gua para decidir acerca de una dcima.
Materiales elaborados por los profesores de la asignatura Anlisis de Datos.
Tema I. Anlisis Exploratorio.
Objetivos:
Establecer hiptesis estadsticas basadas en los objetivos del problema planteado,
los aspectos integrantes de los datos y la estructura de la base de datos.
Contenidos por Encuentros.
1 Contenidos, objetivos y sistema de habilidades de la asignatura. Estructura del
trabajo de curso. Medicin. Escalas de medicin
2 Promedios: media aritmtica, mediana, moda. Estadgrafos de dispersin:
recorrido, desviacin tpica.
3 Trabajo con el paquete estadstico. Gestin de datos. Importacin de otro
software.
4 Tabla de frecuencias. Cuartiles. Histograma. Diagrama de Caja y Bigotes.
5 Correlacin. Matriz de correlacin.
6 Sistematizacin del tema.
Aspectos Metodolgicos.
1. Resulta importante tener en cuenta que con este tema se inician
conocimientos y habilidades que sern utilizados y evaluados en el trabajo
final y que son empleados en el tercer tema (docimasia de hiptesis), por lo
que el alumno deber ser cuidadoso en dominarlo, ya que cualquier
omisin, que de l se haga, ocasionar en el futuro el tener que volver a
estudiarlo.
2. Particular importancia reviste el saber clasificar correctamente una medicin
de acuerdo a la escala que le corresponda. Este aspecto resulta
fundamental, tanto en la eleccin del promedio, y del estadgrafo de
dispersin a ser utilizado, como en la ubicacin de la dcima correcta a ser
empleada ante un problema determinado de acuerdo a la base de datos
utilizada.
3. Es trascendental el cuidado que se deber tener en cuanto a la base de
datos que se utilice, ya que con ella transitar a travs de toda la asignatura
y con el problema que de ella se derive conformar el trabajo final con el
que culminar la asignatura. Cualquier demora en su obtencin en el
paquete estadstico utilizado, producir demoras que pueden llegar a ser
catastrficas.
4. En la obtencin de los estadgrafos y grficos expresados en los
contenidos, se debern conciliar adems de su obtencin en el paquete
estadstico empleado, la exposicin de lo que significan los mismos y lo que
es ms importante las hiptesis que ellos muestran en el contexto del
problema considerado. Esto ltimo es hacer hablar a los resultados
obtenidos en el procesamiento.
5. Es de capital importancia que al final de este tema el alumno sea capaz de
hacer una sntesis de las tcnicas que le han sido impartidas, atendiendo a:
Su definicin.
Su utilizacin de acuerdo a las escalas de medicin utilizadas.
Su obtencin de acuerdo al paquete estadstico considerado.
Gua de Preguntas.
Escalas de medicin.
1. Cul es el nivel ms elemental entre los cuatro que aparecen en las escalas
de medicin?
2. Exponga ejemplo en su campo de actividad de resultados de mediciones
nominales.
3. Qu tipo de promedio puede ser utilizado en este tipo de escala?
4. Qu medida de dispersin podemos utilizar cuando los resultados de las
mediciones se encuentran en la escala nominal?
5. Exponga ejemplos en su campo de actividad donde los resultados de las
mediciones aparezcan en la escala ordinal.
6. Qu promedio resulta apropiado para ser utilizados en mediciones del tipo
ordinal?
7. Es posible utilizar en una medicin del tipo ordinal como promedio la
moda?
8. Qu medidas de dispersin pueden ser utilizadas en mediciones del tipo
ordinal? Cul es la diferencia fundamental existente entre los resultados
de una medicin en la escala de intervalos y en la escala de proporcin?
9. Cules estadgrafos pueden ser utilizados en la escala de proporcin?
10. De los estadgrafos anteriores, cules no deben ser utilizados si se
encuentran los resultados de las mediciones en la escala de intervalos?
Promedios.
1. Cmo usted definira la moda de un conjunto de resultados de mediciones?
2. Argumente (puede utilizar ejemplos), en los casos en que la moda sea:
1. nica.
2. Ms de un valor modal.
3. No existir.
3. De qu manera podemos determinar en un histograma la clase donde se
encuentra la moda?
4. Cmo usted definira valor mediano de un conjunto de resultados de
mediciones?
5. Tericamente, pueden existir infinitos valores medianos?. Argumente su
respuesta. En la prctica de estos infinitos valores medianos cul es el que
se toma.
6. Por qu la mediana, a diferencia de la media aritmtica, se afecta poco, o
no es afectada por resultados de mediciones extremas?
7. Suponga que usted est exponiendo un trabajo y uno de los asistentes le
solicita que le explique de qu manera ha sido obtenido el valor mediano en
los resultados de una prueba en particular, cmo usted le explicara el
proceso teniendo en cuenta que el tamao de la muestra sea: a)Impar.
b)Par.
8. Suponga que usted est asistiendo junto a otra persona en la exposicin de
un trabajo investigativo y el ponente hace referencia primero al valor
mediano y posteriormente denomina a este mismo valor mediano como el
del percentil 50. Su acompaante le pregunta; por fin de lo que est
hablando es de la mediana o del percentil 50? Qu le respondera usted?
9. Cmo est definida la media aritmtica de un conjunto de resultados de
mediciones?
10. Cules son algunas de las ventajas, siempre que el resultado de las
mediciones lo permitan, de la media aritmtica de un conjunto dado?
11. Si se tiene un conjunto de resultados de mediciones y se desea obtener la
media aritmtica del mismo, en cul escala de medicin debern
encontrarse estos resultados?
12. Si se tiene en una base de datos una medicin, cuyos resultados son o muy
grandes, o muy pequeos, o ambos inclusive: Ser conveniente la
utilizacin de la media aritmtica? Qu procedimiento podra realizar usted
con los resultados de estas mediciones para poder aplicar la media
aritmtica?
13. Cul es la notacin con que se designa a la media aritmtica De una
muestra? De una poblacin?
Estadgrafos de dispersin.
1. Cmo est definido el recorrido o amplitud?
2. En qu escalas de medicin pueden ser aplicadas?
3. Podemos considerar al recorrido como una medida precisa de la
dispersin? Argumente su respuesta.
4. Cmo est definido el recorrido o amplitud intercuartlico?
5. Qu por ciento de las mediciones abarca el recorrido intercuartlico?
6. Cul es la definicin de desviacin tpica o estndar muestral.? Cul
debe ser la escala de medicin de los resultados para ser aplicada la
desviacin tpica o estndar? Cul es su notacin?
7. Es posible que el resultado de la desviacin tpica o estndar de un
conjunto de resultados de mediciones sea un nmero negativo?
8. Qu caracterstica tendr el conjunto de los resultados de una medicin en
los que su desviacin tpica o estndar es cero?
9. Supongamos que se tiene un conjunto de resultados de mediciones cuya
unidad es u, en cules unidades estar expresada la desviacin tpica o
estndar?
10. Supongamos que estamos en presencia de dos conjuntos cuyas
desviaciones estndares son s1 y s2 tales que s1 >s2 Podemos decir que
la dispersin en el conjunto cuya desviacin es s
2
tiene una dispersin
mayor que los resultados del otro conjuntos? Argumente su respuesta.
11. Cmo se denota a la desviacin tpica o estndar poblacional?
Correlacin.
1. Qu se entiende por correlacin?
2. Cules dos aspectos principales que son analizados cuando se realiza la
correlacin entre dos pruebas?
3. Qu podemos plantear acerca del comportamiento entre dos pruebas si su
coeficiente de correlacin es positivo?, y si fuera negativo?
4. Por qu motivo en la diagonal principal de una matriz de correlacin el
coeficiente de correlacin siempre es 1?
Tabla de frecuencias. Histograma.
1. Para cules aspectos del Anlisis de Datos resultan tiles los
histogramas?
2. Cul es la estructura de una tabla de distribucin de frecuencias?
3. Realice una tabla de distribucin de frecuencias o un histograma. Explique
los siguientes trminos
1. Frecuencia absoluta.
2. Amplitud, ancho o longitud de un intervalo.
3. Marca de clase.
4. Lmite superior de un intervalo.
5. Lmite inferior de un intervalo.
Diagrama de Caja y Bigotes.
1. Cules son los cinco estadgrafos en los que est definido un diagrama de
caja y bigotes?
2. Suponga que usted observa los diagramas de caja y bigotes, de una prueba
realizada en dos momentos diferentes, y usted observa que la caja en el primer
momento tiene un rea mayor que la caja en el segundo momento. Qu
puede usted afirmar en cuanto a la dispersin?

TEMA II. PROBABILIDAD.
Objetivos del tema:
General:Identificar el concepto de probabilidad para su posterior aplicacin.
Especficos:
Familiarizar al alumnado con los conceptos de experimento aleatorio, espacio
muestral, y suceso.
Familiarizar al alumnado con el concepto de probabilidad de un suceso.
Familiarizar al alumnado con las caractersticas de la distribucin Normal.

Contenidos del tema:
Probabilidad de un evento. Espacio muestral. Evento opuesto. Teorema de la
Multiplicacin. Sucesos independientes. Curva Normal.

Orientaciones para la autopreparacin:
El tema que comenzars a estudiar es de gran importancia para el desarrollo
posterior de la asignatura, por eso debes estudiar con cuidado los aspectos
indicados ya que este resulta un tema de difcil comprensin. Se debe destacar
que desde el punto de vista algebraico los requisitos que generalmente se
necesitan no rebasan usualmente las operaciones mas utilizadas en la aritmtica.

Bibliografa:
Libro de texto pginas 65-72; 74-79 y 98-102.

Introduccin: Pgina 65 del libro de texto.
Preguntas:
1. Qu estudia la teora de las probabilidades?

Experimento aleatorio. Espacio muestral y suceso: Pgina 66 del libro de
texto.
Preguntas:
1. Cundo se considera que un experimento es aleatorio?
2. Escriba tres ejemplos de experimentos aleatorios que estn relacionados
con la cultura fsica.
3. Qu se entiende por regularidad estadstica o estabilidad de las
frecuencias relativas de un experimento aleatorio?
4. Qu es un espacio muestral?
5. Con que letra del alfabeto se designa al espacio muestral de un
experimento aleatorio?
6. Clasifique a los espacios muestrales de acuerdo al nmero de sus
elementos.
7. Escribe ejemplos de espacios muestrales .
8. Escriba algn ejemplo de espacio muestral referido a la cultura fsica.
9. Diga con sus palabras que usted entiende por suceso.
10. Que letras del alfabeto se utilizan para denotar a los sucesos?.
11. Cuando ocurre un suceso?.
12. Escriba ejemplos de sucesos elementales y de sucesos compuestos.
13. Qu nombre recibe el suceso A+B?
14. Que representa el suceso A+B?
15. Qu nombre recibe el suceso A*B?
16. Que representa el suceso A*B?
17. A que se llama suceso complementario de A en S?
18. Cmo se denota?
19. Cundo se dice que un suceso es cierto o seguro?
20. Escriba algn ejemplo de suceso cierto referido a la cultura fsica.
21. Cundo se dice que un suceso es imposible o nulo?.

Definicin clsica y estadstica de probabilidad de un suceso: Pgina 69 y 70
del libro de texto.
Orientacin: Busque en un diccionario el significado de la palabra probabilidad.
Lea con cuidado los prrafos 5 y 6 de la pgina 69 los cuales contienen la
interpretacin y la definicin clsica de probabilidad de un suceso. Analice los
ejemplos 4.3-4.6 de las pginas 70 y 71. Regrese al primer tema para recordar de
qu forma se calculan las frecuencias relativas. Lea con detenimiento los dos
ltimos prrafos de la pgina 71 los cuales nos aportan las razones por las cuales
es necesario el conocimiento de la definicin estadstica de probabilidad de un
suceso. Analice con detenimiento los elementos de la distribucin Normal, su
utilidad y la importancia de esta.
Preguntas:
1. Qu establece la definicin clsica de probabilidad de un suceso?
2. Qu significan N
a
y N?
3. La definicin clsica de probabilidad de un suceso se aplica a espacios
muestrales (finitos/infinitos)
4. En la definicin clsica de probabilidad de un suceso se supone que los
resultados elementales del experimento (son igualmente posibles / no son
igualmente posibles)
5. La probabilidad de un suceso cierto es ( 0 / 1)
6. Cul seria el valor de la probabilidad si el suceso es imposible o nulo?
7. Cul es la frmula que permite dada una distribucin Normal convertir las
puntuaciones X en Z (estndar)?
8. En que unidades se expresan las puntuaciones Z?

Ejercicios propuestos.
Puedes realizar los ejercicios de las pginas 84 y 85, excepto el 12, 17-20, 21c,
23d.

Tema 3 Pruebas de Hiptesis. 14 horas
Objetivos:
- Analizar las correlaciones entre variables que son significativas.
- Analizar los resultados para la comparacin de grupos y de mediciones de
un mismo grupo seleccionando una prueba de hiptesis que se lo permita.
Esta seleccin contempla:
1 La existencia de las premisas de la prueba de hiptesis, en particular de
la escala de medicin en que se encuentra la variable procesada.
2 La formulacin de las hiptesis.
3 Realizar la interpretacin de los resultados en la conclusin de la prueba.

Contenidos por Encuentro
7 Problemas a solucionar con las pruebas de hiptesis. Conceptos de las
pruebas de hiptesis: Hiptesis estadsticas, decisin, errores y regla de
decisin.
8 Prueba para la correlacin. Hiptesis. Regla de decisin. Anlisis de los
resultados de una matriz de correlaciones.
9 ANOVA de clasificacin simple. Premisas. Hiptesis. Regla de decisin.
Conclusiones.
10 ANOVA de clasificacin doble con una observacin por casilla. Premisas.
Hiptesis. Regla de decisin. Conclusiones.
11 Prueba de Kruskal Wallis. Premisas. Hiptesis. Regla de decisin.
Conclusiones.
12 Prueba de Friedman. Premisas. Hiptesis. Regla de decisin. Conclusiones.
13 Tabla de contingencia. Premisas. Hiptesis. Regla de decisin. Conclusiones.
Aspectos Metodolgicos.
En la introduccin del tema deben discutirse tres problemas que pueden
resolverse con las pruebas de hiptesis en el campo de la educacin fsica, se
recomienda hacerlo a travs de ejemplos concretos:
1 Comparacin de los resultados de varios grupos.
2 Comparacin de los resultados de varias mediciones en un mismo grupo.
3 Significacin de la relacin entre variables.
Este ltimo problema esta relacionado con el tema 1 pues los resultados de los
softwares siempre sealan las correlaciones significativas.
El desarrollo de los conceptos bsicos de las pruebas de hiptesis son
fundamentales para la compresin y anlisis de los resultados de las mismas. Ver
Freund (1971), Siegel (1972) y pginas Web de la asignatura.
Al desarrollar una prueba de hiptesis se aconseja siempre describir las hiptesis
con palabras y puede utilizarse un ejemplo para hacerlo.
En los dos ANOVA deben sealarse las premisas para la utilizacin y las
dificultades que entraan la comprobacin de las mismas, lo que conduce a utilizar
pruebas de hiptesis no paramtricas. Ver Guerra (1987), Zatsiorski (1983) y
pginas Web de la asignatura.
En el resto de las pruebas debe sealarse lo dbil que son las premisas de las
mismas, ver Siegel (1972) y pginas Web de la asignatura.

Gua de Preguntas.
1 Se reporta en un artculo que existen diferencias sexuales significativas con
error de 0.05 en cuanto a la capacidad de atencin de los alumnos durantes
las clases de Educacin Fsica. Una persona sin conocimientos le solicita la
explicacin de estas conclusiones. Qu respondera usted?
2 Se decide tomar los resultados en un grupo de pruebas fsicas con el fin de
seleccionar a alumnos para el equipo de la escuela, debido a que no se puede
predecir con absoluta certeza si los alumnos seleccionados tendrn buenos
resultados en las competencias, qu errores pueden cometerse? Cul es el
ms importante a tener en cuenta?
3 Un investigador desea probar una hiptesis y para ello toma una muestra y
mide los resultados. Antes de efectuar las mediciones se acerca a usted y le
formula la siguiente pregunta: puedo afirmar, segn los resultados obtenidos
de rechazar o no, que la hiptesis es totalmente verdadera o falsa? Qu le
contestara usted?
5 Si la correlacion entre dos variables A y B es:
a) Negativa.
b) Cero.
c) Positiva.
A que conclusin puede Ud. Llegar respecto a la relacin que hay entre las dos
variables.
6 Se determino que la correlacin de la velocidad y la resistencia en una base de
datos donde el tamao de la muestra es de 121 sujetos es de p= 0.05138 y su
coeficiente de correlacin es r= 0.458 . Realice un breve anlisis de la relacin
existente entre las variables.
7 Suponga que se cumplen las premisas para la aplicacin de la Dcima de
Correlacin de Pearson. Las siguientes salidas son tomadas de una base de datos
de una Secundaria Bsica con una muestra de 60 estudiantes. Realice un anlisis
de cada una y emita sus conclusiones.
a)
Correlations
1.000 .925**
. .000
30 30
.925** 1.000
.000 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
RAP1
RAP2
RAP1 RAP2
Correlation is significant at the 0.01 level
(2-tailed).
**.


a)
Correlations
1.000 -.439*
. .015
30 30
-.439* 1.000
.015 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
TRAC1
RESIST1
TRAC1 RESIST1
Correlation is significant at the 0.05 level (2-tailed). *.

b)
Correlations
1.000 .922**
. .000
30 30
.922** 1.000
.000 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
TRAC1
TRAC2
TRAC1 TRAC2
Correlation is significant at the 0.01 level
(2-tailed).
**.

c)
Correlations
1.000 .005
. .979
30 30
.005 1.000
.979 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
SALT1
SALT2
SALT1 SALT2


8 Completa la sgte. Tabla que muestra la Correlacin en un grupo de estudiantes
de la EPEF. Suponga que la varianza y la Distribucin de donde proviene la
muestra son normales.

Prueba Coef. de
Correlacin
Estadgrafo Probabilidad Significacin Sentido
Abd1& Abd2 0.765 2.567 0.00098
Res1&Res2 - 0.987 5.87 0.00000
Vel1&Tra2 - 0.456 3.76 0.0567
Tra1& Tra2 0.123 1.98 0.345


9 De acuerdo a las salidas de resultados presentadas.
a) Identifique la Dcima empleada.
b) Haga un anlisis de cada una de ellas.

a.
Correlations
1.000 .891**
. .000
30 30
.891** 1.000
.000 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
RESIST1
RESIST2
RESIST1 RESIST2
Correlation is significant at the 0.01 level (2-tailed). **.

b.
Correlations
1.000 .517*
. .048
15 15
.517* 1.000
.048 .
15 15
1.000 -.206
. .462
15 15
-.206 1.000
.462 .
15 15
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
PLANCHS
ABDOMNLS
PLANCHS
ABDOMNLS
Spearman's rho
Spearman's rho
GRUPO
1
2
PLANCHS ABDOMNLS
Correlation is significant at the .05 level (2-tailed). *.

c)

Correlations
1.000 .324
. .142
22 22
.324 1.000
.142 .
22 22
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
PESO
TALLA
Spearman's rho
PESO TALLA


d)
Correlations
1.000 -.313
. .076
33 33
-.313 1.000
.076 .
33 33
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
RAPIDEZ1
RAPIDEZ2
RAPIDEZ1 RAPIDEZ2


10 La siguiente base de datos corresponde a nios de 10 aos de edad de una
escuela primaria, se tomo una muestra en cada grupo de 20. Se desea analizar
las diferencias entre los grupos, en las PEF en la resistencia, para determinar el
entrenamiento a aplicar.
a) Que docima bebe emplear.
b) Halle la salida correspondiente.
c) Haga un anlisis del resultado obtenido. Plantee sus conclusiones.

Grupo1: 8.36- 9.56- 8.56- 12.9- 11.36- 7.56- 9.14- 7.56- 9.6- 8.59- 7.89- 8.96-
7.56- 7.56- 9.75- 10.23- 7.36- 12.36- 8.56- 7.36-

Grupo2: 7.36- 8.36- 8.36- 10.35- 8.96- 7.56- 7.56- 8.36- 7.23- 8.31- 7.56- 7.- 7.45-
8.5- 7.38- 8.56- 7.89- 8.99- 9.12- 7.23-

11 Se analiza el resultado deportivo en nios atletas en condiciones bajo techo y
al aire libre. El grupo se ha dividido en un grupo de control y el otro experimental.
La muestra tomada es de 15 estudiantes en cada uno,. A continuacin te
ofrecemos las salidas de resultados.
a) Que docima ha empleado el investigador.
b) Tome una decisin en cada caso y confeccione un breve resumen.
1.
Test Statistics
b
109.000
229.000
-.146
.884
.902
a
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailed
Sig.)]
PLANCHA
Not corrected for ties.
a.
Grouping Variable: SERIES
b.


2
Test Statistics
b
17.000
137.000
-3.981
.000
.000
a
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailed
Sig.)]
SALTOS
Not corrected for ties. a.
Grouping Variable: SERIES b.


12 Se han tomado mediciones a un grupo de 30 atletas de 16 aos de la
modalidad TWD.
Entre mediciones se realizo un entrenamiento intensivo. Considere que se
cumplen las premisas para la aplicacin de esta dcima. Mostramos las salidas
correspondientes.
a) Identifique la dcima empleada.
b) Haga un resumen del anlisis realizado por Ud.


PLANCHAS

Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
4128.062 1 4128.062 231.019 .000
553.937 31 17.869
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.


RAPIDEZ
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
2958.680 1 2958.680 7864.976 .000
11.662 31 .376
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.

SALTO
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
1324801.000 1 1324801.000 5254.456 .000
7816.000 31 252.129
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.


13 Observa las siguientes salidas:
a) A que dcima corresponden.
b) Analice la decisin a tomar y realice un resumen.

a)
Test Statistics
a,b
5.068
2
.079
Chi-Square
df
Asymp. Sig.
PENCEST
Kruskal Wallis Test a.
Grouping Variable: GRUPO b.


b)
Correlations
1.000 .040
. .832
30 30
.040 1.000
.832 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
PEENC1
PEENC2
PEENC1 PEENC2


c)
Correlations
1.000 .465**
. .000
120 120
.465** 1.000
.000 .
120 120
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
TALLA
PESO
TALLA PESO
Correlation is significant at the 0.01 level
(2-tailed).
**.


14 El numero de pelotas encestadas por 3 grupos de atletas de alto rendimiento
se realiza por tiempo determinando la cantidad que realiza cada grupo, donde el
tamo de cada uno es de 10 sujetos determina:
a) La dcima que debe aplicarse.
b) Obtenga las salida correspondiente y determine las diferencias entre los
grupos. Realice un anlisis.

15 Se conoce en un trabajo anterior que la media para nios de 10 aos en el
salto de longitud es de 1.5 metros. Se tomo una muestra aleatoria de 25 nios de
esa edad y se obtuvo una media de 1.48 metros y una desviacin tpica de 0.1 m.
Determine el grado de significacin entre la media de la poblacin y el valor de
1.5m.

16 Las siguientes salidas muestran los resultados alcanzados por una muestra de
10 sujetos a los cuales se les aplico las Pruebas de Eficiencia Fsica en pruebas
de velocidad en tres momentos con un tiempo entre ellas de tres meses.
a) Que dcima debe aplicar.
b) Analice el grado de significacin entre las pruebas. Haga un breve resumen.

A.-
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
15430.792 1 15430.792 11150.664 .000
53.970 39 1.384
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.

A.-
Correlations
1.000 .649**
. .000
40 40
.649** 1.000
.000 .
40 40
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
RES1
RES2
RES1 RES2
Correlation is significant at the 0.01 level
(2-tailed).
**.

B.-
Ranks
30
a
18.35 550.50
8
b
23.81 190.50
2
c
40
Negative Ranks
Positive Ranks
Ties
Total
RES2 - RES1
N Mean Rank Sum of Ranks
RES2 < RES1 a.
RES2 > RES1 b.
RES1 = RES2 c.

Test Statistics
b
-2.611
a
.009
Z
Asymp. Sig. (2-tailed)
RES2 - RES1
Based on positive ranks. a.
Wilcoxon Signed Ranks Test b.


C.
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
4268.880 1 4268.880 1477.069 .000
286.120 99 2.890
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.


D.-
Correlations
1.000 .537*
. .015
20 20
.537* 1.000
.015 .
20 20
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
ABD1
ABD2
Spearman's rho
ABD1 ABD2
Correlation is significant at the .05 level (2-tailed). *.


E.-
Ranks
8
a
6.94 55.50
7
b
9.21 64.50
5
c
20
Negative Ranks
Positive Ranks
Ties
Total
ABD2 - ABD1
N Mean Rank Sum of Ranks
ABD2 < ABD1 a.
ABD2 > ABD1 b.
ABD1 = ABD2 c.


Test Statistics
b
-.268
a
.788
Z
Asymp. Sig. (2-tailed)
ABD2 - ABD1
Based on negative ranks. a.
Wilcoxon Signed Ranks Test b.


F.-

Ranks
20 21.45
20 19.55
40
EQUIPO
orientales
occidentales
Total
VELO1
N Mean Rank


Test Statistics
a,b
.265
1
.607
Chi-Square
df
Asymp. Sig.
VELO1
Kruskal Wallis Test a.
Grouping Variable: EQUIPO b.


G.-

Correlations
1.000 .994**
. .000
20 20
.994** 1.000
.000 .
20 20
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
VELO1A
VELO1B
Spearman's rho
VELO1A VELO1B
Correlation is significant at the .01 level (2-tailed). **.

H.-
Ranks
20 21.45 429.00
20 19.55 391.00
40
20 23.27 465.50
20 17.73 354.50
40
EQUIPO
orientales
occidentales
Total
orientales
occidentales
Total
VELO1
VELO2
N Mean Rank Sum of Ranks


Test Statistics
b
181.000 144.500
391.000 354.500
-.515 -1.507
.607 .132
.620
a
.134
a
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailed
Sig.)]
VELO1 VELO2
Not corrected for ties. a.
Grouping Variable: EQUIPO b.

Introduccin al Anlisis Exploratorio en
la Cultura Fsica




con un enfoque computacional
Versin 1.0


MSc. Rodrigo Manrique de Lara Rosell.


INSTITUTO SUPERIOR DE CULTURA
FSICA "MANUEL FAJARDO" C.H.







INTRODUCCIN

Motivos que impulsaron el surgimiento del Anlisis
Exploratorio.

Obj etivos y resultados que persigue el Anlisis
Exploratorio.

Fases Generales en el Anlisis Exploratorio.

Algunos consejos metodolgicos a seguir en el
Anlisis Exploratorio.

Motivos que impulsaron al
surgimiento del Anlisis
Exploratorio.
Antes del advenimiento y desarrollo de la computacin,
exista una divisin, en cuanto a las tcnicas empleadas
en el procesamiento de datos en dos grandes vertientes,
ellas son:

Tcnicas descriptivas.

Tcnicas inferenciales.
En donde la primera se ocupaba de todo lo relacionado
con la descripcin de la base de datos objeto de trabajo
y la segunda en el aspecto de obtener inferencias acerca
de las poblaciones de donde provienen las muestras.
Particularmente en el aspecto de las tcnicas
descriptivas, la utilizacin de las mismas se limitaba
fundamentalmente, a la obtencin de estadgrafos de las
muestras, estando muy limitado el procesamiento
mediante grficos de los resultados de las mediciones
realizadas debido a lo engorroso de la tarea.
En este estado de cosas y debido al desarrollo de la
computacin surge en la dcada de 1960, un grupo de
paquetes estadsticos diseados para grandes
plataformas informticas (Main Frame), que posibilitan
principalmente.

El procesamiento de Bases de Datos con un gran
nmero de variables y casos, con las tcnicas
estadsticas corrientemente utilizadas.

La creacin, introduccin y popularizacin de tcnicas
en el procesamiento de datos, que resultaban
en el procesamiento de datos, que resultaban
prcticamente imposibles de ser empleadas, sin
medios de cmputo.
De esta poca se destacan entre los Paquetes
Estadsticos, que an son utilizados los siguientes:

SAS (Statistical Analysis System). Dirigido al mundo
empresarial, las universidades y las especialidades
tcnicas.

BMD (Biomedical Computer Programs). Enfocado
principalmente hacia la medicina.

SPSS(Statistical Package for the Social Sciences). Que
apunta hacia aquellas ciencias relacionadas con la
sociedad.
Independientemente de la liberacin en las ataduras que
represent el advenimiento de estos paquetes
estadsticos, al no tener que realizar los clculos
manualmente, si continu la misma tendencia a la
utilizacin de las tcnicas descriptivas tradicionales.
En este estado de cosas, comenz una evolucin de
transformacin de las ideas en el procesamiento de bases
de datos desde finales de los aos 1970s, que concluy
en 1977 con la introduccin por G. W. Tukey del vocablo
Anlisis Exploratorio, comenzando a aunarse la
perspectiva clsica contenida en la Estadstica
Descriptiva, con las nuevas concepciones de la
Estadstica Exploratoria.
Este nuevo enfoque recomienda hacer interactuar a
grficos y estadgrafos de las variables en la base de
datos objeto de anlisis, de forma tal que permitan
visualizar su estructura permitiendo un mejor
entendimiento y formulacin de las hiptesis inherentes
al problema antes de pasar al anlisis confirmatorio
(dcimas), posibilitando poder operar en la muestra.
Objetivo y resultados del Anlisis
Exploratorio.
El objetivo que persigue el Anlisis Exploratorio, es el
conocimiento de las estructuras y aspectos integrales de
los datos, siendo su resultado las hiptesis que
posteriormente debern ser probadas.
Fases Generales en el Anlisis
Exploratorio.
En general las fases a seguir recomendadas en el Anlisis
Exploratorio son:
1. Organizacin.
2. Representacin grfica.
3. Descripcin de los datos.
De manera que resulten ms comprensibles a nuestra
mente y poder detectar por lo tanto, su estructura
subyacente y la presencia de posibles anomalas.
Algunos consejos metodolgicos a
seguir en el Anlisis Exploratorio.
Mosteler et al (1983), han sugerido algunos consejos:

La eleccin de estadgrafos apropiados al nivel de
medicin considerados.

Comenzar con el clculo de los siguientes cinco
estadgrafos.

Mediana.

Cuartil Inferior.

Cuartil Superior

Mnimo

Mximo

La aplicacin de las tcnicas grficas disponibles,
como estrategia bsica para revelar la estructura de
los resultados de las mediciones, tales como:

Histogramas.

Diagramas de Tallo y Hojas.

Diagrama de Caja y Bigotes, etc.

La utilizacin de estadgrafos robusto (aquellos que
son poco sensibles a pequeas alteraciones de los
resultados de las mediciones), cuando sea necesario..

En el caso de que los resultados de las mediciones
tengan que obedecer a un modelo, se deber:

Analizar los residuos para determinar
inadecuaciones en el modelo.

La utilizacin de trasformaciones para adecuar los
datos a las exigencias del modelo

Compatibilizar la organizacin de los datos de forma
tal que resulte ms comprensible a nuestra mente su
estructura subyacente y la presencia de posibles
estructura subyacente y la presencia de posibles
anomalas, mediante una consecuente interralacin
entre los valores de los estadgrafos obtenidos y la
representacin grfica de las mediciones realizadas.



BASE DE DATOS
Esta pgina est destinada a advertir sobre los errores ms
frecuentes que al inicio pueden cometerse y suministrar algunos
consejos tiles en la estructuracin y llenado de bases de datos
en los Paquetes Estadsticos Computacionales. En la misma han
sido tratados los siguientes aspectos.

Cuidado con tener ms de una base de datos para un
mismo problema.

Nmero de dgitos del resultado de una medicin.

Textos que describen a una categora.

El problema de los datos faltantes.

Una medicin a varios grupos (muestras) independientes.

Mediciones repetidas a un mismo grupo.
Cuidado con tener ms de una base de datos para un mismo
problema.
En ocasiones ocurre que la informacin contenida en una
investigacin aparece reseada en varias planillas. Estas pueden
ser:

El sexo masculino y el femenino.

Los resultados en los distintos mesociclos. Mesociclo1,
Mesociclo2, etc.

Grupos de alumnos de una escuela. Grupo A, Grupo B, etc.
Independientemente y cualesquiera sea el caso, toda la
informacin en torno a un problema determinado, deber
aparecer estructurada en una sola base de datos, ya que el
paquete estadstico procesa una sola base a la vez y le resulta
imposible realizar el procesamiento en ms de dos bases de
datos.
Nmero de dgitos del resultado de la medicin.
Independientemente del nmero de dgitos que presente la
medicin original , esta debe ser llenada con todos ellos. No es
de ningn modo aconsejable el realizar un redondeo o peor an
truncar las medidas originales.
Lo anterior no quiere decir en manera alguna que si se tienen
las siguientes mediciones 3.023, 2.035 y 3.000 tenga que
escribirse el ltimo registro textualmente 3.000 . En este caso
puede escribirse simplemente 3.
Textos que describen a una categora.
Independientemente que la mayora de los paquetes estadsticos
actuales, permiten la inclusin de palabras para designar una
categora, es preferible como norma hacer el llenado con
nmeros y despus el cambio a las letras que identifiquen la
categora.
Por ejemplo si tenemos una base en donde una variable
categrica es SEXO, es mejor hacer el llenado marcando por
ejemplo el sexo masculino por 1 y el femenino por 2. Con esto
se gana tiempo ya que es mucho ms cmodo teclear un dgito
en vez de escribir una palabra, pudindose despus hacer el
cambio del dgito por la palabra. Adems ocurre que las
entradas MASC., MASC., masc., son distintas.
El autor recuerda una base con un tamao de muestra grande,
donde la variable clasificadora eran las provincias de Cuba.
Esta variable fue llenada con una abreviatura de los nombres de
las provincias y al final no coincidi que existiera provincia
alguna en donde las abreviaturas coincidieran.
El problema de los datos faltantes.
Un dato faltante es aquel que en el momento del llenado de la
base es omitido, ya sea por no haberse podido realizar la
medicin o que esta se haya perdido.
Por regla general para realizar el llenado de un dato faltante en
los paquetes estadsticos, se procede de acuerdo a una de las dos
variantes siguientes:

Dejar en blanco el valor en la celda.
Con esta variante, que es la ms cmoda, el paquete est
asumiendo que el dato no ha sido llenado, omitindolo del
procesamiento.
Ejemplo.
Supongamos que se tiene una base de datos conformada por los
dgitos 4, 5, FALTANTE, 2, 9, FALTANTE y deseamos
calcular su media aritmtica. La base de datos que tendremos
que teclear estar dada por:
No. Var1
1 4
2 5
3
4 2
5 9
6
La suma de estos dgitos es 4+5+2+9=20
Como se sabe para realizar el clculo de la media aritmtica, se
divide la suma de los resultados por el tamao de muestra
considerado. En la base aparecen cinco entradas. Sin embargo el
paquete considerar solamente como tamao de muestra a la
cantidad de registros que han sido tecleadas sustrayndole a esta
el nmero de datos faltantes. De ah que la media de Var1 sea
20/4=5

Asignarle un valor al dato faltante.
Otra variante que es la menos utilizada, aunque a veces
necesaria, consiste en declararle al paquete un valor determinado
como dato faltante.
Por ejemplo, supongamos que se tiene la siguiente base de datos
en la que se desea obtener tambin la media aritmtica
No. Var2
1 4
2 5
3 -2
4 2
5 9
6 -2
Los dgitos que aparecen en Vare son: 4, 5,-2, 2, 9 y -2.
Ha sido declarado a -2 como dato faltante.
Esto quiere decir, que independientemente que no aparezca en
blanco la celda, el paquete asume que en aquellas donde
aparezca el valor -2, considerarla en el procesamiento como un
dato faltante. De ah que aunque la visin de la base de datos sea
diferente a la sealada anteriormente, realmente es la misma.
Cuidado.
Un error que en ocasiones comete el principiante es asignar
como dato faltante el valor 0. Piense que al hacer esto no est
considerando el valor como dato faltante sino escribiendo el
resultado de una medicin donde se expresa la ausencia de la
cualidad que se desea medir.
Para ilustrar lo anterior, supongamos que estamos en presencia
de la misma base de datos, en donde los resultados de las
mediciones son: 4, 5, FALTANTE, 2, 9, FALTANTE.
Procedamos a realizar el llenado de la base de datos Cometiendo
el error de poner el cero como dato faltante. Supongamos que se
le ordena a paquete calcular la media aritmtica de estos
resultados.
No. Variable 1
1 4
2 5
3 0
4 2
5 9
6 0
Cuando el paquete comienza la lectura de las celdas, no hay
nada que le indique que el registro 3 y el 6 son datos faltantes.
En efecto, la celda no aparece en blanco y el valor 0 no ha sido
declarado como dato faltante.
La suma de los dgitos es 20, sin embargo la media aritmtica
que calcular el paquete estar dada por: 20/6 y no 20/4 como se
debiera haber realizado.

Que hacer cuando se tiene en una base un registro donde
aparecen varias variables y en una de ellas aparece un dato
faltante.
Existen tcnicas en el Anlisis de Datos, que reclaman la no
existencia de datos faltantes en ninguna variable de los registros.
Estas tcnicas proceden, cuando ocurre lo anterior, a suprimir
los registros incompletos y efectuar el clculo con los restantes.
Por ejemplo, supongamos que se tiene la siguiente base de
datos.
TABLA 1
Registros Var1 Var2 Var3
1 4 14 23
2 5 11 12
3 9 15
4 2 6 6
5 9 9 9
6 10 14
Segn se observa Var1 presenta un dato faltante en los registros
5 y 7, que impide un determinado procesamiento simultneo con
las otras dos variables.
Independientemente que existen otras tcnicas mucho ms
depuradas acerca de los datos faltantes atendiendo al
procesamiento particular que se haga, un recurso que ayuda en
este problema, es asignarle al dato faltante el valor de la media
aritmtica de los datos no faltantes.
Por ejemplo en el caso anterior, la media aritmtica de Var1 es
5, de ah que la base pueda ser llenada sustituyendo en el/los
datos faltantes el valor obtenido en su media aritmtica,
quedando conformada entonces la base:
TABLA 2
Registros Var1 Var2 Var3
1 4 14 23
2 5 11 12
3 5 9 15
4 2 6 6
5 9 9 9
6 5 10 14
Una medicin a varios grupos (muestras) independientes.
Supongamos que se tiene una base de datos donde han sido
medidas dos pruebas:

Abdominales realizados durante un tiempo determinado.

Tiempo empleado en la carrera de 50 m. volantes.
Supongamos que esto ha sido realizado a tres grupos:

(1) Adelantados

(2) Normales

(3) Retrasados.
Que constan de 5 alumnos cada uno.
De qu manera puede ser estructurada la base?
Procederemos a realizar la base en la siguiente forma:
Nmero de variables 3.
Debido a que el nmero de pruebas a realizar es 2 (Abdominales
y 50 m. volantes) , y que la base aparece particionada o
clasificada en otra variable (Grupo).
Total de registros que aparecen en la base 3Variablesx5casos
en cada una=15 registros.
Quedando estructurada la base en la siguiente forma.
ABDOMIN VOLANT GRUPO
1 25 8.5 1
2 23 9.2 1
3 22 10.6 1
4 21 12.4 1
5 20 13.2 1
6 15 17.5 2
7 12 18.0 2
8 14 17.6 2
9 19 19.2 2
10 14 18.1 2
11 9 22.0 3
12 8 20.4 3
13 4 23.2 3
14 7 20.1 3
15 5 19.7 3
Mediciones repetidas a un mismo grupo.
Supongamos que se tiene una base de datos donde han sido
medidas dos pruebas:

Abdominales realizados durante un tiempo determinado.

Tiempo empleado en la carrera de 50 m. volantes.
A un mismo grupo formado por 5 sujetos.
Estas han sido repetidas en tres momentos.

Antes del primer mesociclo.

Despus del primer mesociclo.

Despus del segundo mesociclo.
De qu manera puede ser estructurada la base?
Procederemos a realizar la base en la siguiente forma:
Nmero de variables 4.
Debido a que el nmero de pruebas a realizar es 2 (Abdominales
y Volantes) y que cada uno de los resultados de estas
mediciones es dependiente, del sujeto que realiza la prueba y de
la repeticin en que esta ha sido realizada.

Total de registros que aparecen en la base 15 registros.
Quedando estructurada la base en la siguiente forma.
ABDOMIN VOLANTES SUJETO SERIE
1 25 8.5 1 1
2 23 9.2 2 1
3 22 10.6 3 1
4 21 12.4 4 1
5 20 13.2 5 1
6 15 17.5 1 2
7 12 18.0 2 2
8 14 17.6 3 2
9 19 19.2 4 2
10 14 18.1 5 2
11 9 22.0 1 3
12 8 20.4 2 3
13 4 23.2 3 3
14 7 20.1 4 3
15 5 19.7 5 3
Observe que cada resultado en las variables ABDOMIN y
VOLANTES, dependen de las variables SUJETO y SERIE. De
ah que tambin se acostumbre a decir que las variables que se
miden son dependientes de las que clasifican (SUJETO y
SERIE), que son denominadas como variables independientes.

Empleo de los diagramas de Caja y
Bigotes.
Los diagramas de Cajas y Bigotes son representaciones
grficas extremadamente tiles que permiten, analizar y
visualizar:

En los resultados de una medicin:

Un promedio muestral.

Su dispersin

Su simetra (ocasionalmente)

Los cambios realizados por los resultados de una
medicin, cuando sta es efectuada:

A una misma muestra en varios momentos.

A varias muestras independientes en un mismo
momento.
Caractersticas de los diagramas de
Caja y Bigotes.
Estructuralmente est conformado de la siguiente forma

En el se observa que en el diagrama aparecen cuatro
medidas de dispersin (D1, D2, D3, D4), en donde:

La caja est limitada por los valores D1 y D2.

Los extremos de los bigotes son respectivamente D3 y
D4.
Tipos de diagramas de Caja y
Bigotes.
Basndonos en las caractersticas antes mencionadas,
puede inferirse que existe ms de un tipo de diagramas
de Caja y Bigotes. Entre ellos se encuentran:
TIPOS PROMEDIO CAJAS (D1 y D2)
BIGOTES (D3 y
D4)
I MEDIANA
CUARTIL
SUPERIOR (D1)
CUARTIL
INFERIOR (D2)
D3=MXIMO
D4=MNIMO
Puede aparecer
como variante
D3=MXIMO
excluyendo los
valores atpicos
superiores
D4=MNIMO
excluyendo los
valores atpicos
inferiores
II
D3=+1,96s
D4=-1,96s
III
ERROR TPICO
(ESTNDAR)
D3=+1.96(ERROR
TPICO)
D4=-1,96
(ERROR TPICO)
IV
MEDIA
ARITMTICA
DESVIACIN
TPICA
(ESTNDAR)
D3=1,96s
D4=-1,96s
Ahora bien de todos ellos el que aparece como Tipo I es
el ms til de todos y por tanto el ms utilizado.
Diagrama de Caja y Bigotes del tipo
(mediana, cuartiles, mximo y
mnimo).
Este tipo de diagrama responde a la idea original de
Tukey de tomar a estos cinco estadgrafos (five-number
summary), como una de las piedras angulares en la
visualizacin de la estructura que presentan los datos.
Las principales ventajas que presenta son:

Posibilita el ser utilizado para mediciones que se
encuentren en la escala ordinal u otra superior.
De ah que su radio de accin sea muy amplio ya que slo
le es vedado utilizar resultados de mediciones en la
escala nominal.

Permite establecer vnculos con la simetra de la
distribucin de los resultados de las mediciones
realizadas y por tanto puede actuar como una
aproximacin visual rpida para el anlisis de la
normalidad.
Aunque las comparaciones entre representaciones
grficas, no pueden gozar de exactitud, si en cambio
ofrecen una buena gua en el anlisis, manifestndose los
resultados del mismo con una mayor medida, cuanto ms
sea acusada la propiedad.
A continuacin presentamos los tres tipos de simetra
generales que pueden presentarse (simtrico, asimtrico
hacia la derecha y asimtrico hacia la izquierda).
Simtrica

El diagrama de una distribucin simtrica (o que lo sea
aproximadamente), sigue una estructura muy particular
que se revierte en la disposicin del diagrama de Caja y
Bigotes que se muestra.

En l se observa que los bigotes tienen la misma longitud
y que la mediana se encuentra en el centro del
rectngulo.
Asimtrica hacia la derecha.
Segn se sabe aquellas representaciones grficas cuya
asimetra sea hacia la derecha, presentan una gran
concentracin de puntos para los valores ms pequeos,
lo que hace que se manifieste una cola ms larga hacia
los valores mayores.

Esta situacin hace que los diagramas de Caja y Bigotes
se presenten con el bigote inferior ms corto que el
superior, acentundose ms esta diferencia en cuanto
sea ms acusada la asimetra.

Asimetra hacia la izquierda.
Como se conoce, aquellas representaciones grficas cuya
asimetra sea hacia la derecha, presentan una gran
concentracin de puntos para los valores mayores y la
dbil concentracin para los ms pequeos, hace que se
produzca la cola ms larga hacia la derecha.

Esta situacin hace que los diagramas de Caja y Bigotes
se presenten con el bigote superior ms corto,
acentundose ms esta diferencia en cuanto sea ms
acusada la asimetra.


Deteccin de resultados de mediciones atpicas.
El tener representados el mximo y el mnimo en los
bigotes. permite detectar la existencia de resultados de
mediciones atpicas, especialmente cuando en un mismo
diagrama aparecen varias variables con la misma
caracterstica.
Normalmente en los paquetes estadsticos esta deteccin
se realiza de acuerdo a la manera en que aparecen las
salidas. En efecto pueden aparecer bsicamente dos
casos.

En la salida aparece como dimensin de los bigotes el
mximo y el mnimo descontando los casos extremos.

En la salida no aparecen descontados los resultados de
mediciones atpicas.
Veamos a continuacin los resultados en una misma
variable (Estatura), en uno u otro caso.
Tipo de salida 1.
En esta variante aparece disminuido el bigote superior y
aumentado el inferior, debido a que no han sido
considerados en ellos los resultados atpicos.

Tipo de salida 2.
En este caso aparece como bigote superior el propio
mximo y como bigote inferior el mnimo.


Coeficiente de Variacin

Introduccin

Definicin.

Utilizacin y ventajas.

Algunas desventajas observadas.

Clasificacin del Coeficiente de Variacin
segn Zatsiorsky.

Preguntas.

Introduccin.
El coeficiente de variacin es una medida de dispersin,
que presenta ventajas considerables en el anlisis de la
dispersin, sobre todo entre varias muestras, ya sea
independientes o dependientes y adems en el estudio
de resultados de mediciones distintas realizadas en una
misma muestra. Sin embargo este estadgrafo presenta
una serie de limitantes muy fuertes que ocasiona que su
empleo tenga que realizarse con sumo cuidado, incluso
ha sido observado que en las ltimas versiones de los
paquetes estadsticos computacionales profesionales, es
omitido este estadgrafo entre las salidas propuestas. Sin
embargo y a pesar de lo dicho anteriormente este
estadgrafo goza de una gran popularidad entre los
investigadores de la Cultura Fsica en nuestro pas.
Abordaremos esta medida de dispersin de acuerdo a los
siguientes pasos:

Definicin.

Utilizacin y ventajas.

Desventajas.

Clasificacin del Coeficiente de Variacin segn
Zatsiorsky.
Definicin:
Sea un conjunto de resultados cuya escala de medicin
es la de proporcin y en donde su media aritmtica y su
desviacin tpica o estndar son
respectivamente: . Se define como el
Coeficiente de Variacin del conjunto y se designa
usualmente por la letra V, al cociente entre la desviacin
estndar y la media aritmtica del conjunto. En
smbolos:

Nota: Observe que el Coeficiente de Variacin se
expresa en por cientos.
Ejemplo:
Sea una muestra en donde los resultados en el salto de
longitud sin carrera de impulso son:
Desviacin tpica o
estndar
0,15
m
Media aritmtica
1,75
m
Entonces el Coeficiente de variacin de la muestra ser:


Observe que V es una medida adimensional, resultado
del cociente entre dos cantidades con las mismas
unidades.

Recalcar que al estar expresado el Coeficiente de
Variacin como un cociente entre dos mediciones, slo
es aplicable en resultados cuya escala de medicin sea
la de proporcin.

La otra restriccin, que aparece en la definicin, es
que la media aritmtica tiene que ser diferente de
cero, debido a la imposibilidad de la divisin por este
nmero.
Utilizacin y ventajas del
Coeficiente de Variacin.

Resulta ideal para comparar la dispersin de muestras
cuyos resultados tengan medias aritmticas diferentes,
e incluso unidades de medida diferentes.
Ejemplo 1.
Segn se ha planteado anteriormente, la desviacin
estndar presenta el inconveniente de no permitir
realizar inferencias acerca de su magnitud, a no ser que
las medias aritmticas de las muestras sean iguales. En
efecto, supongamos que se tienen los siguientes
resultados en dos grupos:
Grupo
Media
aritmtica
Desviacin tpica o
estndar.
A 1,73 m 0,05 m
B 1,73 m 0,18 m
Al ser la media aritmtica de los dos grupos iguales, es
posible establecer que a mayor valor de la desviacin
estndar, mayor dispersin y concluir:
El Grupo B presenta mayor dispersin que el Grupo A
Observe que si se hubiera calculado el Coeficiente de
Variacin, hubiera arrojado un valor mayor y por tanto
una mayor dispersin en el Grupo B.
Ejemplo 2.
Se midi en las pruebas que a continuacin se relacionan
a nios entre 3 y 4 aos de edad cuyos resultados son:
PRUEBA UNIDAD
MEDIA
ARITMTICA
DESVIACIN
TPICA
COEFICIENTE
DE
VARIACIN
Carrera de
10 m
segundos 4,668 1,217 26,1
Carrera de
20 m. (ida y
vuelta)
segundos 15,552 4,946 31,8
Salto de
longitud sin
carrera de
impulso.
centmetros 37,052 17,519 47,3
Lanzamiento
de la
pelota.
metros 2,832 2,573 90,9
En esta tabla se observa que a pesar de que el valor de
las medias aritmticas es diferente e incluso no estn en
las mismas unidades, si es posible analizar (al menos en
el contexto del coeficiente de variacin) que:
Los resultados que presentaron mayor dispersin fueron
en el Lanzamiento de la Pelota, seguidos del Salto de
longitud sin carrera de impulso, la carrera de 20 m y por
ltimo la carrera de 10 m.

Puede ser utilizado para sospechar de valores atpicos
en las mediciones.
En efecto, si se conoce histricamente el coeficiente de
variacin de los resultados de una medicin, y vemos que
el obtenido en una muestra determinada se aparta de l
ostensiblemente, podemos sospechar acerca de la
existencia de alguna anomala.

Puede ser utilizado para estimar la desviacin estndar
de una muestra.
Este caso est relacionado con el anterior, pero en otro
sentido. Si es conocido el Coeficiente de Variacin, es
posible trabajar con una muestra piloto, obtener su
media aritmtica y con este valor inferir acerca de la
magnitud que tendr la desviacin estndar de una
poblacin.
Algunas desventajas observadas.

Puede dar una situacin engaosa si se utiliza
nicamente para analizar la dispersin.
El Coeficiente de Variacin, resulta tan conveniente, que
muchos investigadores, pasan por alto la informacin que
encierran los estadgrafos originales (la media aritmtica
y la desviacin estndar) a los que ste, est referido, ya
que si no se tienen, se desconoce si sus variaciones son
debidas a un aumento o a una disminucin de la media
aritmtica o la desviacin estndar. De ah que
establezcamos, que el Coeficiente de Variacin puede
ser til e informativo cuando es acompaado por la
media y la desviacin pero slo puede ser engaoso.

A medida que el valor de la media aritmtica se
acerque a cero, el coeficiente de variacin aumenta
vertiginosamente.
En efecto, el grfico muestra las caractersticas de
aumento que presentan los resultados en el eje de
ordenadas (Coeficiente de Variacin), a medida que
media aritmtica se acerca a cero.
Clasificacin del Coeficiente de
Variacin segn Zatsiorsky.
En el libro de Metrologa Deportiva (Zatsiorsky 1989 p.
32), aparece:
En la prctica deportiva, en
dependencia del valor del
coeficiente de variacin, el
grado de oscilacin de las
medias se considera pequeo
(0-10%) medio (11-20%) y
grande (V>20%)
Esta clasificacin y lo "atrayente" de sus categoras ha
hecho que muchos investigadores se hayan convertido en
"adictos", a cuanta muestra estudio se encuentre en el
mbito de la Cultura Fsica.
El que esto escribe, considera dudoso el poder clasificar
universalmente a la dispersin de las muestras de
acuerdo a este criterio. En efecto, consideramos que la
clasificacin dispersin de un parmetro en una prueba
est condicionado a las caractersticas propias de los
resultados dela muestra que se est midiendo,
pudindose tener muestras homogneas en cada uno de
los casos siguientes resultados:

Nios con poco tiempo en el desarrollo de un deporte.

Atletas participantes en los juegos juveniles.

Atletas de alto rendimiento.

Medallistas y recordistas mundiales.
Como se sabe a medida se alcanza una categora mayor,
los resultados se van haciendo cada vez ms
homogneos, de ah que este produzca cambios en el
Coeficiente de Variacin y tenga poco sentido hablar de
la dispersin fuera del contexto en donde se encuentran
estas.
En cambio si sera altamente productivo analizar la
permanencia del coeficiente de variacin, de forma tal
que se establezca un cierto intervalo de variacin en el
de acuerdo a la categora en que se est midiendo.

Preguntas.
1. Cmo est definido el coeficiente de variacin?
1. Se acostumbra expresarlo mediante un
nmero o mediante un por ciento?
2. En qu unidades se expresa?
3. En cul escala de medicin debern
encontrarse los resultados para poder
aplicarlo?
2. Qu valores no puede tomar la media aritmtica
de un conjunto de resultados de mediciones, para
aplicarlo?
3. Cules son algunas de las ventajas que representa
la utilizacin del coeficiente de variacin en el
Anlisis de Datos?
1. Cules son algunas de sus desventajas?
4. Exprese cules son los intervalos de valores del
coeficiente de variacin en la clasificacin del
mismo segn Zatsiorsky y cules son las categoras
que se relacionan con los intervalos?

.

Algunos conceptos bsicos.
Tipos de distribuciones ms comunes en el
Anlisis de Datos.

Simtrica o acampanada.

Asimtrica hacia la derecha.

Asimtrica hacia la izquierda.

En forma de J.

En forma de J invertida.

En forma de U.

Bimodal (con dos modas).

Multimodal (con ms de dos modas).

Algunos conceptos bsicos.
Todos "recordarn" que en la Enseanza Media, una
manera de introducir el concepto de circunferencia, lo
era partiendo del incremento del nmero de lados de un
polgono regular, de forma tal que este aumento produce
que los lados del polgono se hagan cada vez ms
pequeos y ms contiguos, transformndose los
segmentos en puntos, dando lugar a una figura con
caractersticas completamente diferentes.
Anlogamente, si estamos en presencia de una
distribucin continua, en donde la muestra de los
resultados de las mediciones obtenidas proceden de una
poblacin cuyo tamao sea considerable, es posible
entonces obtener una muestra cuyo tamao no sea
pequeo y posibilitar, al menos en el plano terico,
construir una tabla de distribucin de frecuencias que
consista en intervalos muy prximos, tan prximos como
se desee), y por tanto con un tamao tan pequeo como
deseemos. Si bien en la prctica nunca podremos obtener
una curva de frecuencia, si en cambio podemos realizar
inferencias acerca de la forma que adopta un
histograma, inspirados en su estructura. As podra
esperarse que al aumentar el nmero de clases se realiza
una transformacin de segmentos a puntos, de ah que la
poligonal sea posible aproximarla a una curva, que recibe
el nombre de curva de frecuencia.
Tales curvas de frecuencia constituyen puntos focales en
la clasificacin de la forma que adopta una distribucin.
En efecto se ha comprobado que en la prctica las
distribuciones tienen determinadas formas
caractersticas, en donde las ms importantes son:
1. Simtrica o acampanada.
2. Asimtrica hacia la derecha.
3. Asimtrica hacia la izquierda.
4. En forma de J.
5. En forma de J invertida.
6. En forma de U.
7. Bimodal (con dos modas).
8. Multimodal (con ms de dos modas).
Simtrica o acampanada.

Algunas de sus caractersticas ms importantes son:

Coinciden los tres promedios fundamentales: media
aritmtica, mediana y moda.

Las mediciones equidistantes del "pico" (mximo
central), tienen la misma frecuencia.

La distribucin terica ms importante en el anlisis
de datos, la distribucin normal, responde a esta
caracterstica.

En el mbito de la teora de pruebas:

Una prueba cuya representacin grfica tenga esta
caracterstica, discrimina muy bien para valores muy
altos o muy bajos del promedio.

Constituye una prueba equilibrada.

Dos ejemplos clsicos en este tipo de distribucin lo
son: el peso y la talla en una poblacin grande.



Asimtrica hacia la derecha.

Algunas de sus caractersticas ms importantes son:

La cola de la curva a la derecha de la moda es ms
larga que la cola que se encuentra hacia la izquierda.

En el campo de la teora de pruebas:

Si en la escala de puntuacin se cumple, que a
medida que el sujeto obtenga valores ms altos, su
resultado es mejor, ser un ndice de que la prueba
ha sido difcil, al encontrarse concentrado la mayor
parte de los resultados a la derecha de la
distribucin

Son caractersticas de aquellas pruebas que
discriminan bien a los puntuaciones a la derecha del
valor modal.
Asimtrica hacia la izquierda.

Algunas de sus caractersticas ms importantes son:

La cola de la curva a la izquierda de la moda es ms
larga que la cola que se encuentra hacia la izquierda.

En el campo de la teora de pruebas:

Si en la escala de puntuacin se cumple, que a
medida que el sujeto obtenga valores ms altos, su
resultado es mejor, ser un ndice de que la prueba
ha sido fcil, al encontrarse concentrado la mayor
ha sido fcil, al encontrarse concentrado la mayor
parte de los resultados a la derecha de la
distribucin

Son caractersticas de aquellas pruebas que
discriminan bien a los puntuaciones a la izquierda
del valor modal.
En forma de J.

Es una distribucin tpicamente ascendente en donde el
mximo y el mnimo se encuentran en los extremos de la
distribucin. Con el mnimo a la izquierda y el mximo a
la derecha.
Un ejemplo tpico de esta forma lo es el tiempo
cronometrado en una carrera de ciclismo, en donde los
tiempos menores corresponden a los ganadores y a
medida que el tiempo aumenta va creciendo la curva
hasta un valor mximo que se origina con el arribo del
pelotn.
En forma de J invertida.

Ocurre al revs que en forma de J. Es una distribucin
tpicamente descendente en donde el mximo y el
mnimo se encuentran en los extremos de la distribucin.
Con el mnimo a la derecha y el mximo a la izquierda.
En forma de U.

Sus caractersticas ms importantes son:
Aparecen dos modas, las que estn situadas en los
extremos. Algunos ejemplos donde se puede presentar
este tipo de distribucin es:

Cantidad de adultos asistentes a instalaciones
deportivas en horas del da. En efecto la mayor
cantidad de personas asisten en las horas tempranas o
en horas de la tarde.

Cantidad de accidentes de trnsito en horas del da.
Bimodal (con dos modas).
En este tipo de forma aunque aparece una moda absoluta
se observa la existencia de dos modas relativas.

De ah que con este tipo de distribucin resulte
importante analizar la existencia de dos subgrupos
confundidos. Ejemplo de lo anterior pueden estar dados
en:

Grupos con capacidades fsicas diferentes, digamos:

Atletas de alto rendimiento y personas que no lo
sean.

Personas que sanas unidas a personas que padezcan
una patologa determinada.

Personas de ambos sexos en mediciones donde
dependa destacadamente el sexo con los resultados
de la medicin.

Multimodal (con ms de dos modas).
En este tipo de forma aparecen ms de dos modas
relativas. Obedece a una situacin similar a la anterior
pero con un mayor grado de complejidad.




Acerca de la pgina Dispersin.

Concepto de dispersin.

Clasificacin de los estadgrafos univariados de
dispersin, que sern estudiados de acuerdo a
la escala de medicin de sus resultados.
Aqu se presentan los aspectos referidos al anlisis de la
dispersin de los resultados en una muestra. El plan
metodolgico a seguir est compartimentado en las
siguientes pginas.

Dispersin

Acerca de la dispersin

Clasificacin de los estadgrafos de dispersin de
acuerdo a la escala de medicin de sus resultados.

Recorrido o amplitud y subordinadas a esta pgina se
tendrn:

Recorrido o amplitud.

Recorrido o amplitud intercuartlico.

Varianza y desviacin tpica o estndar., y
subordinadas a esta pgina se tendrn:

Propiedades de la media aritmtica, la varianza y la
desviacin tpica o estndar.

Coeficiente de variacin.

Puntuaciones z o puntuaciones estndares
Concepto de dispersin.
Ejemplo 1
Si se est hablando acerca de una prueba de velocidad en
un grupo de alumnos y se plantea que los resultados en la
prueba han sido de 11,3 seg., podramos hacernos las
siguientes preguntas:
1. Todos los alumnos alcanzaron 11,3 seg?
2. Existen algunos alumnos que alcanzaron 11,3
seg., otros que tuvieron un resultado superior y
otros un resultado inferior a 11,3 seg?
Es evidente que si la respuesta de la primera pregunta es
afirmativa, no existir variacin alguna entre los
resultados obtenidos y todos los registros estarn
concentrados en un slo punto, esto es 11,3 seg.
Si hubiere sido afirmativa la segunda pregunta, esto
implica que existir una variacin entre los resultados.
Algunos se encontraran por encima, otros por debajo y
quizs alguno coincida con el promedio.
Ejemplo 2.
Podr ocurrir tambin, que se le aplique la misma prueba
a dos grupos de sujetos y que sus promedios sean iguales
y nos tropecemos con las siguientes interrogantes.
1. Los dos grupos tendran la misma consistencia?
Esto es la dispersin de sus resultados es la misma.
2. Si los dos grupos no presentan la misma dispersin.
En cul existir mayor variacin?
Ejemplo 3.
Se est llevando a cabo un experimento que consiste en
realizar una medicin en dos grupos: el primero al que
designaremos por Grupo Experimental, donde se ha
introducido un nuevo tipo de entrenamiento y un
segundo al que designaremos Grupo de Control y en
donde se ha trabajado con un mtodo de entrenamiento
tradicional. Cmo es deseable que sea la dispersin de
los grupos:

Lo ms semejante posible. (Grupos homogneos)

Que presenten diferencias significativas (Grupos
heterogneos).

Se desea investigar acerca de la preferencia hacia
algn tipo de tcnica que permita obtener mejores
resultados en la base. Es deseable que la muestra
escogida sea:

Homognea.

Heterognea.
Esta y otras muchas preguntas nos hacen llegar a la
conclusin acerca de la necesidad de considerar como un
aspecto fundamental la dispersin de la/s muestras y
emplear estadgrafos que permitan evaluarla.

Clasificacin de los estadgrafos
univariados de dispersin, que sern
estudiados de acuerdo a la escala de
medicin de sus resultados.
De la gama de estadgrafos o medidas de dispersin que
existen, consideraremos solamente a aquellos que son
ms utilizados en el mbito de la Cultura Fsica. Ellos
son:

Coeficiente de variacin.

Varianza

Desviacin tpica o estndar

Recorrido o amplitud.

Recorrido o amplitud intercuarttilica.
La utilizacin de estos estadgrafos pueden ser
clasificados de acuerdo a la escala de medicin donde se
encuentran sus resultados, tal como se muestra a
continuacin.

ESCALAS
De los
estadgrafos que
van a ser
estudiados
pueden ser
utilizados en las
respectivas
escalas:
MTRICAS. PROPORCION
TODOS

Coeficiente de
variacin.

Varianza

Desviacin
tpica o
estndar

Recorrido o
amplitud.

Recorrido o
amplitud
intercuarttilica

INTERVALO
Todos menos el
Coeficiente de
Variacin

Varianza

Desviacin
tpica o
estndar

Recorrido o
amplitud.

Recorrido o
amplitud
intercuarttilica
ORDINAL
Solamente

Recorrido o
amplitud

Recorrido o
amplitud
intercuarttilica
NO
MTRICAS.
NOMINAL NINGUNO
En ella es necesario sealar lo siguiente:

Aparece una divisin general de las escalas, en
MTRICAS y NO MTRICAS.
En efecto y como se puede ver, solamente existe un slo
estadgrafo, el Coeficiente de Variacin, que es privativo
de utilizarse solamente cuando sus resultados se
encuentren en la escala de proporcin, por lo que en
general no resulta necesario realizar una diferenciacin
entre los resultados de mediciones en las escalas de
intervalos y proporcin.

Observe que en la tabla anterior a medida que se
desciende en el poder de la escala de medicin, son
menos los estadgrafos que pueden utilizarse. En
efecto en la cspide (escala de proporcin), pueden
ser utilizados todos, en la sima (escala nominal)
ninguno.

Ttulo. Dcima de Levene
para la igualdad de
varianzas.
Premisas
Bsicamente las premisas son las mismas del modelo de
Anlisis de Varianza que se utilice, exceptuando lo referido a la
igualdad de las varianzas poblacionales, que es la hiptesis que
se va a docimar.
Este contraste para la homogeneidad de varianzas es menos
dependiente del supuesto de normalidad que la mayora de las
dcimas, por lo que acta de manera bastante robusta ante
desviaciones moderadas con respecto a la distribucin normal.
Caractersticas de la dcima
Bsicamente la dcima realiza un Anlisis de Varianza, en el
modelo de Clasificacin Simple, tomando como datos los
mdulos de las desviaciones de las mediciones obtenidas,
respecto a la media de los grupos.
Hiptesis
Hiptesis nula:
H
o
: Las varianzas poblacionales son iguales.
Hiptesis alternativa:
H
1
: Existen alguna pareja de varianzas poblacionales
desiguales.
Estadgrafo y distribucin muestral
El estadgrafo, segn se expres en las caractersticas de la
dcima tiene la misma estructura que la tabla de Anlisis de
Varianza, en el modelo de Clasificacin Simple.

Estructura de la base de datos
Sigue la misma estructura que la que tiene una base de datos en
el Anlisis de Varianza que va a ser realizado.
Salidas de la dcima
En el ejemplo que se muestra, la base de datos en donde se ha
realizado una medicin a cuatro grupos de alumnos con cuatro
sujetos en cada uno de los grupos.
MEDICIN GRUPOS
4.3 1
3.1 1
4 1
2 1
4.8 2
3.9 2
4.1 2
3.8 2
3.9 3
3 3
3.7 3
3.6 3
3.7 4
4 4
3.9 4
3.5 4
4 5
4.1 5
4.2 5
3.9 5
La salida obtenida usualmente en los Paquetes Estadsticos es
similar a la salida para el Anlisis de Varianza utilizada por el
paquete, la que se muestra a continuacin:
SS df MS SS df MS

Effect Effect Effect Error Error Error
MEDICION 1.203 4 0.30075 1.02 15 0.068


F p
MEDICION 4.42279412 0.01467218

En la salida de la dcima observamos que al ser el valor
de la probabilidad menor que 0,01; podemos concluir que
existen diferencias muy significativas entre las varianzas
de las poblacionales de donde provienen las muestras.
Es de sealar que aunque usualmente el promedio que se
utiliza en la celda es la media aritmtica, puede ser
utilizado otros, como la mediana, la mediana con grados
de libertad corregidos, la media ajustada etc.
A continuacin se muestra otra forma de salida, segn la
hace el SPSS

DCIMAS

En la pgina Normalidad.

Dcima de Shapiro-Wilks.

Dcima de Kolmogorov-Smirnov-Lillienford.

Dcima de Levene para la igualdad de varianzas.
Aunque el Anlisis Exploratorio no se distingue por la
utilizacin de dcimas, si es importante y constituye una tarea
muy importante la investigacin acerca de:

La normalidad de la poblacin de donde provienen los datos.

La igualdad de las varianzas poblacionales.
Independientemente que en la literatura existen varias dcimas
acerca de estos dos aspectos, la prctica a decidido, hasta el
momento, que sean utilizadas las siguientes, para el anlisis de
resultados univariados:

Para analizar la normalidad:

Dcima de Shapiro-Wilks si el tamaos de muestra es menor
o iguales que 50.

La dcima de Kolmogorov-Smirnov-Lillienfors si el tamao
de muestra es mayor que 50.
De estas dos dcimas la que ha demostrado ser ms potente,
ante aquellas que tienen su mismo tamao de muestra, es la de
Shapiro-Wilks, por lo que es la que preferentemente debe ser
usada siempre que sea posible.
En el caso de las dcimas para analizar la igualdad de varianzas
ocurre otro tanto, pero hasta el momento la dcima de Levene es
la que ha mostrado una mayor potencia, de ah que sea la nica
que analizaremos para investigar la homocestadicidad.

Errores

Introduccin.

Errores Crasos.

Resultados de mediciones atpicas.
Introduccin.
Existen dos tipos de resultados de las mediciones, en los
que es necesario ser extremadamente cuidadosos, antes
de comenzar con el procesamiento de una base de datos.
Estos son:

Errores crasos.

Resultados de mediciones atpicas.
Sin embargo el principiante, y a veces el que no lo es,
olvida lo traumatizante que puede ser para el
investigador, el realizar un determinado procesamiento e
incluso imprimirlo para despus llegar a la triste
conclusin que han existido resultados con estas
caractersticas que han invalidado el anlisis.
De ah, que debe tomarse como norma a seguir el no
continuar con el anlisis hasta que se tenga la certeza de
que ha sido analizada la existencia de tales resultados.
Errores Crasos.
Los errores crasos se presentan fundamentalmente
cuando:
1. La captacin de los datos primarios ha sido
realizada errneamente.
2. Los valores han sido tecleados incorrectamente.
Es importante destacar que la rectificacin del dato en el
primer caso, reviste un alto grado de complejidad,
siendo en muchas ocasiones necesario repetir la medicin
y en los casos en que esto no sea posible anularla.
En el segundo caso, consiste en ir a los datos originales y
enmendar el resultado tecleado.
La deteccin de errores crasos se realiza
fundamentalmente mediante dos vas:

Observando el mximo y el mnimo obtenidos.
Por ejemplo si estamos tecleando los resultados de una
variable que representa los resultados en una asignatura
en la Enseanza Superior, donde como se sabe las
posibles notas a obtener son 2, 3, 4, 5; y al pedir al
paquete la obtencin del mximo y del mnimo,
observamos que el primero es superior a 5, o que el
segundo es inferior a 2, ser fcil percatarnos que se ha
cometido un error craso.
Otros errores crasos fcilmente detectables ocurren en
mediciones donde los resultados aparecen con decimales
(peso, talla, velocidad, etc) y se ha omitido el lugar
decimal.

Realizando una tabla de distribucin de frecuencias o
su representacin grfica correspondiente
(histograma).
Existen otras situaciones donde no es posible observar el
error por la va del mximo o del mnimo. Esta situacin
ocurre cuando existe un valor entre el mximo y el
mnimo que no es posible que aparezca. Por ejemplo,
supongamos que estamos midiendo los resultados en un
tipo de shock y que estos sean:
Tipo de
Shock
Numeral
Hipovolmico 3
Cardiognico 4
Bacteriano 5
Neurognico 6
Supongamos que en la muestra no es posible que
aparezca un ataque del tipo cardiognico, esto quiere
decir que no es posible que el numeral 4, aparezca en la
base. Resulta evidente que por la va del mximo y del
mnimo, no resulta posible detectar el error. En cambio
si se realiza una tabla de distribucin de frecuencias ( o
su histograma correspondiente) la situacin podr ser
detectada.
Resultados de mediciones atpicas.
Primero que todo, es preciso sealar que una medicin
atpica, no tiene que ser necesariamente un error craso,
es ms es enteramente posible la existencia de este tipo
de medicin en la muestra que va a ser analizada.
Insistimos que es enteramente factible (sobre todo
cuando el tamao de muestra no sea chico), la existencia
de sujetos que descuellen ya sea en sentido aumentativo,
como en el disminutivo con respecto a los resultados en
un parmetro o prueba determinada, o que existan
determinados resultados que sin ser extremos se aparten
del contexto.
En muchas ocasiones, el procedimiento recomendado a
seguir, cuando se detecten este tipo de resultados es
extraerlos de la base, y despus de mencionar su
existencia procesarlos aparte. Esta solucin debe
adoptarse principalmente cuando el tamao de muestra
no sea considerable.
Concepto de estadgrafo.
Supongamos que en un problema de Fsica elemental se
nos pide encontrar la velocidad que ha empleado un
cuerpo que sigue un movimiento uniforme, cuyo
recorrido es de 6 metros durante 3 segundos. Para
resolver este problema contamos con los siguientes
datos:
s (distancia recorrida)=6 m.
t (tiempo transcurrido)=3 seg.
Conocemos que la frmula a aplicar en este problema es:

Sustituyendo entonces en la frmula se tendr:

Consideremos ahora el siguiente caso.
Se han registrado las velocidades en 5 tramos de un
corredor y se desea hallar el promedio de la velocidad
empleada.
Los resultados parciales que se han obtenido son: 2,5
seg. 3,0 seg. 2,0 seg. 1,5 seg. y 1,0 seg., se desea
obtener la media aritmtica de estos resultados.
Los datos que se disponen, han sido obtenidos de la
muestra y son: x
1
=2,5 x
2
=3,0 x
3
=2,0 x
4
=1,5 x
5
=1,0.
El estadgrafo a utilizar es:

Que aplicado a los datos que se tienen se tendr:

Respuesta: La media aritmtica de los resultados de las
mediciones es de 2 seg.
Concepto de estadgrafo.
Si se est en presencia de un conjunto de resultados de
mediciones en ocasiones es necesario obtener
determinadas cantidades numricas que permitan
caracterizar a este conjunto. Estas cantidades
numricas, que reciben el nombre de estadgrafos (y en
ocasiones estadsticos) varan de acuerdo a los resultados
obtenidos en la muestra.
A los efectos prcticos, de acuerdo al nivel de
conocimientos que actualmente se dispone, podemos
asociar la obtencin del mismo de acuerdo al mismo
tratamiento que se hizo con los ejemplos anteriores, esto
es, como si fuera una frmula en donde los valores que
vamos a sustituir en ella siempre es posible obtenerla de
acuerdo a los resultados de las mediciones contenidos en
la muestra.
Debe tenerse en cuenta que con la introduccin de los
paquetes estadsticos computacionales, no se hace
necesario desarrollar algoritmos que permitan obtenerlos
sin embargo resulta imprescindible conocer en cada uno
de ellos:

Las condiciones o requisitos en que puedan ser
utilizados.

Las ventajas y desventajas que presenta ante otros
similares, de acuerdo a las condiciones planteadas.

Las conclusiones que de ellos emanan en la/s muestras
analizadas.
Es preciso tener en cuenta que aunque no existe un
lmite preciso en cuanto al nmero de estadgrafos
diferentes que existen, debido a las mltiples maneras
en que puede ser caracterizada una muestra, si la
prctica ha indicado un nmero muy reducido de
estadgrafos a ser utilizados en el mbito de la Educacin
Fsica, el Deporte, la Recreacin y la Rehabilitacin, los
que son presentados en las pginas siguientes y
clasificados de acuerdo al siguiente criterio:

Promedios.

Media aritmtica.

Mediana.

Moda.

Estadgrafos (medidas) de dispersin.

Recorrido o amplitud y subordinadas a esta pgina
se tendrn:

Recorrido o amplitud.

Recorrido o amplitud intercuartlico.

Varianza y desviacin tpica o estndar y
subordinadas a esta pgina se tendrn:

Propiedades de la media aritmtica, la varianza y
la desviacin tpica o estndar.

Coeficiente de variacin.

Puntuaciones z o puntuaciones estndares

Estadgrafos de simetra.

Coeficiente de esquenosis.

Estadgrafos de apuntamiento.

Coeficiente de curtosis.

Opcin Frecuencias
El procedimiento Frecuencias proporciona estadsticos y
representaciones grficas que resultan tiles para
describir muchos tipos de variables. Es un buen
procedimiento para una inspeccin inicial de los datos.
Para los informes de frecuencias y los grficos de barras,
puede organizar los diferentes valores en orden
ascendente o descendente u ordenar las categoras por
sus frecuencias. Es posible suprimir el informe de
frecuencias cuando una variable posee muchos valores
diferentes. Puede etiquetar los grficos con las
frecuencias (la opcin por defecto) o con los
porcentajes.
Estadsticos o Estadgrafos.

media

mediana

moda

suma

desviacin tpica

varianza

amplitud

valores mnimo y mximo

error tpico de la media

asimetra y curtosis (ambos con sus errores tpicos)

cuartiles

percentiles especificados por el usuario.
Grficos.

grficos de barras

Frecuencias

porcentajes

grficos de sectores

Frecuencias

porcentajes

histogramas.

Con curva normal superpuesta.

Sin curva normal superpuesta.

Las tcnicas grficas
Introduccin
Las tcnicas grficas constituyen un instrumento de gran
potencia para el anlisis de datos y constituyen una de
las piedras angulares en que se basa el Anlisis
Exploratorio, debido a la objetividad y simplicidad que
ellas despliegan para examinar la estructura de una Base
de Datos.
En efecto, cuando se pretende analizar los datos de una
investigacin y se realizan tcnicas grficas , las mismas
pueden ayudar extraordinariamente, entre otras a:

Encontrar patrones y relaciones

Detectar resultados no previstos.

Facilitar la interpretacin de los resultados.

Examinar el cumplimiento de las premisas de las
dcimas utilizadas.

Comunicar informacin de una manera muy simple.
De ah que podamos plantear sintticamente que los dos
objetivos bsicos de los datos son:
1. Facilitar el estudio de su estructura.
2. Comunicar los resultados del anlisis realizado a
otros.
Ahora bien, entre los cientos de representaciones
grficas que estn a disposicin del analista, se debe ser
cuidadoso en escoger aquellas que permitan:

Una orientacin hacia los datos.
Al respecto existen dos vertientes a las cuales debe de
estarse particularmente atentos ellos son:
1. La continuidad y la escala de
medicin donde se encuentran los
resultados de la medicin realizada.
2. El tipo de estudio que piensa hacerse
en esa base de datos.

Una buena cualidad descriptiva del proceso que ha
sido realizado y que apunte hacia lo que se pretende
que el grfico ilustre
En efecto si la ausencia de grficos entorpece el anlisis,
el abuso de los mismos, en aras de "engordar" la
investigacin produce un entorpecimiento de la fluidez
del discurso y hace patente las intenciones o el
desconocimiento del autor.

Ayudar a la localizacin de la atencin.
Es siempre importante tener en cuenta que no
escribimos para nosotros, sino para los dems. En
efecto no baste que en una investigacin un grfico sea
bien utilizado, sino que ste despierte el inters del
lector, ya sea por que:

Ilustre un determinado anlisis realizado

Sirva para comprender lo que se est indicando en el
contexto.

La posibilidad que permita poder establecer
comparaciones internas.
En efecto un grfico que no permita hacer
comparaciones internas, no es un grfico es una pintura.
Es preciso tambin tener en cuenta cules son las
dimensiones que mejor permiten discriminar entre las
cualidades y los patrones que se pretenden representar.
Desde la teora de la percepcin de grficos, se han
identificado en orden de mayor a menor los siguientes
(Cleveland, W. S. y R. Mc. Gill, 1984).
1. Posicin a lo largo de una escala comn.
2. Posicin a lo largo de una escala comn no
alineada.
3. Longitud.
4. ngulo-pendiente.
5. rea.
6. Volumen y curvatura.
7. Sombreado y saturacin


HISTOGRAMA

Introduccin.

Tablas de distribucin de frecuencias.

Estructura de un histograma.

Ejemplos.

Preguntas.
Introduccin.
Los histogramas son grficos que resultan tiles para
extraer informacin sobre resultados de mediciones
continuas, o en aquellas que sin serlo presenten un grado
de variabilidad tal que justifique su uso. Dado que un
histograma no es ms que la representacin grfica de
una tabla de distribucin de frecuencias, se hace
necesario impartir este concepto y paralelamente a ste
introducir el concepto de histograma. Ahora bien, dado
que existen diferentes tipos de tablas de distribucin de
frecuencias, se colige la existencia de diferentes tipos de
histogramas, acordes al tipo de tabla utilizada.
A despecho de lo que se ha dicho anteriormente, acerca
del paralelismo conceptual existente entre histograma-
tabla de distribucin de frecuencias, en los momentos
presentes y ante el auge del Anlisis Exploratorio, con su
preminencia en el desarrollo de tcnicas grficas, ha
cedido terreno la obtencin de una tabla de distribucin
de frecuencias ante la representacin grfica de la
misma, ya que mediante ella resulta mucho ms fcil:

Detectar errores crasos y resultados de mediciones
atpicas.

Poder comparar la estructura en diferentes muestras
tomadas de una misma poblacin, en los mismos
intervalos de clase.

Percibir la forma que adopta la distribucin de los
resultados de las mediciones, lo que puede permitir:

Determinar distribuciones empricas.

Realizar un mejor anlisis de las tcnicas
confirmatorias (dcimas) o y a ser realizadas.

Una posible transformacin de los datos.
Tablas de distribucin de
frecuencias.
Una Tabla de Distribucin de Frecuencias, o
simplemente una Tabla de Frecuencias, es una "Tabla",
constituida por dos componentes fundamentales:

Clases

Frecuencia en que se producen los resultados de las
mediciones en una clase.
Clases.
Las clases podrn estar constituidas por:

Conteo de valores individuales, pudiendo ser:

Resultados individuales de mediciones.

Resultado de mediciones faltantes.

Un intervalo.
Generalmente un intervalo semiabierto cerrado a la
izquierda y abierto a la derecha.
Frecuencias de clase.
Las frecuencias correspondientes a una clase
determinada estar constituida por:

Un nmero natural (entero positivo), en el caso de que
se trate del conteo de:

El conteo de valores absolutos correspondiente a la
celda

El conteo de valores absolutos acumulados hasta la
celda en cuestin.

Una proporcin o un por ciento que refleje:

La proporcin (por ciento) de valores en una celda
determinada respecto al total de casos en la
variable:

Vlidos

Total de casos que aparecen en la variable.

La proporcin (por ciento) acumulados hasta la
celda en cuestin, respecto al total de casos en la
variable:

Vlidos

Total de casos que aparecen en la variable
De las caractersticas que pueden tener las frecuencias
se derivan los distintos tipos de Tablas de Distribucin
utilizados, estas podrn ser:

Tabla de distribucin de frecuencias

Absolutas

Absolutas acumuladas.

Tabla de distribucin de frecuencias

Relativas (en proporcin o en por ciento)

Relativas (en proporcin o en por ciento),
acumuladas.
Estructura de un histograma.
Un histograma es una representacin grfica
bidimensional de rectngulos, formada por una pareja de
ejes cartesianos donde:
Eje de abscisas.
En el eje de abscisas (eje de las x) se sitan las clases,
estas podrn estar constituidas por un numeral o un
intervalo.

Numeral. En el caso de que se realice un conteo
individual de valores. Este tipo de histograma es
equivalente al Diagrama de barras. Tiene ms sentido
su utilizacin cuando los resultados de las mediciones
son nominales, o cuando la variacin (dispersin) de
los resultados es muy poca.

Intervalo. Slo tiene lgica hacerlo si estamos en
presencia de una medicin continua, o que
bsicamente lo sea.
Eje de ordenadas.
En el se encontrarn las frecuencias que podrn ser: un
nmero natural, en el caso de que se trate de un
histograma de frecuencias absolutas o frecuencias
absolutas acumuladas y una proporcin (o un por ciento),
en el caso de que sean frecuencias relativas.
Rectngulos.
Los rectngulos estn limitados por todos o algunos de
los siguientes elementos.

ELEMENTO SIGNIFICADO
F

Frecuencia.

Por ciento (generalmente) o proporcin
del:

Numeral M, en el caso de que sea un
conteo individual de valores

Del intervalo I-S.
I Lmite inferior del intervalo I-S.
S Lmite superior del intervalo I-S.
M
Marca de clase (Punto medio entre I y S, en
el caso de que se tenga un intervalo
I-S
Amplitud o Tamao de la clase del intervalo
I-S.
Salida en los paquetes.
Generalmente la salida en los paquetes tienen las
siguientes caractersticas respecto a los intervalos.:
1. Aparece slo la marca de clase en cada uno de
los intervalos.
2. Aparecen los lmites (inferior y superior) de
cada uno de los intervalos.
Cmo encontrar los lmites de los intervalos si
aparece la marca de clases y viceversa?
Dado que usualmente el tamao de la clase es el mismo,
si se desea hallar:

El ancho del intervalo partiendo de la marca de clase,
lo nico que se tiene que hacer es:
Restarle a la marca de clase de un
intervalo, la marca del intervalo que lo
antecede. El resultado ser el ancho del
intervalo.
Ejemplo 1.
A continuacin se muestra el siguiente
histograma, que refleja la estatura medida
en centmetros de un grupo de sujetos. En
los intervalos aparecen solamente las
marcas de clase.


1.- Visualizar las marcas de clase.
145 155 ... 185.

2.- Obtener la semiamplitud del intervalo..
La diferencia entre dos marcas de clase
contiguas es de 5 cm (155-145=10 165-
155=10 ...). De ah que la amplitud del
intervalo sea 10 y su semiamplitud 5.

3.- Obtener los lmites de clase.
Para hallar el lmite inferior de la primera
clase, se le resta a la marca de clase de un
intervalo la semilongitud del intervalo. 145-
5=140.
Para hallar el lmite superior de la primera
clase, se le suma a la marca de clase la
semilongitud del intervalo. 145+5=150.
Los lmites de clase sern entonces:
140-150 150-160 160-170 y 170-180

Para obtener la marca de clase partiendo de los lmites
de clase, lo nico que se tiene que hacer es:
Ejemplo 2.
A continuacin se muestra el siguiente
histograma, que refleja la estatura medida
en centmetros de un grupo de sujetos. En
los intervalos aparecen los lmites de clase.

Para obtener las marcas de clase en cada intervalo, lo
nico que se tendr que hacer es:

1.- Hallar la semiamplitud de la clase.
La amplitud de clase se obtiene restando en cualquier
clase (todas las clases tienen la misma amplitud) al
lmite superior el lmite inferior.
150-140=160-150=...=190-180=10
Luego la semiamplitud de la clase es 10 cm/2=5 cm

2.- Obtencin de las marcas de clase.
En cada intervalo se le sumar al lmite inferior la
semiamplitud de la clase. El resultado ser entonces la
marca de clase. En efecto:
140+5=145 Marca de clase 145 cm.
150+5=155 Marca de clase 155 cm.
....180+5=185 Marca de clase 185 cm
Ejemplos.
A continuacin analizaremos la estructura de cada una
de estas tablas, as como los de sus histogramas
correspondientes, de la siguiente forma:

Conteo de valores individuales.

Distribucin de frecuencias absolutas-Histograma de
frecuencias absolutas.

Distribucin de frecuencias absolutas acumuladas-
Histograma de frecuencias absolutas acumuladas.

Distribucin de frecuencias relativas-Histograma de
frecuencias relativas.

Distribucin de frecuencias relativas acumuladas-
Histograma de frecuencias relativas acumuladas.

Conteo de valores en un intervalo.

Distribucin de frecuencias absolutas-Histograma de
frecuencias absolutas.

Distribucin de frecuencias absolutas acumuladas-
Histograma de frecuencias absolutas acumuladas.

Distribucin de frecuencias relativas-Histograma de
frecuencias relativas.

Distribucin de frecuencias relativas acumuladas-
Histograma de frecuencias relativas acumuladas.
Partiremos para obtenerlos de una base de datos muy
simple, de tamao 113 donde aparecen dos variables.
Grupo: (Nominal). Constituida por cinco niveles. Observe
que en la tabla est puesto a la izquierda el numeral que
corresponde a la entrada seguido de la etiqueta. Por
ejemplo 1 Grupo1, 2 Grupo2, etc.
Estatura (Continua y en la escala de intervalo).
Formada por la estatura de los sujetos medidos en
centmetros.
La base en cuestin es la siguiente:
Variable Grupo.
A continuacin se muestran los histogramas
correspondientes a las tablas de frecuencias anteriores.




Variable Estatura.
Por regla general los paquetes estadsticos asumen una
disposicin en cuanto a las caractersticas que puede
tener un histograma. Ahora bien, si lo que se necesita es
realizar un histograma con determinadas caractersticas,
podr ensayarse en realizar modificaciones en uno de los
dos aspectos siguientes:

Incrementando el nmero de clases

Fijando el tamao de las clases.
Si se modifica una cualesquiera de estas opciones,
automticamente queda modificada la otra. En efecto:
Supongamos que el nmero de clases de un histograma
sea 10 y que debido a esto la longitud de la clase sea de
5. Si deseamos incrementar el nmero de intervalos, por
ejemplo a 20, el tamao de la clase ser de 2,5.
Similarmente si el tamao de las clases se modifica,
ocurrir una modificacin en el nmero de clases. En
efecto, si se disminuye el tamao, aumentar el nmero
de clases y si se aumenta disminuirn estas.
A continuacin se muestra la tabla de distribucin de
frecuencias y los histogramas correspondientes.
ESTATURA
CLASES
(INTERVALOS)
FRECUENCIA
FRECUENCIA
ACUMULADA
PORCENTAJE
PORCENTAJE
ACUMULADO
140.000<=x<145.000 2 2 1.769911504 1.769911504
145.000<=x<150.000 3 5 2.654867257 4.424778761
150.000<=x<155.000 11 16 9.734513274 14.15929204
155.000<=x<160.000 9 25 7.96460177 22.12389381
160.000<=x<165.000 26 51 23.00884956 45.13274336
165.000<=x<170.000 28 79 24.77876106 69.91150442
170.000<=x<175.000 16 95 14.15929204 84.07079646
175.000<=x<180.000 14 109 12.38938053 96.46017699
180.000<=x<185.000 2 111 1.769911504 98.2300885
185.000<=x<190.000 2 113 1.769911504 100



Nota:
Es importante destacar que coinciden las formas de:

El histograma de frecuencias absolutas y el de por
cientos.

El histograma de frecuencias absolutas acumuladas y el
de por cientos acumulados.
Preguntas.
1. Para cules aspectos del Anlisis de Datos
resultan tiles los histogramas?
2. Cul es la estructura de una tabla de distribucin
de frecuencias?
3. Explique los siguientes trminos que pueden
aparecer en una tabla de distribucin de
frecuencias:
1. Frecuencia absoluta.
2. Frecuencia absoluta acumulada.
3. Frecuencia relativa.
4. Frecuencia relativa acumulada.
5. Amplitud, ancho o longitud de un intervalo.
6. Marca de clase.
7. Lmite superior de un intervalo.
8. Lmite inferior de un intervalo.


INTERVALO DE CONFIANZA.

Introduccin.

Distribucin muestral de un estadgrafo.

Distribucin muestral de la media.

Expresin del intervalo de confianza para la
media con varianza poblacional desconocida.

Valores usuales para la confianza del intervalo.

Ejemplo numrico para el clculo de un
intervalo de confianza para la media.

Variaciones que se producen en la longitud del
intervalo debido a cambios en la confianza,
dispersin y tamao de muestra.

Interpretacin de un intervalo de confianza.
Introduccin.
En muchas ocasiones en que estamos en presencia de una
poblacin de la que deseamos obtener algn parmetro
(su media aritmtica poblacional, su varianza poblacional
etc), nos tropezamos con la dificultad de no poder contar
con los resultados de la medicin de todos los elementos
de la poblacin, debido entre otras causas a:

Mayor economa.
Resulta claro en sentido general que la toma de
informacin de una muestra resulta ms econmica que
la de una poblacin, independientemente del tamao de
una u otra, pero las diferencias se acentan cuando se
est en presencia de poblaciones muy numerosas. Lo
anterior se agudiza cuando se presentan inconvenientes,
entre ellos:

La medicin de la prueba implica la utilizacin de
recursos gastables, que en ocasiones pueden ser muy
costosos, por ejemplo reactivos, que hacen prohibitivo
el ser realizado a una muestra numerosa, ms an a
una poblacin que lo sea.

Se hace necesario emplear equipos que no se cuentan
en el momento y que debern ser solicitados en
carcter de prstamo a otra entidad durante un
perodo de tiempo determinado.

Mayor rapidez.
Resulta evidente que el proceso de medicin se hace ms
rpido si se realiza a una parte que a un todo, pero lo
anterior se agudiza en los casos que:

Se est realizando un evento y los atletas participantes
se marchan a la terminacin del mismo.

Es necesaria una informacin urgente de ah que el
tiempo destinado a la recogida de informacin deba
hacerse lo ms rpido posible.



De ah que por regla general cuando se desea realizar
alguna estimacin de un parmetro poblacional se
recurra a una muestra y basndonos en los resultados
obtenidos en ella efectuar la estimacin del parmetro
poblacional. Esa estimacin puede ser de dos tipos:

Estimacin puntual
Mediante este tipo de estimacin se toma una muestra,
se obtiene el valor de un estadgrafo muestral, digamos
la media aritmtica y se adopta el resultado obtenido
como valor del parmetro poblacional, en este caso la
media aritmtica poblacional .
Este tipo de estimacin presenta una serie de
inconvenientes entre ellos el de no permitir cuantificar
la cercana del parmetro poblacional a la estimacin
realizada.

Estimacin por intervalos.
En este tipo de estimacin se parte de una estimacin
puntual, pero posteriormente a ser encontrada esta (la
media aritmtica, la desviacin estndar, etc), es
deseable obtener alguna indicacin acerca de la
confiabilidad del estimador obtenido, de ah que resulte
conveniente acompaar al resultado de la estimacin
puntual obtenida, a la desviacin estndar de la
distribucin muestral del estimador, la que recibe el
nombre de error estndar de la estimacin y constituye
una medida de su variabilidad.
Es preciso adelantar que asociada a un intervalo de
confianza se encuentra la probabilidad de que el
intervalo incluya al parmetro poblacional que se desea
estimar. Con el fin de formalizar lo anterior, designemos
por al parmetro poblacional que se desea
estimar y por al estimador del parmetro.
Designemos por , a la probabilidad de que el
parmetro problacional incluya al intervalo. Esta
probabilidad no ser otra cosa que la confianza que
tendremos que el parmetro poblacional se
encuentre en el intervalo.
La cuestin entonces reside en encontrar dos nmero a y
b, en funcin de a los que denotaremos por
tales que:

Al intervalo se denomina intervalo de
confianza al . Donde ser la
probabilidad de encontrarse en el intervalo
expresada en por cientos.
Veamos los siguientes ejemplos.
Ejemplo 1.
Supongamos que sabemos que en las 100 bolas que
contiene una caja 95 son blancas y 5 son negras. Se saca
una bola al azar. Analicemos las siguientes interrogantes:
1. De qu color sera la bola extrada?
Analicemos algunas de las respuestas ms factibles.

La bola extrada es blanca.
Esa respuesta es incorrecta. Es cierto que la mayor
probabilidad de ocurrencia radica en que la bola que se
escogi fuera blanca, pero nicamente pudiera ser
correcta lla respuesta, en el caso de que las 100 bolas de
la caja fueran de ese color.

La bola extrada es negra.
Si usted ha decidido que esta es la respuesta, su porvenir
en el anlisis de datos parece ser del mismo color.

No se sabe el color de la bola.
Esta es la respuesta correcta. En efecto
independientemente de que existan mucho ms bolas
blancas que negras, lo mismo puede salir una bola de un
color o de otro.
2. Imagnese que usted est participando en un
juego, donde el quie acierte a la bola que sale
gana y conoce que en la caja existen 95 bolas
blancas y 5 bolas negras. Por qu color de bola
usted apostara?
Independientemente que no podemos saber a priori el
color de la bola, no es nada desacertado "apostar" a que
la bola extrada es blanca, ya que:
En el contexto del
problema, tenemos una
confianza del 95% de que
la bola extrada sea
blanca.
En efecto, si en total existen 100 bolas y de ellas
contamos con 95 que son blancas, tendremos una
probabilidad de ocurrencia de 0,95 o lo que es lo mismo
del 95%, de escoger una bola blanca.
Ejemplo 2.
Supongamos que usted entrena a nios de 12 aos en la
carrera de 100 m. planos y que tiene a su disposicin los
resultados que tuvieron a los 12 aos los 50 mejores
atletas en esa especialidad durante el pasado cuatrienio.
Decididamente ser de mucha importancia para usted, y
para cualquier otro especialista en esta actividad, el
comparar los resultados de los nios que entrenan con los
registros cuando tenan doce aos de los mejores atletas
del cuatrienio. Ahora bien, una forma en que podramos
hacer la comparacin es la siguiente.

Obtener la media aritmtica de los resultados que
tuvieron estos 50 atletas destacados a los doce aos y
compararlos con los registros alcanzados en esa
compararlos con los registros alcanzados en esa
especialidad por los nios que se entrenan.
Esta es una va que entraa las siguientes dificultades:
1. Es muy difcil de que coincidan exactamente la
media obtenida de los resultados de los 50 atletas
con los registros que usted desea comparar.
2. An en el caso de que coincidan o que
aproximadamente lo sean, no debera hacerse una
comparacin puntual, esto es compararla con el
valor obtenido por la media aritmtica de los 50
atletas, ya que en la observacin que se est
haciendo de los registros de los 50 atletas se
observa que unos han obtenido un resultado mayor
o menor y que una diferencia pequea no ha sido
concluyente respecto a los desempeos
individuales futuros.
Lo ideal sera en vez de obtener y trabajar con una
estimacin puntual, en este caso la media aritmtica, lo
hagamos con un intervalo, que nos permitiera decir que
si se encuentran los futuros atletas dentro de este
intervalo, tendrn posibilidades de ser en un futuro
atletas muy destacados.
Este intervalo, podr realizarse a travs de:

Criterios tcnicos subjetivos.
En efecto podramos establecer los extremos del
intervalo mediante una comisin de expertos, la propia
experiencia del entrenador, etc.
Ahora bien es de sealar que independientemente de la
utilidad que presenten estos lmites siempre podr ser
discutida y cuestionada por otra comisin de expertos, la
experiencia del propio entrenador o de otro, etc.

Asociar a este intervalo criterios probabilsticos.
Si se elige esta otra variante estaremos en presencia de
los llamados intervalos de confianza que ser el objetivo
de la presente pgina.
Resulta tambin preciso destacar en la informacin que
usted posee lo siguiente:

La poblacin de atletas destacados en esta
especialidad es una poblacin prcticamente
conceptual o terica, ya que esta es continuamente
cambiante.

Los datos de los 50 atletas no constituyen una
poblacin. En efecto:

Pueden haber existido atletas muy destacados en los
que no se disponga el registro por:

Haberse perdido.

El atleta no estaba entrenando.
De ah, que la informacin que se disponga de los 50
atletas sea la de una muestra y no la de una poblacin.
Consideremos entonces que esa poblacin que
desconocemos de registros a los doce aos de atletas
destacados tenga como media aritmtica a y
realicemos una particin de esa poblacin en muestras
de tamao 50, que es el tamao de muestra que
disponemos, mediante el Muestreo Aleatorio Simple. No
sabemos cuntas muestras de tamao 50 vamos a
obtener, lo que si sabemos es que una de ellas ser la
muestra constituida por las mediciones conocidas.
Distribucin muestral de un
estadgrafo.
Consideremos a una poblacin P y hallemos todas las
muestras posibles, mediante el Muestreo Aleatorio
Simple, que es posible extraer de ella. Encontremos en
cada una de esas muestras de tamao n el valor que
toma un estadgrafo cualquiera que denotaremos por e.
Se tendr entonces el siguiente esquema, donde ha sido
denotadas las muestras de la poblacin P por M y en la
distribucin muestral del estadgrafo e, los resultados del
estadgrafo con el subndice de la muestra
correspondiente.

Ahora bien de acuerdo a lo anterior podemos realizar dos
tipos de distribuciones:

La distribucin de la poblacin P, cuya forma podr ser
por ejemplo:


La distribucin muestral del estadgrafo e, cuya forma
podr ser la que se indica.

En estos dos esquemas se ha pretendido indicar que en
general las formas de las distribuciones de la poblacin y
muestral del estadgrafo difieren y que la distribucin
muestral del estadgrafo adopta generalmente una forma
tendiendo a lo acampanado.
Ilustremos lo anterior considerando como estadgrafo e,
a la media muestral. De ah que pasaremos entonces a
estudiar brevemente la Distribucin Muestral de la
Media.
Distribucin muestral de la media.
Consideremos los siguientes ejemplos:
Ejemplo 1.
Sea la poblacin P conformada por los siguientes
elementos: 1, 2, 3, 4 y 5. La media aritmtica de esta
poblacin que denotaremos es igual a 5.
Sea la varianza de la poblacin P
Si representamos grficamente a la poblacin P, veremos
que la forma que esta adopta es rectangular, segn se
muestra a continuacin.

Formemos todas las muestras posibles de tamao n=2 y
obtengamos cada una de as las medias aritmticas de
estas muestras.
Media
Aritmtica
1 2 3 4 5
1 1 1.5 2 2.5 3
2 1.5 2 2.5 3 3.5
3 2 2.5 3 3.5 4
4 2.5 3 3.5 4 4.5
5 3 3.5 4 4.5 5
Denotemos a la media de la distribucin muestral de
medias por
La distribucin muestral de medias nos reportar las
siguientes caractersticas.

La media de la distribucin muestral de medias es
igual a la media de la poblacin. En smbolos:


La varianza de la distribucin muestral de medias es
igual a la varianza de la poblacin dividida por el
tamao de la muestra. En smbolos:


La forma que adopta la distribucin muestral de
medias se aproxima ms a la distribucin normal,
segn se muestra.

En efecto el cambio de la forma de la distribucin de la
poblacin, que es rectangular, es dramtico con respecto
al cambio que experimenta la distribucin nuestral de las
medias, que adopta una forma acampanada.
A medida que el tamao de muestra n crezca, se seguir
cumpliendo que:


Y adems la distribucin muestral de medias se acercar
cada vez ms a la distribucin normal. De forma tal que
si n crece ilimitadamente se tendr que la distribucin
muestral de medias estar distribuida normalmente con
media y varianza .
Dado que el tamao de muestra n, en la prctica no es ni
remotamente puede ser ilimitado los especialistas han
adoptados el criterio de considerar la aproximacin a la
distribucin normal satisfactoria siempre que el tamao
de muestra sea:

Mayor que 30 para la mayora de los autores.

Mayor que 50 para algunos.
Expresin del intervalo de confianza
para la media con varianza
poblacional desconocida.
Sea una muestra aleatoria de tamao n con media
aritmtica y desviacin estndar s.
Para tamaos de muestra lo suficientemente grandes la
expresin que adopta el intervalo de confianza para la
media est dada por:

Donde:
n tamao de la muestra.
es la media de la muestra.
s desviacin tpica o estndar de la muestra.
es la confianza del intervalo.
t(n-1; ) es el percentil de la distribucin de la t de
student con n-1 grados de libertad y una probabilidad
.
Es posible expresar grficamente a un intervalo de
confianza mediante el siguiente esquema:
Valores usuales para la confianza del
intervalo.

90 %

95 %

99 %
Ejemplo numrico para el clculo de
un intervalo de confianza para la
media.
Supongamos que estamos en presencia de una muestra
que ha sido medida en los resultados de la carrera de 50
m. con las siguientes caractersticas.

Tamao de muestra n=100
Media muestral =12 seg.

Desviacin tpica o estndar muestral s=1 seg.
Se desea realizar una estimacin de la media de la
poblacin de donde proviene la muestra. Para ello
procederemos a calcular los intervalos de confianza al 90
%, 95 % y 99 %, de acuerdo a los siguientes pasos:

Obtencin de los percentiles de la distribucin de la t
de studen



90 % 1.64
95 % 1.96
99 % 2.58


Sustituyendo en:

Se tendr que:

Intervalo de confianza al 90 %

Observe que es posible tambin dar como respuesta
efectuando la suma y resta indicada: 12-0,164=11,836 y
12+0,164=12,164
(11,836;12,164)
De esta manera se est mostrando el mnimo y el mximo
del intervalo.
Observe que la longitud del intervalo estar dada por la
diferencia entre el mximo y el mnimo de ah que se
tenga que:
Longitud del intervalo 12,164-11,836=0,328

Intervalo de confianza al 95%
Anlogamente se tendr:

(11,804;12,196)
Longitud del intervalo 12,164-11,836=0,392

Intervalo de confianza al 99%

(11,742;12,258)
Longitud del intervalo 12,258-11,742=0,516
Variaciones que se producen en la
longitud del intervalo debido a
cambios en la confianza, dispersin
y tamao de muestra.
Si se mantienen constantes los restantes elementos
ocurre que:

Si la confianza aumenta (disminuye) la longitud del
intervalo aumenta (disminuye).

Si la dispersin aumenta (disminuye) la longitud del
intervalo aumenta (disminuye).

Si el tamao de muestra aumenta (disminuye) la
longitud del intervalo disminuye (aumenta).
Interpretacin de un intervalo de
confianza.
Partiendo del ejemplo numrico anterior, supongamos
que un especialista expone que con los datos
considerados ha obtenido un intervalo de confianza al 95
% para la media de la carrera de 50 m que es:
(11,804;12,196)
Y un participante le pregunta que le explique qu
significa el resultado que ha obtenido.
Una respuesta corta a la interrogante sera: que si de la
poblacin donde se ha obtenido esta muestra, se
obtienen varias muestras con el mismo tamao, ocurrir
que como promedio en el 95 % de ellas, la media de la
poblacin se encuentre entre los lmites establecidos, de
ah que tengamos una confianza de un 95 % de que la
media poblacional se encuentre entre estos valores.

Dcima de Kolmogorov-Smirnov
(Lilliefors)
La prueba de Lilliefors es una modificacin de la prueba de
Kolmogorov-Smirnov que contrasta la normalidad cuando las
medias y las varianzas no son conocidas, sino que deben ser
estimadas a partir de los datos.
En la dcima de Koomogorov-Smirnov la media y la desviacin
estndar con que se trabaja, con el estadgrafo D son conocidas a
priori y no estimadas de los datos. Sin embargo usualmente
estos parmetros son obtenidos en la muestra con que se est
trabajando. Este cambio origina que la obtencin del estadgrafo
D involucre a hiptesis condicionales muy complejas, en cuya
interpretacin est involucrada la pregunta: cmo obtener
verosmilmente un estadgrafo D de esta magnitud o mayor que
acte sobre la media aritmtica y la desviacin estndar obtenida
a partir de los datos?
Esta dcima no presenta la potencia de la de Shapiro-Wilks, sin
embargo es utilizada cuando el tamao de muestra es mayor que
50. Sin embargo Royston, J. P. (1982), introdujo una extensin
de la dcima hasta 2000 casos, que es utilizada por algunos
paquetes.
En el caso del paquete computacional SPSS, automticamente
adopta una u otra en dependencia al tamao de la muestra. En
otros paquetes se brindan las dos opciones para elegir la que se
ajuste ms a las necesidades de la base de datos.
Las caractersticas de la Dcima de Kolmogorov-Smirnov se
muestra a continuacin.
Dcima de Kolmogorov-Smirnov.
Premisas
La nica premisa que se necesita es que las mediciones se
encuentren al menos en una escala de intervalo. Se necesita que
la medicin considerada sea bsicamente continua. Adems
dicha prueba es aplicable cualquiera sea el tamao de la
muestra.
Potencia-Eficiencia
La prueba de una muestra de K-S puede en todos los casos en
que se aplique ser ms poderosa que su prueba alternativa, la
prueba de
2
( ji-cuadrado) Siegel Diseo experimental no
paramtrico.
Caractersticas de la dcima
La prueba de K-S de una muestra es una dcima de bondad de
ajuste. Esto es, se interesa en el grado de acuerdo entre la
distribucin de un conjunto de valores de la muestra y alguna
distribucin terica especfica. Determina si razonablemente
puede pensarse que las mediciones mustrales provengan de una
poblacin que tenga esa distribucin terica. En la prueba se
compara la distribucin de frecuencia acumulativa de la
distribucin terica con la distribucin de frecuencia
acumulativa observada. Se determina el punto en el que estas
dos distribuciones muestran la mayor divergencia. .
Hiptesis
Ho: La distribucin observada se ajusta a la distribucin terica.
En smbolos: F(x) = F
t
(x) para todo x.
H
1
: La distribucin observada no se ajusta a la distribucin
terica.
En smbolos: F(x) F
t
(x) para algn x
F(x): es la distribucin observada
F
t
(x): es la distribucin terica. Esta puede ser por ejemplo la
funcin normal con cierta media y varianzas conocidas.
Estadgrafo y distribucin muestral

S
n
(x): es la funcin de distribucin emprica.
Ejemplo
Sea la siguiente base de datos:
3 7 11 12 13 14 15 16 17 17 18 18 18 19 19 19 20 20 21 21 21
22 22 23 23 24 24 24
25 25 25 26 26 26 26 27 27 27 28 28 28 29 29 29 29 30 30 30
30 30 30 30 30 30 30 31
31 31 31 32 32 33 33 33 33 33 34 34 34 35 35 35 36 36 36 37
37 38 38 39 39 39 40 40 41
41 41 42 42 42 43 43 44 45 46 47 48 49 53 57
Las hiptesis a contrastar son las siguientes:
Ho: Los datos estn distribuidos normalmente
H
1
: Los datos no estn distribuidos normalmente.

Salidas de la dcima

Prueba de Kolmogorov-Smirnov para una muestra
DATOS
N 100
Parmetros
normales
Media 30.00

Desviacin
tpica
10.05
Diferencias
ms
extremas
Absoluta .050
Positiva .050
Negativa -.050
Z de
Kolmogorov-
Smirnov
.504
Sig. asintt.
(bilateral)
.962
a La distribucin de contraste es la Normal.
b Se han calculado a partir de los datos.


Conclusiones:
No se rechaza a Ho, por tanto la distribucin de los datos es
normal.
A continuacin se muestran los resultados para la modificacin
de Lillienfors.
Pruebas de normalidad de Kolmogorov-Smirnov-Lillienfors.

Kolmogorov-
Smirnov

Estadstico gl Sig.
DATOS .050 100 .200
* Este es un lmite inferior de la significacin verdadera.
a Correccin de la significacin de Lilliefors
Arnaldo Herrera.
Histograma.
A continuacin se muestra el histograma correspondiente, donde
se muestra lo cercano a la normalidad de los datos.


Media aritmtica.

Definicin de media aritmtica.

Algunas ventajas de la media aritmtica.

Algunas desventajas de la media aritmtica.

Interpretacin geomtrica de la media
aritmtica.

Notacin de la media aritmtica muestral y la
media aritmtica poblacional.

Preguntas.

Definicin de media aritmtica.
Sean x
1
, x
2
, ...., x
n
el conjunto de los resultados de una medicin
en una muestra de tamao n. Se define como media aritmtica
muestral y se designa por al cociente entre la suma de los
resultados de las mediciones y el tamao de la muestra.
En smbolos:

Dado que el numerador puede ser expresado mediante una
sumatoria, en forma compacta quedar expresada la media
aritmtica de una muestra como:



Ejemplo 1
Sean 8,4seg 9,1seg 7,2seg 6,8seg 8,7seg y 7,8seg; los
resultados obtenidos en la carrera de 25m. planos de 6 sujetos.
Hallar su media aritmtica.
Solucin:
Se tendr que:

Respuesta la media aritmtica es 6,3 seg.
Ejemplo 2.
Sean 5, 6 ,7 y 30 los abdominales realizados por 4 nios. A)
Hallar la media aritmtica. B) Cree usted que el promedio
obtenido sea representativo de la muestra.
Solucin inciso A:


Respuesta la media aritmtica es de 12 abdominales.

Solucin inciso B:
Evidentemente no existe representatividad en este promedio. En
efecto el promedio de 12 abdominales en el grupo es bastante
superior en los tres primeros resultados de la medicin y
notablemente inferior en el ltimo resultado. De ah que se
concluya que la media aritmtica no es un buen promedio a
utilizar cuando exista mucha dispersin en los resultados de la
medicin.
De la definicin y los ejemplos puede inferirse las siguientes
ventajas y desventajas de la media aritmtica.
Algunas ventajas de la media
aritmtica.
1. Utiliza toda la informacin disponible de todos y
cada uno de los resultados de la medicin
realizada.
2. Independientemente de cual sea el conjunto de
los resultados de las mediciones realizadas
siempre va a existir la media aritmtica y esta
ser nica.
3. Si se tiene una medicin donde es posible realizar
cualquier estadgrafo, la media aritmtica ser el
estadgrafo que presente una menor variabilidad.
Algunas desventajas de la media
aritmtica.
1. Hablando rigurosamente, slo debe ser utilizada
cuando la escala de medicin sea mtrica (escala
de intervalo o escala de proporcin).
2. Su magnitud se afecta si existen valores extremos
( o muy chiquitos o muy grandes). Segn se
muestra en el ejemplo 2.
Sin embargo, podemos decir que esta deficiencia no es
conclusiva, si se suprimen los valores extremos.
Resumiendo podemos decir que las considerables ventajas de la
media aritmtica ante los otros promedios, hacen que sea el
estadgrafo de tendencia central ms utilizado (siempre que sea
posible), e incluso hasta ha sido capaz de usurpar para s el
vocablo promedio. En efecto en el habla comn (sobre todo en
aquellas personas con poca cultura en el anlisis de datos) decir
promedio es sinnimo de media aritmtica.
Interpretacin geomtrica de la
media aritmtica.
Geomtricamente la media de una distribucin de
frecuencias es el centro de gravedad.
Para ejemplificar lo anterior, supngase que la
distribucin de frecuencia de la figura es la
representacin de una lmina de cualquier tipo de
material. El punto (denotado por un rombo), en donde se
balancea esta lmina es precisamente la media
aritmtica.

Notacin de la media aritmtica
muestral y la media aritmtica
poblacional.
Como hemos visto anteriormente, la media aritmtica de
una muestra se designa mediante una letra latina
minscula afectada por una barra superior. Debido a que
la letra con que se designa a los resultados de la
medicin es la x (minscula), comnmente es designada
su media muestral como .
En el caso de que se quiera hacer referencia a la media
aritmtica de una poblacin, se acostumbra a designarla
por la letra griega (que se lee miu).
Preguntas.
1. Cmo est definida la media aritmtica de un
conjunto de resultados de mediciones?
2. Cules son algunas de las ventajas, siempre que
el resultado de las mediciones lo permitan, de la
media artimtica de un conjunto dado?
3. Si se tiene un conjunto de resultados de
mediciones y se desea obtener la media aritmtica
del mismo, en cul escala de medicin debern
encontrarse estos resultados?
4. Si se tiene en una base de datos una medicin,
cuyos resultados son o muy grandes, o muy
pequeos, o ambos inclusive:
1. Ser conveniente la utilizacin de la media
aritmtica?
2. Qu procedimiento podra realizar usted
con los resultados de estas mediciones para
poder aplicar la media aritmtica?
5. Usted est presenciando la exposicin de un
trabajo investigativo y el ponente se refiere a que
"ha obtenido el promedio de las mediciones
realizadas".
1. De qu promedio usted sospecha que est
hablando el ponente?
2. Cul de las dos expresiones debi haber
sido la ms correcta. Justifique su
respuesta.
1. Se obtuvo el promedio?
2. Se obtuvo un promedio?
6. Cul es la interpretacin geomtrica de la media
aritmtica?
7. Cul es la notacin con que se designa a la media
aritmtica
1. De una muestra.
2. De una poblacin


Mediana.

Definicin de mediana.

Interpretacin geomtrica de la mediana.

Preguntas.

Definicin de mediana.
Sean x
1
, x
2
, ...., x
n
el conjunto de los resultados de una
medicin en una muestra de tamao n. Se define como
mediana de una muestra y lo denotaremos por m
e
, a
aquel valor que no es superado ni supera a ms de la
mitad de los resultados de la medicin.
Ejemplo 1.
Sea el nmero de abdominales realizados por 7 sujetos
los siguientes:
5abd, 4abd, 8abd, 3abd, 7abd, 2abd, 9abd,
Si se ordenaran los datos en forma ascendente se tendr:
2abd, 3abd, 4abd, 5abd, 7abd, 8abd, 9abd.
Despus de hecho este ordenamiento observamos que el
resultado de la medicin en el sujeto que ha realizado 5
abdominales no es superada ni supera a ms de la mitad
de los resultados contenidos en la muestra. De ah que
podamos plantear que el valor mediano o mediana de la
muestra es de 5 abdominales. De ah que m
e
=5
abdominales.
Observe que la mediana tiene la misma unidad que los
datos primarios.
Si en el ejemplo anterior se analiza que al ser el tamao
de muestra un nmero impar, despus de ser realizado el
ordenamiento (el que puede hacerse en forma
ascendente o en forma descendente), quedar un
elemento central, el que ser el valor mediano.
Ejemplo 2.
Consideremos ahora el siguiente conjunto de resultados,
donde el tamao de muestra es un nmero par.
Sean los resultados de velocidad medidos en segundo de
una muestra cuyo tamao es 6:
8,4 29,1 7,2 7,1 8,7 y 7,8
Al realizar el ordenamiento de los resultados se tiene:
7,1 7,2 7,8 8,4 8,7 29,1
Observe que en este caso, en vez de existir un slo valor
central, se disponen de dos.
Si nos remitimos a la definicin nos podemos percatar de
que existen infinitos valores que pueden ser tomados
como valor mediano. En efecto cualquier nmero mayor
o igual que 7,8 o menor o igual que 8,4, satisface la
definicin de valor mediano. De ah que en aras de
obtener un nico valor se acostumbre a tomar la media
aritmtica entre los dos valores centrales. De ah que el
valor mediano m
e
sea:

Otra cuestin que debemos observar es que el resultado
extremo de 29,1seg no ha afectado al promedio. De ah
que una de las ventajas que presente la mediana con
respecto a la media aritmtica es la de dar una promedio
ms representativo en el caso de que existan en la
muestra valores extremos.
Resumen.
A manera de resumen podemos decir que:

Para realizar el clculo manual de la mediana se
procede de acuerdo a los siguientes pasos:
1. Realizar un ordenamiento de los resultados de las
mediciones. Es indiferente si este se hace en
forma descendente o en forma ascendente.
2. El valor mediano (mediana), ser:

Si el tamao de muestra es impar, el valor central.

Si el tamao de muestra es par, la media aritmtica
entre los dos valores centrales.


La mediana, a diferencia de la media aritmtica no se
ve afectada en el caso de que existan algunos valores
extremos.


Con la mediana es posible, en la prctica cotidiana,
obtener en forma muy rpida un promedio de la
muestra. Supngase que es de urgencia conocer un
promedio de la estatura, de los pesos, o de los
resultados en una prueba de un grupo de alumnos. Lo
nico que tendramos que hacer es orientarlos a
alinearse en orden. Bastar tomar el resultado de la
medicin, si el tamao de la muestra es impar, o la
media entre los dos resultados centrales si ste es
impar, para obtener un promedio.

Interpretacin geomtrica de la
mediana.
Geomtricamente la mediana divide a un histograma en
dos regiones iguales, de ah que el valor mediano est
asociado con el percentil 50. En efecto si se tiene un
histograma de frecuencias acumuladas relativas,
(expresada en por cientos) y trazamos una paralela al eje
de abscisas que pase por el punto cuya ordenada
corresponde al 50%, el punto correspondiente al eje x
ser el valor mediano. Lo anterior se muestra en el
siguiente grfico.

Preguntas.
1. Cmo usted definira valor mediano de un
conjunto de resultados de mediciones?
2. Tericamente, pueden existir infinitos valores
medianos?. Argumente su respuesta.
1. En la prctica de estos infinitos valores
medianos cul es el que se toma.
3. Por qu la mediana, a diferencia de la media
aritmtica, se afecta poco, o no es afectada por
resultados de mediciones extremas?
4. Suponga que usted est exponiendo un trabajo y
uno de los asistentes le solicita que le explique de
qu manera ha sido obtenido el valor mediano en
los resultados de una prueba en particular, cmo
usted le explicara el proceso teniendo en cuenta
que el tamao de la muestra sea:
1. Impar.
2. Par.
5. Cul es la interpretacin geomtrica de la
mediana?
6. Suponga que usted est asistiendo junto a otra
persona en la exposicin de un trabajo
investigativo y el ponente hace referencia primero
al valor mediano y posteriormente denomina a
este mismo valor mediano como el del percentil
50. Su acompaante le pregunta; por fin de lo
que est hablando es de la mediana o del
percentil 50? Qu le respondera usted?

Medicin

Introduccin

Algunos enfoques en el concepto de medicin.

Definicin de medicin.

Instrumento de medicin.

Preguntas.

Introduccin.
Como se sabe las mediciones juegan un papel de extrema
importancia en la Cultura Fsica, ya que ellas son la
informacin de partida en la solucin de la mayora de
los problemas planteados en ella. Pero dado que en la
propia Cultura Fsica se encuentra la Educacin Fsica, el
Deporte, la Recreacin y la Rehabilitacin, que son de
por s ramas apartes de desarrollo, en ellas se producen
una gran diversidad en el tipo de mediciones que se
realizan, producindose diferentes tendencias en la
consideracin del concepto de medicin que hacen que
sea muy difcil trabajar en investigaciones de carcter
multidisciplinario e incluso en aquellas donde solamente
se manifieste alguna de ellas. Estas insuficiencias en el
concepto de medicin pueden dar lugar a deficiencias en
el trabajo prctico y sobre todo en el procesamiento y
anlisis de la informacin obtenida.
Algunos enfoques en el concepto de
medicin.
Uno de los enfoques que se ha observado en el desarrollo de
algunos trabajos es el considerar solamente como medicin a
aquellas que se encuentren incluidas en un sistema cuya mtrica
puede responder a la pregunta:
Cuntas veces es ms grande una medicin que otra?
Con este enfoque algunos autores dicotomizan a los datos y lo
que es ms importante al tipo de procesamiento, en
cuantitativos, si los datos obedecen a una respuesta afirmativa
de la pregunta anterior y cualitativos si la niegan. Esta particin
origina un enfoque metodolgico que no permite la adopcin de
elementos comunes en ambas tendencias, lo que no es
necesariamente cierto, conduciendo a enfoques operacionales
en el tratamiento de la informacin casi siempre miope y
algunas veces inefectivo hacia la solucin de los objetivos
planteados.
Otro enfoque ms amplio que el anterior considera como
medicin a aquellas cuyo sistema responda como mnimo a un
ordenamiento estricto. Esta direccin presenta el inconveniente
de no considerar como medicin a aquellas que no cumplan el
requisito establecido.
Un enfoque ms abarcador es el sealado por Zatsiorsky que
considera a la medicin en un sentido ms amplio, definindola
como la correspondencia que se establece entre los
fenmenos estudiados por una parte y su expresin
numrica por otra1
[1]
. Esta definicin, representa, a nuestro
juicio, un avance respecto a las anteriores, pero en ella se
advierten los siguientes inconvenientes:
1. Posibilita solo establecer la correspondencia con
nmeros.
Este aspecto limita considerablemente el trabajo ya que en
muchos casos es cmodo y conveniente el establecer esta
correspondencia con letras e incluso smbolos. Para ilustrar lo
anterior, supongamos que se est trabajando con una base donde
se analizan las provincias de residencia de un grupo de sujetos.
Si ha estas solo se las designa mediante nmeros, habra que
estar haciendo referencias (utilizando la memoria o la escritura),
con respecto a qu nmero le corresponde una determinada
provincia.
En realidad, en su aspecto prctico, el enfoque de hacer
corresponder a un nmero el resultado de una medicin
obedeca a la limitante establecida por los primeros paquetes
estadsticos computacionales, en donde muchos de ellos no
permitan la utilizacin de caracteres alfanumricos. Sin
embargo, en la actualidad, esa limitante no existe. De ah que en
cualquier paquete estadstico sea posible trabajar, con letras, con
nmeros, con smbolos e incluso con combinaciones de ellos.
2. Ofrece una visin falsa a aquellas personas que
comienzan con el procesamiento de bases de datos

1
[1]
Zatsiorsky V. M. Metrologa Deportiva. p. 14
en operar con estos como si respondieran a
mediciones con una mtrica homloga a las
magnitudes fsicas.
En efecto, todos sabemos que 1+1=2 y que 7/4= 1.75, pero no
necesariamente estos resultados pueden corresponder al hecho
que se est midiendo y las inferencias que se realicen al no estar
sustentadas por la realidad, originan resultados muy alejados de
sta.
3. No considera a la medicin como un proceso.
En efecto a nuestro juicio la medicin es el resultado de un
proceso donde en ocasiones interesa ms de qu forma se ha
operado el proceso que el propio resultado del mismo.
Es por ello que proponemos el considerar como definicin de
medicin la siguiente:
Definicin de medicin.
Medicin es cualquier proceso mediante el cual es asignado un
numeral a un nivel, o a un estado de alguna cualidad de un
elemento de una poblacin objeto de estudio, o a una unidad
experimental.
En esta definicin se hace necesario distinguir los
siguientes aspectos:

Cualidad
En el contexto de la definicin entendemos por cualidad
a cada una de las circunstancias o caractersticas que
distinguen a las personas o a las cosas. Dada la
generalidad de la definicin de cualidad de esta manera,
quedan englobadas en la definicin cualquier tipo de
caracterstica que se considere objeto de estudio.

Numeral
Entendemos por numeral a cualquier combinacin de
caracteres alfanumricos (nmeros, letras e incluso
smbolos). Con esto se est logrando que el resultado de
la medicin no tenga que ser obligatoriamente expresado
mediante un nmero, sino que pueda ser utilizados,
nmeros, letras, e incluso smbolos, solos o combinados
entre s.
Con esta definicin se logra:

Situar al concepto de medicin en el lugar
que le corresponde.
Esto es mediante un proceso, todo lo general posible, en
donde pueden admitirse tanto los resultados de procesos
subjetivos y objetivos, y en donde su resultado es la
propia medicin

Liberar a la correspondencia que se establece
de las restricciones que surgen de tener que
asociar a sta con un nmero.
En efecto, el hacer corresponder a la unidad
experimental o elemento de la poblacin objeto de
estudio un numeral, le imprime una mayor fuerza tanto
en el campo conceptual como en el metodolgico,
debido a que:

Obliga al especialista a analizar las
caractersticas, en cuanto al nivel de
medicin, que est representando este
numeral de acuerdo a la medicin planteada.
En efecto, uno de los errores ms frecuentes es el de
establecer operaciones, principalmente promedios, a
mediciones que no tienen el nivel necesario para que
este se realice, por el motivo de que al hacerse la
correspondencia entre nmeros se piense que en ellos
son susceptibles de ser planteadas libremente todas las
operaciones que son inherentes a ellos.

Posibilita el realizar una mejor descripcin del
objeto de estudio principalmente en las
categorizaciones.
Las ventajas que tiene este aspecto son innegables, dada
la comodidad que permite el trabajo con caracteres
alfanumricos.
A continuacin presentamos cinco ejemplos donde se
muestra la compatibilidad de la definicin en aspectos
que aparentemente son dismiles.
Ejemplo No.1
En el resultado del salto de longitud sin carrera de impulso de un
estudiante en un grupo escolar, se estar en presencia de un
proceso que compara la magnitud que se desea medir con otra
homognea que se toma como unidad de medida, utilizando
como instrumento de medicin, por ejemplo, una cinta mtrica.
Al resultado de este proceso se le ha asignado el numeral,
digamos de 1,55, expresada sta en metros.
Ejemplo No. 2.
Cuando estamos sometiendo a una persona a un cuestionario con
el fin de evaluar alguna caracterstica necesaria al objeto de
estudio, vemos que en la evaluacin obtenida ha sido realizado
un proceso de medicin, mediante el cual asignamos un numeral
de acuerdo a una regla dada por las condiciones evaluativas del
cuestionario y que son inherentes a l. El resultado de este
numeral pudo haber sido: 5, EXCELENTE, BIEN, etc, segn
sea el caso.
Ejemplo No. 3.
A un alumno se le solicita que evale el desempeo de un
docente durante la clase, de acuerdo a una gua de observacin.
En dependencia de la correspondencia que se establece con los
distintos aspectos, el alumno le asigna al docente un numeral
que est en correspondencia con la actividad desarrollada.
Ejemplo No. 4.
Un juez est analizando el desempeo de un atleta, al que puede
ubicarlo en una categora determinada, o asignarle una cierta
puntuacin, o establecer un orden de primaca en cuanto a la
cualidad que est observando respecto a otros atletas. El
resultado que se observa lo hace corresponder con un numeral
que est en consonancia con l de acuerdo a la medicin que
pretende obtener.
Ejemplo No. 5.
En una base de datos se est analizando el sexo de las personas
que conforman la muestra. Para ello una persona, con una
metodologa determinada, le asigna un numeral que refleje la
cualidad del sujeto.

Instrumento de medicin.
En los ejemplos anteriores, bastante dismiles, se han presentado
resultados de mediciones. Ahora bien, es de todos conocido que
cuando se est realizando una medicin, se hacer necesario
poder contar con un instrumento de medicin.
En efecto, en los ejemplos anteriores ha ocurrido que en el
primer ejemplo ha existido un instrumento de medicin, la cinta
mtrica.
En el segundo ejemplo, est claro que el instrumento de
medicin es el cuestionario que recibe el sujeto y mediante el
mismo podemos establecer una medicin de la cualidad que
estamos analizando.
En el tercer ejemplo el instrumento de medicin, en que se
apoya el alumno para realizar la medicin, recibe el nombre de
gua de observacin.
En el cuarto ejemplo, ocurre que el instrumento de medicin es
el propio juez.
En el quinto caso el instrumento de medicin es el sujeto que
est determinando el sexo de cada uno de los componentes de la
muestra.
De los ejemplos anteriores se colige que se hace necesario
establecer una definicin de instrumento de medicin que sea lo
suficientemente general, como para que sean englobados todos
estos aspectos, y que responda al concepto de medicin
planteado. Es por tanto que establecemos la siguiente definicin.
Instrumento de medicin es todo recurso
que nos permita asignar un numeral a un
nivel o estado de una cualidad poseda por
un elemento o unidad experimental de la
poblacin objeto de estudio.
Creemos que esta definicin es completamente
compatible a todas las situaciones planteadas y en
general a todas donde se obtenga una medicin, de
acuerdo a la nueva definicin.
Por ltimo se hace necesario plantear que bajo el concepto
establecido de medicin y de instrumento de medicin, le son
susceptibles a ser aplicados en ellas aspectos inherentes al
concepto tradicional de medicin, entre ellos se tienen:
La confiabilidad de la medicin.
La validez de la medicin.
La calibracin de errores.
Ahora bien, aunque en el contexto terico planteado se han
unificado aspectos dismiles en cuanto a las mediciones, se hace
necesario establecer diferencias entre ellas. Un enfoque correcto
en el anlisis de estas diferencias deber ser encauzado en base a
la clasificacin de stas de acuerdo a las escalas de medicin de
Stevens y a su carcter continuo o discreto. Concretamente, en
las pginas que aparecen sealadas en los botones de la
izquierda ser analizada la clasificacin de las mediciones de
acuerdo a las escalas de Stevens.
Preguntas:
1. Por qu resulta importante en las investigaciones,
donde intervengan varios especialistas llegar a un
acuerdo sobre el concepto de medicin con que se
va a trabajar?
2. Cules desventajas usted considera que tiene el
considerar a una medicin nicamente cuando se
puede relacionar con ella un nmero?
3. Cul es la definicin de medicin que aparece en
el material?
1. Explique con sus propias palabras el
significado de numeral.
1. Ponga algunos ejemplos de
numerales asignados a su actividad
profesional.
2. Tienen lugar, bajo el concepto de medicin
establecido, las mediciones subjetiva.
1. Ponga ejemplos de este tipo de
medicin.
3. Qu se entiende por instrumento de
medicin?
1. Cite ejemplos de instrumentos de
medicin y mediciones realizadas con
los mismos en su actividad
profesional.
MEDICIONES MTRICAS

Introduccin.

Caractersticas comnes de las mediciones
mtricas.

Diferencias existentes entre las mediciones en
la escala de intervalo y la de proporcin.

Transformaciones permisibles en los dos tipos
de escalas de mediciones mtricas.

Caractersticas que rigen las mediciones en la
escala de intervalos y en la de proporcin.

Estadgrafos que pueden ser utilizados en las
dos escalas.

Preguntas.
Introduccin.
A continuacin pasaremos a analizar los otros dos tipos de
mediciones de acuerdo a la clasificacin hecha por Stevens.
Estas mediciones son:

Mediciones en la escala de intervalos.

Mediciones en la escala de razones o proporciones.
A diferencia de lo que se ha hecho en las dos anteriores, donde
se analizaba por separado cada una de ellas, se proceder en este
caso a incluirlas a las dos mediante un slo rubro, esto es el de
mediciones mtricas. El motivo por el que se ha hecho esta
fusin, estriba que en el procesamiento de bases de datos a
excepcin de dos estadgrafos que son aplicables solamente a las
escalas de proporciones (el coeficiente de variacin y la media
geomtrica), todos los dems pueden ser utilizados
indistintamente entre una u otra. Incluso en la prctica, cuando
se realiza el anlisis previo de una base de datos es usual fundir
estos dos tipos de medicin en una sola y particionar a las
mediciones de acuerdo a las escalas de Stevens en:

Mediciones nominales.

Mediciones ordinales.

Mediciones mtricas.
A continuacin veremos las caractersticas que se advierten en
las mediciones mtricas.
Caractersticas comunes de las
mediciones mtricas.
Las mediciones mtricas se presenta cuando no solamente
somos capaces de decidir entre los resultados de dos mediciones
diferentes, si la cualidad que se est midiendo es disfrutada en
una mayor o menor medida, sino que adems es posible
establecer en cuntas veces ms se goza de esta cualidad.
En el contexto de las escalas de medicin de Stevens, se hace
susceptible de particionar a las mediciones mtricas en dos tipos
de escalas.

Mediciones en la escala de intervalos.

Mediciones en la escala de razones o proporciones.
Una caracterstica distintiva que tienen las mediciones mtricas,
independientemente del tipo de escala en que ellas se encuentren
es que siempre estn asociadas a ellas una unidad de medida.
Diferencias existentes entre las
mediciones en la escala de intervalo
y la de proporcin.
La diferencia existente entre estos dos tipos de escala radica en
considerar al cero de la medicin (ausencia de la cualidad),
como relativa o como absoluta. De forma tal que si:

El cero de la medicin es relativo estaremos en
presencia de una medicin en la escala de intervalo.

El cero de la medicin es absoluto estaremos en
presencia de una medicin en la escala de razones o
proporciones.
Analicemos para ver estas diferencias los siguientes ejemplos
que presentan cada uno de ellos los dos tipos de escala de
mediciones.
Ejemplo 1.
Se est midiendo el peso de cuerpos A y B en kilogramos. Sean
los pesos respectivos de ellos: A=20 kg y B=10 kg.
Si nos preguntramos cul sera la proporcin entre los pesos B
y A se tendra:
Si en vez de expresar las
mediciones en kilogramos las hubiramos expresado en
gramos, libras, etc. Se observara que la proporcin se
sigue manteniendo.
Ejemplo 2.
Se est midiendo la temperatura en grados centgrados, en dos
cuerpos A y B. Sea la temperatura de A=10
o
y de B=20
o
. La
proporcin existente entre las dos mediciones es:
Si en vez de realizar las
mediciones en grados centgrados las hubiramos
realizado en grados Fahrenheit. Se tendra que la
conversin sera A=50
o
y B=68
o
. Evidentemente el
cociente de la proporcin no se mantiene. En efecto:
Ahora bien en vez de tomar dos valores en
las mediciones (A y B) se hubieran tomado tres (A, B y C), se
tendra .
Medicin en
grados
Cuerpo A Cuerpo B Cuerpo C
Centgrados 10 20 40
Fahrenheit 50 68 104
Consideremos ahora los siguientes intervalos: AB, BC y CD. Y
obtengamos las diferencias existentes entre ellos.
Se tendr entonces que las diferencias entre estos intervalos
expresados en:
Grados centgrados es:
AB=20
o
-10
o
=10
o
BC=40
o
-20
o
=20
o

De donde la proporcin existente entre estos dos intervalos
cuando se realiza la medicin en grados centgrados es
Si se realizara el mismo proceso
pero midindolos en grados Fahrenheit se tendra:
AB=68
o
-50
o
=18
o
BC=104
o
-68
o
=36
o

De donde la proporcin existente entre estos dos intervalos
cuando se realiza la medicin en grados centgrados es:
Observamos entonces que si
bien las proporciones entre los puntos no se cumplen, s
se cumplen las proporciones entre intervalos.
El motivo por el que en el caso del peso se cumple esta
proporcin y en el caso de la temperatura (expresada en
grados centgrados y grados Fahrenheit) no, es debido al
hecho de que:

En el caso del peso a una medida de cero kg.,
corresponde la ausencia de peso de un cuerpo.

En el caso de la temperatura en grados centgrados y
grados Fahrenheit, el cero es convencional. Por
ejemplo la temperatura de fusin en grados
centgrados es de 0
o
y sin embargo esta misma
temperatura medida en grados Fahrenheit es de 32
o
.
Otro tanto ocurre con la temperatura de ebullicin.
Transformaciones permisibles en los
dos tipos de escalas de mediciones
mtricas.
La existencia de una unidad de medicin y el hecho de que la
medicin cero sea arbitraria (escala de intervalos), o represente
realmente la ausencia de la cualidad que se mide (escala de
proporcin), ocasiona que las estructuras de cada una de las
escalas no vare si se realizan las siguientes transformaciones:
Escala de intervalos.
y=ax+b con a>0
Evidentemente el efecto de esta transformacin es cambiar el
origen b unidades y multiplicar la unidad de medida por a. Y se
observa que en los ejemplos que se han realizado para realizar el
cambio de grados centgrados a Fahrenheit, la transformacin
est dada por:
y=1,8x+32
Donde: y: temperatura medida en grados Fahrenheit y X:
temperatura medida en grados centgrados.
Escala de proporciones.
y=ax con a>0
Obsrvese que la nica diferencia de esta transformacin con su
similar en la escala de intervalos es que el valor de b es cero.
De ah que se tenga que para transformar una medicin de
kilogramos a gramos a=1000, para llevar de kilogramos a libras
a 2,2.
Caractersticas que rigen las
mediciones en la escala de
intervalos y en la de proporcin.
Estamos en presencia de una escala de intervalos o en una de
proporcin si se cumple:
ESCALA DE INTERVALOS ESCALA DE PROPORCIN
Relacin de equivalencia. Relacin de equivalencia
Relacin de orden > Relacin de orden >
Proporcin conocida de dos
intervalos.
Proporcin conocida de dos
intervalos.
Proporcin conocida de dos
valores de la escala
Estadgrafos que pueden ser
utilizados en las dos escalas.
La similitud entre estos dos tipos de escala hacen que tanto en
una como en otra puedan ser aplicados todos los estadgrafos de
posicin, dispersin, simetra y apuntamiento, exceptuando la
media geomtrica y el coeficiente de variacin, los que solo son
posibles de ser aplicados en la escala de proporcin.
Preguntas.
1. Bajo el rubro mediciones mtricas, cules dos
tipos de escala de medicin segn Stevens, se
engloban en ella?
2. Cules son las tres categoras "prcticas" en que
se clasifican los resultados de las mediciones
cuando se analiza una base de datos?
3. Cul es la caracterstica distintiva "prctica", que
diferencia a los resultados de una medicin
mtrica de otras en la escala ordinal o en la escala
nominal o clasificatoria?
4. Cul es la diferencia fundamental existente entre
los resultados de una medicin en la escala de
intervalos y en la escala de proporcin?
5. Cul es el tipo de transformacin permisible en la
escala de:
1. intervalo?
2. proporcin?
6. a) Cules son las caractersticas que rigen las
mediciones en la escala de intervalos y en las de
proporcin? b) Cul es su diferencia?
7. Cules estadgrafos pueden ser utilizados en la
escala de proporcin?
8. De los estadgrafos anteriores, cules no deben
ser utilizados si se encuentran los resultados de las
mediciones en la escala de intervalos?


MODA

Definicin de moda.

La moda y su relacin con los histogramas.

Cambios en la ubicacin de la frecuencia
modal de una misma base cuando cambia el
nmero de clases a considerar.

Preguntas.

Definicin de moda.
Sean x
1
, x
2
, ...., x
n
el conjunto de los resultados de una
medicin en una muestra de tamao n. Se define como
moda y la designaremos por m
o
al resultado de la
medicin ms frecuente.
Como vemos en la definicin, al estar definida la moda
como el resultado ms frecuente, sta est asociada a
una distribucin de frecuencias de ah que la moda pueda
ser:

nica.
En efecto sen los resultados de las mediciones en la
prueba de abdominales:
18abd 20abd 20abd 5abd 13abd 4abd 22abd 1abd
Se tendr que la moda m
o
=20 abdominales, al ser este el
resultado ms frecuente.

Existir ms de una.
18abd 18abd 20abd 20abd 5abd 13abd 4abd 22abd 1abd
Se tendr que la moda m
o
=20abd; 18 abdominales, al ser
estos dos resultados los ms frecuentes.

Incluso no existir.
18abd 20abd 5abd 13abd 4abd 22abd 1abd
En efecto al no existir ningn resultado de medicin ms
frecuente, se tendr que: m
o
: no existe.
La moda y su relacin con los
histogramas.
Dado un histograma es muy sencillo poder referirse al
valor modal. Para hacerlo, solo tenemos que observar
donde se encuentra "el pico" de la curva.
Por ejemplo en el histograma que se muestra, se observa
que la moda se encuentra en el intervalo cuya marca de
clase es de 170 cm, dado que el rectngulo que presenta
mayor altura es aquel que contiene a la marca de clase
mencionada.

ATENCIN!
Es importante estar atentos ante una situacin donde se
presente dos o ms picos en el histograma, ya que esto
puede ser una indicacin de que existan dos o ms
grupos, con caractersticas distintas, confundidos en una
misma muestra. Esta situacin obliga a realizar una
estratificacin de la muestra analizada.
Por ejemplo en la siguiente base ha sido incluida
intencionalmente la presin diastlica de dos grupos
diferentes.

Observe la existencia de dos "picos", muy bien definidos
que indican la situacin anteriormente planteada.
Ahora bien, puede ocurrir que se tenga en una base dos
grupos con caractersticas diferentes en cuanto a los
resultados de la medicin realizada, y sin embargo
cuando se realice el histograma no se presenten dos
picos. De ah que nunca podamos olvidar que el
conocimiento de la medicin realizada y la experiencia
del investigador en el contexto de la muestra sea vital
para poder prever este tipo de anomalas, sin confiar en
que el histograma pueda reflejar una situacin que debi
ser analizada antes de realizar el procesamiento.
Lo anteriormente expresado se refuerza an ms con los
cambios producidos en un histograma, con una misma
muestra, si se realizan cambios en el nmero de
intervalos (clases) a ser considerados.
Cambios en la ubicacin de la
frecuencia modal de una misma base
cuando cambia el nmero de clases
a considerar.
A continuacin se presenta una base que muestra los
resultados alcanzados en el salto de longitud sin carrera
de impulso de un grupo de nios, expresados en
centmetros.
Resultados del salto Frecuencia Absoluta
44 1
46 3
47 1
48 1
49 2
50 1
51 1
53 1
56 4
57 1
58 2
59 2
60 1
61 4
63 3
64 2
66 1
68 1
69 2
70 3
72 3
73 1
74 1
75 1
77 1
78 1
80 1
88 2
89 1
91 1
Total 50
Observe que en esta distribucin aparecen dos valores
modales, los que aparecen marcados en rojo.
A continuacin y con la misma base, se proceder a
realizar histogramas, variando el nmero de intervalos y
por tanto el tamao de los mismos.
Considerando tres intervalos.

Como se puede observar en este histograma aparece bien
definida la clase modal, que se encuentra en un intervalo
con marca de clase igual a 67,5 cm.
Considerando cinco intervalos.

Observe que en este caso la clase modal aparece
confundida entre los intervalos de marcas de clase de
57,5 cm y 67,5 cm.
Considerando 10 intervalos

Aparecen dos picos en los histogramas.
Conclusin.
De la conclusin que arribamos de acuerdo a los cambios
en la clase modal relativo al nmero de intervalos
considerados en un histograma, se infiere la necesidad de
compatibilizar la informacin que este nos suministra
con la obtenida con el estadgrafo moda y la tabla de
distribucin de frecuencias de los resultados de la
medicin considerada.
Preguntas.
1. Cmo usted definira la moda de un conjunto de
resultados de mediciones?
2. Argumente (puede utilizar ejemplos), en los casos
en que la moda sea:
1. nica.
2. Ms de un valor modal.
3. No existir.
3. De qu manera podemos determinar en un
histograma la clase donde se encuentra la moda?

MEDICIN NOMINAL o CLASIFICATORIA

Introduccin.

Ejemplos.

Relacin de equivalencia.

Definicin de medicin nominal o
clasificatoria.

Promedios y medidas de dispersin apropiados
para las mediciones nominales.

Preguntas.
Introduccin.
En el presente material ser analizado el nivel de medicin ms
elemental, de acuerdo a las escalas de medicin de Stevens. En
el se ver que, independientemente de su simplicidad, es
susceptible realizar en l diversos procesamientos, en el campo
no paramtrico. Sin embargo independientemente de la escala de
medicin en que se encuentre la variable que va a ser analizada,
esta es susceptible de ser analizada mediante una clasificacin, e
incluso por motivos particulares de los numerales con que se
trabaje considerar a la medicin con su valor nominal. Todo lo
anterior hace que este tipo de medicin sea muy utilizada en el
campo de la Educacin Fsica, el Deporte, la Recreacin y la
Rehabilitacin. Comencemos entonces analizando algunos
ejemplos.
Ejemplos.
Ejemplo No. 1
Supongamos que en una muestra de una poblacin determinada
queremos categorizar a sus componentes en cuanto al sexo.
Podemos entonces decir que el primer sujeto pertenece al sexo
masculino, que el tercero pertenece al femenino, etc. Si
designamos mediante numerales a esta medicin podramos
hacer la asignacin de numerales de acuerdo a varios criterios.
Entre ellos se tendran por ejemplo:
Que el numeral fuera una palabra.
En efecto podemos asignarle a aquellas personas pertenecientes
al sexo femenino, por ejemplo, el numeral FEM y a las que
pertenecen al sexo masculino, por ejemplo, el numeral MAS. Es
evidente que entre estos dos numerales no existe ninguna
relacin de orden.
Si nos hubiramos encontrado en la base un grupo de sujetos
que responde al numeral MAS, podemos decir sin temor que
todos pertenecen al sexo masculino. De la misma manera si nos
encontramos a un sujeto con el numeral MAS y a otro con el
numeral FEM, podemos tambin decir sin temor que pertenecen
a sexos diferentes.
Que el numeral fuera un nmero.
En efecto hubiramos podido asignarle a un sujeto del sexo
masculino por 1, y al del femenino por 2 y aunque existe un
ordenamiento en la serie numrica sta no tiene. en el ejemplo
que se est analizando, ninguna relacin de orden. En efecto el
numeral 1 solo nos sirve para poder agrupar a todos los sujetos
en un mismo sexo, al igual que con el numeral 2. En ningn
momento en los numerales se ha establecido una relacin de
orden.
Ejemplo No. 2
Se est trabajando en una base de datos, donde una de las
variables refleja el deporte que ms le gustara practicar al
sujeto. Supongamos que los deportes escogidos hubieran sido:
Karate, Besbol, Pesas, Atletismo, Canotaje, Judo, Taek-wan-
do . Supongamos que deseamos asignarle como numeral, las tres
primeras letras del deporte que practica. Se tendran entonces los
siguientes numerales:
KAR, BEI, PES, ATL, CAN, JUD, TAE
Independientemente que podemos realizar un ordenamiento de
acuerdo al orden alfabtico de estos deportes, donde el primero
responde a ATL (Atletismo) y el ltimo es TAE (Taek-wan-do),
ese ordenamiento no responde a ningn criterio que lo respalde.
Cualquier sujeto que responde al numeral KAR ser este el
deporte que ms le gusta practicar y distintos de cualquier otro
que responda a un numeral diferente.
Del mismo modo pudiramos haber asignado en vez de una
combinacin de letras nmeros, as se tendra entonces que:
NUMERAL
DEPORTE
En letras En nmeros
Karate KAR 1
Beisbol BEI 2
Pesas PES 3
Atletismo ATL 4
Canotaje CAN 5
Judo JUD 6
Taek-wan-do TAE 7
Obsrvese que independientemente que existe un orden
entre los nmeros que han sido asignados, (el siete es el
ltimo, el 1 es el primero etc), estos no indican un orden
en cuanto a la relacin entre los deportes considerados.
Ejemplo No. 3
Supongamos que en una base de datos, aparece una variable que
expresa la nacionalidad del sujeto, o la provincia donde vive, o
el municipio donde reside, en estos casos tambin resulta que la
caracterstica que plantea la medicin no permite establecer una
relacin de orden entre los resultados de las mismas.
Los ejemplos anteriores tienen como caracterstica comn el de
poder permitirnos decidir en cuanto al estado de la cualidad que
se presenta (sexo, preferencia deportiva, nacionalidad, lugar de
residencia), en cuanto a la pertenencia a un grupo determinado
(masculino, karate, cubano, habanero), pero sin embargo nos
imposibilita el poder establecer ninguna otra relacin entre estos
estados.
Podemos establecer entonces una conclusin parcial diciendo:
La idea bsica en cuanto al tipo de
medicin de los ejemplos anteriores
consiste en que la asignacin de
numerales iguales, est dado solamente
por la equivalencia que gozan de acuerdo
a estas cualidades.
Dicho en otras palabras:
La asignacin mediante numerales, slo obedece al
criterio de distinguir solamente los que son iguales de
los que son diferentes.
Relacin de equivalencia.
Existe una relacin que permite mediante ella formalizar
a aquellas mediciones que se encuentran en el nivel
nominal o clasificatorio. Esta relacin es la relacin de
equivalencia que a continuacin presentamos:
Una relacin es de equivalencia si en ella se cumplen las
siguientes propiedades:
1. Reflexiva.
Para todo x se cumple que x=x.
2. Simtrica.
Si x=y entonces se cumple que y=x
3. Transitiva.
Si x=y y adems se cumple que y=z entonces x=z
Podemos entonces llegar a la siguiente definicin.


Definicin de medicin nominal o
clasificatoria.
Es aquella en la que solamente es posible plantear una
relacin de equivalencia.
La aplicacin de estas tres propiedades conforman la
estructura permisible para el trabajo prctico con este
tipo de escala.
Ejemplo 1.
Supongamos que se tiene una base donde se le ha asignado al
sexo masculino por M y al femenino por F, podemos sustituir, el
numeral M por el numeral 1, al numeral F por el numeral 2. O
realizar cualquier otro tipo de sustitucin de forma tal que esta
sea realizada en todas las categoras. Segn se muestra en las
siguientes tablas.
TABLA A
Sujeto Sexo
1 1
2 2
3 1
4 2
5 2
6 1
7 1
8 1
9 2
50 1

TABLA B
Sujeto Sexo
1 M
2 F
3 M
4 F
5 M
6 F
7 M
8 M
9 F
50 M
Ambas bases de datos representan la misma situacin
independientemente del cambio del numeral.
Ejemplo 2.
Reconsideremos el ejemplo donde aparecen siete
deportes considerados: Karate, Beisbol, Pesas, Atletismo,
Canotaje y Judo. Se consider denotar a los numerales
de la siguiente forma:

NUMERAL
DEPORTE
En letras En nmeros
Karate KAR 1
Beisbol BEI 2
Pesas PES 3
Atletismo ATL 4
Canotaje CAN 5
Judo JUD 6
Taek-wan-do TAE 7
Resulta enteramente posible en vez de asignarle a estos deportes
por nmeros consecutivos el hacerlo en la siguiente forma:
DEPORTE NUMERAL
Karate 10
Beisbol 23
Pesas 18
Atletismo 14
Canotaje 25
Judo 6
Taek-wan-do 71
Promedios y medidas de dispersin
apropiadas para las mediciones
nominales.
Promedios.
El nico promedio aplicable a este tipo de escala de
medicin es la moda.
Medidas de dispersin.
No existe medida de dispersin alguna que pueda ser
utilizada en el anlisis de resultados de mediciones en
la escala nominal.
Ahora bien, lo anterior no quiere decir en manera alguna
que no sea posible realizar un anlisis de la dispersin en
este tipo de escala. Supongamos que se tienen dos
muestras donde han sido analizadas la preferencia por
siete tipos de deportes y en donde los resultados han
sido:
MUESTRA No. 1
DEPORTE Por ciento
Karate 10
Beisbol 15
Pesas 17
Atletismo 14
Canotaje 15
Judo 15
Taek-wan-do 14

MUESTRA No. 2
DEPORTE Por ciento
Karate 0
Beisbol 75
Pesas 15
Atletismo 0
Canotaje 0
Judo 15
Taek-wan-do 0
Decididamente en la muestra 2 ocurre una menor
dispersin en los resultados que en la muestra 1.
Preguntas.
1. Cul es el nivel ms elemental entre los cuatro
que aparecen en las escalas de medicin?
2. Supongamos que el resultado de una medicin se
encuentra incluido en la escala nominal y los
numerales que han sido asignados son 3, 4, 5 y 7.
Existe alguna relacin de orden entre estos
numerales?
3. Cules propiedades se cumplen en una relacin
de equivalencia?
4. Cul es la definicin de medicin nominal o
clasificatoria?
5. Exponga ejemplo en su campo de actividad de
resultados de mediciones nominales.
6. Qu tipo de promedio puede ser utilizado en este
tipo de escala?
7. Qu medida de dispersin podemos utilizar
cuando los resultados de las mediciones se
encuentran en la escala nominal?

DISTRIBUCIN NORMAL

Breve resea acerca de la distribucin normal.

Dcimas para la normalidad.

Breve resea acerca de la
distribucin normal.
La distribucin normal es la ms importante de todas las
distribuciones tericas en el Anlisis de datos por sus
implicaciones tanto en el campo de la teora como en el de la
prctica, de ah que el determinar el grado de ajuste de los
resultados con que estemos trabajando con la distribucin
normal constituya un aspecto muy importante a tener siempre en
cuenta.
En efecto, numerosas dcimas estadsticas necesitan entre sus
requisitos que la muestra analizada provenga de una distribucin
normal o que siga una forma bastante similar a ella y en general
el conocimiento acerca de la normalidad es aplicable a
numerosos procesamientos a realizar en el Anlisis de Datos.
La denominacin de distribucin normal fue utilizada por
primera vez por Galton en 1889, estando definida por:

Esta distribucin depende solamente de dos parmetros:

su media aritmtica

su varianza
Siendo su representacin grfica la de una curva en forma
acampanada segn se muestra.

Una propiedad caracterstica de aquellos resultados que siguen
una distribucin normal es que en un recorrido de:

1 desviacin estndar de la media se encuentre
aproximadamente el 68% de los resultados de la
medicin.

2 desviaciones estndares de la media se encuentre
aproximadamente el 95% de los resultados
En otras palabras, si los datos siguen aproximadamente
los de una distribucin normal ocurrir que los resultados
estandarizados que sean menores que 2 y mayores que
+2, deber tener una frecuencia relativa del 5% o menor.
Dcimas para la normalidad.
Aunque en la literatura en el Anlisis de Datos aparecen
varias dcimas para verificar la normalidad, en la
actualidad son utilizadas fundamentalmente dos:

La dcima de Shapiro-Wilks, si el tamao de muestra
es de 50 o menor.
Que hasta el momento es la ms utilizada cuando el
tamao de muestra lo permite.

La dcima de Kolmogorov-Smirnov-Lillienfors, cuando
el tamao de muestra es superior a 50.

MEDIONES ORDINALES

Introduccin.

Tres caractersticas de las mediciones
ordinales.

Relacin de orden >.

Definicin de medicin ordinal.

Promedios y medidas de dispersin apropiados
para las mediciones ordinales.

Preguntas.
Introduccin.
Cuando estamos en presencia de la escala nominal, y estamos
trabajando en dos mediciones, las que estamos interesados en
comparar, nos encontramos con que solo podemos sacar una de
las dos conclusiones siguientes de acuerdo a sus numerales.
Las dos mediciones pertenecen a la misma clase.
Las dos mediciones pertenecen a clases diferentes.
Esta situacin es debida a que solamente es posible establecer
entre las mediciones una relacin de equivalencia. Sin embargo
en muchas ocasiones, es posible adems de poder establecer
una relacin de equivalencia, establecer una relacin de orden.
Las situaciones donde se presentan este tipo de escalas son muy
abundantes en la Educacin Fsica, el Deporte, la Recreacin y
la Rehabilitacin. Entre algunas de ellas podemos citar:

Las evaluaciones recibidas por los estudiantes en la
enseanza superior.

Lugar ocupado en una competencia por un deportista.

Las evaluaciones acerca del desempeo en la tcnica
de un atleta.

Resultado de la categorizacin de un deportista por un
grupo de expertos.

Las inclinaciones ante una proposicin dada donde las
alternativas sean:

Fuertemente a favor.

A favor.

En contra

Fuertemente en contra.

El sistema de grados en el ejrcito.

Resultados alcanzados en un paciente ante un
tratamiento.

Los niveles alcanzados por un sujeto en las pruebas de
Eficiencia Fsica del Plan L.P.V.

Los distintos niveles de aceptacin de un usuario ante
un paquete turstico.
En los ejemplos que se han expuesto anteriormente podemos
establecer respecto a la cualidad analizada, que dado un
numeral:
Este pertenece a una categora determinada.
Esto es aquellas personas que hubieren obtenido la nota de 2, se
encuentran en una categora distinta de aquellos que han
recibido otra de 3, 4 o 5.
Pero adems se manifiesta en estos numerales:
La existencia de un mayor o menor grado de esta
cualidad.
En efecto podemos decir que un sujeto que ha obtenido una
evaluacin de 4 puntos est en mejores condiciones que otro que
ha obtenido 2. Que una persona que ha obtenido una calificacin
de Muy Bien, est en mejores condiciones, con respecto a esta
cualidad, que otra que haya obtenido una calificacin de Bien.
Sin embargo con este nivel de medicin:
No somos capaces de establecer que una relacin
mtrica entre los numerales.
Quiere esto indicar, por ejemplo que: No podemos decir que la
persona que obtuvo 4 puntos tiene el doble de cantidad en la
cualidad medida que otra que tuvo 2.
Tres caractersticas de las mediciones ordinales.
Podemos considerar entonces que en general las mediciones
ordinales poseen tres caractersticas:
1. Los numerales son asignados a los elementos o unidades
experimentales de la poblacin en forma tal que podemos
identificar cules elementos o unidades experimentales son
equivalentes.
2. En cualquier pareja de numerales, no equivalentes,
podemos decidir acerca de en cules de ellos se manifiesta en un
mayor o menor grado la cualidad.
3. Si el numeral que asigna la cualidad del elemento A es
mayor que el numeral que se le asigna a la cualidad del
elemento B y ste es mayor que la asignada al elemento C,
podemos apuntar que el elemento A tiene un mayor grado de
cualidad que el elemento C.
Relacin de orden >.
Una relacin de orden es aquella que incorpora no
solamente la relacin de equivalencia, sino tambin la
relacin "ms grande que" (>). Esta ltima relacin
cumple las siguientes:
I. Propiedad antireflexiva.
No es verdad que para ningn numeral x se cumpla que el
numeral x sea mayor que si mismo.
II. Propiedad antisimtrica.
Si el numeral x es mayor que el numeral y, entonces no puede
ocurrir que el numeral x sea menor que el numeral y.
III. Propiedad transitiva.
Si el numeral x es mayor que el numeral y y a su vez el numeral
y es mayor que el numeral z. Entonces se cumple que el numeral
x es mayor que el numeral z.
Definicin de medicin ordinal.
Una medicin ordinal es aquella que incorpora a la
relacin de equivalencia la relacin de orden >
El establecimiento de las tres propiedades anteriores a la
relacin de equivalencia, es simplemente una manera formal de
establecer que las mediciones ordenadas en este tipo de escala,
permiten establecer un ranqueo (ordenacin por rangos) de las
mediciones realizadas a los elementos de la poblacin, en
trminos de la posesin de alguna cualidad.
De lo anterior se colige que la asignacin de numerales a las
mediciones deber estar condicionado a un ordenamiento dado
por los numerales asignados. Por ejemplo si deseamos clasificar
a un sujeto de acuerdo a su desempeo podremos utilizar los
siguientes numerales:
Desempeo
Realizado
NUMERALES ASIGNADOS
Excelente A 5 4
Muy Bien B 4 3
Bien C 3 2
Deficiente D 2 1
Es preciso hacer resaltar que hubiera podido haberse hecho el
ordenamiento al revs y no cambiara la estructura de la
medicin.
Desempeo
Realizado
NUMERALES ASIGNADOS
Excelente D 2 1
Muy Bien C 3 2
Bien B 4 3
Deficiente A 5 4
Incluso, la asignacin de los numerales no tiene que seguir
necesariamente un orden secuencial. En efecto la escala no se
distorsiona si hubiramos hecho la asignacin de numerales en
la forma siguiente:
Desempeo
Realizado
NUMERALES ASIGNADOS
Excelente A 10
Muy Bien O 12
Bien R 84
Deficiente Z 95
Aunque es evidente que la asignacin de estos numerales no
hace nada cmodo el trabajo con la base de datos, si podemos
llegar a la conclusin que la estructura de una medicin ordinal
no se afecta ante cualquiera sustitucin uno a uno siempre y
cuando sta conserve el orden.
Promedios y medidas de dispersin
apropiados para las mediciones
ordinales.
Dado que este tipo de medicin tiene de por s las
caractersticas de las mediciones del tipo nominal, en ellas sern
susceptibles de ser aplicados los mismos promedios que se
aplican en este tipo de medicin, esto es la moda. Y como ella
incorpora como nuevo elemento el ordenamiento, tambin ser
posible aplicar en ella la mediana, que es su promedio
adecuado.
En el caso de las medidas de dispersin podrn ser utilizados:
v El recorrido (diferencia entre el mximo y el mnimo).
v El recorrido intercuartlico (diferencia entre el cuartl
superior y el cuartl inferior).
Como se ve, dada la estructura que presenta este tipo de
medicin, en ella le son vedadas todas aquellas caractersticas
numricas donde estn involucradas operaciones aritmticas. De
ah que cualquier tipo de inferencias que se hagan si se utilizan
con este tipo de medicin los dos grandes caballos de batalla del
procesamiento de datos que son la media aritmtica y la
desviacin estndar, arrojar resultados bastante dudosos y de
escaso valor inferencial.
Preguntas.
1. Exponga ejemplos en su campo de actividad donde
los resultados de las mediciones aparezcan en la
escala ordinal.
2. Diga si las siguientes proposiciones son verdaderas
o falsas. Si los resultados de un conjunto de
mediciones corresponden a la escala ordinal:
1. Podemos establecer una relacin de orden
entre sus resultados?
2. Es posible establecer alguna relacin
mtrica entre dos resultados diferentes?
3. Cules son las tres propiedades que incorpora a la
relacin de equivalencia la relacin de orden?
4. Cules son las tres caractersticas que se
establecen en las mediciones ordinales?
5. Diga si la siguiente proposicin es verdadera o
falsa. Si se tiene en una base de datos un conjunto
de resultados de mediciones en la escala ordinal y
se realiza un cambio en los numerales que
conserve el orden, el conjunto de resultados de
mediciones cambia.
6. Qu promedio resulta apropiado para ser
utilizados en mediciones del tipo ordinal?
7. Es posible utilizar en una medicin del tipo
ordinal como promedio la moda?
8. Qu medidas de dispersin pueden ser utilizadas
en mediciones del tipo ordinal?


PERCENTILES

Introduccin.

Percentiles.

Definicin de Percentil.

Mtodo para el clculo de los percentiles.

Utilidad de los percentiles en el mbito de la
Cultura Fsica.

Introduccin.
El estadgrafo percentil, a pesar de su nombre raro, es
uno de los estadgrafos ms mencionados an por las
personas que no tienen la ms remota idea de la
terminologa del Anlisis de Datos. En efecto, es comn
or decir a una madre de un nio obeso, que su hijo tiene
que bajar de peso porque el mdico le dijo que estaba
con un peso por encima del percentil 90, o la de otro que
el mdico le haba mandado a realizar un grupo de
anlisis porque el nio se encontraba por debajo del
percentil 10.
En el caso de un profesor de Educacin Fsica, al ser
preguntado por sus alumnos acerca de cmo haban sido
obtenidos los niveles en las pruebas de Eficiencia Fsica
en el plan L.P.V., este les haba respondido que se
obtuvieron en base a determinados percentiles de la
muestra analizada.
Lo que se ha expuesto anteriormente permite
comprender la necesidad del futuro graduado en no
solamente saber de qu tratan los aspectos que a
continuacin sern expuestos, sino tambin ser capaz de
explicarlos de forma tal que sea entendido.
Los aspectos que sern analizados son:

Percentiles y entre ellos particularmente los:

Cuartiles

Deciles


Percentiles.
Est claro que, aunque no se sepa de lo que se trate,
cuando se est hablando de Percentiles, cuartiles y
deciles, el prefijo est indicando una cierta relacin con
la particin de una distribucin en potencias de 10. En
efecto:
ESTADGRAFO PREFIJO
DIVIDIR A
UNA
DISTRIBUCIN
Percentil Percent Centsimos
Cuartil Cuart Cuartos
Decil Dec Dcimos
Ahora bien, es evidente que para dividir a un segmento
en n partes, slo necesitamos n-1 puntos para hacerlo.
De ah que si dividimos un segmento en diez partes, se
necesitarn slo nueve puntos, donde:

D
1
es el primer decil

D
2
es el segundo decil

D
9
es el noveno y ltimo decil.
De forma anloga para dividir a un segmento en cuatro
partes, se necesitarn tres puntos. donde:

Q
1
es el primer cuartil.

Q
2
es el segundo cuartil.

Q
3
es el tercero y ltimo cuartil.
Ahora bien, dado que el segundo cuartil corresponde a la
mediana, que es un estadgrafo con nombre y
personalidad propia, se acostumbra a llamarle al primer
cuartil (Q
1
), esto es al cuartil que tiene un valor superior
al valor mediano cuartil superior (Q
S
). Y anlogamente
al cuartil (Q
3
), que es el cuartil con valor inferior al valor
mediano cuartil inferior (Q
I
)
De forma anloga para dividir un segmento en 100
partes, se necesitarn 99 puntos, donde:

p
1
ser el Percentil 1.

p
2
el Percentil 2.

p
10
el Percentil 10 o primer decil.

p
20
el Percentil 20 o segundo decil.

p
25
el Percentil 25, primer cuartil o cuartil superior.

p
50
el Percentil 50 o mediana.

p
75
el Percentil 75 o cuartil superior.

p
90
el Percentil 90 o decil 9.

p
99
el Percentil 99.
Consideremos ahora la siguiente curva de frecuencia en
donde ha sido trazada una paralela en el punto donde se
designa el p% de las mediciones ordenadas. La altura al
eje de abscisas refleja el valor x
p
, por debajo de los
cuales se encuentran el p% de las mediciones.
Podemos entonces definir:
Definicin de Percentil.
El Percentil p de un conjunto de resultados de
mediciones es aquel valor x
p
, por debajo de la cual se
encuentran el p% de los resultados de las mediciones.
Por ejemplo:

El Percentil 95, es el valor por debajo del cual se
encuentran el 95% de las observaciones).

El Percentil 25 es el valor por encima del cual se
encuentran el 75% de los mediciones realizadas y por
debajo del cual se encuentra el 25% de los valores
observados.

El Percentil 50, la mediana. Valor por debajo y por
encima del cual se encuentran la mitad de los valores
observados de una variable.

El Percentil 75. Valor por encima del cual se encuentra
el 25% de los valores observados y por debajo del cual
se encuentra el 75% de los valores observados.
Mtodo para el clculo de los
percentiles.
En el esquema anterior dado se utiliz una curva de
frecuencias para ejemplificar el percentil. En la prctica
para localizar el valor de un percentil digamos el P
p
, tal
que el p por ciento (0<p<100) de las observaciones son
menores que P
p
, llamaremos a P
p
, el lmite superior del
p-simo percentil y podemos obtener un valor
aproximado, mediante una de las dos expresiones
siguientes:

Si se desea obtener la frecuencia absoluta acumulada
aproximada, donde se encuentra P
p
podemos utilizar
la expresin:


Si se desea obtener la frecuencia relativa acumulada
aproximada, donde se encuentra el porciento
acumulado podemos utilizar la expresin:

Segn dijo anteriormente los valores de los percentiles
son aproximados, incluso puede ocurrir que en una
misma distribucin y utilizando ms de un Paquete
Estadstico computacional, los resultados no sean
exactamente iguales, aunque s muy aproximados.
En el caso de que se deseara obtener un valor exacto, se
tendra que recurrir a la tabla de frecuencias en un
conteo de valores individuales y obtener los percentiles
por interpolacin.
Ejemplo:
Supongamos que estamos en presencia de la siguiente
distribucin, que representa la talla de 100 sujetos
expresada en centmetros:
ESTATURA
Resultado
de las
Mediciones
Frecuencia
Absoluta
Frecuencia
Absoluta
Acumulada
Por
ciento
Por ciento
Acumulado
140.000 1 1 0.9 0.9
142.000 1 2 0.9 1.8
145.000 1 3 0.9 2.7
147.000 1 4 0.9 3.5
149.000 1 5 0.9 4.4
150.000 3 8 2.7 7.1
151.000 1 9 0.9 8.0
152.000 4 13 3.5 11.5
154.000 3 16 2.7 14.2
155.000 7 23 6.2 20.4
157.000 2 25 1.8 22.1
160.000 9 34 8.0 30.1
161.000 7 41 6.2 36.3
163.000 7 48 6.2 42.5
164.000 3 51 2.7 45.1
165.000 9 60 8.0 53.1
166.000 2 62 1.8 54.9
168.000 11 73 9.7 64.6
169.000 6 79 5.3 69.9
170.000 9 88 8.0 77.9
171.000 2 90 1.8 79.6
173.000 5 95 4.4 84.1
175.000 2 97 1.8 85.8
176.000 1 98 0.9 86.7
177.000 5 103 4.4 91.2
178.000 5 108 4.4 95.6
179.000 1 109 0.9 96.5
182.000 1 110 0.9 97.3
183.000 1 111 0.9 98.2
185.000 1 112 0.9 99.1
187.000 1 113 0.9 100.0
Utilizando un Paquete Estadstico han sido obtenidos los
siguientes percentiles:


Clculo del percentil 25:
Aplicando la frmula para n=113 y p=25 se tiene:

El percentil obtenido es 160, que es aproximadamente el
que corresponde a los clculos realizados.
Clculo del percentil 50 (valor mediano):

El percentil obtenido es 165 cm, que es
aproximadamente el que corresponde a los clculos
realizados.
Clculo del percentil 70

El percentil obtenido es 169,8 cm, que es
aproximadamente el que corresponde a los clculos
realizados.
Clculo del percentil 70

El percentil obtenido es 170 cm, que es
aproximadamente el que corresponde a los clculos
realizados.
Utilidad de los percentiles en el
mbito de la Cultura Fsica.

Asignacin de puntuaciones de acuerdo a por cientos
de resultados.
Supongamos que se desea incentivar la participacin
popular en k carreras masivas. Asumamos que al final se
desea dar un certificado de acuerdo a los resultados
obtenidos en cada una, aparte de los que alcanzaron los
primeros lugares. Una forma de resolver este problema
es:
1. Obtener el nmero total de participantes en la
carrera.
2. Conferir puntos en base al porcentaje de
participantes que sobrepase. Es decir que si un
participante obtuvo. Esto es si un participante
obtuvo el 86%, indicar que sobrepas al 86% de
los participantes.
3. Sumar las puntuaciones obtenidas en las k
carreras.

En el peso y la talla de nios.
Se ha computado (Jordn), los percentiles de la talla y
el peso de los nios de la poblacin cubana. Esto
representa una gua para aquellos profesionales que
tratan con nios (mdicos, profesores, instructores,
etc). Por ejemplo, cuando el mdico compara el peso de
un infante obeso y le dice a sus padres que su peso
sobrepasa el Percentil 90, est pensando e indicando a
sus padres que el peso de su hijo es superior al 90% de los
nios que pertenecen a la categora de la criatura en
cuestin.


Asignacin de niveles en el cumplimiento de Pruebas
de Eficiencia Fsica.

La asignacin del nivel de cumplimiento de las pruebas
utilizadas en el Plan L. P. V. De Eficiencia Fsica, estn
condicionada mediante los siguientes Percentiles.
NIVEL PERCENTIL
CUARTO
Percentil
10
TERCERO
Percentil
20
SEGUNDO
Percentil
50-
PRIMERO
Percentil
80
SELECCIN
DE
TALENTOS
Percentil
90


Promedios o medidas de
tendencia central

Definicin de promedio.

Utilizacin de los promedios estudiados con
relacin a la escala de medicin donde se
encuentren los resultados.

Posicin de los estadgrafos fundamentales de
acuerdo a la simetra de la distribucin
muestral.

Preguntas.
Definicin de promedio.
Definiremos como promedio de un conjunto de
resultados de una medicin a aquel valor que sea
representativo del conjunto dado en la medicin
considerada.
Dado que en la prctica cotidiana es deseable que estos
promedios estn referidos a la tendencia central de la
distribucin de los resultados de la medicin, se
acostumbra a denominarlos tambin como medidas de
tendencia central.
Primero que todo, es necesario recalcar que en el
contexto del Anlisis de Datos, no existe un slo
promedio, es ms si se recurre a la literatura se ver que
existen numerosas medidas de tendencia central. Lo
anterior es debido a que el valor numrico que se ofrece,
para que sea representativo, deber estar en
consonancia con:
1. La escala de medicin
2. Las caractersticas particulares que presenten los
resultados de las mediciones que han sido
realizadas.
3. Los objetivos investigativos que se persigan.
Existen tres promedios que presentan una amplia
utilizacin en el Deporte, la Educacin Fsica, la
Recreacin y la Rehabilitacin ellos son:

La media aritmtica

La mediana

La moda.
Los que aparecen en los botones de la barra de
herramientas a la izquierda.
Utilizacin de los promedios
estudiados con relacin a la escala
de medicin donde se encuentren
los resultados.
A continuacin presentamos la siguiente tabla donde se
muestra la utilizacin de los promedios mencionados de
acuerdo a la escala de medicin donde se encuentran los
resultados.
ESCALAS
PROMEDIOS QUE
PUEDEN SER
UTILIZADOS
PROPORCION
MTRICAS.
INTERVALO

Media
aritmtica

Mediana

moda
ORDINAL

Mediana

Moda
NO MTRICAS.
NOMINAL

Moda
Observe que, con respecto a las escalas de medicin en
que aparecen los resultados, a medida que sta se hace
ms dbil, disminuye la posibilidad de utilizacin de los
promedios mencionados. En efecto en la cspide (Escalas
mtricas), es posible utilizarlos a todos y as va
disminuyendo sucesivamente hasta los que slo gozan de
la escala nomimal, donde nicamente puede ser utilizada
la moda.
Posicin de los estadgrafos
fundamentales de acuerdo a la
simetra de la distribucin muestral.
Otro aspecto que resulta importante resaltar es el
vnculo existente entre estos tres estadgrafos y la
representacin grfica de la muestra. En efecto un
aspecto que muchas veces es soslayado por el
especialista consiste en no relacionar la forma de la
distribucin muestral con los tres estadgrafos principales
(media aritmtica, mediana y moda), aspecto que resulta
fundamental en el trabajo prctico con las pruebas.
Independientemente de que se pueda hablar mucho al
respecto, es de importancia tener una ubicacin mental
de la disposicin en que se encuentran estos estadgrafos
en la grfica de una distribucin que sea :

Simtrica.

Asimtrica hacia la derecha.

Asimtrica hacia la izquierda.
Simtrica.
Aunque en el trabajo investigativo de la Educacin
Fsica, el Deporte, la Recreacin y la Rehabilitacin
resulta raro el tropezarse con muestras que sean
perfectamente simtricas, si lo es el contar con muestras
que aproximadamente lo sean.
Dado el caso de que la muestra sea simtrica. la media,
la mediana y la moda son coincidentes. Lo que se
muestra en el siguiente esquema.

De ah que si se tiene una muestra que sea
aproximadamente simtrica se tendr que sern
aproximadamente iguales estos tres estadgrafos.
Asimtrica hacia la derecha.

Asimtrica hacia la izquierda.

Observe que ya sea en la asimetra a la derecha o a la
izquierda, la mediana siempre se encuentra en el medio
de la media aritmtica y de la moda
Preguntas
1. Cmo usted definira a un promedio?
2. Bajo qu otro nombre, adems de promedio,
reciben este tipo de caractersticas numricas en
la literatura?
3. Mencione algunos aspectos a tener en cuenta
cuando se est analizando cul promedio ser
utilizado en el resultado de una medicin.
4. Cules son los tres promedios ms utilizados en el
anlisis de datos?
5. Cules, de los anteriores promedios, pueden ser
utilizados si los resultados de las mediciones se
encuentran en la escala:
1. Nominal.
2. Ordinal.
3. Intervalo.
4. Proporcin.
6. Cul es la posicin relativa de los tres promedios
estudiados (la media aritmtica, la mediana y la
moda), si la distribucin es:
1. Simtrica.
2. Asimtrica hacia la derecha.
3. Asimtrica hacia la izquierda.

PROPIEDADES

Introduccin.

Caso 1 : Si el conjunto de resultados en una
variable es una constante.

Caso 2: Si se tienen dos variables tales que la
diferenciacin entre una y otra sea la suma o
diferencia de una constante.

Caso 3: Si se tienen dos variables tales que la
diferenciacin entre una y otra sea el
producto o el cociente por una constante.
Introduccin.
A continuacin pasaremos a analizar algunas de las
propiedades ms importantes que se cumplen para la:

Media aritmtica.

Varianza.

Desviacin tpica o estndar.
Es importante decir, antes de empezar, que estas
propiedades eran muy tiles, en la poca heroica del
papel y el lpiz, debido al ahorro de trabajo que
representaba su utilizacin. Ahora bien, con el
advenimiento de las Computadores Personales y de los
Paquetes Estadsticos, su aplicacin en este aspecto se
ha hecho innecesaria, ya que si bien antes el tiempo
invertido para obtener los estadgrafos que se
necesitaban era a veces muy largo, en la actualidad
mediante los referidos paquetes la demora es de
fracciones de segundos.
No obstante lo anterior, el conocimiento de estas
propiedades conlleva a las siguientes ventajas:

Ayuda extraordinariamente en el anlisis de las salidas
de los paquetes, sobre todo en los casos en que el
valor de los estadgrafos obtenidos nos resulta
singular.

Se derivan de ellas aspectos conceptuales que ayudan
al estudio y entendimiento de muchas tcnicas
estadsticas entre ellas:

Las puntuaciones z o estndares.

El Anlisis de Varianza.

La Correlacin.

Ayudan a entender y sintetizar diversas escalas
estndares, que son de frecuente uso en la teora de la
evaluacin de pruebas.
Todo lo anterior nos permite decir que su conocimiento a
la larga puede contribuir de manera decisiva en el
trabajo investigativo, siempre y cuando estas
propiedades estn presentes.
A diferencia de la mayora de los libros de texto, donde
realizan el anlisis por separado de estas propiedades en
cada uno de los tres estadgrafos mencionados, aqu
sern consideradas las tres mediante casos. Ya que
normalmente en los Paquetes Estadsticos estos
estadgrafos se efectan al mismo tiempo en una misma
salida. Estos casos sern:

Caso 1 : Si el conjunto de resultados en una variable
es una constante.

Caso 2: Si se tienen dos variables tales que la
diferenciacin entre una y otra sea la suma o
diferencia de una constante.

Caso 3: Si se tienen dos variables tales que la
diferenciacin entre una y otra sea el producto o el
cociente por una constante.

Caso 1 : Si el conjunto de resultados en una
variable es una constante.
Dado un conjunto de resultados de mediciones
constantes (todos son iguales), se cumplir que:

La media aritmtica del conjunto ser la propia
constante.

La varianza del conjunto ser cero.

La desviacin estndar o tpica ser cero.


Comentario.
La utilidad prctica de la propiedad no es en el sentido
en que ella establece, esto es, si se tiene un conjunto de
resultados constantes y se desea hallar los estadgrafos
antes mencionados. La importancia que tiene es a la
inversa, y sobre todo cuando en las salidas observamos
que la varianza o la desviacin tpica son ceros. Pudiendo
entonces establecerse:
Si se obtiene que la varianza o la desviacin estndar
de una muestra son iguales a cero, esto implica que los
resultados de la muestra obtenida son constantes.
Caso 2: Si se tienen dos variables tales que la
diferenciacin entre una y otra sea la suma o
diferencia de una constante.
Propiedad.
Si a cada uno de los elementos de un conjunto de
resultados de una medicin se le adiciona (sustrae) una
constante se cumple que:

La media aritmtica del conjunto transformado es
igual a la media aritmtica del conjunto original ms
(menos) la constante.

La varianza y la desviacin estndar del conjunto
transformado es igual a la varianza y la desviacin
estndar del conjunto original.
Luego la dispersin no cambia si a cada elemento del
conjunto se adiciona o se sustrae un mismo valor.
A continuacin se muestra una tabla que ilustra las
propiedades anteriores.
i X
i
X
i
+10 X
i
-10
1 4 14 -6
2 3.5 13.5 -6.5
3 3.1 13.1 -6.9
4 2.2 12.2 -7.8
5 1.6 11.6 -8.4
6 1 11 -9
7 1.9 11.9 -8.1
8 0.5 10.5 -9.5
9 0.3 10.3 -9.7
10 0.1 10.1 -9.9
MEDIA 1.82 1.82+10=11.82 1.82-10=-8.18
VARIANZA 1.89955556 1.89955556 1.89955556
DESVIACIN
TPICA
1.37824365 1.37824365 1.37824365
Caso 3: Si se tienen dos variables tales que la
diferenciacin entre una y otra sea el producto o
el cociente por una constante.
Propiedad.
Si a cada uno de los elementos de un conjunto de
resultados de una medicin se le multiplica (divide) por
una constante se cumple que:

La media aritmtica del conjunto transformado es
igual a la media aritmtica del conjunto original
multiplicada (dividida) por la constante.

La varianza del conjunto transformado es igual al
producto de la varianza del conjunto original
multiplicada (dividida) por el cuadrado de la
constante.

La desviacin estndar del conjunto transformado es
igual al producto de la desviacin estndar del
conjunto original multiplicada (dividida) por la
conjunto original multiplicada (dividida) por la
constante.

i X
i
(X
i
)10 (X
i
)/10
1 4 40 0.4
2 3.5 35 0.35
3 3.1 31 0.31
4 2.2 22 0.22
5 1.6 16 0.16
6 1 10 0.1
7 1.9 19 0.19
8 0.5 5 0.05
9 0.3 3 0.03
10 0.1 1 0.01
MEDIA 1.82 (1.82)10=18.2 (1.82)/10=0.182
VARIANZA 1.89955556 189.955556 0.01899556
DESVIACIN
TPICA
1.37824365 13.7824365 0.13782436


PUNTUACIONES
Las puntuaciones z o puntuaciones estndares
pertenecen al grupo de las transformaciones de
puntuaciones y es de todas ellas, la ms utilizada. Estas
puntuaciones tienen su basamento en las propiedades
acerca de la media aritmtica y la desviacin estndar
tratadas en otra pgina. El plan metodolgico a seguir
est dado por los siguientes aspectos:

Concepto de puntuaciones z.

Propiedades de las puntuaciones z.

Obtencin de las puntuaciones z en los Paquetes
Estadsticos.

Comparacin entre los grficos de resultados de una
medicin y los de sus puntuaciones z
correspondientes.

Ventajas de la estandarizacin.

Escalas estndares.

Concepto de puntuaciones z.
Supongamos que se tiene un conjunto de resultados de
mediciones: x
1
, x
2
,...,x
n
cuya media aritmtica es y su
desviacin estndar es s. Si se realiza una transformacin
de los resultados de las mediciones x
1
, x
2
,...,x
n
; al que
llamaremos z, tal que a cada uno de estos resultados se
le reste el valor de su media aritmtica y despus de
efectuada esta operacin se divide por la desviacin
estndar, se estar en presencia de un conjunto
transformado cuyos elementos son:

Y en donde su ley de formacin general ser:

Observe que, una puntuacin z expresa la desviacin de
mediciones originales, respecto a su media aritmtica,
en trminos de unidades estndares.
Ejemplo.
En la siguiente tabla son mostrados los resultados de una
medicin (x
i
), en una muestra de tamao 16.
i x
i
z
i

1 66 -1.58
2 70 -1.37
3 74 -1.16
4 78 -0.95
5 82 -0.74
6 86 -0.53
7 90 -0.32
8 94 -0.11
9 98 0.11
10 102 0.32
11 106 0.53
12 110 0.74
13 114 0.95
14 118 1.16
15 122 1.37
16 126 1.58
Media Arit. 96
Desv. Tpica 19.0438091

Observe que todos los resultados cuya magnitud es
inferior a la media aritmtica de la muestra, producen
puntuaciones z negativas, y con aquellas que se
encuentren "por encima" de la media, positivas. Es fcil
inferir que si se tuviera un resultado cuyo valor
coincidiera con la media aritmtica, la puntuacin z que
le corresponde sera cero.
Propiedades de las puntuaciones z.
De las propiedades que presenta la media aritmtica y la
desviacin estndar acerca de las operaciones racionales
referidas a una constante sabemos que:

Si a cada elemento de un conjunto de resultados de
mediciones se le resta una constante se cumplir:

La media aritmtica del conjunto transformado es
igual a la media del conjunto original menos la
constante.

La desviacin estndar del conjunto transformados
es igual a la desviacin del conjunto original.
Si ocurre que esa constante es igual a la propia media
aritmtica ocurrir, que en la transformacin ,
ocurrir:

Su media aritmtica es cero.

Su desviacin tpica es igual a la del conjunto original.
Lo anterior se comprueba en el ejemplo.:
i x
i


1 66 -30
2 70 -26
3 74 -22
4 78 -18
5 82 -14
6 86 -10
7 90 -6
8 94 -2
9 98 2
10 102 6
11 106 10
12 110 14
13 114 18
14 118 22
15 122 26
16 126 30
Media Arit. 96 0
Desv. Tpica 19.0438091 19.0438091
Conocemos tambin, que si a cada uno de los resultados
de un conjunto de mediciones son divididos por una
constante se cumple que:

La media del conjunto transformado es igual a la
media aritmtica del conjunto original dividido por la
constante.

La desviacin estndar del conjunto transformado es
igual a la desviacin estndar del conjunto original
dividido por la constante.
Ahora bien, partiendo de la transformacin , si
cada uno de estos resultados son divididos por la
desviacin estndar s, ocurrir que en la transformacin
:

Su media aritmtica es cero.
En efecto, la media aritmtica de los resultados ,
es cero, luego si la dividimos por s, su resultado ser
cero.

Su desviacin estndar es 1.
En efecto, la desviacin de las resultados , tiene la
misma desviacin (s) que la de los resultados x
i
, por lo
que al dividir a por s, el resultado ser 1.
Lo anterior es comprobado en la siguiente tabla.
i x
i



1 66 -30 -1.58
2 70 -26 -1.37
3 74 -22 -1.16
4 78 -18 -0.95
5 82 -14 -0.74
6 86 -10 -0.53
7 90 -6 -0.32
8 94 -2 -0.11
9 98 2 0.11
10 102 6 0.32
11 106 10 0.53
12 110 14 0.74
13 114 18 0.95
14 118 22 1.16
15 122 26 1.37
16 126 30 1.58
Media Arit. 96 0 0.00
Desv. Tpica 19.0438091 19.0438091 1.00

Obtencin de las puntuaciones z en
los Paquetes Estadsticos.
Como es de esperar, el procedimiento que se ha
realizado en las tablas anteriores, ha tenido como nico
objetivo el ilustrar:

Cmo se realiza una transformacin z a un conjunto
de resultados de mediciones?

Las propiedades que presenta la transformacin z con
respecto a su media aritmtica y a su desviacin.
En los Paquetes Estadsticos, esta transformacin se
realiza de manera inmediata y es posible encontrarla
dentro de las opciones de:

Transformacin de variables.

Estandarizacin de variables.
En general, cuando en una variable se realiza una
transformacin del tipo , se dice que la variable x
ha sido estandarizada.
Comparacin entre los grficos de
los resultados de una medicin y los
de sus puntuaciones z
correspondientes.
Ante todo es preciso recalcar una vez ms que la
puntuacin z es una puntuacin transformada la que
expresa la distancia o desviacin de los resultados de una
medicin respecto a la media aritmtica en trminos de
unidades de desviacin estndar, por lo que no existe
diferencia alguna en la forma que adoptan ambas
distribuciones, mantenindose el mismo nmero de
intervalos. Lo anterior se ilustra mediante el siguiente
ejemplo.


Conclusin.
Podemos decir, segn se ha podido observar. que el
cambio a puntuaciones z mantiene las propiedades
bsicas de una distribucin, ayudndonos a tener como
se ver, una mejor comprensin de la misma.
Ventajas de la estandarizacin.
La estandarizacin de variables, representa un grupo de
ventajas considerables, entre ellas se encuentran:

Permite realizar comparaciones de mediciones en
distribuciones diferentes.
Se ha medido a un grupo de jvenes en el peso y la talla,
conocindose la media aritmtica y la desviacin
estndar del grupo. Se desea conocer en uno de ellos si
es ms alto que pesado. Los resultados son:
Medicin Resultados Estadgrafos
Media aritmtica
1,49 m
Estatura 1,55 m
Desviacin
estndar 0,03
Media aritmtica
57,9 kg
Peso Corporal 62,3 kg
Desviacin
estndar 2,3 kg
Obteniendo las puntuaciones z se tiene:
Para la estatura:

Para el peso corporal:

Luego de acuerdo a los resultados obtenidos en las
puntuaciones z se concluye que la persona es ms alta
que corpulenta.

Permite combinar calificaciones de exmenes con
distribuciones diferentes.
La tabla muestra los resultados y promedio (media
aritmtica) de dos estudiantes, A y B, en tres exmenes,
(Dixon, 1980).
ESTUD. EXAMEN 1 EXAMEN 2 EXAMEN 3 PROM.
A 57 puntos 76 puntos 96 puntos
76.33
puntos
B 73 puntos 86 puntos 70 puntos
76.33
puntos
Si nos preguntaran acerca del rendimiento de los dos
estudiantes en los tres exmenes, sin lugar a dudas
responderamos que su resultado es el mismo.
Ahora bien, supongamos que se conoce la media
aritmtica y la desviacin estndar de los resultados en
la muestra.
EXAMEN 1 EXAMEN 2 EXAMEN 3
Media 65 puntos 74 puntos 71 puntos
Desv. 4 puntos 6 puntos 12 puntos
Si con esta informacin se obtienen las respectivas
puntuaciones z se tiene:
ESTUD. EXAMEN 1 EXAMEN 2 EXAMEN 3
A -2.00 0.33 2.08
B 2.00 2.00 -0.08
De la tabla anterior se colige que el estudiante B obtuvo
calificaciones relativamente superiores al estudiante A,
debido a:

El estudiante A recibi una calificacin alta en el
Examen 3 una muy baja en el Examen 1 y una baja en
el examen 2

El estudiante B obtuvo 2 calificaciones muy altas en los
exmenes 1 y 2, y una calificacin baja en el Examen
exmenes 1 y 2, y una calificacin baja en el Examen
3.

El estudiante A recibi una calificacin muy
Esta situacin se refleja ms claramente si se obtienen
los promedios de las puntuaciones z.
ESTUDIANTE PROMEDIO
A 0.14
B 1.31
En ellas se observa que relativamente el estudiante B
obtuvo como promedio resultados mucho mejores que el
estudiante A.
Escalas estndares.
Las puntuaciones z, han dado lugar a un tipo de escala,
la escala z, que es la madre de otras tales como
(Zatsiorsky, 1989)
Escala Expresin Utilizacin
Escala T T=50+10z
Para eliminar las
puntuaciones
negativas.
Escala C C=5+2z
En investigaciones
masivas, cuando
no es necesaria
una gran
precisin.
H=3-z
En algunos pases
europeos.
Escalas de
exmenes
E=500+100z
En EEUU, para el
ingreso en la
enseanza
superior.
Escala Binet B=100+16z
En investigaciones
psicolgicas.

Recorrido o amplitud.

Recorrido o amplitud.

Utilizacin del recorrido

Recorrido o amplitud intercuartlica.

Preguntas.
Recorrido o amplitud.
Sea un conjunto de resultados de mediciones que se
encuentren al menos en una escala ordinal donde sean su
valor mximo (max) y su valor mnimo (min). Se define
como recorrido o amplitud a la diferencia entre su valor
mximo y su valor mnimo. En smbolos:
Recorrido (Amplitud)=max-min
Las ventajas que presenta este estadgrafo de dispersin
son:

Es muy simple su clculo, para ello slo tenemos que
conocer el mximo y el mnimo de la distribucin.

Es aplicable a resultados cuya escala de medicin sea
superior a la nominal ordinal (ordinal, intervalo,
proporcin).
Ahora bien, este estadgrafo representa la desventaja
que slo es sensible a los cambios en las mediciones
extremas, ocasionando los siguientes inconvenientes:

Puede existir dos distribuciones que presenten
diferentes amplitudes y sin embargo que no podamos
hacer ninguna inferencia acerca de su dispersin.
En efecto, supongamos que estamos en presencia de dos
grupos Grupo A y Grupo B, donde han sido medidos los
resultados en el salto de longitud sin carrera de impulso.
De estos dos grupos se conoce:
GRUPO
Media
Aritmtica
Mnimo Mximo
Recorrido
o
Amplitud
A 1,70m 0,70m 1.95m 1,25m
B 1,68 0,70m 2.95m 2,95
Del anlisis de la tabla se colige que:
1. No existe una diferencia muy acusada entre los
promedios, ya que esta es de 0,1m.
2. Las diferencias en los recorridos es apreciable, en
el primer caso es de 1,25m y en el segundo de
2,95m.
Sin embargo a pesar de la diferencia existente en el
recorrido, si no contamos con otra informacin, es
insensato afirmar que la dispersin sea apreciablemente
mayor en el Grupo B con relacin al Grupo A. En efecto,
puede perfectamente haber ocurrido, que en la muestra
slo exista un registro con el valor de 2,95m y que todos
los dems estn con una variacin similar a las del otro
grupo.

Pueden existir distribuciones con amplitudes similares
y sin embargo la situacin de su dispersin sea
completamente diferente en cada una de ellas.
En efecto, pudiramos estar en presencia de un grupo de
muestras que tengan las caractersticas de tener el
mismo mximo y el mismo mnimo (un ejemplo pudiera
ser los resultados en un examen escrito donde algn
sujeto obtuvo el mximo de puntos y otro el mnimo),
luego todas las muestras presentarn el mismo recorrido,
sin embargo la situacin referida a la dispersin puede
ser totalmente diferente en cada una de ellas.
Utilizacin del recorrido.
A pesar de la sencillez que presenta este estadgrafo en
el anlisis de datos, cuando es incorporado a los
diagramas de caja y bigotes presenta las siguientes
ventajas:

Detectar resultados de mediciones atpicas por valores
mayores.
En efecto si existe algn valor extremo que sobrepase a
los resultados usuales de una medicin estos sern
detectados:
Ejemplo:
Se ha medido la estatura en 6 grupos de adultos, medidos
en metros, y se han obtenido los recorridos o amplitudes
siguientes:
Recorrido o
Amplitud
GRUPOS ESTATURA
1 1.20
2 0.33
3 0.24
4 0.28
5 0.37
6 0.37
Total 1.37
Segn se observa en la tabla, en el Grupo 1, existe una
anomala con relacin al recorrido (que se manifiesta
como es lgico en el total de la muestra), y que deber
ser analizada.
Recorrido o amplitud intercuartlica.
Definicin.
Sea un conjunto de resultados de mediciones que se
encuentren al menos en una escala ordinal donde sean su
cuartil superior (Q
S
) y su cuartil inferior (Q
I
). Se define
como recorrido o amplitud intercuartlico a la
diferencia entre su cuartil superior y su cuartil inferior.
En smbolos:
Recorrido (Amplitud) intercuartlica=Q
S
-Q
I

Esta claro que el recorrido intercuartlico est en funcin
del cuartil superior (el percentil 75) y el cuartil inferior
(el percentil 25), de ah que el recorrido intercuartlico
sea la distancia entre estos dos cuartiles.
Es evidente que el recorrido intercuartil est midiendo la
dispersin del 50% de los resultados de las mediciones y
lo que es ms importante de los resultados de las
mediciones centrales.
Preguntas.
1. Cmo est definido el recorrido o amplitud?
2. En qu escalas de medicin pueden ser aplicadas?
3. Podemos considerar al recorrido como una
medida precisa de la dispersin? Argumente su
respuesta.
4. Cmo est definido el recorrido o amplitud
intercuartlico?
5. Qu por ciento de las mediciones abarca el
recorrido intercuartlico?


Dcima de Shapiro-Wilks.
Premisas
Las mediciones deben encontrarse al menos en la escala de
intervalo.
Hiptesis
Es preferible expresarlas mediante palabras. Esto es:
H
o:
:La poblacin de donde proviene la muestra est distribuida
normalmente.
H
1 :
La poblacin de donde proviene la muestra no est
distribuida normalmente.
Caractersticas de la dcima
Esta dcima propuesta en 1965 dirige su atencin a la forma en
que estn ploteados sus puntos en una pareja de ejes cartesianos,
cuando se sitan en el eje de ordenadas los valores de la muestra
y en el de abscisas los valores esperados normalizados de las
mediciones ordenadas.
Es una de las dcimas para el anlisis de la normalidad de la
poblacin ms potentes, lo que la hace muy popular en el
procesamiento de datos. Originalmente la dcima fue
desarrollada para tamaos de muestra menores o iguales que 50,
pero en la actualidad existen paquetes computacionales
(STATISTICA) que utilizan una transformacin (Royston J. P.
1982) que hace posible utilizarla en muestras con tamaos hasta
2000, de ah que una de las cuestiones que sea necesario
verificar es el tamao de muestra mximo que admite el
paquete, para esta dcima. En SPSS solamente lo admite para
tamaos menores o iguales que 50.


Estadgrafo
El estadgrafo de esta dcima se denota por W. Estando
comprendido W entre cero y uno. Siendo su expresin:
Donde:
n: tamao de la muestra
s
2
: varianza muestral
x
(i):
medicin ordenada de la muestra que ocupa el lugar i
a
i,n
: coeficientes de alejamiento de la normalidad en la dcima
de Shapiro Wilks.

En la propia medida en que W se acerca a la unidad, es
indicativo en las mediciones muestrales la cercana a los
respectivos valores esperados normalizados. Esto es que la
poblacin se acerca a la distribucin normal.
Es importante tener en cuenta que a medida que la dispersin en
la muestra se haga mayor, se producir entoces un menor valor
del estadgrafo W, si se mantiene constante el numerador
Los coeficientes a
i,n
, son obtenidos mediante tablas. A
continuacin se muestra una tabla reducida. A partir de la n, en
funcin de i, donde el coeficiente se anule, as ocurrir con los
restantes.
Tabla de coeficientes de la dcima de Shapiro-Wilks

2 3 4 5 6 7 8
1 .7071 .7071 .6872 .6646 .6431 .6233 .6052
2 0 0 .1667 .2413 .2806 .3031 .3164
3 0 0 .0875 .1401 .1743
4 0 0 0


Ejemplo
Ejemplo 1
Este ejemplo ha sido construdo de forma tal que por su
sencillez permita el entendimiento de la estructura del
estadgrafo y las caractersticas de variacin que en l se
manifiestan-
Sean las mediciones 41, 36, 25, 15, 12, 18. Realicemos un
ordenamiento ascendente de las mediciones. Tendremos
entonces que el orden (i) de las mediciones estar dado por:
(i) ORDEN DEL ELEMENTO MEDICION
(1) x
(1)
=12
(2) x
(1)
=15
(3) x
(1)
=18
(4) x
(1)
=25
(5) x
(1)
=36
(6) x
(1)
=41
En la tabla anterior se observa que el subndice (1), corresponde
a la medicin menor y el subndice mayor a la medicin mayor.
En el ejemplo que se ha considerado no existen ligas; en el caso
de que estas existan los autores de la dcima han planteado que
si se utiliza un ordenamiento por rangos utilizando la media
artimtica de las mediciones ligadas, no existen discrepancias
notables.
Un primer aspecto a tener en cuenta lo es el considerar si el
tamao de la muestra es par o impar, ya que en base a esta
diferenciacin as ser el valor mximo que toma h.
Debido a que n=6, se tomar entonces .
Se tendr entonces:


Dado que s
2
=138,7. Obtengamos el valor del denominador
utilizando el siguiente cuadro:


i
(n-
i+1)
6-
i+1
(7-
i) x
(n-i+1)
x
(i)
x
(n-i+1)
-x
(i)
a
i,n
(x
(n-i+1)
-x
(i)
)a
i,n
1 6 X
(6)
= 41 X
(1)
=12 29 0.6431 18.6499
2 5 X
(5)
=36 X
(2)
=15 21 0.2806 5.8926
3 4 X
(4)
=25 X
(3)
=18 7 0.0875 0.6125

Suma
25.155
Se observa en la tabla anterior que:

Se han particionado las seis mediciones en dos
columnas (columna 3 y columna 4). En la tercera se
han includo las tres ltimas mediciones ordenadas,
con un ordenamiento de mayor a menor, y en la cuarta
las tres restantes pero ordenadas de menor a mayor.

En la quinta columna aparecen las diferencias dadas
por x
(n-i+1)
-x
(i)


En la sexta columna aparecen los coeficientes
correspondientes a n=6, de acuerdo a la tabla de
coeficientes de la dcima.

La sptima columna refleja el producto de las
diferencias obtenidas (x
(n-i+1)
-x
(i)
), y los coeficientes
a
i,n
.

Se obtuvo que la Suma de este producto fue:
25.155
De ah que en virtud de lo anterior se tenga:


Salidas de la dcima
Las salidas de la dcima, en los paquetes computacionales, es
muy simple, ya que en ella solo se necesita que aparezca el valor
del estadgrafo (W), y el valor de probabilidad de la dcima.
Ejemplos

Ejemplo 1
A continuacin realizaremos el ejemplo utilizado para el clculo
del estadgrafo:
Segn se puede observar no es posible rechazar la hiptesis nula
(p=.4366).
Luego las conclusiones sern que no existen motivos suficientes
para decidir que la poblacin de donde proviene la muestra no es
normal.
A continuacin se muestra un histograma, con el grfico de la
distribucin normal superpuesta con el fin de ilustrar la
utilizacin de la dcima.



Ejemplo 2
Se desea analizar si la poblacin de donde ha sido obtenida una
muestra de 100 escolares, donde les han sido medidos la
cantidad de abdominales que realizan en un periodo de tiempo
determinado. Los resultados obtenidos son los siguientes:

3 7 11 12 13 14 15 16 17 17 18 18 18 19 19 19 20 20 21 21 21 22 22 23 23 24

24 24 25 25 25 26 26 26 26 27 27 27 28 28 28 29 29 29 29

30 30 30 30 30 30 30 30 30 30 31 31 31 31 32 32 33 33 33 33 33 34 34 34

35 35 35 36 36 36 37 37 38 38 39 39 39 40 40 41 41 41 42 42 42 43 43 44 45

A continuacin se muestran .los resultados obtenidos
apoyndonos en el histograma (con la distribucin normal
superpuesta) y la tabla de distribucin de frecuencias.
Segn se observa (p=0,9826). El histograma con la distribucin
normal superpuesta es:



SIMETRA

Introduccin.
Donde ser abordada, mediante ejemplos, la necesidad
de ser incluido el anlisis de la simetra y el
apuntamiento de una distribucin.

Teora de los momentos de Pearson.
Se da una breve explicacin del nombre de esta teora y
se explica cules son los momentos ms utilizados en el
Anlisis Exploratorio.

Momentos con respecto a la media.
Aqu se da la definicin de momentos con respecto a la
media y se particulariza en los cuatro primeros tipos de
momentos, indicndose su utilizacin.

Coeficiente de esquenosis.
Se define el coeficiente de esquenosis, y se indica la
clasificacin que se realiza en cuanto a la simetra de
una distribucin de acuerdo a esta medida.

Coeficiente de curtosis.
Se define el coeficiente de curtosis, y se indica la
clasificacin que se realiza en cuanto al apuntamiento de
una distribucin de acuerdo a esta medida.

Preguntas.

Introduccin.
Del mismo modo que se obtienen para su posterior
anlisis estadgrafos que permitan determinar un
promedio, as como medidas para conseguir la dispersin
que tienen los resultados, es tambin de utilidad (aunque
no tanto como en los anteriores), conocer acerca de la
simetra y el apuntamiento que adopta la distribucin .
Veamos los ejemplos siguientes:
Ejemplo1.
Se tienen dos mediciones que hemos llamado MED1 y
MED2, y cuyos resultados se muestran a continuacin.


La media aritmtica y la desviacin estndar de los
resultados de ambas mediciones son los mismos. Sin
embargo si se realizan sus histogramas, vemos que sus
respectivas distribuciones son diferentes en cuanto a su
simetra. En efecto el histograma de MED1, presenta una
simetra respecto a su media aritmtica en tanto que el
histograma de MED2, no la expone.



De los ejemplos anteriormente expuestos se colige la
necesidad de encontrar una medida que permita
determinar, al menos en forma aproximada, si en un
conjunto de resultados de mediciones determinado, cul
ser aproximadamente la simetra de los mismos.
Ejemplo 2.
Consideremos ahora otras dos mediciones a las que
hemos denominado MED3 y MED4. La media aritmtica y
la desviacin estndar de sus resultados es el mismo y
adems ambas distribuciones son simtricas, segn se
muestra en sus grficas.






Ahora bien, independientemente que en los respectivos
resultados sus medias aritmticas, sus desviaciones
estndares son iguales y que ambas distribuciones son
simetricas, se observa que sus distribuciones son
bsicamente diferentes. En efecto los resultados de
MED3, son ms apuntados que los de MED4.
De lo anterior se infiere, que sera til tener una medida
por medio de la cual se pudiera realizar inferencias
acerca del apuntamiento de la distribucin. Esas
medidas, como se ver posteriormente, estn
relacionadas con la grfica de la distribucin normal.
Teora de los momentos de Pearson.
La teora de los momentos de Pearson debe su nombre a
la semejanza que tiene su estructura con la de los
momentos que se desarrolla en la Fsica. Como se ver
posteriormente, estos momentos no son ms que
promedios de potencias de las desviaciones de los
resultados de un conjunto de mediciones con respecto a
un valor de una medicin cualquiera, sin embargo los que
ofrecen un mayor campo de aplicacin son aquellos
donde el valor es un promedio y entre ellos
principalmente la media aritmtica.
Ahora bien, independientemente que puedan existir n
momentos, en la mayora de las ocasiones el investigador
est interesado en medidas que relacionen el primero y
segundo momentos, en algunos pocos problemas son
necesarios aadirles el tercero y el cuarto, pero es
rarsima la utilizacin de los momentos de quinto grado o
superiores, debido a la inestabilidad que presentan en
experimentos de muestro repetido, lo que los hace poco
confiables.
Momentos con respecto a la media
aritmtica.
Comenzaremos entonces a definir el momento con
respecto a la media ms general.
Definicin de momento respecto a la media de
orden k
Sea una medicin que se aplica a una muestra, cuyos
resultados son: x
1
, x
2
,...,x
n
. Se define como momento de
orden k de los resultados de la medicin y lo
denotaremos por M
k
, a la suma de las potencias de orden
k de las desviaciones con respecto a la media de los
resultados de la medicin. En smbolos:

Partiendo del momento de orden k, pueden
particularizarse los siguientes momentos:
1) Momento respecto a la media aritmtica de orden
1.

Este momento no tiene utilizacin prctica alguna,
debido al hecho de que cuaesquier sea el conjunto de
resultados de mediciones, M
1
siempre es cero.
En efecto:

2) Momento respecto a la media aritmtica de orden 2.

Segn se observa la expresin que adopta este momento
es idntica a la expresin que toma la varianza de una
poblacin.
3) Momento respecto a la media aritmtica de orden 3.

Como posteriormente se ver, este momento est
relacionado con la medida de la simetra (esquenosis) de
una distribucin.
Momento respecto a la media aritmtica de orden 4.

Anlogamente este momento se relaciona con una
medida del apuntamiento.
Coeficiente de esquenosis.
El coeficiente de esquenosis es la medida ms utilizada
para determinar el grado de simetra de una distribucin
de resultados de una medicin, que se encuentre al
menos en la escala de intervalos. Est expresado por:

Con relacin a l es preciso sealar que:

Es una medida adimensional
Esto es su resultado no depende de la unidad de medida
empleada.

Si se est en presencia de una distribucin simtrica
el valor del coeficiente de esquenosis es cero.&

Segn se observa en el ejemplo grfico anterior,
coinciden la media aritmtica, la mediana y la moda.

Si presenta la cola ms larga hacia la derecha el
coeficiente de esquenosis es positivo.


Si presenta la cola ms larga hacia la izquierda el
coeficiente de esquenosis es negativo

Coeficiente de Curtosis.
El coeficiente de curtosis es la medida ms utilizada del
grado de apuntamiento de una distribucin de resultados
de una medicin, que se encuentre al menos en la escala
de intervalos y viene expresado por:

Con relacin a l es preciso sealar que:

Es una medida adimensional
Esto es su resultado no depende de la unidad de medida
empleada.

Su clasificacin est relacionada con la
distribucin normal.
En efecto se tendrn los siguientes casos:

Si la distribucin es normal el coeficiente de
curtosis es cero.

En este caso la distribucin recibe el nombre de
mesocrtica.

Si la distribucin es ms apuntada que la
distribucin normal su coeficiente de curtosis
es positivo.

Recibiendo la denominacin de apuntada o
leptocrtica.

Si la distribucin es ms achatada que la
distribucin normal su coeficiente de curtosis
es negativo.

Recibe el nombre de achatada o platicrtica.
Preguntas.
1. Cmo se define el momento con respecto a la
media aritmtica de orden K?
2. De cul orden es el momento con respecto a la
media que est relacionado con:
1. La simetra de la representacin grfica de
los resultados de una medicin?
2. El apuntamiento de la representacin
grfica de los resultados de una medicin?
3. El valor del coeficiente de esquenosis de un
conjunto de resultados de mediciones depende de
las unidades de la medicin?
4. Cul es el valor del coeficiente de esquenosis
cuando la representacin grfica de los resultados
de las mediciones es:
1. Simtrica?
2. Simtrica a la derecha?
3. Simtrica a la izquierda?
5. Cul distribucin terica est asociada con el
apuntamiento?
6. Cul es el valor del coeficiente de curtosis cuando
la representacin grfica de los resultados de las
mediciones es:
1. Semejante a la distribucin normal?
2. Ms apuntada que la distribucin normal?
1. Qu nombre reciben este tipo de
distribucin de acuerdo a su
apuntamiento?
3. Ms achatada que la distribucin normal?
1. Qu nombre reciben este tipo de
distribucin de acuerdo a su
apuntamiento?

ESTADSTICOS
DESCRIPTIVOS
Las opciones que aparecen en el SPSS, relacionadas con
los estadgrafos descriptivos son las siguientes:
FRECUENCIAS
DESCRIPTIVOS
EXPLORAR
A continuacin aparece una descripcin de cada una de
ellas, con el fin de adelantar las posiblidades que el
paquete permite, a las que se puede acceder marcando
el hipervnculo correspondiente.
FRECUENCIAS
El procedimiento Frecuencias proporciona estadsticos y
representaciones grficas que resultan tiles para describir
muchos tipos de variables. Es un buen procedimiento para una
inspeccin inicial de los datos.
Para los informes de frecuencias y los grficos de barras, puede
organizar los diferentes valores en orden ascendente o
descendente u ordenar las categoras por sus frecuencias. Es
posible suprimir el informe de frecuencias cuando una variable
posee muchos valores diferentes. Puede etiquetar los grficos
con las frecuencias (la opcin por defecto) o con los porcentajes.
A continuacin se muestran las opciones que ofrece:

Estadgrafos:

frecuencias

porcentajes

porcentajes acumulados

media

mediana

moda

suma

desviacin tpica

varianza

amplitud (recorrido) (rango)

valores mnimo y mximo

error tpico de la media

asimetra y curtosis (ambos con sus errores tpicos)

cuartiles

percentiles especificados por el usuario.

Grficos:

grficos de barras

grficos de sectores

histogramas.
DESCRIPTIVOS
El procedimiento Descriptivos muestra los estadgrafos usuales
en el tratamiento de la informacin. Dentro de la opcin no
ofrece grficos, pero estos pueden ser obtenidos por la opcin
GRFICOS del men. En general las disponibilidades que
ofrece son:

Estadsticos de resumen univariados para varias variables en
una nica tabla

Calcula valores tipificados (puntuaciones z).
Cuando se guardan las puntuaciones z, stas se aaden a los
datos del Editor de datos, quedando disponibles para los
grficos, el listado de los datos y los anlisis.

Las variables se pueden ordenar por:

El tamao de sus medias (en orden ascendente o
descendente).

Alfabticamente o por el orden en el que se seleccionen las
variables (el valor por defecto).

Estadsticos.

Tamao de muestra

media

mnimo y mximo

desviacin tpica

varianza

rango (recorrido)

suma

error tpico de la media

curtosis y asimetra con sus errores tpicos.

EXPLORAR
El procedimiento Explorar genera estadsticos de resumen y
representaciones grficas, bien para todos los casos o bien de
forma separada para grupos de casos.
La inspeccin de los datos puede mostrar que existen valores
inusuales, valores extremos, discontinuidades en los datos u
otras peculiaridades. La exploracin de los datos puede ayudar a
determinar si son adecuadas las actuales o futuras tcnicas
estadsticas que est teniendo en consideracin para el anlisis
de los datos.
Existen numerosas razones para utilizar este procedimiento, las
principales son:

Inspeccionar los datos en general.

Identificar valores atpicos.

Obtener descripciones generales.

Comprobar el cumplimiento de algunas futuras premisas
fundamentales, tales como la normalidad y la homogeneidad
de varianzas.
Las disponibilidades que ofrece esta opcin son:

Valores extremos.

Los cinco valores mayores y cinco menores, en cada
variable

Estadgrafos usuales:

media

mediana

media recortada al 5%

error tpico

varianza

desviacin tpica

mnimo y mximo

amplitud (recorrido), (rango)

amplitud (recorrido), (rango) intercuartil

asimetra y curtosis y sus errores tpicos

percentiles (5, 10, 25, 50, 75, 90 y 95).

Estadgrafos robustos:

estimador-M de Huber

estimador en onda de Andrews

estimador-M redescendente de Hampel

estimador biponderado de Tukey.

Dcimas para la normalidad.

estadstico de Kolmogorov-Smirnov con el nivel de
significacin de Lilliefors para contrastar la normalidad (si
el tamao de muestra es mayor que 50)

estadstico de Shapiro-Wilk, (si el tamao de muestra es
menor o igual que 50).

Dcima de Levene para la homogeneidad de varianzas.

Diagramas de caja y bigotes.

Diagramas de tallo y hojas.

Histogramas.

Intervalos de confianza al 95%

Transformaciones.

SUMATORIAS

Introduccin.

Subndices.

Sumatorias.

Dobles sumatorias.

Ejemplos resueltos

Algunas propiedades de las sumatorias.

Ejercicios propuestos.
Introduccin.
En esta pgina se acometern algunos aspectos que son
utilizados con mucha frecuencia en el trabajo
conceptual, en el procesamiento y anlisis de las bases
de datos. Estos son:

Subndices.

Sumatoria.

Doble sumatoria.

Algunas propiedades de las sumatorias.
En el material se pretende presentar estos conceptos en
la forma ms operativa y orientados fundamentalmente
al tratamiento futuro que se har de ellos durante el
tema.

Subndices.
Partiremos de un ejemplo.
Ejemplo1.
Supongamos que estamos analizando una base de datos
que consta de dos mediciones: el peso corporal medido
en kilogramos y la talla en metros, a tres atletas. Como
ocurre normalmente, en la base de datos aparece, en la
primera columna, el orden del sujeto o ente que se est
midiendo y posteriormente las variables segn se
muestra:

Peso Talla
1 78,5 1,88
2 65,3 1,83
3 80,0 1,88
Si consideramos a las mediciones precedentes como
variables y denotamos a las mismas respectivamente por
X y Y, ser consecuente denominar a los resultados de las
mediciones con la misma letra pero en minscula. Ahora
bien, dado que en la base considerada, su tamao es
tres, ser lgico designar a los mismos mediante
subndices, de tal forma que los resultados de las
mediciones obtenidas podamos denotarlos por:

x
1
=78,5 x
2
=65,3 x
3
=80,

y
1
=1,88 y
2
=1,83 y
3
=1,88
Ahora bien, es posible denotar a los resultados de las
mediciones del peso, por la misma variable x; y por un
subndice generalizado, esto es una letra, digamos i, de
forma tal que cuando se plantee x
i
con i=1, 2, 3,;
estaremos haciendo referencia a lo planteado
anteriormente (x
1
=78,5 x
2
=65,3 x
3
=80) y de una
forma mucho ms sintticas.
Del mismo modo que en el caso de las variables que
representan a las mediciones, donde por costumbre son
denotadas por las letras x, y, z, en el caso de los
subndice se acostumbra a utilizarlos mediante las letras
i, j, k etc.
Consideremos ahora la siguiente situacin:

Ejemplo 2.
Se han registrado en un torneo de voleibol la calidad del
saque con respecto al tipo de enseanza de los
participantes, obtenindose la siguiente tabla:


Centro
Docente
Calidad del
Saque
ESPA IPUEC IPU
Satisfactorios 42 29 39
No
satisfactorios
4 2 7
Esta tabla, de doble entrada, recibe el nombre de Tabla
de Contingencia de orden 2, ya que para cualquier y
cada uno de los valores que se muestra en cada una de
sus seis celdas [(2filas)x(3columnas)=6 celdas], se le hace
corresponder un nivel respecto a cada una de las dos
variables que se estn midiendo. En efecto:

A 42 atletas le corresponde un nivel Satisfactorio del
saque en el Centro Docente ESPA, que es uno de los
niveles en que se encuentra la medicin Centro
Docente.

A 4 atletas le corresponde un nivel No satisfactorio del
saque en el Centro Docente ESPA, y as
sucesivamente.
De lo anterior se infiere que no nos bastar con un slo
subndice para denotar inequvocamente el resultado de
la medicin. Tendremos entonces necesidad de utilizar
dos subndice.

Denotemos por i el lugar que corresponde a la fila.
Luego al existir en la tabla dos filas, existirn dos niveles
i=1 i=2. Donde i=1, corresponde al nivel no satisfactorio y
el nivel i=2, al no satisfactorio.

Denotemos por j el lugar que corresponde a la
columna.
Luego al existir en la tabla tres columnas existirn tres
niveles. Don i=1 corresponde a los atletas que proceden
de las ESPA, i=2 a los del IPUEC, e i=3 a los del IPU.
De forma tal que si se tiene:


x
1,2
estaremos haciendo referencia al nmero de
saques satisfactorios alcanzados por los estudiantes de
los IPUEC.

x
2,3
quiere decir que estamos tratando acerca del
nmero de saques no satisfactorios alcanzados por los
estudiantes de los IPU.

x
i,j
a un trmino cualquiera de la tabla.
Sumatorias.
El concepto de sumatoria es un concepto analizado en la
Enseanza Media, y consiste en expresar la adicin de un
conjunto de trminos en forma sinttica. Su estructura
est dada por los siguientes elementos:

Smbolo de sumatoria. Este corresponde a la letra
mayscula griega sigma:

Una ley de formacin, llamada tambin trmino
general de la sumatoria.

Un subndice que relaciona desde que trmino va a ser
utilizada el trmino general de la sumatoria (lmite
inferior), hasta qu trmino alcanza (lmite superior).
Ejemplo 3.
Sea la sumatoria:

En ella observamos los siguientes elementos.

El smbolo de sumatoria (), que est indicando la
operacin a realizar.

El subndice que est ordenndole a la sumatoria que
sean sumados los trminos correspondientes a la
sustitucin de los valores de la i, (desde i=1 hasta i=5)
al trmino general de la sumatoria.

El trmino general, que en este caso es x
2
.





Ejemplo 4.
Sea la sumatoria:

En este caso al estar denotado el lmite superior por n,
los sumandos que sern considerados sern: 1, 2, 3, 4 y
as sucesivamente hasta n. De ah que se acostumbre a
situar algunos sumandos antes del ltimo termino,
separando los precedentes con tres puntos suspensivos y
finalizando con el ltimo trmino.
Ejemplo 5.
Sea la sumatoria:

Observe que en este caso:

La ley de formacin (x+8), consta de dos trminos los
cuales se consideran en el desarrollo de la sumatoria.

Al comenzar el lmite inferior por 2 (i=2), por ese
trmino se comienza la sustitucin.

El desarrollo de la sumatoria consta de cuatro
sumandos. En general el nmero de sumandos estar
dado por la diferencia entre el lmite superior (5) y el
lmite inferior (2), aadindole 1.
Dobles sumatorias.
Introduccin
En los ejemplos del prrafo anterior slo se han
analizado resultados de mediciones unidimensionales,
esto es que su efecto es afectado nicamente por una
variable. Esto no siempre ocurre necesariamente. En
efecto, podrn estar involucradas tantas sumatorias
como sea la dimensin considerada. Estas sumatorias
actuarn con respecto a las sumatorias que las preceden
como si existiera un parntesis entre ellas. Veamos un
ejemplo, sea la tabla de doble entrada:
Columnas (j)
Fila (i)
1 2 3
1 x
1,1
x
1,2
x
1,3

2 x
2,1
x
2,2
x
2,3

La suma de cada uno de los x
i,j
, esto es el total de los
elementos de la tabla est dada por:

La suma de la primera fila estar dada por todos los
elementos donde i=1:

La suma de la primera fila estar dada por todos los
elementos donde i=2:

La suma de los elementos de la primera columna estar
dada por todos los elementos donde j=1.

La suma de los elementos de la segunda columna estar
dada por todos los elementos donde j=2.

La suma de los elementos de la tercera columna estar
dada por todos los elementos donde j=3.

Veamos los siguientes ejemplos.
Ejemplos resueltos
Ejemplo 6.
Sea la tabla de doble entrada del ejemplo 2, a la que le
hemos adicionado los totales, por filas, por columnas y el
total general.
Centro
Docente
Calidad del
Saque
ESPA IPUEC IPU TOTAL
Satisfactorios 42 29 39 110
No
satisfactorios
4 2 7 13
TOTAL 46 31 46 123
En efecto:

Totales por filas.
Estos son: 110 y 13. Los que nos indican
respectivamente, que el total de sujetos con calidad del
saque satisfactorio es 110. Y anlogamente el total de
personas con el saque no satisfactorio es 13. Observe que
en cada uno de estos totales, estn confundidos en un
mismo nmero los atletas de todos los niveles (las tres
escuelas).

Totales por columnas.
Son 46 31 y 46. Aqu ocurre, anlogamente, que en los
respectivos totales de las columnas estn confundidos los
dos niveles correspondientes al saque.


Total general.
Segn se puede observar en la tabla este
total puede ser definido como:

La suma de los totales por filas.
110+113=123

La suma de los totales por columnas.
46+31+46=123

La suma de todos las entradas realizadas en las celdas
de la tabla.
42+29+39+4+2+7=123
Ahora bien, si quisiramos expresar
utilizando sumatorias, la suma de todas las
celdas, al estar denotado cada trmino por
x
i,j
, tendremos necesidad de utilizar en vez
de una sumatoria 2. En efecto se tendr
entonces que:

Anlogamente si quisiramos expresar los
totales por filas, mediante sumatorias, se
tendra que:

El total de la primera fila, puede ser expresado
entonces como:

Observe que el subndice i (que corresponde
a la fila) ha sido sustituido por 1.

El total de la segunda fila, mediante:

Observe que el subndice i (que corresponde
a la fila) ha sido sustituido por 2.

El total de la primera columna:

Observe que el subndice j (que
corresponde a la columna) ha sido
sustituido por 1.

El total de la segunda columna:

Observe que el subndice j (que
corresponde a la columna) ha sido
sustituido por 2.

El total de la tercera columna.

Observe que el subndice j (que
corresponde a la columna) ha sido
sustituido por 3.
Ejemplo 6.
Dada la siguiente tabla, obtener:
X
i
F
i
U
I
U
i
F
i
U
i
2
F
i

1 11 2 -7 -14 98
2 14 1 -6 -6 36
3 17 2 -5 -10 50
4 20 1 -4 -4 16
5 23 6 -3 -18 54
6 26 7 -2 -14 28
7 29 11 -1 -11 11
8 32 12 0 0 0
9 35 12 1 12 12
10 38 17 2 34 68
11 41 19 3 57 171
12 44 9 4 36 144
13 47 0 5 0 0
14 50 0 6 0 0
15 53 1 7 7 49
TOTAL 100 69 737
a) Cul es la expresin numrica de:

b) Que representa en los totales el nmero
69.
c) Cul es el valor de la sumatoria

Respuestas:
a) 100
b)
c) 737
Ejemplo 7.
Dada la tabla:
i x
i
y
i

1 3 4
2 2 0
3 0 5
4 3 3
Obtener las siguientes sumatorias:

Solucin.
En la tabla que nos dan como referencia,
solamente aparecen las leyes de formacin
para x
i
y y
i.

Una forma muy directa de hacer los incisos
que nos piden es, partiendo de la tabla que
aparece en los datos y analizando las leyes
de formacin de las sumatorias que nos
piden que encontremos su valor, formar
otra tabla donde aparezcan los trminos
generales de las sumatorias que nos
reclaman los incisos, transformando las
mediciones de acuerdo a las nuevas leyes
de formacin.
Se tendr entonces:
i x
i
y
i
(x
i
-2) (y
i
-3) (x
i
-2)
2
(y
i
-3)
2

(x
i
--2)
2
(y
i
-
3)
2

1 3 4 1 1 1 1 1
2 2 0 0 -3 0 9 0
3 0 5 -2 2 4 4 16
4 3 3 1 0 1 0 0
SUMA 8 12 0 0 6 14 17
De ah que tomando como respuesta la
suma en cada una de las leyes de formacin
se tenga:
Respuesta:
a) 8 b)12 c)0 d)0 e)6 f)14 g)17
Algunas propiedades de las
sumatorias.
Independientemente de la existencia de
varias propiedades en la sumatoria, existen
particularmente tres de ellas que resultan
muy tiles en el trabajo ellas son:
Propiedad 1.
La sumatoria de una suma algebraica es
igual a la suma algebraica de las sumatorias
de sus trminos. La que se expresa
sintticamente como:

Propiedad 2.
Sea k una constante. La sumatoria de una
constante por una variable es igual al
producto entre la constante y la sumatoria
de la variable. La que se expresa
sintticamente como:

Propiedad 3.
La sumatoria de una constante es igual al
producto de la constante multiplicada por
el nmero de trminos de la sumatoria. La
que se expresa sintticamente como:

Ejercicios propuestos.
Ejercicio 1. Desarrolle sin efectuar las siguientes
sumatorias.

Ejercicio 2. Exprese las siguientes sumas utilizando
sumatorias.

Ejercicio 3. Dada la siguiente tabla; calcule:
i X Y
1 0 1
2 2 4
3 3 2

Ejercicio 4. Pruebe que:

Ejercicio 5. Dados:

Hallar, aplicando las propiedades estudiadas:

DIAGRAMAS DE TALLO Y HOJAS

Introduccin.

Estructura del diagrama.

Introduccin.
El diagrama de tallo y hojas es un procedimiento
semigrfico, debido a J. W. Tukey, para mediciones
cuyos resultados se encuentran en la escala de intervalo
o superior (mediciones mtricas), que resulta
especialmente til en el Anlisis Exploratorio debido a
que es un vehculo idneo para:

Detectar valores atpicos, especialmente los no
extremos, en los resultados de las mediciones.

Realizar un pronstico acerca de la simetra de la
distribucin de los resultados de las mediciones.

Profundizar en la estructura de la recogida de
informacin, para averiguar anomalas relacionadas
con la recogida de la informacin, especialmente en
tamaos de muestra reducidos.
Antes de comenzar con la estructura del diagrama
pasemos brevemente a recordar el concepto de cifras
significativas.
Cifras significativas.
Se denominan como cifras significativas de un nmero a
los dgitos necesarios que forman al nmero, excluyendo
los ceros inmediatos despus del lugar decimal (coma,
punto) y los que se encuentran a la derecha de las cifras
enteras.
Ejemplo
Sean los siguientes nmeros: 0,000345 0,00345 34,5 3,45
3450000. Si en ellos se eliminan los ceros que se
encuentran a la derecha del lugar decimal y los que se
hayan al final de las cifras enteras, nos encontraremos
que a pesar de ser todos entre s diferentes, tienen en
cambio las mismas cifras significativas. Esto es 3,4,5.
Otra forma de acometer el problema de la obtencin de
cifras significativas, puede ser encauzado mediante la
expresin del nmero en notacin cientfica. Esto es
mediante el producto de un factor por una potencia de
10. Se tendr entonces que:
0.000345=3,45x10
-4

0,00345=3,45x10
-3

34,5=3,45x10
2

3,45=3,45x10
3450000=3,45x10
6

De ah que podamos decir tambin que las cifras
significativas de un nmero estar dado por la cantidad
de dgitos que tiene el nmero expresado en notacin
cientfica
Estructura del diagrama.
El diagrama de tallos y hojas realiza una particin de las
entradas realizadas en las variables en dos grupos,
considerando solamente las cifras significativas y no
teniendo en consideracin la posicin de los enteros (o
los decimales), dejando entonces al ancho del tallo
como factor indicativo de la dimensin del registro que
se est considerando.
De ah que la cifra significativa que se encuentre a la
derecha del nmero, constituir las hojas del respectivo
tallo. De ah que, si se tiene una base con n cifras
significativas, se tendr que:

El tallo constar de las primeras n-1 cifras
significativas.

Cada hoja estar formada por la cifra significativa
restante.
A continuacin veremos el siguiente ejemplo

Ejemplo1
Sean las variables siguientes:
VAR1 VAR2 VAR3 VAR4
1 13 113 1.13
1 14 114 1.14
1 14 114 1.14
1 22 122 1.22
1 24 124 1.24
3 25 125 1.25
3 27 127 1.27
3 27 127 1.27
3 33 133 1.33
3 34 134 1.34
3 35 135 1.35
4 42 142 1.42
4 47 147 1.47
5 52 152 1.52
5 61 161 1.61
5 72 172 1.72
6
6
7
7

Observe que las entradas realizadas a la primera variable
consta de una sola cifra significativa, la de la segunda de
dos cifras significativas, y las de la tercera y cuarta de
tres cifras significtivas.

Las salidas de los respectivos diagramas de tallos y hojas
se muestran a continuacin, donde:
Denominacin en
Ingls
Significado en
Espaol
Stem and Leaf
Plot
Diagrama de tallos
y hojas
Plot y hojas
Frequency Frecuencia
Stem width Ancho de tallo
Each leaf Cada hoja
Case (s) Caso (s)

VAR1 Stem-and-Leaf Plot
Frequency Stem & Leaf
5.00 1 00000
.00 2 .
6.00 3 . 000000
2.00 4 . 00
3.00 5 . 000
Stem width: 1
Each leaf: 1 case(s)
En el diagrama anterior se observa que no
aparecen valores para las hojas. Esto es
debido a que la variable consta de una sola
cifra significativa.
VAR2 Stem-and-Leaf Plot
Frequency Stem & Leaf
3.00 1 . 344
5.00 2 . 24577
3.00 3 . 345
2.00 4 . 27
1.00 5 . 2
1.00 6 . 1
1.00 7 . 2
Stem width: 10
Each leaf: 1 case(s)
En este caso y al ser el ancho del tallo
(Stem witht) 10, indica que hay que
multiplicar los dgitos por este nmero de
forma tal que, en el primer tallo, que
aparece:1 . 344,indican respectivamente las
siguientes entradas (10x1)+3=13;
(10x1)+4=14; y 10x1)+4=14 y as
sucesivamente con los restantes tallos.
VAR3 Stem-and-Leaf Plot
Frequency Stem & Leaf
3.00 11 . 344
5.00 12 . 24577
3.00 13 . 345
2.00 14 . 27
1.00 15 . 2
1.00 16 . 1
1.00 17 . 2
Stem width: 10
Each leaf: 1 case(s)
En este caso ocurre lo mismo con respecto
al ancho del tallo (stem width). Luego el
primer tallo cuya estructura es:3.00 11 .
344, indica respectivamente las siguientes
entradas: (11x10)+3=113; (11x10)+4=114 y
(11x10)+4=114 y as sucesivamente con los
restantes tallos.
VAR4 Stem-and-Leaf Plot
Frequency Stem & Leaf
3.00 11 . 344
5.00 12 . 24577
3.00 13 . 345
2.00 14 . 27
1.00 15 . 2
1.00 16 . 1
1.00 17 . 2
Stem width: .10
Each leaf: 1 case(s)
En este caso, donde la longitud del tallo
es 0,10, se tendr una estructura similar
Ejemplo 2.
Veamos el siguiente ejemplo, donde se muestra la
utilidad de este tipo de diagrama en el anlisis de la
estructura interna de la base.
Supongamos que estamos en presencia de una base de
datos, donde se han registrado el nmero de repeticiones
efectuadas durante un minuto y se ha obtenido el
diagrama de tallos y hojas siguiente:
Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 5 . 2
1.00 5 . 6
12.00 6 . 000000444444
8.00 6 . 88888888
8.00 7 . 22222222
6.00 7 . 666666
4.00 8 . 0044
2.00 8 . 88
1.00 9 . 2
Stem width: 10.00
Each leaf: 1 case(s)
Observe que en los grupos de hojas, aparece la secuencia
de dgitos 2, 6, 0, 4 y 8, y que esta secuencia se vuelve
a repetir. Esta situacin se hace sospechosa por los
motivos siguientes.


Dado que se supone que las mediciones han sido
tomadas al transcurrir un minuto, es de pensar que la
tendencia en los resultados de las mediciones tiende
ms hacia la aleatoriedad que hacia la uniformidad.
Esto no ocurre as ya que la secuencia aparecen
exclusivamente los dgitos 2, 6, 0 4 y 8.

Todos los registros realizados son mltiplos de cuatro.
Por lo que concluimos con una fuerte sospecha a pensar
que las repeticiones han sido obtenidas durante 15
segundos y luego han sido multiplicadas por cuatro.
VARIANZA, DESVIACIN TPICA

Definicin de varianza muestral.

Definicin de desviacin tpica o estndar
muestral.

Algunos aspectos importantes a tener en
cuenta en la varianza y la desviacin estndar.

Varianza (desviacin estndar) muestral y
poblacional.

Preguntas.

Definicin de varianza muestral.
Sea x
1
, x
2,
...,x
n
el conjunto de resultados de mediciones
que se encuentren al menos en la escala de intervalos
en una muestra, se define como varianza de la muestra y
se designa por s
2
a la expresin:

Con respecto a la varianza es importante sealar:

Su resultado es siempre un nmero no negativo.

Si la varianza es cero implica que todos los resultados
de la medicin en la muestra son iguales.

La varianza mide el grado de desviacin que presentan
los resultados de la medicin alrededor de la media
aritmtica de estos resultados.

Mientras ms grande sea este valor as ser la
dispersin de los resultados respecto a la media
aritmtica.

Tiene las mismas unidades que los resultados de la
muestra elevadas al cuadrado. Esto quiere decir que:

Si se est midiendo las planchas realizadas la unidad
que acompaa a la varianza ser planchas al
cuadrado.

Si se est midiendo los resultados en una prueba de
velocidad medidos en segundos, los resultados de la
varianza estarn dados en segundos cuadrados.
La varianza tiene un grupo de propiedades interesantes
que son mostradas en la pgina Propiedades.
Definicin de desviacin tpica o
estndar muestral.
Sea x
1
, x
2,
...,x
n
el conjunto de resultados de mediciones
que se encuentren al menos en la escala de intervalos
en una muestra, se define como desviacin tpica o
estndar de la muestra y se designa por s, a la raz
cuadrada positiva de la varianza.

Con respecto a la desviacin es importante sealar:

Su resultado es siempre un nmero no negativo.

Si la desviacin es cero implica que todos los
resultados de la medicin en la muestra son iguales.

La desviacin mide el grado de desviacin que
presentan los resultados de la medicin alrededor de
la media aritmtica de estos resultados.

Mientras ms grande sea este valor as ser la
dispersin de los resultados respecto a la media
aritmtica.

Tiene las mismas unidades que los resultados de la
muestra. Esto quiere decir que:

Si se est midiendo las planchas realizadas la unidad
que acompaa a la desviacin ser planchas.

Si se est midiendo los resultados en una prueba de
velocidad medidos en segundos los resultados de la
desviacin estarn dados en segundos.
La desviacin estndar tiene un grupo de propiedades
interesantes que son mostradas en la pgina
Propiedades.
Algunos aspectos importantes a
tener en cuenta en la varianza y
desviacin estndar.

La desviacin estndar es utilizada primordialmente en
resultados de investigaciones. La varianza en aspectos
tericos.
Segn se observa en sus respectivas definiciones la
varianza y la desviacin estn ntimamente relacionadas,
sin embargo el hecho de que la primera sea expresada en
las unidades originales al cuadrado, implica una
desventaja en la exposicin de los resultados de las
investigaciones sobre todo cuando esta se realiza ante
personas no familiarizadas con el anlisis de datos. Sin
embargo la varianza de por s tiene una fuerza propia
que se hace ostensible y la hace imprescindible en
cuestiones tericas.

Tanto en la desviacin estndar como la varianza slo
es posible establecer comparaciones entre dos
muestras siempre y cuando sus medias aritmticas
sean iguales.
Analicemos lo anterior, mediante la desviacin estndar.
Supongamos que se tienen los siguientes resultados en
dos grupos:
Grupo
Media
aritmtica
Desviacin tpica o
estndar.
A 1,73 m 0,05 m
B 1,73 m 0,18 m
Al ser la media aritmtica de los dos grupos iguales, es
posible establecer que a mayor valor de la desviacin
estndar, mayor dispersin y concluir que:
El Grupo B presenta mayor dispersin que el Grupo A
Sin embargo si se tuviera una situacin diferente por
ejemplo:
Grupo
Media
aritmtica
Desviacin tpica o
estndar.
A 1,73 m 0,05 m
B 1,72 m 0,18 m
No podemos llegar a ninguna conclusin acerca de
donde existe mayor dispersin.
Es de imaginar que es muy difcil en una base de datos el
tener resultados de mediciones con idnticas medias
aritmticas.

Si nos preguntaran que es o que significa la desviacin
tpica o estndar qu responderamos.
Han existido ocasiones en que durante el transcurso de la
exposicin de los resultados de investigaciones en donde
ha sido realizada esta pregunta. Algunas de las
respuestas cortas posibles son:

Es una medida de dispersin.

Es una medida de dispersin dada por:


En algunos textos la varianza (desviacin estndar)
aparece dividida por n y en otros aparece dividida por
n-1?
Para contestar a esta pregunta es preciso particionarla
en dos partes:
1. Concepto de grados de libertad.
2. Varianza (desviacin estndar) poblacional y
muestral.
Grados de libertad.
Consideremos que se tiene una muestra formada por tres
resultados que se desconocen, x
1
, x
2
y x
3
tales que su
media aritmtica sea 6.
Dado que:

Se tendr que:
x
1
+x
2
+x
3
=3(60) de donde x
1
+x
2
+x
3
=180
Si despejemos uno de estos resultados, digamos x
3
se
tendr que:
x
3
=180-x
1
-x
2

Resulta evidente que la igualdad anterior no se cumple
para cualquier terna de resultados, sino solamente
aquellos en donde se cumple la relacin anterior.
Por ejemplo no se cumple si x
1
=4 x
2
=1 y x
3
=2
Sin embargo, s es posible cambiar libremente a dos de
estos resultados y cuando esto se haga, automticamente
quedar fijado el siguiente. En efecto:
Si por ejemplo: x
1
=4 y x
2
=1 entonces x
3
=180-4-1=175.
Si lo anterior lo generalizamos a una muestra de tamao
n donde es fija su media aritmtica, tendremos que es
posible realizar libremente n-1 cambios.
Si consideramos que al calcular la desviacin estndar o
la varianza, nuestro primer paso es hallar la media
aritmtica de la muestra, ocurrir que si se tienen n
resultados, solamente es posible cambiar libremente a n-
1 de ellos. Explicado lo anterior podemos pasar entonces
a analizar el concepto Grados de libertad.
Concepto de grados de libertad.
Si consideramos:

Una muestra de n resultados.

Un conjunto de n variables.
Podemos decir entonces que los grados de libertad son:

El nmero de resultados que pueden ser tomados
libremente.

El nmero de variables que varan libremente

El nmero de variables independientes.
Varianza (desviacin estndar)
muestral y poblacional.
Supongamos que estamos en presencia de una poblacin
de resultados y de ellos tomamos un nmero
considerable de muestras de tamao n.
Calculemos en cada una de estas muestras su varianza
utilizando las dos expresiones siguientes. Sean estas:
s
1
2
, s
2
2
,...,s
n
2
. y


Ser lgico debamos elegir entre una u otra, aquella cuyo
promedio de las varianzas se aproxime ms a la varianza
de la poblacin.
Se ha comprado que de las dos anteriores aquella que se
acerca ms al valor poblacional es la que est dividida
(sus grados de libertad son) n-1.
Este es entonces el motivo que se ha escogido como
expresin para la varianza muestral aquella en donde
aparece el denominador dividido por n-1. Esto es:

Y tomando como expresin de la varianza poblacional a.

Es evidente que la expresin de la desviacin estndar
poblacional ser la raz cuadrada de la anterior esto es:

Preguntas.
1. Cul es la definicin de varianza muestral.?
2. Cul debe ser la escala de medicin de los
resultados para ser aplicada la varianza muestral?
3. Cul es su notacin?
4. Es posible que el resultado de la varianza de un
conjunto de resultados de mediciones sea un
nmero negativo?
5. Qu caracterstica tendr el conjunto de los
resultados de una medicin en los que su varianza
es cero?
6. Supongamos que se tiene un conjunto de
resultados de mediciones cuya unidad es u, en
cules unidades estar expresada la varianza?
7. Cul es la definicin de desviacin tpica o
estndar muestral.?
8. Cul debe ser la escala de medicin de los
resultados para ser aplicada la desviacin tpica o
estndar?
9. Cul es su notacin?
10. Es posible que el resultado de la desviacin tpica
o estndar de un conjunto de resultados de
mediciones sea un nmero negativo?
11. Qu caracterstica tendr el conjunto de los
resultados de una medicin en los que su
desviacin tpica o estndar es cero?
12. Supongamos que se tiene un conjunto de
resultados de mediciones cuya unidad es u, en
cules unidades estar expresada la desviacin
tpica o estndar?
13. Cul de las dos medidas la varianza o la
desviacin tpica es utilizada usualmente en
resultados de investigaciones?
14. Supongamos que estamos en presencia de dos
conjuntos cuyas desviaciones estndares son s
1
y s
2

tales que s
1
>s
2
Podemos decir que la dispersin
en el conjunto cuya desviacin es s
2
tiene una
dispersin mayor que los resultados del otro
conjuntos? Argumente su respuesta.
15. Cmo se denota a la varianza poblacionall?
16. Cmo se denota a la desviacin tpica o estndar
poblacional?

BIBLIOGRAFA
Afifi, A. A. y Azen S. P. Statistical Analisis a computer
oriented approach. New York, Academic Press, 1974
Chambers, J. M. et al. Graphical Methods for Data Analysis.
Boston, Duxburry Press, 1983.
Churchman, C. W y P. Ratoosh. Measurements, Definitions and
Theory. New York, Willey and Sons, 1959.
Cleveland, W. S. y R. Mc. Gill. Graphical Perception Theory,
Experimentation and Application to the Development of
Graphical Methods. U.S.A, Journal of the American
Statistical Association, 79, 807-822, 1984.
Cochran William G. Tcnicas de Muestreo. Mxico, Compaa
Editorial Continental, 1974.
Dixon, W. J. y J. Massey Jr. Introduccin al Anlisis
Estadstico. Ciudad de La Habana, Editorial Pueblo y
Educacin, 1980.
Ehhrenfeld, S. y S, Littauer. Introduction to Statistical Meted.
Ciudad de La Habana, Editorial Revolucionaria, 1970.
Freund, John, E. Estadstica Elemental Moderna. Ciudad de la
Habana, Editorial Pueblo y Educacin, 1977.
Gotkin, L. G. y L. S. Goldstein. Estadstica Descriptiva, Texto
Programado. Tomo I. Ciudad de La Habana, Editorial
Pueblo y Educacin.
Guerra Bustillo, C. W. et al. Estadstica. Ciudad de La Habana,
Editorial Pueblo y Educacin, 1987.
Hoaglin D. C., Mosteller G y Tukey J. W. Undrestanding
Robust and Exploratory Data Analysis. New York, Willey
and Sons, 1983.
Hoel, P. G. Introduccin a la Estadstica Matemtica. Ciudad de
La Habana, Instituto Cubano del Libro, Edicin
Revolucionaria, 1972.
Linares Fleites Gladys. Anlisis de Datos. Ciudad de La
Habana, Empresa Nacional de Produccin del MES, 1990.
Martnez Canalejo, H. y S, Santana Porbn. Manual de
Procedimientos Bioestadsticos. Tomo 1. Ciudad de La
Habana, Instituto Superior de Ciencias Mdicas, 1990.
Mood, A. M. y F. A. Graybill. Introduccin a la Teora
Estadstica. 4ta. Edicin. Madrid, Editorial Aguilar,
1965.
Ostle, B. Estadstica Aplicada. Ciudad de La Habana. Editorial
Cientfico Tcnica, 1979.
Pearson, E. S. y H. O. Hartley. Biomtrica Tables for Staticians.
Tercera edicin, volume I. Cambridge, Biomtrica
Trustees., 1970
Royston, J. P. An extension of Shapiro and Wilk's W test for
normality to large samples. Applied Statistics, 31, 115-124,
1982
Sdenecor, G. W. y W. G. Cochran. Statistical Methods. Iowa,
The Iowa State University Press, 1977.
Spiegel, M. R. Teora y Problemas de Estadstica. Ciudad de La
Habana, Editorial Pueblo y Educacin, 1977.
Tukey, J. W. The Future of Data Analysis. U.S.A, Annals of
Mathematical Stattistics, 33, 1-67.
Yamane, T. Statisticss; An introductory Analisys. Segunda
Edicin. Ciudad de La Habana, Editora Revolucionaria,
1970
Zatsiorsky, V. M. et al. Metrologa Deportiva. Mosc, Editorial
Planeta, 1989.


1
Ttulo. Anlisis de Varianza de una
clasificacin por Rangos de Kruskal-Wallis.



Premisas
La nica premisa que se necesita es que las mediciones se encuentren al menos en
escala ordinal.
Potencia-Eficiencia
Esta prueba tiene una potencia de 95.5% con relacin a su dcima paramtrica similar
ANOVA clasificacin simple.
Caractersticas de la dcima

La prueba de Kruskal-Wallis puede ser utilizada en cualquier situacin donde el
ANOVA de clasificacin simple sea aplicable. El anlisis no paramtrico puede ser
aplicado cuando las K muestras no provengan de poblaciones normales y/o cuando las
K varianzas poblacionales sean heterogneas. El procedimiento se basa en el trabajo con
los rangos de las mediciones en las variables, y las sumas de estos rangos.
.
Hiptesis

Ho: Los resultados promedios obtenidos en los K grupos son iguales.
H
1
: Los resultados promedios obtenidos en los K grupos no son iguales.

Estadgrafo y distribucin muestral

H = ( )

+
+
K
i
i
i
N
n
R
N N
1
2
1 3
) 1 (
12

Donde:
i
n : es el nmero de observaciones en el i-simo grupo.
N : es el nmero total de observaciones en todos los K grupos.
k
n n n N + + + ....
2 1

i
R : es la suma de los rangos de las
i
n observaciones en el grupo i.


Si los tamaos de c/u de las muestras son mayores que 5 y/o para K>3 puede
considerarse que la distribucin muestral se aproxima a la distribucin
2
con K-1


2
grados de libertad. En caso contrario existen tablas con la probabilidad exacta de la
dcima.


Ejemplo
Un metodlogo de cultura fsica de un Municipio desea determinar dados 4
mtodos de ejercicios para bajar de peso, cual de estos resulta ser el ms eficiente.
Para esto el toma 4 muestras aleatorias de individuos a los cuales se les aplicaron
los diferentes mtodos de entrenamiento y procedi al anlisis de sus pesos. Las
mediciones correspondientes a los pesos de los analizados aparecen en la tabla
siguiente:
WORK 1 al 3 y HOBBY 1 son los nombres de los correspondientes grupos.
Esta base de datos fue tomada de un ejemplo que presenta el programa.

WORK_1 WORK_2 WORK_3 HOBBY_1
1 105.126 101.659 115.060 100.998
2 77.049 72.933 77.485 72.744
3 86.017 82.206 78.889 77.951
4 91.425 106.107 95.640 90.901
5 113.714 92.029 99.079 79.277
6 86.606 87.817 67.663 93.662
7 95.067 94.505 98.081 94.513
8 113.500 104.607 105.572 101.008
9 104.549 97.299 94.074 88.538
10 104.635 97.908 85.823 82.486
11 102.064 87.010 94.687 79.203
12 109.428 94.937 104.396 119.293
13 89.994 77.392 100.771 97.026
14 89.983 91.259 89.216 81.250


Hiptesis:
Ho: El peso promedio obtenido en cada grupo es igual para cada uno de ellos.
H
1
: El peso promedio obtenido en cada grupo no es igual para cada uno de ellos.

Mtodo de trabajo:
1- Se procede a hallar los rangos de las mediciones.
2- Se calculan las sumas de los rangos en cada grupo.
3- Se calcula el valor de H aplicando la frmula.

2- WORK 1 WORK 2 WORK 3 HOBBY 1
482 380 409 325

3-H = 3.4441


3
Estructura de la base de datos
Deben ser ubicadas las mediciones de cada grupo uno a continuacin del otro en una
sola columna para la variable a analizar y deber crearse una variable nueva
clasificadora que nos permitir conocer cuales son las mediciones que pertenecen a cada
grupo.



Salidas de la dcima


En la salida aparecen reflejados el valor del estadgrafo H=3.444152 los df=3 (grados de
libertad) y el valor de p= 0.3281. Adems aparecen los tamaos de las muestras
analizadas y los resultados de las sumas de los rangos en cada muestra.

Conclusiones: No se rechaza a Ho, por tanto no existen diferencias significativas entre
los pesos de los grupos y podemos decir que no existe un mtodo mejor que otro.
Tcnicas adicionales a la dcima



4
1-Diagramas de cajas y bigotes.
2-Histogramas.


.
Estadgrafos que deben acompaar a los estadgrafos de la dcima.
Medias, varianzas, medianas, curtiles, mnimos y mximos.





Diagramas de Caja y Bigotes.



Podemos apreciar que los valores de las medianas en los diferentes grupos no distan
mucho adems podemos apreciar mayor dispersin en los pesos de los grupos 3 y 4.



5

Histogramas





Arnaldo Herrera.


6
Ttulo. Dcima de Chi-cuadrado para la
homogeneidad.
Utilizacin
Se utiliza cuando deseamos determinar el grado de significacin de la diferencia entre
las proporciones poblacionales de f grupos independientes.
Premisas
La nica premisa que se necesita es que las mediciones se encuentren al menos
en una escala nominal.
La cantidad de sujetos en cada grupo puede ser fija, pero las mediciones que se
realizan en los grupos tienen que ser aleatorias.

Existen algunos criterios con respecto al tamao de muestra que son:

1. e
i
5
2. Que en el 80% de las celdas e
i,j
5 y que el 20% de las frecuencias esperadas
de las restantes celdas sean mayores que 1 y menores que 4.
Potencia-Eficiencia
.La potencia eficiencia de esta dcima no tiene sentido de ser analizada, dado que su
nivel de medicin es muy bajo (escala nominal)
Caractersticas de la dcima
.
Hiptesis
H
o
: Las proporciones de las poblaciones son iguales.
La hiptesis nula puede ser expresada sintticamente mediante:
c o
H ... :
2 1

H
1
: Existen al menos una pareja de proporciones poblacionales diferentes.
Estadgrafo y distribucin muestral

f
1 i
c
1 j
,
2
, j i,
2
) (o
j i
j i
e
e



Donde:


7
i: orden del grupo j: nivel del factor que se utiliza
f: cantidad de grupos c: cantidad de niveles del factor que se utiliza.
o
i,j:
frecuencia observada en la celda i,j

f
i,j:
frecuencia observada en la celda i,j

Para tamaos de muestra lo suficientemente grandes el estadgrafo sigue la
distribucin chi-cuadrado con (f-1)(c-1) grados de libertad.
Estructura de la base de datos

La base de datos constar de dos variables, en una de ellas se indicar el grupo al que
pertenece el sujeto y en la otra la medicin (nominal) que ha sido realizada. Segn se
muestra:

SEXO EVALUACI
1 MASCUL MUY BIEN
2 FEMENIN REGULAR
3 FEMENIN MUY BIEN
4 FEMENIN EXCELENT
5 MASCUL REGULAR
6 FEMENIN MUY BIEN
7 FEMENIN REGULAR
8 FEMENIN REGULAR
9 MASCUL EXCELENT
10 FEMENIN REGULAR
11 FEMENIN MAL
12 FEMENIN REGULAR
13 FEMENIN MUY BIEN
14 FEMENIN EXCELENT
15 MASCUL MAL
16 FEMENIN REGULAR
17 FEMENIN REGULAR
18 FEMENIN REGULAR
19 FEMENIN REGULAR
20 FEMENIN MUY BIEN
21 MASCUL REGULAR
22 FEMENIN EXCELENT
23 MASCUL REGULAR
24 FEMENIN MUY BIEN
25 MASCUL EXCELENT
26 MASCUL EXCELENT
27 MASCUL EXCELENT
28 FEMENIN EXCELENT
29 FEMENIN REGULAR
30 FEMENIN REGULAR
31 FEMENIN REGULAR
32 FEMENIN EXCELENT
33 FEMENIN REGULAR
34 FEMENIN REGULAR
35 FEMENIN EXCELENT


8
36 MASCUL MUY BIEN
37 FEMENIN REGULAR
38 FEMENIN EXCELENT
39 FEMENIN REGULAR
40 FEMENIN EXCELENT
41 FEMENIN EXCELENT
42 MASCUL EXCELENT
43 FEMENIN MUY BIEN
44 MASCUL REGULAR
45 MASCUL REGULAR
46 FEMENIN REGULAR
47 FEMENIN MAL
48 FEMENIN REGULAR
49 FEMENIN MUY BIEN
50 FEMENIN MUY BIEN
51 FEMENIN MUY BIEN
52 FEMENIN REGULAR
53 FEMENIN REGULAR
54 FEMENIN EXCELENT
55 FEMENIN MUY BIEN
56 FEMENIN MAL
57 FEMENIN REGULAR
58 FEMENIN REGULAR
59 FEMENIN REGULAR
60 MASCUL EXCELENT
61 FEMENIN EXCELENT
62 FEMENIN EXCELENT
63 FEMENIN MAL
64 FEMENIN REGULAR
65 FEMENIN EXCELENT
66 FEMENIN REGULAR
67 FEMENIN EXCELENT
68 FEMENIN REGULAR
69 FEMENIN EXCELENT
70 FEMENIN REGULAR
71 FEMENIN EXCELENT
72 FEMENIN EXCELENT
73 FEMENIN REGULAR
74 FEMENIN REGULAR
75 MASCUL REGULAR
76 MASCUL REGULAR
77 FEMENIN MUY BIEN
78 FEMENIN REGULAR
79 FEMENIN EXCELENT
80 FEMENIN REGULAR
81 FEMENIN REGULAR
82 FEMENIN REGULAR
83 FEMENIN REGULAR
84 MASCUL REGULAR
85 FEMENIN EXCELENT
86 FEMENIN REGULAR


9
87 FEMENIN EXCELENT
88 FEMENIN REGULAR
89 FEMENIN REGULAR
90 FEMENIN EXCELENT
91 FEMENIN EXCELENT
92 FEMENIN REGULAR
93 FEMENIN MUY BIEN
94 MASCUL EXCELENT
95 FEMENIN EXCELENT
96 FEMENIN EXCELENT
97 FEMENIN MUY BIEN
98 MASCUL REGULAR
99 MASCUL REGULAR
100 FEMENIN EXCELENT
101 FEMENIN REGULAR
102 FEMENIN REGULAR
103 FEMENIN REGULAR
104 FEMENIN REGULAR
105 FEMENIN REGULAR
106 FEMENIN MUY BIEN
107 MASCUL MUY BIEN
108 FEMENIN EXCELENT
109 FEMENIN REGULAR
110 MASCUL MUY BIEN
111 FEMENIN EXCELENT
112 FEMENIN REGULAR
113 FEMENIN REGULAR
114 MASCUL EXCELENT
115 FEMENIN MAL
116 MASCUL REGULAR
117 FEMENIN MAL
118 FEMENIN EXCELENT
119 FEMENIN EXCELENT
120 FEMENIN REGULAR
121 FEMENIN MUY BIEN
122 MASCUL EXCELENT
123 FEMENIN REGULAR
124 FEMENIN REGULAR
125 FEMENIN MAL
126 FEMENIN REGULAR
127 FEMENIN EXCELENT
128 MASCUL MAL
129 FEMENIN MAL
130 MASCUL MUY BIEN
131 FEMENIN MUY BIEN
132 FEMENIN REGULAR
133 FEMENIN MUY BIEN
134 FEMENIN REGULAR
135 FEMENIN EXCELENT
136 FEMENIN REGULAR
137 FEMENIN EXCELENT


10
138 FEMENIN MAL
139 FEMENIN MUY BIEN
140 MASCUL REGULAR
141 MASCUL REGULAR
142 MASCUL REGULAR
143 MASCUL EXCELENT
144 FEMENIN REGULAR
145 FEMENIN EXCELENT
146 FEMENIN REGULAR
147 MASCUL EXCELENT
148 MASCUL REGULAR
149 FEMENIN EXCELENT
150 FEMENIN MUY BIEN
151 FEMENIN REGULAR
152 FEMENIN REGULAR
153 FEMENIN REGULAR
154 FEMENIN EXCELENT
155 FEMENIN EXCELENT
156 FEMENIN MUY BIEN
157 FEMENIN MAL
158 FEMENIN MAL
159 FEMENIN MAL
160 FEMENIN REGULAR
161 FEMENIN MUY BIEN
162 FEMENIN REGULAR
163 FEMENIN MAL
164 FEMENIN MAL
165 FEMENIN EXCELENT
166 MASCUL EXCELENT
167 FEMENIN EXCELENT
168 FEMENIN EXCELENT
169 FEMENIN REGULAR
170 FEMENIN REGULAR
171 FEMENIN MAL
172 FEMENIN REGULAR
173 MASCUL MUY BIEN
174 FEMENIN EXCELENT
175 FEMENIN REGULAR
176 FEMENIN REGULAR
177 FEMENIN MAL
178 FEMENIN REGULAR
179 FEMENIN MUY BIEN
180 FEMENIN EXCELENT
181 FEMENIN REGULAR
182 FEMENIN REGULAR
183 MASCUL REGULAR
184 FEMENIN EXCELENT
185 FEMENIN MUY BIEN
186 FEMENIN MUY BIEN
187 FEMENIN REGULAR
188 FEMENIN EXCELENT


11
189 FEMENIN MAL
190 FEMENIN EXCELENT
191 FEMENIN REGULAR
192 FEMENIN REGULAR
193 FEMENIN REGULAR
194 FEMENIN EXCELENT
195 FEMENIN REGULAR
196 FEMENIN EXCELENT
197 FEMENIN MUY BIEN
198 FEMENIN EXCELENT
199 FEMENIN REGULAR
200 FEMENIN EXCELENT

Salidas de la dcima y tcnicas adicionales
Las salidas de la dcima aparecern el valor del estadgrafo de chi-cuadrado y el valor
de probabilidad obtenido.
Es prctica comn que aparezca junto a los resultados de la dcima los siguientes tablas
de contingencia:
Frecuencias observadas
Por-ciento de las frecuencias observadas.
Frecuencias esperadas.
Residuos (diferencia entre la frecuencia observada y la frecuencia esperada por
celdas).

Adems son convenientes utilizar los siguientes:

Histogramas por categoras.
Histograma en tercera dimensin.

Los que se muestran a continuacin.

data file: (chicua.sta) [ 200 cases with 2 variables ]

VARIABLE SPECIFICATIONS:

No Name Format MD Code Long Label

1 SEXO 8.0 -9999
5 EVALUACI 9.0 -9999

STAT. Summary Frequency Table (chicua.sta)
BASIC Table: SEXO(2) x EVALUACI(4)
STATS

EVALUACI EVALUACI EVALUACI
EVALUACI Row


12
SEXO EXCELENT MUY BIEN REGULAR MAL
Totals

FEMENIN 48 25 74 17 164
MASCUL 12 6 16 2 36

All Grps 60 31 90 19 200

STAT. Summary Table: Percentages of Column Totals (chicua.sta)
BASIC Table: SEXO(2) x EVALUACI(4)
STATS

EVALUACI EVALUACI EVALUACI EVALUACI Row
SEXO EXCELENT MUY BIEN REGULAR MAL Totals

FEMENIN 80.00 80.65 82.22 89.47
82.00
MASCUL 20.00 19.35 17.78 10.53
18.00

All Grps 30.00 15.50 45.00 9.50




13

STATISTICA: Basic Statistics and Tables 05-31-01 01:53 PAGE 165

STAT. Summary Table: Percentages of Row Totals (chicua.sta)
BASIC Table: SEXO(2) x EVALUACI(4)
STATS

EVALUACI EVALUACI EVALUACI
EVALUACI Row
SEXO EXCELENT MUY BIEN REGULAR MAL
Totals

FEMENIN 29.27 15.24 45.12 10.37 82.00
MASCUL 33.33 16.67 44.44 5.56 18.00

All Grps 30.00 15.50 45.00 9.50

STAT. Summary Table: Percentages of Total N=200 (chicua.sta)
BASIC Table: SEXO(2) x EVALUACI(4)
STATS

EVALUACI EVALUACI EVALUACI
EVALUACI Row
SEXO EXCELENT MUY BIEN REGULAR MAL
Totals

FEMENIN 24.00 12.50 37.00 8.50 82.00
MASCUL 6.00 3.00 8.00 1.00 18.00

All Grps 30.00 15.50 45.00 9.50

STAT. Summary Table: Expected Frequencies (chicua.sta)
BASIC
STATS Pearson Chi-square: .923178, df=3, p=.819831

EVALUACI EVALUACI EVALUACI
EVALUACI Row
SEXO EXCELENT MUY BIEN REGULAR MAL
Totals

FEMENIN 49.20000 25.42000 73.80000 15.58000 164.0000
MASCUL 10.80000 5.58000 16.20000 3.42000 36.0000

All Grps 60.00000 31.00000 90.00000 19.00000 200.0000

STATISTICA: Basic Statistics and Tables 05-31-01 01:53 PAGE 166
STAT. Summary Table: Observed minus Expected Frequencies
BASIC
STATS Pearson Chi-square: .923178, df=3, p=.819831


14

EVALUACI EVALUACI EVALUACI
EVALUACI Row
SEXO EXCELENT MUY BIEN REGULAR MAL
Totals

FEMENIN -1.20000 -.420000 .200000 1.42000 -.000000
MASCUL 1.20000 .420000 -.200000 -1.42000 -.000000

All Grps -.00000 -.000000 .000000 -.00000 -.000000

Categorized Histogram: SEXO x EVALUACI
N
o

o
f

o
b
s
SEXO: FEMENIN
0
20
40
60
80
EXCELENT
MUY BIEN
REGULAR
MAL
SEXO: MASCUL
EXCELENT
MUY BIEN
REGULAR
MAL





15

STATISTICA: Basic Statistics and Tables
05-31-01 01:53 PAGE 167




16
Ttulo. El coeficiente de correlacin de
rango de Spearman. (r
s
)

Premisas
La nica premisa que se necesita es que las mediciones se encuentren al menos en una
escala ordinal.
Potencia-Eficiencia
La eficiencia de la correlacin de rango de Spearman cuando se compara con la
correlacin de Pearson, es de cerca del 91%. Eso quiere decir que si existe una
correlacin entre X e Y en esa poblacin, r
s
necesitar 100 casos para establecer esa
correlacin al mismo nivel de significacin que r lo logra con 91 casos.
.
Caractersticas de la dcima

El coeficiente de correlacin de Spearman se utiliza para determinar el grado de
asociacin entre variables a travs de 2 conjuntos de n pares de observaciones. Este
coeficiente requiere slo de la determinacin de los rangos de cada sujeto respecto a
cada una de las 2 variables y del hallazgo de la diferencia de estos rangos. Este se basa
en la idea de que si dos variables X e Y estn correlacionadas, las posiciones relativas
de los sujetos dentro de las series ordenadas no deben diferir mucho y por tanto las
diferencias de los rangos no deben diferir mucho de cero. El coeficiente de correlacin
de Spearman es una medida de estas diferencias.
Hiptesis
Ho: = 0 Tambin: no existe asociacin entre las variables en la poblacin.
H
1
: 0 existe asociacin entre las dos variables en la poblacin.

Estadgrafo y distribucin muestral

R
s
= 1
n n
d
n
i
i

3
1
2
6



T = R
s

2
1
2
s
r
n





17
R
S
: Coeficiente de correlacin de Spearman.
D
i
: Diferencia entre cada pareja de rangos.
N : Tamao de la muestra.
T: Estadgrafo.
En cuanto a la distribucin muestral del estadgrafo tenemos que para n 10 este est
distribuido segn la distribucin t de student con n-2 grados de libertad.
Ejemplo
Un entrenador de pesas quiere determinar si existe relacin lineal entre las variables
cantidad de cuclillas realizadas y salto vertical, las cuales son medidas en los test
pedaggicos que ellos les aplican a sus atletas. Para realizar su anlisis el toma una
muestra aleatoria de los atletas de un rea deportiva y realiza las mediciones
correspondientes. Los datos estn dados en la siguiente tabla:

CUCLILLA FZAACOST FZAPARD SSCI SALTOVER
1 60.000 40.000 35.000 1.500 34.000
2 47.500 40.000 35.000 1.500 31.000
3 80.000 50.000 45.000 1.950 33.000
4 75.000 40.000 40.000 1.900 28.000
5 90.000 50.000 45.000 2.600 36.000
6 80.000 50.000 40.000 1.400 31.000
7 47.500 35.000 30.000 1.450 38.000
8 90.000 50.000 35.000 2.000 34.000
9 70.000 55.000 50.000 1.900 30.000
10 75.000 50.000 45.000 1.500 30.000
11 90.000 60.000 55.000 2.000 28.000
12 80.000 55.000 50.000 2.000 30.000
13 90.000 60.000 50.000 1.800 28.000
14 47.500 65.000 60.000 2.000 40.000
15 70.000 55.000 50.000 1.860 35.000
16 110.000 70.000 60.000 2.100 43.000

Las hiptesis son: Ho: = 0; H
1
: 0


18

Mtodo de trabajo sin el paquete estadstico:
Se construye una tabla que contenga los rangos de cada variable y las diferencias entre
los rangos.
RANGOS
cuclillas salto vertical diferencias
1 4.000 10.500 -6.5
2 2.000 7.500 -5.5
3 10.000 9.000 1
4 7.500 2.000 5.5
5 13.500 13.000 0.5
6 10.000 7.500 2.5
7 2.000 14.000 -12
8 13.500 10.500 3
9 5.500 5.000 0.5 r
s =
-0.1586
10 7.500 5.000 2.5
11 13.500 2.000 11.5
12 10.000 5.000 5
13 13.500 2.000 11.5
14 2.000 15.000 -13
15 5.500 12.000 -6.5
16 16.000 16.000 0

Tenemos que calcular a r
s
utilizando la frmula.

Salidas de la dcima


Conclusiones: No se rechaza a Ho por tanto no existe correlacin entre las variables en
la poblacin.
Tcnicas adicionales a la dcima

Coeficientes de Kendall y el Gamma.

Tcnicas auxiliares para respaldar los resultados obtenidos en la
conclusin.

1- Histogramas.
2- Diagramas de dispersin




19


Estructura de la base de datos
La misma que presentan los datos del ejemplo. Se forma la base de datos poniendo las
variables a analizar una al lado de otra.



Arnaldo Herrera.


20
Dcima de la U de Mann y Whitney.
Premisas

La nica premisa que se necesita es que las mediciones se encuentren al menos en una
escala ordinal. Adicionalmente se necesita que la medicin considerada sea bsicamente
continua.
Caractersticas de la dcima
La caracterstica que tiene esta dcima es permitir el anlisis de la significacin entre
los promedios de dos muestras independientes. La dcima admite la desigualdad de los
tamaos de muestra.
Constituye la opcin ms poderosa ante la la dcima de la t de student para muestras
independientes, o su equivalente el Anlisis de Varianza en el modelo de clasificacin
simple, incluso en algunas ocasiones se comporta con una potencia mayor que esta.
Hiptesis
Las hiptesis de la dcima de la U de Mann y Whitney son bsicamente las mismas que
la de la dcima de la t de student para grupos independientes. La nica diferencia
consiste que en vez de trabajar con la media aritmtica, lla lo hace utilizando la suma
de rangos.
Se sugiere expresar las hiptesis nula y alternativa en palabras que expresen el problema
que va a ser docimado mediante un promedio, sin que ste sea especificado. As se
tendra entonces:

H
o
: No existen diferencias entre los promedios (de la medicin considerada), en
las poblaciones.
H
1
: Existen diferencias entre los promedios (de la medicin considerada), en las
poblaciones.


21

Estadgrafo y distribucin muestral
El estadgrafo de esta dcima se designa por la letra z, donde:

U
U
U
z







En la expresin anterior, U designa el valor mnimo entre U
1
y U
2
, en smbolos:


Es interesante hacer notar que U
1
y U
2
, estn relacionados con el producto de los
tamaos de muestra mediante la relacin:


En realidad el nico cambio que se produce al sustituir en el estadgrafo de la dcima, a
U
1
o a U
2
, es el signo en el estadgrafo z.

Por ltimo, cabe sealar que el estadgrafo z, para tamaos de muestras lo
suficientemente grandes est distribuido con media cero y varianza 1


Ejemplo para determina a U

Sean dos grupos: Grupo1 y Grupo2, cuyas mediciones son:

Grupo 1 (n
1
=4) 5 8 15 17
Grupo 2 (n
2
=3) 13 16 19

Unamos los dos grupos y efectuemos un ordenamiento por rango, consignando el
grupo al que pertenece.
i grupo al ientes correspond rangos los de Suma i R
con
R
n n
n n U R
n n
n n U
Donde
U U U
i
: ) 2 1 (
2
) 1 (
2
) 1 (
:
) ; min(
2
2 2
2 1 2 1
1 1
2 1 1
2 1

+
+
+

2 1 2 1
n n U U + +
2 :
1 :
:
12
) 1 (
2
:
2
1
2 1 2 1 2 1
muestra la de tamao n
muestra la de tamao n
con
n n n n
y
n n
Donde
U U
+ +



22

Medicin 5 8 13 15 16 17 19
Grupo 1 1 2 1 2 1 2
Rango 1 2 3 4 5 6 7

Sumemos los rangos correspondientes a cada uno de los grupos. Se tendr entonces:

Para el grupo 1: R
1
=1+2+4+6=13 y Para el grupo 2: R
2
=3+5+7=15
Donde R
1
:Suma de ,los rangos correspondientes al grupo 1
: R
2
:Suma de ,los rangos correspondientes al grupo 2

De donde U
1
y U
2
estarn dados por:
9 13
2
5 4
3 4
2
) 1 (
1
1 1
2 1 1

+
+
+ R
n n
n n U
3 15
2
4 3
3 4
2
) 1 (
2
2 2
2 1 1

+
+
+ R
n n
n n U
Obsrvese que se cumple que U
1
+U
2
=(n
1
)(n
2
)
En efecto sustituyendo se tiene: 9+13=(4)(3)
De donde U=min(U
1
,U
2
)=min(3,9)=3
Clculo del estadgrafo
Sabiendo que U=3 n
1
=4 y n
2
=3, se tendr entonces que:
8
12
8 3 4
12
) 1 (
6
2
3 4
2
2 1 2 1 2 1

+ + +

o o o n n n n n n
U U


De donde

Obsrvese que si en vez de haber tomado como valor del estadigrafo U=3, se hubiera
tomado el valor de U=9, se hubiera tenido entonces:, el mismo valor obtenido pero de
signo contrario.
061 , 1
8
3 6

U
U
U
z



23
Distribucin muestral
El estadgraf z est distribuido normalmente con media cero y varianza 1, en smbolos
N~(0,1). Si el menor de los tamaos de muestra es mayor que 20. Si los tamaos de
muestra son menores se acostumbran a utilizar probabilidades exactas, a pesar de que la
aproximacin, utilizando la distribucin muestral es excelente.
Estructura de la base de datos

La base de datos sigue la estructura usual para el anlisis de grupos independientes. Esto
es una variable que responder a la medicin realizada y otra variable (variable
clasificadora), donde aparecern los dos grupos en que est particionada la medicin.

Para el ejemplo considerado se tendr entonces:

Var1 Var2
MEDICION GRUPO
5 1
8 1
15 1
17 1
13 2
16 2
19 2

Salidas de la dcima

Aunque las salidas en los distintos paquetes puede variar, usualmente se presentan las
siguientes:

Rangos
Suma G1
Rangos
Suma G2
U Z Valor de
probab
Z
Ajustada
Prob con
Z ajustad
13.00000 13.00000 3.0000 -1.06066 .288852 -1.06066

Ocasionalmente cuando los tamaos de muestras son pequeos, algunos paquetes
estadsticos ofrecen el valor de la probabilidad exacta. En el caso del ejemplo este es:



Prob exacta
2 colas
.400000


24
Tcnicas adicionales a la dcima
Es recomendable, cuando existen tamaos de muestra no pequeos, el utilizar,
adicionalmente las siguientes tcnicas.

Diagrama de caja y bigotes.
Histogramas de cada uno de los grupos.
Ejemplo

Se muestra a continuacin los resultados alcanzados por dos grupos en una carrera de
resistencia, donde los resultados de las mediciones han sido medidos en segundos. Se
desea saber el grado de significacin de la diferencia entre los dos grupos. La base de
datos en la que aparecen los dos grupos es mostrada a continuacin:


25

MEDICION GRUPO
64 1
63 1
65 1
66 1
64 1
63 1
66 1
69 1
63 1
65 1
63 1
63 1
65 1
64 1
65 1
65 1
67 2
67 2
63 2
68 2
64 2
69 2
63 2
60 2
60 2
55 2
58 2
65 2
55 2
64 2
67 2
61 2
67 2
61 2
65 2
66 2
68 2
61 2
67 2




Salidas obtenidas



26



Las salidas anteriores nos indican que no existen diferencias significativas entre los
promedios de los grupos.
Tcnicas adicionales

Min-Max
25%-75%
MEDIANA
DIAGRAMA DE CAJA Y BIGOTES
Variable: MEDICION
GRUPO
M
E
D
I
C
I
O
N
54
56
58
60
62
64
66
68
70
1 2


En el se observan que existen diferencias muy apreciables en cuanto a la dispersin y al
mnimo de los dos grupos.



27
HISTOGRAMA DE LOS DOS GRUPOS
Variable: MEDICION
N
o

o
f

o
b
s
GRUPO: 1
0
2
4
6
8
10
52 54 56 58 60 62 64 66 68 70 72
GRUPO: 2
52 54 56 58 60 62 64 66 68 70 72


Se observan diferencias en cuanto a la forma de los histogramas en los dos grupos,
especialmente en la simetra.



28
Ttulo. Dcima de Levene para la igualdad
de varianzas.
Premisas
Bsicamente las premisas son las mismas del modelo de Anlisis de Varianza que se
utilice, exceptuando lo referido a la igualdad de las varianzas poblacionales, que es la
hiptesis que se va a docimar.

Es preciso sealar que esta dcima es bastante robusta ante desviaciones moderadas de
la distribucin normal..
Caractersticas de la dcima
Bsicamente la dcima realiza un Anlisis de Varianza, en el modelo de Clasificacin
Simple, tomando como datos los mdulos de las desviaciones de las mediciones
obtenidas, respecto a la media de los grupos.
Hiptesis
Hiptesis nula:
H
o
: Las varianzas poblacionales son iguales.
Hiptesis alternativa:
H
o
: Existen alguna pareja de varianzas poblacionales desiguales.
Estadgrafo y distribucin muestral
El estadgrafo, segn se expres en las caractersticas de la dcima tiene la misma
estructura que la tabla de Anlisis de Varianza, en el modelo de Clasificacin Simple.
Estructura de la base de datos
Sigue la misma estructura que la que tiene una base de datos en el Anlisis de Varianza
que va a ser realizado.
Salidas de la dcima
En el ejemplo que se muestra, la base de datos en donde se ha realizado una medicin a
cuatro grupos de alumnos con cuatro sujetos en cada uno de los grupos.

MEDICION GRUPOS
4.3 1
3.1 1
4 1
2 1
4.8 2
3.9 2


29
4.1 2
3.8 2
3.9 3
3 3
3.7 3
3.6 3
3.7 4
4 4
3.9 4
3.5 4
4 5
4.1 5
4.2 5
3.9 5

La salida obtenida usualmente en los Paquetes Estadsticoses:

SS df MS SS df MS

Effect Effect Effect Error Error Error
MEDICION 1.203 4 0.30075 1.02 15 0.068


F p
MEDICION 4.42279412 0.01467218

En la salida de la dcima observamos que al ser el valor de la probabilidad menor que
0,01; podemos concluir que existen diferencias muy significativas entre las varianzas de
las poblacionales de donde provienen las muestras.



30
Ttulo. Dcima de una muestra de
Kolmogorov-Smirnov.



Premisas
La nica premisa que se necesita es que las mediciones se encuentren al menos en una
escala de intervalo. Se necesita que la medicin considerada sea bsicamente continua.
Adems dicha prueba es aplicable cualquiera sea el tamao de la muestra.
Potencia-Eficiencia
La prueba de una muestra de K-S puede en todos los casos en que se aplique ser ms
poderosa que su prueba alternativa, la prueba de
2
( ji-cuadrado.
.
Caractersticas de la dcima

La prueba de K-S de una muestra es una dcima de bondad de ajuste. Esto es, se
interesa en el grado de acuerdo entre la distribucin de un conjunto de valores de la
muestra y alguna distribucin terica especfica. Determina si razonablemente puede
pensarse que las mediciones mustrales provengan de una poblacin que tenga esa
distribucin terica. En la prueba se compara la distribucin de frecuencia acumulativa
de la distribucin terica con la distribucin de frecuencia acumulativa observada. Se
determina el punto en el que estas dos distribuciones muestran la mayor divergencia.
.
Hiptesis
Ho: La distribucin observada se ajusta a la distribucin terica. Tambin: F(x) =
F
t
(x) para todo x.
H
1
: La distribucin observada no se ajusta a la distribucin terica.
Tambin: F(x) F
t
(x) para algn x

F(x): es la distribucin observada
F
t
(x): es la distribucin terica. Esta puede ser por ejemplo la funcin normal con cierta
media y varianzas conocidas.
Estadgrafo y distribucin muestral

D = mxima ) ( ) ( x S x F
n t

S
n
(x): es la funcin de distribucin emprica.



31

Ejemplo


El entrenador de salto de un grupo de atletas, desea conocer con vistas al procesamiento
de los datos por el obtenidos, sobre salto en una muestra aleatoria de atletas de esa
especialidad en un CVD, si las mediciones realizadas por l estn distribuidas
normalmente. Los datos son los siguientes:

S_LARGO
1 1.60
2 1.65 Ho: Los datos estn distribuidos normalmente
3 1 .55 H
1
: Los datos no estn distribuidos normalmente.
4 1.62
5 1.64
6 1.70
7 1.71
8 1.68
9 1.66
10 1.67
11 1.65
12 1.68
13 1.69
14 1.70
Salidas de la dcima



Conclusiones:
No se rechaza a Ho, por tanto la distribucin de los datos es normal.
Tcnicas adicionales a la dcima
1- Tabla de frecuencias
2- Histograma.


32



Estadgrafos que deben acompaar a los estadgrafos de la dcima.
1-Tabla de frecuencias.


Tcnicas auxiliares para respaldar los resultados obtenidos en la
conclusin.
1-Histogramas.



Arnaldo Herrera.


33
Dcima de la probabilidad exacta de Fisher.
Premisas

La nica premisa que se necesita es que las mediciones se encuentren en una escala
nominal.
Caractersticas de la dcima

Esta dcima es la solucin cuando se est aplicando una dcima de chi-cuadrado para la
indenpencia y las premisas para su cumplimiento fallan al ser los tamaos de muestra
muy pequeos. Bajo este punto de visto su utilizacin estar circunscrita como una
dcima auxiliar a la dcima de chi-cuadrado para la independencia. Representa una
opcin a la limitante de frecuencias esperadas pequeas en tablas de contingencia de
2x2, cuando el tamao de muestra es menor que 20.
Hiptesis

Son las mismas que la dcima de chi-cuadrado para la independencia esto es:

H
o
: p
i,j
=p
i,.
p
.,j
para todo i,j

H
o
: p
i,j
p
i,.
p
.,j
para algn i,j

Estadgrafo

Supongamos que nos encontramos en presencia de una Tabla de Contingencia con 2
factores y 2 niveles en cada factor, segn se muestra.




34
A
B

B
1
B
2

A
1
F
11
f
12
f
1

A
2
f
21
f
22
f
2

f
1
f
2
n

Donde f
ij
, son las frecuencias de ocurrencia donde i=1,2; indica el nivel del factor A y j=1,2
el nivel del factor B.

La probabilidad exacta de esta Tabla de Contingencia, cuando las frecuencias marginales se
consideran fijas est dada por la distribucin hipergeomtrica, cuya probabilidad exacta de
ocurrencia est dada por una fraccin donde en el numerador aparecen los productos de las
cuatro frecuencias marginales y en el denominador el producto del tamao de muestra n, y
las frecuencias observadas de cada una de las celdas de la Tabla de Contingencia. En
smbolos, siempre que se se cumplan las condiciones de la hiptesis nula se tendr que:






Por ejemplo, supongamos que se tiene la siguiente tabla de contingencia:

TABLA A
A
B

B
1
B
2

A
1

3 4 7
A
2
4 2 6

7 6 13


:Se tendr entonces que:







Ahora bien, relacionadas con la Tabla de Contingencia anterior, estarn asociadas las
siguientes Tablas de Contingencia, manteniendo las respectivas frecuencias marginales y
llevando las frecuencias en cada celda a situaciones extremas.

! ! ! !
! ! ! !
11 11 11 11
2 1 2 1
f f f nf
f f f f
p

3059 , 0
! 2 ! 4 ! 4 ! 3 ! 13
! 6 ! 7 ! 6 ! 7

A
p


35
Esas situaciones extremas en el caso anterior sern dos.

TABLA B
A
B

B
1
B
2

A
1

2 5 7
A
2
5 1 6

7 6 13
Donde:







TABLA C
A
B

B
1
B
2

A
1

1 6 7
A
2
6 0 6

7 6 13


Donde:








De forma anloga pudiramos haber calculado la probabilidad exacta de la Tabla de
Contingencia B (p
A
) y la Tabla de Contingencia C (p
B
). De ah que si aplicramos la
dcima de la probabilidad exacta de Fisher al ejemplo anterior, el valor de la probabilidad
de la dcima. Estara dado por:

p=p
A
+p
B
+p
C
=.3059+.0734+.0041=.3834
07343 , 0
! 1 ! 5 ! 5 ! 2 ! 13
! 6 ! 7 ! 6 ! 7

B
p
0041 , 0
! 0 ! 6 ! 6 ! 1 ! 13
! 6 ! 7 ! 6 ! 7

C
p


36

Estructura de la base de datos

La estructura de la base de datos deber estar dada en dos variables donde en cada una de
ellas aparecern los respectivos factores cada uno con dos niveles.

FACTOR A FACTOR B
1 2
1 2
2 2
1 1
2 1
1 1
1 2
2 1
1 2
2 2
1 1
2 1
2 1

Quedando estructurada la tabla de contingencia de la siguiente manera:


FACTOR A Nivel 1 Nivel 2 Tot. Filas

Nivel 1 3 4 7
Nivel 2 4 2 6

Tot col. 7 6 13
Obtenindose como valor de probabilidad de la dcima:

Fisher exact p, one-tailed (una cola) p=.3834
two-tailed (dos colas) p=.5921

De las dos probabilidades la que se toma usualmente es la de una cola. Si se compara el
resultado obtenido en la salida del paquete, con el que se ha encontrado en el ejemplo
resuelto, se llegar a la conclusin que en la salida estn contempladas tanto la tabla de
contingencia original, como los casos extremos que se presentan en esta dcima..

Debe de tenerse en cuenta tambin que existen algunos paquetes estadsticos
(MICROSTRAT, STATISTICA, etc), donde se hace necesario obtener la tabla de
contingencia en una opcin aparte y con los resultados obtenidos en la Tabla de
Contingencia, obtener el valor de la probabilidad de la dcima.


37
Ttulo. Anlisis de varianza de dos
clasificaciones por Friedman.
Premisas
La nica premisa que se necesita es que las mediciones se encuentren al menos en una
escala ordinal.
Caractersticas de la dcima
Permite determinar la significacin de la diferencia entre la suma de los rangos de las
columnas, obtenidos estos por filas.
Hiptesis
Se sugiere expresarlas en palabras, donde:
H
o
: No existen diferencias entre la suma de los rangos de las columnas
H
1
: Existen diferencias entre al menos una pareja de suma de rangos
Es bueno aclarar que H
1
no especfica entre columnas es la diferencia, sino solamente que
existe al menos una pareja de columnas.
Estadgrafo y distribucin muestral

ESTADIGRAFO


) 1 ( 3 ) (
) 1 (
12
1
2 2
) 1 (
+
+

k N Rj
k Nk
K
j
k



Donde:

N nmero de filas
K nmero de columnas
R
j
Suma de Rangos en la Columna j.

Al aplicar la prueba de Friedman los paquetes estadsticos realizan automticamente el
ranqueo, que consiste en ordenar los datos de cada fila y asociamos al valor ms pequeo el
rango menor y as sucesivamente contina el proceso.



38
DISTRIBUCIN MUESTRAL.


2
r

2
( ,k-1)

El estadgrafo se aproxima a una distribucin Chi- Cuadrado con k-1 grados de libertad.
Estructura de la base de datos
Si se desean comparar las mediciones realizadas a diferentes sujetos, deben colocarse en
una tabla donde las filas representan los sujetos y las columnas las mediciones realizadas.

Ejemplo: Se han realizado tres mediciones de la variable abdominales a 5 adolescentes. Los
resultados se muestran a continuacin:

Sujetos 1ra Medicin 2da Medicin 3ra Medicin
1 11 13 15
2 12 10 17
3 11 17 20
4 14 16 18
5 10 12 15

Observe que en las filas aparecen los adolescentes medidos n=5 y en las columnas las
mediciones realizadas. k=3
Salidas de la dcima
Aunque las salidas en los distintos paquetes puede variar, usualmente se presentan los
siguientes resultados:
Para cada una de las variables medidas:
Rango
Suma de los rangos
Medias de cada variable
Desviacin Estndar de cada variable
El valor del Estadgrafo
La probabilidad asociada.
Tcnicas adicionales a la dcima

Estadgrafos que deben acompaar a los estadgrafos de la dcima.

Tcnicas auxiliares para respaldar los resultados obtenidos en la
conclusin.



39

Ejemplo
Se desea determinar si existen diferencias significativas entre el promedio de abdominales
realizados por 5 adolescentes en tres momentos del curso escolar.
Se retoma la organizacin de los datos y observe la escala de medicin en que se expresan
las variables

Sujetos 1ra Medicin 2da Medicin 3ra Medicin
1 11 13 15
2 12 10 17
3 11 17 20
4 14 16 18
5 10 12 15

En nuestro ejemplo la salida obtenida es la siguiente:

Variables Rangos Suma de los
Rangos
Medias Desviacin
Estndar
1ra Medicin 1.2 6 11.6 1.516575
2da Medicin 1.8 9 13.6 2.880972
3ra Medicin 3 15 17 2.121320

El estadgrafo
2
(5,2)=8.4
Probabilidad p=0.015 .
Al ser 0.015 0.05. Existen diferencias significativas entre al menos dos de las mediciones
realizadas.
Verifique en el mismo ejemplo si existen diferencias significativas entre los adolescentes
medidos.
Le sugerimos par ello que realice una transposicin de la base de datos.
Salida de la dcima

Estadgrafos que deben acompaar a los estadgrafos de la dcima.

Tcnicas auxiliares para respaldar los resultados obtenidos en la
conclusin.

Diagramas de Caja y Bigotes.

Histogramas


40
Dcima de Shapiro-Wilks.

Premisas

Las mediciones deben encontrarse al menos en la escala de intervalo.

Hiptesis

Es preferible expresarlas mediante palabras. Esto es:

H
o:
:La poblacin de donde proviene la muestra est distribuida normalmente.

H
1 :
La poblacin de donde proviene la muestra no est distribuida normalmente.

Caractersticas de la dcima

Esta dcima propuesta en 1965 dirige su atencin a la forma en que estn ploteados sus
puntos en una pareja de ejes cartesianos, cuando se sitan en el eje de ordenadas los valores
de la muestra y en el de abscisas los valores esperados normalizados de las mediciones
ordenadas.

Es una de las dcimas para el anlisis de la normalidad de la poblacin ms potentes, lo que
la hace muy popular en el procesamiento de datos. Originalmente la dcima fue
desarrollada para tamaos de muestra menores o iguales que 50, pero en la actualidad es
posible utilizarla en paquetes computacionales estadsticos con muestras mucho mayores,
de ah que una de las cuestiones que sea necesario venticular es el tamao de muestra
mximo que admite el paquete.

Estadgrafo

El estadgrafo de esta dcima se denota por W. Estando comprendido W entre cero y uno.
Siendo su expresin:






2
2
, ) ( ) 1 (
) 1 (
) (
s n
a x x
W
h
i i
n i i i n

1
]
1

+


41

.
Donde:

n: tamao de la muestra
s
2
: varianza muestral
x
(i):
medicin ordenada de la muestra que ocupa el lugar i
a
i,n
: coeficientes de alejamiento de la normalidad en la dcima de Shapiro Wilks.

'

impar es n si
n
par es n si
n
h
2
) 1 (
2


En la propia medida en que W se acerca a la unidad, es indicativo en las mediciones
muestrales la cercana a los respectivos valores esperados normalizados. Esto es que la
poblacin se acerca a la distribucin normal.

Es importante tener en cuenta que a medida que la dispersin en la muestra se haga mayor,
se producir entoces un menor valor del estadgrafo W, si se mantiene constante el
numerador

Los coeficientes a
i,n
, son obtenidos mediante tablas. A continuacin se muestra una tabla
reducida. A partir de la n, en funcin de i, donde el coeficiente se anule, as ocurrir con los
restantes.



Tabla de coeficientes de la dcima de Shapiro-Wilks
n
i

2 3 4 5 6 7 8
1 .7071 .7071 .6872 .6646 .6431 .6233 .6052
2 0 0 .1667 .2413 .2806 .3031 .3164
3 0 0 .0875 .1401 .1743
4 0 0 0


Ejemplo

Ejemplo 1



42
Este ejemplo ha sido construdo de forma tal que por su sencillez permita el entendimiento
de la estructura del estadgrafo y las caractersticas de variacin que en l se manifiestan-

Sean las mediciones 41, 36, 25, 15, 12, 18. Realicemos un ordenamiento ascendente de las
mediciones. Tendremos entonces que el orden (i) de las mediciones estar dado por:

(i) ORDEN DEL ELEMENTO MEDICION
(1) x(1)=12
(2) x
(1)
=15
(3) x
(1)
=18
(4) x(1)=25
(5) x
(1)
=36
(6) x
(1)
=41

En la tabla anterior se observa que el subndice (1), corresponde a la medicin menor y el
subndice mayor a la medicin mayor. En el ejemplo que se ha considerado no existen
ligas; en el caso de que estas existan los autores de la dcima han planteado que si se utiliza
un ordenamiento por rangos utilizando la media artimtica de las mediciones ligadas, no
existen discrepancias notables.

Un primer aspecto a tener en cuenta lo es el considerar si el tamao de la muestra es par o
impar, ya que en base a esta diferenciacin as ser el valor mximo que toma h.

Debido a que n=6, se tomar entonces 3
2
6
2

n
h .

Se tendr entonces:



Dado
que
s
2
=13
8,7.
Obtengamos el valor del denominador utilizando el siguiente cuadro:




i
(n-i+1)
6-i+1
(7-i) x
(n-i+1)
x
(i)
x
(n-i+1)
-x
(i)
a
i,n
(x
(n-i+1)
-x
(i)
)a
i,n
1 6 X
(6)
= 41 X
(1)
=12 29 0.6431 18.6499
2 5 X
(5)
=36 X
(2)
=15 21 0.2806 5.8926
3 4 X
(4)
=25 X
(3)
=18 7 0.0875 0.6125
2
2
6 , ) 7
2
2
6 , ) 1 6
2
2
, ) ( ) 1 (
5
) (
) 1 6 (
) (
) 1 (
) (
s
a x x
s
a x x
s n
a x x
W
i i i i i i
h
i i
n i i i n
1
]
1

1
]
1

1
]
1

+


43

Suma
25.155


Se observa en la tabla anterior que:

Se han particionado las seis mediciones en dos columnas (columna 3 y columna 4).
En la tercera se han includo las tres ltimas mediciones ordenadas, con un
ordenamiento de mayor a menor, y en la cuarta las tres restantes pero ordenadas de
menor a mayor.
En la quinta columna aparecen las diferencias dadas por x
(n-i+1)
-x
(i)

En la sexta columna aparecen los coeficientes correspondientes a n=6, de acuerdo a
la tabla de coeficientes de la dcima.
La sptima columna refleja el producto de las diferencias obtenidas (x(n-i+1)-x(i)), y
los coeficientes a
i,n
.
Se obtuvo que la Suma de este producto fue: 25.155

De ah que en virtud de lo anterior se tenga: 91244 , 0
7 , 138 5
) 155 , 25 (
2

W
Salidas de la dcima

Las salidas de la dcima, en los paquetes computacionales, es muy simple, ya que en ella
solo se necesita que aparezca el valor del estadgrafo (W), y el valor de probabilidad de la
dcima.

Tcnicas adicionales a la dcima

Resulta conveniente acompaar a los resultados obtenidos en la dcima, por un histograma
con la distribucin normal superpuesta, y si se considera tambin necesario una tabla de
distribucin de frecuencias del resultado de las mediciones realizadas.

Ejemplos

Ejemplo 1

A continuacin realizaremos el ejemplo utilizado para el clculo del estadgrafo:



44
Segn se puede observar no es posible rechazar la hiptesis nula (p=.4366).

Luego las conclusiones sern que no existen motivos suficientes para decidir que la
poblacin de donde proviene la muestra no es normal.






Ejemplo 2

Se desea analizar si la poblacin de donde ha sido obtenida una muestra de 100 escolares,
donde les han sido medidos la cantidad de abdominales que realizan en un periodo de
tiempo determinado. Los resultados obtenidos son los siguientes:

3 7 11 12 13 14 15 16 17 17 18 18 18 19 19 19 20 20 21 21 21 22 22 23 23 24

24 24 25 25 25 26 26 26 26 27 27 27 28 28 28 29 29 29 29

30 30 30 30 30 30 30 30 30 30 31 31 31 31 32 32 33 33 33 33 33 34 34 34

35 35 35 36 36 36 37 37 38 38 39 39 39 40 40 41 41 41 42 42 42 43 43 44 45 46 47 48 49 53 57



45
A continuacin se muestran .los resultados obtenidos apoyndonos en el histograma (con la
distribucin normal superpuesta) y la tabla de distribucin de frecuencias.

Segn se observa (p=0,9826). Luego








46
Ttulo. Dcima de los Signos.

Premisas
Las mediciones deben estar en escala Quasi - Nominal. ( un poco ms que nominal sin
llegar a serlo y viceversa)
El tamao de la muestra debe ser mayor o igual que 20.(n>= 20 ).Bsicamente las
mediciones deben estar en la escala continua.
Caractersticas de la dcima
Esta es una dcima que se utiliza para determinar el grado de significacin del cambio de
una muestra tomada en dos momentos diferentes (ANTES Y DESPUS).
Hiptesis
Ho: P+ = P = 0.5 La proporcin de signos positivos es igual a la proporcin de signos
negativos.
H1: P + P La proporcin de signos positivos es diferente a la proporcin de signos
negativos.
Estadgrafo y distribucin muestral
A medida que el tamao de la muestra aumenta es posible hacer una aproximacin de la
Binomial a la distribucin Normal donde:

Z =
) 1 ( p np
np X

N(0,1).

p: Probabilidad de xito en el experimento.
n: Tamao de la muestra.
1-p: Probabilidad de fracaso.
X : Variable Aleatoria.
Ejemplo
Se realiz una prueba de velocidad al inicio del semestre a un grupo de atletas del rea
especial de Atletismo, donde se obtuvieron malos resultados. Luego de un entrenamiento de
3 meses se repiti la prueba en igualdad de condiciones. Verifique si hubo cambios en la
preparacin fsica de los atletas. Tome una decisin. (Ver base de datos al final).


47
Salida de la dcima


Decisin: Rechazo Ho porque existen Cambios MUY SIGNIFICATIVOS con
Nivel de significacin 0.01,entre el nivel alcanzado en la segunda medicin respecto a
la primera.

Estadgrafos que deben acompaar a los estadgrafos de la dcima.

Estadgrafo: Z de la distribucin Normal.
Tcnicas auxiliares para respaldar los resultados obtenidos en la
conclusin.

Diagrama de Cajas y Bigotes e Histogramas.

Diagramas de Caja y Bigotes.

Observa que en el diagrama de la primera prueba efectuada (Vel 1) el comportamiento de
los atletas fue de 9.4 a 11 seg por lo que los tiempos fueron malos, mientras que producto
de un entrenamiento en la segunda prueba hubo una mejora en los tiempos efectuados.



48


Histogramas



Observa que aunque los tiempos mejoraron la dispersin existente es mucha por lo que hay
que continuar trabajando en las marcas. Ms del 50% de l os atletas hacen marcas de 8-9
seg. Por lo que hay que hacer un trabajo sistemtico con ellos.




49

Estructura de la base de datos





50
Ttulo.Dcima de MacNemar para la
significacin de los cambios.

Premisas
Las mediciones deben estar en escala Nominal.
El tamao de la muestra debe ser mayor o igual que 20.(n>= 20 )Los valores de la
frecuencia esperada debe ser mayor o igual que 5.(Ei>=5)
Caractersticas de la dcima
Para probar cualquier cambio observado en esta dcima, se elabor una tabla de cuatro
entradas de frecuencias que representa al primero y al segundo conjunto de respuestas de
los mismos individuos.
Se utilizan signos(+) y () para simbolizar respuestas diferentes, estos cambios aparecen
las celdas (a y d) ; a cambio de (+) () y d cambio de () (+); si no hay cambio se
colocan en las celdas b c ya sea (+) (+) de() (). Luego (a + d) representa el
nmero total de personas que cambiaron conforme a la hiptesis nula establecida o sea que
( a + d) es la frecuencia esperada de Ho en ambas celdas a y d.
La tabla de 22 tiene la siguiente forma:


a

b

c

d

Hiptesis
Ho: Pa = Pd =0.5 a: Cambio de ( + ) a ( )
H1: Pa Pd d: Cambio de ( ) a ( + )
Estadgrafo y distribucin muestral
2 =
( )

K
i
Ei
Ei Oi
1
) (
2



51

Oi: Casos observados en la categora i.
Ei: Nmero de casos esperados en la categora i.
El estadgrafo 2 de acuerdo a Ho sigue una distribucin de Chi Cuadrada con df=1 grados
de libertad. El tamao de df refleja el nmero de observaciones susceptibles a variar
despus de que ciertas restricciones se han hecho en los datos, estas no son arbitrarias
porque tenemos que tener en cuenta las dos etapas en que se realizan las mediciones.
Ejemplo
Se realiz una prueba de abdominales a un grupo de estudiantes de una secundaria bsica y
con ello se establecieron los niveles alcanzados por ellos de acuerdo al plan. Se necesita
conocer la tendencia a cambio de acuerdo a las dos etapas que se evalan despus de
procesar los datos llegamos a la sgte. tabla.(Base de datos al final).


4

3



5

13
De acuerdo a la base de datos hemos obtenido esta tabla de doble entrada en este caso los
valores que se le asignan a las celdas b y c son 3 y 5 respectivamente pues los signos son
iguales no hay cambios.
Salida de la dcima

El valor de la probabilidad p= 0.0524 y el valor del estadgrafo 2 es de 3.76 recuerde que
ha medida que este valor aumenta la probabilidad se va haciendo ms pequea.
DECISION: Rechazo Ho con nivel de significacin = 0.1 porque existe una tendencia
poco significativa al cambio despus de un ciclo de entrenamiento.


52

Tcnicas auxiliares para respaldar los resultados obtenidos en la
conclusin.

Histogramas y Diagrama de Cajas y Bigotes.
Diagramas de Caja y Bigotes.

Los diagramas de cajas y bigotes :La primera medicin Los valores se comportaron
por debajo de lo esperado pero la segunda medicin presenta una ligera mejora en los
alumnos al finalizar el entrenamiento, tanto en valores como en la concentracin de las
observaciones.
Histogramas




53

Estructura de la base de datos
Observa en la base de datos que la diferencia en signos entre el primer nivel y el segundo
nos da que no existen cambios en 8 parejas de mediciones las cuales las distribuimos de
forma aleatoria entre las celdas b y c.



54

Anlisis de Varianza
Anlisis de Varianza
Premisas del An-
lisis de Varianza
Modelo de Clasifi-
cacin Simple
Modelo de Clasifi-
cacin Doble
Modelo de medicio-
nes repetidas
Diferencias inter-
grupos
Clasificacin Simple
Clasificacin Simple
Utilizacin.
Base de datos
Utilizacin.
Modelo
Hiptesis
Tabla de Anlisis de Varianza.
Salidas en STATISTICA.
Utilizacn
Utilizacn
(
(
Clas. Simple)
Clas. Simple)
Cuando deseamos docimar si las medias
poblacionales de a o ms grupos son
iguales o no. Puede ocurrir:
1.Si se rechaza H
o
habr que analizar si se
descubren en cules existen diferencias
significativas mediante las dcimas de
diferencias intergrupos.
2.En caso contrario, se concluir hallando
la media combinada de las medias de los
niveles.
Clasificacin Doble
Clasificacin Doble
Utilizacin
Base de Datos
Modelo
Hiptesis
Tabla de Anlisis de Varianza.
Salida en STATISTICA
Utilizacin (Mod. Clas. Doble)
Utilizacin (Mod. Clas. Doble)
1.En el anlisis de la confiabilidad en
pruebas.
En este caso el efecto fila sern los
sujetos y el efecto columna las
series.
Mediciones Repetidas
Mediciones Repetidas
Utilizacin
Base de datos
Modelo
Modelo
Hiptesis
Tabla de Anlisis de Varianza.
Salidas en STATISTICA
Utilizacin (Med. Repetidas)
Utilizacin (Med. Repetidas)
Cuando deseamos docimar si las
medias poblacionales de a o ms
repeticiones son iguales o no. Puede
ocurrir:
Si se rechaza H
o
habr que analizar si
se descubren en cules existen
diferencias significativas mediante las
dcimas de diferencias intergrupos, en
el caso de que se hallan realizado ms
de dos repeticiones.
1. La escala de las mediciones realizadas es
mtrica.
2. Las muestras son obtenidas aleatoriamente
3. El resultado de cada medicin es indepen-
diente de cualquier otro, dentro y entre los
grupos
4. Las poblaciones de donde provienen las
muestras estn distribuidas normalmente.
5. Las varianzas poblacionales son iguales
Premisas del Anlisis de Varianza
Premisas del Anlisis de Varianza
Verificacin
de las
premisa.
Verificacin de las premisas (1)
Verificacin de las premisas (1)
1. Homogeneidad entre las varianzas po-
blacionales. Las dcimas que pueden
utilizarse son: Bartlett, Cochran, Leve-
ne, etc.
2. Normalidad de las poblaciones. Puede
ser utilizada la de Shapiro-Wilks, si el
tamao de muestra es hasta 2000, o la
de Lillienfors, si ste es mayor que
2000.
Verificacin de las premisas
Verificacin de las premisas
(2)
(2)
El incumplimiento de las premisas, anteriores
implica el tener que utilizar una dcima no
paramtrica, en dependencia de los niveles del
factor que se tenga. (Dos grupos o dos o ms
grupos).
Si existe una correlacin entre las me-
dias de los grupos y las varianzas. Tam-
poco puede ser aplicado el Anlisis de
Varianza.
Caractersticas del modelo.
Los grupos estn clasificados de acuerdo a un solo factor. Cada
grupo es diferenciado del otro de acuerdo al nivel del factor de
clasificacin que posee.
Estructura del modelo.
aleatorio Error :
i nivel el en fila Efecto :
general Media :
j i,
i
j i, i ,

+ + =
j i
x
Modelo de Clasificacin Simple
Modelo de Clasificacin Simple
Hiptesis del Modelo de Clasificacin
Hiptesis del Modelo de Clasificacin
simple
simple
H
o
: Las medias poblacionales son iguales.
H
1
: Existen una pareja de medias
poblacionales distintas.
Otra forma de denotar las hiptesis es:
i algn Para i toda Para
0 : H 0 : H
i 1 i o
=
TABLA DE ANALISIS DE VARIANZA
TABLA DE ANALISIS DE VARIANZA
CLASIFICACION SIMPLE
CLASIFICACION SIMPLE
CME GLE
ERROR
CMG
CME
CMG GLG
GRUPOS
P
R
O
B
F
CUADRA-
DOS
MEDIOS
(MS)
GRADOS
DE
LIBERTAD
(DF)
FUENTES
DE
VARIACION
Estructura del modelo.
Modelo de Clasificacin Doble
Modelo de Clasificacin Doble
aleatorio Error :
j nivel el en columna Efecto :
i nivel el en fila Efecto :
general Media :
j i,
j
i
j i, j i ,

+ + + =
j i
x
Hiptesis del Modelo de Clasificacin Doble
Hiptesis del Modelo de Clasificacin Doble
Existen dos parejas de hiptesis.
H
o
: No existe efecto fila
H
1
: Existe efecto fila
H
o
: No existe efecto columna
H
1
: Existe efecto columna
Hiptesis Clasificacin doble (Efectos)
Hiptesis Clasificacin doble (Efectos)
Es posible expresar las hiptesis
simblicamente de la siguiente forma:
Hiptesis:
i algn Para i toda Para
0 : H 0 : H
i 1 i o
=
j algn Para j toda Para
0 : H 0 : H
1 o
=
j j

TABLA ANOVA CLASIFICACION DOBLE
TABLA ANOVA CLASIFICACION DOBLE
CME GLE ERROR
F
(COLM)
CMC
CME
CMC GLC COLUMNAS
F
(FILAS)
CMF
CME
CMF GLF FILAS
PROB F CUA-
DRADOS
MEDIOS
(MS)
GRADOS
DE
LIBERTAD
(DF)
FUENTES
DE
VARIACION
TABLA ANOVA CLASIFICACION DOBLE
TABLA ANOVA CLASIFICACION DOBLE
Estructura del modelo.
aleatorio Error :
j nivel el en repeticin Efecto :
general Media :
j i,
j
j i, j i ,

+ + + =
j i
x
TABLA ANOVA MEDICIONES
TABLA ANOVA MEDICIONES
REPETIDAS
REPETIDAS
CME GLE ERROR
F
(COLM)
CMC
CME
CMC GLC COLUMNAS
PROB F CUA-
DRADOS
MEDIOS
(MS)
GRADOS
DE
LIBERTAD
(DF)
FUENTES
DE
VARIACION
Diferencias inter
Diferencias inter
-
-
grupos
grupos
No existe una dcima que haya mostrado
ser superior a las restantes entre las ms
populares se encuentran las dcimas de:
Sheff, Duncan, Newman-Keuls, L.S.D., etc
Las mismas pueden ser aplicadas en los
siguientes modelos:
Clasificacin Simple
Modelo de mediciones repetidas.
Hiptesis del Modelo de Mediciones Repetidas
Hiptesis del Modelo de Mediciones Repetidas
rH
o
: No existen diferencias entre las
medias de las repeticiones.
H
1
: Existen al menos dos repeticiones
cuyas medias sean diferentes.
Hiptesis del Modelo de Mediciones Repetidas
Hiptesis del Modelo de Mediciones Repetidas
Es posible expresar las hiptesis
simblicamente de la siguiente forma:
Hiptesis:
j algn Para j toda Para
0 : H 0 : H
1 o
=
j j

Modelo de Mediciones repetidas
Modelo de Mediciones repetidas
aleatorio Error :
j nivel el en repeticin Efecto :
general Media :
j i,
j
j i, j ,

+ + =
j i
x
Salidas Clasif. Simple
Salidas Clasif. Simple
df: (Degree of freedom- Grados de libertad
MS:(Mean Square- Cuadrados medios)
Base de Datos (Clas. Simple)
Base de Datos (Clas. Simple)
La variable dependiente
es la MEDICION y la
independiente (factor) es
la variable GRUPO.
Observe que el factor
cuenta con 5 niveles.
MEDICION GRUPOS
1 4.3 1
2 3.1 1
3 4.0 1
4 2.0 1
5 4.8 2
6 3.9 2
7 4.1 2
8 3.8 2
9 3.9 3
10 3.0 3
11 3.7 3
12 3.6 3
13 3.7 4
14 4.0 4
15 3.9 4
16 3.5 4
17 4.0 5
18 4.1 5
19 4.2 5
20 3.9 5
BASE DE DATOS (Clasif.
BASE DE DATOS (Clasif.
Doble)
Doble)
MEDICION FILAS COLUMNAS
1 4.3 1 1
2 3.1 1 2
3 4.0 1 3
4 2.0 1 4
5 4.8 2 1
6 3.9 2 2
7 4.1 2 3
8 3.8 2 4
9 3.9 3 1
10 3.0 3 2
11 3.7 3 3
12 3.6 3 4
13 3.7 4 1
14 4.0 4 2
15 3.9 4 3
16 3.5 4 4
17 4.0 5 1
18 4.1 5 2
19 4.2 5 3
20 3.9 5 4
La variable dependiente
es MEDICION. Las dos
variables independientes
(factores) son FILAS Y
COLUMNAS. La primera
con 5 niveles y la segunda
con 4 niveles.
SALIDAS MOD. CLASIF. DOBLE
SALIDAS MOD. CLASIF. DOBLE
df: (Degree of freedom- Grados de libertad
MS:(Mean Square- Cuadrados medios)
Base de Datos (Med. Rep.)
Base de Datos (Med. Rep.)
REPETIC1 REPETIC2 REPETIC3 REPETIC4
1 4.3 3.1 4.0 2.0
2 4.8 3.9 4.1 3.8
3 3.9 3.0 3.7 3.6
4 3.7 4.0 3.9 3.5
5 4.0 4.1 4.2 3.9
En este caso existen 4 variables depen-
dientes y ninguna variable independiente
(factor), por lo que en la opcin de varia-
ble independiente en STATISTICA, se
dejar en BLANCO.
SALIDA MED. REPETIDAS
SALIDA MED. REPETIDAS
df: (Degree of freedom- Grados de libertad
MS:(Mean Square- Cuadrados medios)
Dcima de Correlacin
Dcima de Correlacin
Definicin de Correlacin.
Coeficiente de Correlacn Lineal Muestral
Premisas.
Hiptesis.
Estadgrafo y Distribucin Muestral.
Coeficiente de Correlacin
Coeficiente de Correlacin
Lineal Muestral
Lineal Muestral
_ _
n
1 i
2
n
1 i
2
1 i
Y - Y y X - X Con x
y x
xy
r
= =
=

= =
=
n
Premisas
Premisas
Las dos mediciones realizadas a la muestra siguen una
distribucin normal bivariada.
Consejo PRCTICO.
La situacin ms comn es que se desconozca la
distribucin de la poblacin. El requisito general es
trabajar con un tamao de muestra lo suficientemente
grande. En torno a lo anterior los especialistas
recomiendan tres criterios.
0 10 n 3 Criterio
0 5 n 2 Criterio
30 n 1 Criterio

Hiptesis
Hiptesis
l poblaciona n correlaci de e Coeficient : Con
: H 0 : H
1 o

0 =
Estadgrafo y Distribucin
Estadgrafo y Distribucin
muestral
muestral
2 - n con student de t la segn o distribud est t
muestral n Distribuci
muestra de Tamao : n
muestral lineal n Correlaci de e Coeficient : r
r - 1
2 - n
r t
: o Estadgraf
2
=
=

Definicin de Correlacin
Definicin de Correlacin
Puede definirse de acuerdo a las dos
vertien-tes siguientes:
1.Medida del grado de relacin existente
entre las variables.
2.Medida del ajuste de la lnea de regresin
de las observaciones.
Los procedimientos para estimar al Coefici-
ente de Correlacin varan de acuerdo a la
premisa de la distribucin poblacional que
contiene a la muestra.
Dcimas V 0.0
Dcimas V 0.0
Gua de dcimas que
plantean dife-rencias
ANOVA
Igualdad de Varianzas
Normalidad
Correlacin momento
producto de Pearson
Correlacin de
Spearman
Elija una de las dos opciones
Elija una de las dos opciones
Grupos (muestras) independientes
Grupos (muestras) dependientes (repetidas)
Grupos independientes
Grupos independientes
*Chi-cuadrado
para la homo-
geneidad
Prob. Exacta de
Fisher
NOMINAL
*ANOVA
Clasifi-cacin
Simple
METRICA
*ANOVA de una
clas. por ran-gos
de Kruskal-
Wallis
*U Mann Whit-
ney
ORDINAL
DOS O MS
GRUPOS
DOS
GRUPOS
Escala de
Medicin
Grupos dependientes
Grupos dependientes
*Signos
QUASI-
NOMINAL
*ANOVA Mediciones
Repetidas.
METRICA
*ANOVA dos clasi-
ficaciones. por rangos
de Friedman
*Rangos de
Wilcoxon
ORDINAL
*Q de Cochran
*Mc. Nemar pa-
ra la significa-
cin de cam-bios
NOMINAL
DOS O MS
GRUPOS
DOS
GRUPOS
Escala de
Medicin
Dcimas V 0.1
Dcimas V 0.1
Gua de dcimas que
plantean dife-rencias.
ANOVA
Igualdad de Varianzas
Normalidad
Correlacin momento
producto de Pearson
Correlacin de
Spearman
Elija una de las dos opciones
Elija una de las dos opciones
Grupos (muestras) independientes
Grupos (muestras) dependientes (repetidas)
Grupos independientes
Grupos independientes
*Chi-cuadrado
para la homo-
geneidad
Prob. Exacta de
Fisher
NOMINAL
*ANOVA
Clasifi-cacin
Simple
METRICA
*ANOVA de una
clas. por ran-gos
de Kruskal-
Wallis
*U Mann Whit-
ney
ORDINAL
DOS O MS
GRUPOS
DOS
GRUPOS
Escala de
Medicin
Grupos dependientes
Grupos dependientes
*Signos
QUASI-
NOMINAL
*ANOVA Mediciones
Repetidas.
METRICA
*ANOVA dos clasi-
ficaciones. por rangos
de Friedman
*Rangos de
Wilcoxon
ORDINAL
*Q de Cochran
*Mc. Nemar pa-
ra la significa-
cin de cam-bios
NOMINAL
DOS O MS
GRUPOS
DOS
GRUPOS
Escala de
Medicin


I.S.C.F. "Manuel Fajardo" C. H.


Lminas-Resumen de la Asignatura


Versin 1.0





Elaborado por M. Sc. Rodrigo Manrique de Lara


D
1
Cuartil Superior.
D
2
Cuartil Inferior
D
3
Mximo
D
4
Mnimo
Promedio: Mediana





ESCALAS
De los
estadgrafos
que van a ser
estudiados
pueden ser
utilizados en
las respectivas
escalas:
PROPORCION
TODOS

Coeficiente de
variacin.

Varianza

Desviacin
tpica o
estndar

Recorrido o
amplitud.

Recorrido o
amplitud
intercuarttilica
MTRICAS.
INTERVALO
Todos menos
el Coeficiente
de Variacin

Varianza

Desviacin
tpica o
estndar

Recorrido o
amplitud.

Recorrido o
amplitud
intercuarttilica
ORDINAL
Solamente

Recorrido o
amplitud

Recorrido o
amplitud
intercuarttilica
NO
MTRICAS.
NOMINAL NINGUNO














PROMEDIOS












Coeficiente de Esquenosis
El coeficiente de
esquenosis es un
estadgrafo que mide la
asimetra de una
distribucin.

Si se est en presencia de una distribucin simtrica
el valor del coeficiente de esquenosis es cero.

Segn se observa en el ejemplo grfico anterior,
coinciden la media aritmtica, la mediana y la moda.

Si presenta la cola ms larga hacia la derecha el
coeficiente de esquenosis es positivo.


Si presenta la cola ms larga hacia la izquierda el
coeficiente de esquenosis es negativo

Coeficiente de Curtosis
El Coeficiente de Curtosis
mide el apuntamiento de
una distribucin.
Se tendrn los siguientes casos:

Si la distribucin es normal el coeficiente de
curtosis es cero.

En este caso la distribucin recibe el nombre de
mesocrtica.

Si la distribucin es ms apuntada que la
distribucin normal su coeficiente de curtosis
es positivo.

Recibiendo la denominacin de apuntada o
leptocrtica.

Si la distribucin es ms achatada que la
distribucin normal su coeficiente de curtosis
es negativo.

Recibe el nombre de achatada o platicrtica.



PREGUNTAS
Medicin. Escalas de medicin.
1. Exprese la definicin de medicin?
1. Explique con sus propias palabras el significado
de numeral.
1. Ponga algunos ejemplos de numerales
asignados a su actividad profesional.
2. Cul es el nivel ms elemental entre los cuatro tipos que
aparecen en las escalas de medicin?
3. Supongamos que el resultado de una medicin se
encuentra incluido en la escala nominal y los numerales
que han sido asignados son 3, 4, 5 y 7. Existe alguna
relacin de orden entre estos numerales, esto quiere decir
el 7 es mayor que el 5, el 5 es mayor que 4, etc?
4. Exponga ejemplo en su campo de actividad de resultados
de mediciones nominales.
5. Qu tipo de promedio puede ser utilizado en resultados
de mediciones en la escala nominal?
6. Qu medida de dispersin podemos utilizar cuando los
resultados de las mediciones se encuentran en la escala
nominal?
7. Exponga ejemplos en su campo de actividad donde los
resultados de las mediciones aparezcan en la escala
ordinal.
8. Diga si las siguientes proposiciones son verdaderas o
falsas. Si los resultados de un conjunto de mediciones
corresponden a la escala ordinal:
1. Podemos establecer una relacin de orden entre
sus resultados?
2. Es posible establecer alguna relacin mtrica
entre dos resultados diferentes?
9. Diga si la siguiente proposicin es verdadera o falsa. Si
se tiene en una base de datos un conjunto de resultados
de mediciones en la escala ordinal y se realiza un cambio
en los numerales que conserve el orden, el conjunto de
los resultados de las mediciones cambia.
10. Qu promedio resulta apropiado para ser utilizados en
mediciones del tipo ordinal?
11. Es posible utilizar en una medicin del tipo ordinal
como promedio la moda?
12. Qu medidas de dispersin pueden ser utilizadas en
mediciones del tipo ordinal?
13. Bajo el rubro mediciones mtricas, cules dos tipos de
escala de medicin segn Stevens, se engloban en ella?
14. Cite alguna caracterstica, que diferencia a los
resultados de una medicin mtrica de otras en la escala
ordinal o en la escala nominal o clasificatoria?
15. Cul es la diferencia fundamental existente entre los
resultados de una medicin en la escala de intervalos y
en la escala de proporcin?
16. Cules estadgrafos de posicin pueden ser utilizados en
la escala de proporcin?
Promedios
1. Cmo usted definira a un promedio?
2. Bajo qu otro nombre, adems de promedio, reciben
este tipo de caractersticas numricas en la literatura?
3. Cules son los tres promedios ms utilizados en el
anlisis de datos?
4. Cules, de los anteriores promedios, pueden ser
utilizados si los resultados de las mediciones se
encuentran en la escala:
1. Nominal.
2. Ordinal.
3. Intervalo.
4. Proporcin.
5. Cul es la posicin relativa de los tres promedios
estudiados (la media aritmtica, la mediana y la moda),
si la distribucin es:
1. Simtrica.
2. Asimtrica hacia la derecha.
3. Asimtrica hacia la izquierda.
6. Qu se entiende por la moda de un conjunto de
resultados de mediciones?
7. Argumente (puede utilizar ejemplos), en los casos en que
la moda sea:
1. nica.
2. Ms de un valor modal.
3. No existir.
8. Cmo usted definira valor mediano de un conjunto de
resultados de mediciones?
9. Tericamente, pueden existir infinitos valores
medianos?. Argumente su respuesta.
1. En la prctica de estos infinitos valores medianos
cul es el que se toma.
10. Por qu la mediana, a diferencia de la media aritmtica,
se afecta poco, o no es afectada por resultados de
mediciones extremas?
11. Suponga que usted est exponiendo un trabajo y uno de
los asistentes le solicita que le explique de qu manera
ha sido obtenido el valor mediano en los resultados de
una prueba en particular, cmo usted le explicara el
proceso teniendo en cuenta que el tamao de la muestra
sea:
1. Impar.
2. Par.
12. Cul es la interpretacin geomtrica de la mediana?
13. Suponga que usted est asistiendo junto a otra persona en
la exposicin de un trabajo investigativo y el ponente
hace referencia primero al valor mediano y
posteriormente denomina a este mismo valor mediano
como el del percentil 50. Su acompaante le pregunta;
por fin de lo que est hablando es de la mediana o del
percentil 50? Qu le respondera usted?
14. Cmo est definida la media aritmtica de un conjunto
de resultados de mediciones?
15. Cules son algunas de las ventajas, siempre que el
resultado de las mediciones lo permitan, de la media
aritmtica de un conjunto dado?
16. Si se tiene un conjunto de resultados de mediciones y se
desea obtener la media aritmtica del mismo, en cul
escala de medicin debern encontrarse estos resultados?
17. Si se tiene en una base de datos una medicin, cuyos
resultados son o muy grandes, o muy pequeos, o ambos
inclusive:
1. Ser conveniente la utilizacin de la media
aritmtica?
2. Qu procedimiento podra realizar usted con los
resultados de estas mediciones para poder aplicar
la media aritmtica?
18. Usted est presenciando la exposicin de un trabajo
investigativo y el ponente se refiere a que "ha obtenido el
promedio de las mediciones realizadas".
1. De qu promedio usted sospecha que est
hablando el ponente?
2. Cul de las dos expresiones debi haber sido la
ms correcta. Justifique su respuesta.
1. Se obtuvo el promedio?
2. Se obtuvo un promedio?
19. Cul es la interpretacin geomtrica de la media
aritmtica?
20. Cul es la notacin con que se designa a la media
aritmtica
1. De una muestra.
2. De una poblacin.
Dispersin.
1. Cul es la definicin de varianza muestral.?
2. Cul debe ser la escala de medicin de los resultados
para ser aplicada la varianza muestral?
3. Cul es su notacin?
4. Es posible que el resultado de la varianza de un
conjunto de resultados de mediciones sea un nmero
negativo?
5. Qu caracterstica tendr el conjunto de los resultados
de una medicin en los que su varianza es cero?
6. Supongamos que se tiene un conjunto de resultados de
mediciones cuya unidad es u, en cules unidades estar
expresada la varianza?
7. Cul es la definicin de desviacin tpica o estndar
muestral.?
8. Cul debe ser la escala de medicin de los resultados
para ser aplicada la desviacin tpica o estndar?Cul es
su notacin?
9. Es posible que el resultado de la desviacin tpica o
estndar de un conjunto de resultados de mediciones sea
un nmero negativo?
10. Qu caracterstica tendr el conjunto de los resultados
de una medicin en los que su desviacin tpica o
estndar es cero?
11. Supongamos que se tiene un conjunto de resultados de
mediciones cuya unidad es u, en cules unidades estar
expresada la desviacin tpica o estndar?
12. Cul de las dos medidas la varianza o la desviacin
tpica es utilizada usualmente en resultados de
investigaciones?
13. Supongamos que estamos en presencia de dos conjuntos
cuyas desviaciones estndares son s
1
y s
2
tales que s
1
>s
2

Podemos decir que la dispersin en el conjunto cuya
desviacin es s
2
tiene una dispersin mayor que los
resultados del otro conjuntos? Argumente su respuesta.
14. Cmo se denota a la varianza poblacionall?
15. Cmo se denota a la desviacin tpica o estndar
poblacional?
16. Cmo est definido el coeficiente de variacin?
1. Se acostumbra expresarlo mediante un nmero o
mediante un por ciento?
2. En qu unidades se expresa?
3. En cul escala de medicin debern encontrarse
los resultados para poder aplicarlo?
17. Qu valores no puede tomar la media aritmtica de un
conjunto de resultados de mediciones, para aplicarlo?
18. Cules son algunas de las ventajas que representa la
utilizacin del coeficiente de variacin en el Anlisis de
Datos?
1. Cules son algunas de sus desventajas?
19. Exprese cules son los intervalos de valores del
coeficiente de variacin en la clasificacin del mismo
segn Zatsiorsky y cules son las categoras que se
relacionan con los intervalos?

Simetra y Apuntamiento.
1. Cul es el valor del coeficiente de esquenosis cuando la
representacin grfica de los resultados de las
mediciones es:
1. Simtrica?
2. Simtrica a la derecha?
3. Simtrica a la izquierda?
2. Cul distribucin terica est asociada con el
apuntamiento?
3. Cul es el valor del coeficiente de curtosis cuando la
representacin grfica de los resultados de las
mediciones es:
1. Semejante a la distribucin normal?
2. Ms apuntada que la distribucin normal?
1. Qu nombre reciben este tipo de
distribucin de acuerdo a su
apuntamiento?
3. Ms achatada que la distribucin normal?
1. Qu nombre reciben este tipo de
distribucin de acuerdo a su
apuntamiento?
4. Para cules aspectos del Anlisis de Datos resultan
tiles los histogramas?


ISCF Manuel Fajardo








GUA DE ESTUDIO




ASIGNATURA ANLISIS DE DATOS


Autores:
Lic. Arnaldo Hererrea Ponce. Introduccin. Tema II.
Probabilidades.

Msc. Rodrigo Manrique Lara Rosell.
Tema I. Anlisis Exploratorio.


Msc. Ramn Folgueira Roque .
Lic. Ins Serret Mesa.
Tema III. Docimasia de hiptesis.

Introduccin.

Esta gua tiene como objetivo ayudar al estudiante a desarrollar un mtodo
correcto de estudio; orientando su esfuerzo hacia aquellos aspectos que son
fundamentales para lograr los objetivos propuestos en la asignatura. En ella
encontrars sugerencias para que te sean ms fciles de comprender los
diferentes contenidos, as como ejercicios propuestos. La misma contribuir
adems, a desarrollar partiendo de los conocimientos tericos, los hbitos y
habilidades necesarios para la comprensin, aplicacin e interpretacin de los
mtodos Estadsticos, tanto descriptivos como inferenciales, que sern
estudiados, ayudando de esta forma a desarrollar en el estudiante, hbitos de
trabajo independiente.

Objetivos generales de la asignatura.
Objetivo Educativo: Contribuir a que los estudiantes desarrollen convicciones
sobre el rigor, la honestidad cientfica y la esttica al solucionar problemas
vinculados a la Cultura Fsica, manifestndose en la validez de los mtodos; y la
objetividad en el tratamiento y anlisis de la informacin.
Objetivo Instructivo: Aplicar las tcnicas y procedimientos estadsticos
relacionados con la organizacin, presentacin e interpretacin de los datos
primarios vinculados a la cultura Fsica con principios cientficos que les permitan
organizar, describir y analizar la informacin estadstica para tomar decisiones.

Plan temtico.
La asignatura se imparte en 32 horas distribuidas estas en tres temas segn el
cuadro siguiente:

No Tema Horas
1- Anlisis Exploratorio 12
2- Probabilidad 6
3- Pruebas de Hiptesis 14
Total 32

Bibliografa
Texto Bsico: Guerra, C. W. (1987). Estadstica. Pueblo y Educacin. La Habana.
Texto Complementario: Freund, J. E. (1971). Estadstica Elemental Moderna.
Pueblo y Educacin. La Habana.
Textos de Consulta:
Zatsiorski, I. (1983). Metrologa Deportiva.
Valdes, H. Et al (1990). Introduccin a la Investigacin Cientfica Aplicada a la
Educacin Fsica y el Deporte. Pueblo y Educacin : La Habana.
Siegel, S. (1972). Diseo Experimental No Paramtrico. Edicin
Revolucionaria: La Habana.
Ayudas de los Sofware estadsticos.
Manrique de Lara Rosell Rodrigo. Pginas Web Anlisis Exploratorio.
Manrique de Lara Rosell Rodrigo. Gua para decidir acerca de una dcima.
Materiales elaborados por los profesores de la asignatura Anlisis de Datos.
Tema I. Anlisis Exploratorio.
Objetivos:
Establecer hiptesis estadsticas basadas en los objetivos del problema planteado,
los aspectos integrantes de los datos y la estructura de la base de datos.
Contenidos por Encuentros.
1 Contenidos, objetivos y sistema de habilidades de la asignatura. Estructura del
trabajo de curso. Medicin. Escalas de medicin
2 Promedios: media aritmtica, mediana, moda. Estadgrafos de dispersin:
recorrido, desviacin tpica.
3 Trabajo con el paquete estadstico. Gestin de datos. Importacin de otro
software.
4 Tabla de frecuencias. Cuartiles. Histograma. Diagrama de Caja y Bigotes.
5 Correlacin. Matriz de correlacin.
6 Sistematizacin del tema.
Aspectos Metodolgicos.
1. Resulta importante tener en cuenta que con este tema se inician
conocimientos y habilidades que sern utilizados y evaluados en el trabajo
final y que son empleados en el tercer tema (docimasia de hiptesis), por lo
que el alumno deber ser cuidadoso en dominarlo, ya que cualquier
omisin, que de l se haga, ocasionar en el futuro el tener que volver a
estudiarlo.
2. Particular importancia reviste el saber clasificar correctamente una medicin
de acuerdo a la escala que le corresponda. Este aspecto resulta
fundamental, tanto en la eleccin del promedio, y del estadgrafo de
dispersin a ser utilizado, como en la ubicacin de la dcima correcta a ser
empleada ante un problema determinado de acuerdo a la base de datos
utilizada.
3. Es trascendental el cuidado que se deber tener en cuanto a la base de
datos que se utilice, ya que con ella transitar a travs de toda la asignatura
y con el problema que de ella se derive conformar el trabajo final con el
que culminar la asignatura. Cualquier demora en su obtencin en el
paquete estadstico utilizado, producir demoras que pueden llegar a ser
catastrficas.
4. En la obtencin de los estadgrafos y grficos expresados en los
contenidos, se debern conciliar adems de su obtencin en el paquete
estadstico empleado, la exposicin de lo que significan los mismos y lo que
es ms importante las hiptesis que ellos muestran en el contexto del
problema considerado. Esto ltimo es hacer hablar a los resultados
obtenidos en el procesamiento.
5. Es de capital importancia que al final de este tema el alumno sea capaz de
hacer una sntesis de las tcnicas que le han sido impartidas, atendiendo a:
Su definicin.
Su utilizacin de acuerdo a las escalas de medicin utilizadas.
Su obtencin de acuerdo al paquete estadstico considerado.
Gua de Preguntas.
Escalas de medicin.
1. Cul es el nivel ms elemental entre los cuatro que aparecen en las escalas
de medicin?
2. Exponga ejemplo en su campo de actividad de resultados de mediciones
nominales.
3. Qu tipo de promedio puede ser utilizado en este tipo de escala?
4. Qu medida de dispersin podemos utilizar cuando los resultados de las
mediciones se encuentran en la escala nominal?
5. Exponga ejemplos en su campo de actividad donde los resultados de las
mediciones aparezcan en la escala ordinal.
6. Qu promedio resulta apropiado para ser utilizados en mediciones del tipo
ordinal?
7. Es posible utilizar en una medicin del tipo ordinal como promedio la
moda?
8. Qu medidas de dispersin pueden ser utilizadas en mediciones del tipo
ordinal? Cul es la diferencia fundamental existente entre los resultados
de una medicin en la escala de intervalos y en la escala de proporcin?
9. Cules estadgrafos pueden ser utilizados en la escala de proporcin?
10. De los estadgrafos anteriores, cules no deben ser utilizados si se
encuentran los resultados de las mediciones en la escala de intervalos?
Promedios.
1. Cmo usted definira la moda de un conjunto de resultados de mediciones?
2. Argumente (puede utilizar ejemplos), en los casos en que la moda sea:
1. nica.
2. Ms de un valor modal.
3. No existir.
3. De qu manera podemos determinar en un histograma la clase donde se
encuentra la moda?
4. Cmo usted definira valor mediano de un conjunto de resultados de
mediciones?
5. Tericamente, pueden existir infinitos valores medianos?. Argumente su
respuesta. En la prctica de estos infinitos valores medianos cul es el que
se toma.
6. Por qu la mediana, a diferencia de la media aritmtica, se afecta poco, o
no es afectada por resultados de mediciones extremas?
7. Suponga que usted est exponiendo un trabajo y uno de los asistentes le
solicita que le explique de qu manera ha sido obtenido el valor mediano en
los resultados de una prueba en particular, cmo usted le explicara el
proceso teniendo en cuenta que el tamao de la muestra sea: a)Impar.
b)Par.
8. Suponga que usted est asistiendo junto a otra persona en la exposicin de
un trabajo investigativo y el ponente hace referencia primero al valor
mediano y posteriormente denomina a este mismo valor mediano como el
del percentil 50. Su acompaante le pregunta; por fin de lo que est
hablando es de la mediana o del percentil 50? Qu le respondera usted?
9. Cmo est definida la media aritmtica de un conjunto de resultados de
mediciones?
10. Cules son algunas de las ventajas, siempre que el resultado de las
mediciones lo permitan, de la media aritmtica de un conjunto dado?
11. Si se tiene un conjunto de resultados de mediciones y se desea obtener la
media aritmtica del mismo, en cul escala de medicin debern
encontrarse estos resultados?
12. Si se tiene en una base de datos una medicin, cuyos resultados son o muy
grandes, o muy pequeos, o ambos inclusive: Ser conveniente la
utilizacin de la media aritmtica? Qu procedimiento podra realizar usted
con los resultados de estas mediciones para poder aplicar la media
aritmtica?
13. Cul es la notacin con que se designa a la media aritmtica De una
muestra? De una poblacin?
Estadgrafos de dispersin.
1. Cmo est definido el recorrido o amplitud?
2. En qu escalas de medicin pueden ser aplicadas?
3. Podemos considerar al recorrido como una medida precisa de la
dispersin? Argumente su respuesta.
4. Cmo est definido el recorrido o amplitud intercuartlico?
5. Qu por ciento de las mediciones abarca el recorrido intercuartlico?
6. Cul es la definicin de desviacin tpica o estndar muestral.? Cul
debe ser la escala de medicin de los resultados para ser aplicada la
desviacin tpica o estndar? Cul es su notacin?
7. Es posible que el resultado de la desviacin tpica o estndar de un
conjunto de resultados de mediciones sea un nmero negativo?
8. Qu caracterstica tendr el conjunto de los resultados de una medicin en
los que su desviacin tpica o estndar es cero?
9. Supongamos que se tiene un conjunto de resultados de mediciones cuya
unidad es u, en cules unidades estar expresada la desviacin tpica o
estndar?
10. Supongamos que estamos en presencia de dos conjuntos cuyas
desviaciones estndares son s1 y s2 tales que s1 >s2 Podemos decir que
la dispersin en el conjunto cuya desviacin es s
2
tiene una dispersin
mayor que los resultados del otro conjuntos? Argumente su respuesta.
11. Cmo se denota a la desviacin tpica o estndar poblacional?
Correlacin.
1. Qu se entiende por correlacin?
2. Cules dos aspectos principales que son analizados cuando se realiza la
correlacin entre dos pruebas?
3. Qu podemos plantear acerca del comportamiento entre dos pruebas si su
coeficiente de correlacin es positivo?, y si fuera negativo?
4. Por qu motivo en la diagonal principal de una matriz de correlacin el
coeficiente de correlacin siempre es 1?
Tabla de frecuencias. Histograma.
1. Para cules aspectos del Anlisis de Datos resultan tiles los
histogramas?
2. Cul es la estructura de una tabla de distribucin de frecuencias?
3. Realice una tabla de distribucin de frecuencias o un histograma. Explique
los siguientes trminos
1. Frecuencia absoluta.
2. Amplitud, ancho o longitud de un intervalo.
3. Marca de clase.
4. Lmite superior de un intervalo.
5. Lmite inferior de un intervalo.
Diagrama de Caja y Bigotes.
1. Cules son los cinco estadgrafos en los que est definido un diagrama de
caja y bigotes?
2. Suponga que usted observa los diagramas de caja y bigotes, de una prueba
realizada en dos momentos diferentes, y usted observa que la caja en el primer
momento tiene un rea mayor que la caja en el segundo momento. Qu
puede usted afirmar en cuanto a la dispersin?

TEMA II. PROBABILIDAD.
Objetivos del tema:
General:Identificar el concepto de probabilidad para su posterior aplicacin.
Especficos:
Familiarizar al alumnado con los conceptos de experimento aleatorio, espacio
muestral, y suceso.
Familiarizar al alumnado con el concepto de probabilidad de un suceso.
Familiarizar al alumnado con las caractersticas de la distribucin Normal.

Contenidos del tema:
Probabilidad de un evento. Espacio muestral. Evento opuesto. Teorema de la
Multiplicacin. Sucesos independientes. Curva Normal.

Orientaciones para la autopreparacin:
El tema que comenzars a estudiar es de gran importancia para el desarrollo
posterior de la asignatura, por eso debes estudiar con cuidado los aspectos
indicados ya que este resulta un tema de difcil comprensin. Se debe destacar
que desde el punto de vista algebraico los requisitos que generalmente se
necesitan no rebasan usualmente las operaciones mas utilizadas en la aritmtica.

Bibliografa:
Libro de texto pginas 65-72; 74-79 y 98-102.

Introduccin: Pgina 65 del libro de texto.
Preguntas:
1. Qu estudia la teora de las probabilidades?

Experimento aleatorio. Espacio muestral y suceso: Pgina 66 del libro de
texto.
Preguntas:
1. Cundo se considera que un experimento es aleatorio?
2. Escriba tres ejemplos de experimentos aleatorios que estn relacionados
con la cultura fsica.
3. Qu se entiende por regularidad estadstica o estabilidad de las
frecuencias relativas de un experimento aleatorio?
4. Qu es un espacio muestral?
5. Con que letra del alfabeto se designa al espacio muestral de un
experimento aleatorio?
6. Clasifique a los espacios muestrales de acuerdo al nmero de sus
elementos.
7. Escribe ejemplos de espacios muestrales .
8. Escriba algn ejemplo de espacio muestral referido a la cultura fsica.
9. Diga con sus palabras que usted entiende por suceso.
10. Que letras del alfabeto se utilizan para denotar a los sucesos?.
11. Cuando ocurre un suceso?.
12. Escriba ejemplos de sucesos elementales y de sucesos compuestos.
13. Qu nombre recibe el suceso A+B?
14. Que representa el suceso A+B?
15. Qu nombre recibe el suceso A*B?
16. Que representa el suceso A*B?
17. A que se llama suceso complementario de A en S?
18. Cmo se denota?
19. Cundo se dice que un suceso es cierto o seguro?
20. Escriba algn ejemplo de suceso cierto referido a la cultura fsica.
21. Cundo se dice que un suceso es imposible o nulo?.

Definicin clsica y estadstica de probabilidad de un suceso: Pgina 69 y 70
del libro de texto.
Orientacin: Busque en un diccionario el significado de la palabra probabilidad.
Lea con cuidado los prrafos 5 y 6 de la pgina 69 los cuales contienen la
interpretacin y la definicin clsica de probabilidad de un suceso. Analice los
ejemplos 4.3-4.6 de las pginas 70 y 71. Regrese al primer tema para recordar de
qu forma se calculan las frecuencias relativas. Lea con detenimiento los dos
ltimos prrafos de la pgina 71 los cuales nos aportan las razones por las cuales
es necesario el conocimiento de la definicin estadstica de probabilidad de un
suceso. Analice con detenimiento los elementos de la distribucin Normal, su
utilidad y la importancia de esta.
Preguntas:
1. Qu establece la definicin clsica de probabilidad de un suceso?
2. Qu significan N
a
y N?
3. La definicin clsica de probabilidad de un suceso se aplica a espacios
muestrales (finitos/infinitos)
4. En la definicin clsica de probabilidad de un suceso se supone que los
resultados elementales del experimento (son igualmente posibles / no son
igualmente posibles)
5. La probabilidad de un suceso cierto es ( 0 / 1)
6. Cul seria el valor de la probabilidad si el suceso es imposible o nulo?
7. Cul es la frmula que permite dada una distribucin Normal convertir las
puntuaciones X en Z (estndar)?
8. En que unidades se expresan las puntuaciones Z?

Ejercicios propuestos.
Puedes realizar los ejercicios de las pginas 84 y 85, excepto el 12, 17-20, 21c,
23d.

Tema 3 Pruebas de Hiptesis. 14 horas
Objetivos:
- Analizar las correlaciones entre variables que son significativas.
- Analizar los resultados para la comparacin de grupos y de mediciones de
un mismo grupo seleccionando una prueba de hiptesis que se lo permita.
Esta seleccin contempla:
1 La existencia de las premisas de la prueba de hiptesis, en particular de
la escala de medicin en que se encuentra la variable procesada.
2 La formulacin de las hiptesis.
3 Realizar la interpretacin de los resultados en la conclusin de la prueba.

Contenidos por Encuentro
7 Problemas a solucionar con las pruebas de hiptesis. Conceptos de las
pruebas de hiptesis: Hiptesis estadsticas, decisin, errores y regla de
decisin.
8 Prueba para la correlacin. Hiptesis. Regla de decisin. Anlisis de los
resultados de una matriz de correlaciones.
9 ANOVA de clasificacin simple. Premisas. Hiptesis. Regla de decisin.
Conclusiones.
10 ANOVA de clasificacin doble con una observacin por casilla. Premisas.
Hiptesis. Regla de decisin. Conclusiones.
11 Prueba de Kruskal Wallis. Premisas. Hiptesis. Regla de decisin.
Conclusiones.
12 Prueba de Friedman. Premisas. Hiptesis. Regla de decisin. Conclusiones.
13 Tabla de contingencia. Premisas. Hiptesis. Regla de decisin. Conclusiones.
Aspectos Metodolgicos.
En la introduccin del tema deben discutirse tres problemas que pueden
resolverse con las pruebas de hiptesis en el campo de la educacin fsica, se
recomienda hacerlo a travs de ejemplos concretos:
1 Comparacin de los resultados de varios grupos.
2 Comparacin de los resultados de varias mediciones en un mismo grupo.
3 Significacin de la relacin entre variables.
Este ltimo problema esta relacionado con el tema 1 pues los resultados de los
softwares siempre sealan las correlaciones significativas.
El desarrollo de los conceptos bsicos de las pruebas de hiptesis son
fundamentales para la compresin y anlisis de los resultados de las mismas. Ver
Freund (1971), Siegel (1972) y pginas Web de la asignatura.
Al desarrollar una prueba de hiptesis se aconseja siempre describir las hiptesis
con palabras y puede utilizarse un ejemplo para hacerlo.
En los dos ANOVA deben sealarse las premisas para la utilizacin y las
dificultades que entraan la comprobacin de las mismas, lo que conduce a utilizar
pruebas de hiptesis no paramtricas. Ver Guerra (1987), Zatsiorski (1983) y
pginas Web de la asignatura.
En el resto de las pruebas debe sealarse lo dbil que son las premisas de las
mismas, ver Siegel (1972) y pginas Web de la asignatura.

Gua de Preguntas.
1 Se reporta en un artculo que existen diferencias sexuales significativas con
error de 0.05 en cuanto a la capacidad de atencin de los alumnos durantes
las clases de Educacin Fsica. Una persona sin conocimientos le solicita la
explicacin de estas conclusiones. Qu respondera usted?
2 Se decide tomar los resultados en un grupo de pruebas fsicas con el fin de
seleccionar a alumnos para el equipo de la escuela, debido a que no se puede
predecir con absoluta certeza si los alumnos seleccionados tendrn buenos
resultados en las competencias, qu errores pueden cometerse? Cul es el
ms importante a tener en cuenta?
3 Un investigador desea probar una hiptesis y para ello toma una muestra y
mide los resultados. Antes de efectuar las mediciones se acerca a usted y le
formula la siguiente pregunta: puedo afirmar, segn los resultados obtenidos
de rechazar o no, que la hiptesis es totalmente verdadera o falsa? Qu le
contestara usted?
5 Si la correlacion entre dos variables A y B es:
a) Negativa.
b) Cero.
c) Positiva.
A que conclusin puede Ud. Llegar respecto a la relacin que hay entre las dos
variables.
6 Se determino que la correlacin de la velocidad y la resistencia en una base de
datos donde el tamao de la muestra es de 121 sujetos es de p= 0.05138 y su
coeficiente de correlacin es r= 0.458 . Realice un breve anlisis de la relacin
existente entre las variables.
7 Suponga que se cumplen las premisas para la aplicacin de la Dcima de
Correlacin de Pearson. Las siguientes salidas son tomadas de una base de datos
de una Secundaria Bsica con una muestra de 60 estudiantes. Realice un anlisis
de cada una y emita sus conclusiones.
a)
Correlations
1.000 .925**
. .000
30 30
.925** 1.000
.000 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
RAP1
RAP2
RAP1 RAP2
Correlation is significant at the 0.01 level
(2-tailed).
**.


a)
Correlations
1.000 -.439*
. .015
30 30
-.439* 1.000
.015 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
TRAC1
RESIST1
TRAC1 RESIST1
Correlation is significant at the 0.05 level (2-tailed). *.

b)
Correlations
1.000 .922**
. .000
30 30
.922** 1.000
.000 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
TRAC1
TRAC2
TRAC1 TRAC2
Correlation is significant at the 0.01 level
(2-tailed).
**.

c)
Correlations
1.000 .005
. .979
30 30
.005 1.000
.979 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
SALT1
SALT2
SALT1 SALT2


8 Completa la sgte. Tabla que muestra la Correlacin en un grupo de estudiantes
de la EPEF. Suponga que la varianza y la Distribucin de donde proviene la
muestra son normales.

Prueba Coef. de
Correlacin
Estadgrafo Probabilidad Significacin Sentido
Abd1& Abd2 0.765 2.567 0.00098
Res1&Res2 - 0.987 5.87 0.00000
Vel1&Tra2 - 0.456 3.76 0.0567
Tra1& Tra2 0.123 1.98 0.345


9 De acuerdo a las salidas de resultados presentadas.
a) Identifique la Dcima empleada.
b) Haga un anlisis de cada una de ellas.

a.
Correlations
1.000 .891**
. .000
30 30
.891** 1.000
.000 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
RESIST1
RESIST2
RESIST1 RESIST2
Correlation is significant at the 0.01 level (2-tailed). **.

b.
Correlations
1.000 .517*
. .048
15 15
.517* 1.000
.048 .
15 15
1.000 -.206
. .462
15 15
-.206 1.000
.462 .
15 15
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
PLANCHS
ABDOMNLS
PLANCHS
ABDOMNLS
Spearman's rho
Spearman's rho
GRUPO
1
2
PLANCHS ABDOMNLS
Correlation is significant at the .05 level (2-tailed). *.

c)

Correlations
1.000 .324
. .142
22 22
.324 1.000
.142 .
22 22
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
PESO
TALLA
Spearman's rho
PESO TALLA


d)
Correlations
1.000 -.313
. .076
33 33
-.313 1.000
.076 .
33 33
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
RAPIDEZ1
RAPIDEZ2
RAPIDEZ1 RAPIDEZ2


10 La siguiente base de datos corresponde a nios de 10 aos de edad de una
escuela primaria, se tomo una muestra en cada grupo de 20. Se desea analizar
las diferencias entre los grupos, en las PEF en la resistencia, para determinar el
entrenamiento a aplicar.
a) Que docima bebe emplear.
b) Halle la salida correspondiente.
c) Haga un anlisis del resultado obtenido. Plantee sus conclusiones.

Grupo1: 8.36- 9.56- 8.56- 12.9- 11.36- 7.56- 9.14- 7.56- 9.6- 8.59- 7.89- 8.96-
7.56- 7.56- 9.75- 10.23- 7.36- 12.36- 8.56- 7.36-

Grupo2: 7.36- 8.36- 8.36- 10.35- 8.96- 7.56- 7.56- 8.36- 7.23- 8.31- 7.56- 7.- 7.45-
8.5- 7.38- 8.56- 7.89- 8.99- 9.12- 7.23-

11 Se analiza el resultado deportivo en nios atletas en condiciones bajo techo y
al aire libre. El grupo se ha dividido en un grupo de control y el otro experimental.
La muestra tomada es de 15 estudiantes en cada uno,. A continuacin te
ofrecemos las salidas de resultados.
a) Que docima ha empleado el investigador.
b) Tome una decisin en cada caso y confeccione un breve resumen.
1.
Test Statistics
b
109.000
229.000
-.146
.884
.902
a
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailed
Sig.)]
PLANCHA
Not corrected for ties.
a.
Grouping Variable: SERIES
b.


2
Test Statistics
b
17.000
137.000
-3.981
.000
.000
a
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailed
Sig.)]
SALTOS
Not corrected for ties. a.
Grouping Variable: SERIES b.


12 Se han tomado mediciones a un grupo de 30 atletas de 16 aos de la
modalidad TWD.
Entre mediciones se realizo un entrenamiento intensivo. Considere que se
cumplen las premisas para la aplicacin de esta dcima. Mostramos las salidas
correspondientes.
a) Identifique la dcima empleada.
b) Haga un resumen del anlisis realizado por Ud.


PLANCHAS

Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
4128.062 1 4128.062 231.019 .000
553.937 31 17.869
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.


RAPIDEZ
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
2958.680 1 2958.680 7864.976 .000
11.662 31 .376
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.

SALTO
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
1324801.000 1 1324801.000 5254.456 .000
7816.000 31 252.129
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.


13 Observa las siguientes salidas:
a) A que dcima corresponden.
b) Analice la decisin a tomar y realice un resumen.

a)
Test Statistics
a,b
5.068
2
.079
Chi-Square
df
Asymp. Sig.
PENCEST
Kruskal Wallis Test a.
Grouping Variable: GRUPO b.


b)
Correlations
1.000 .040
. .832
30 30
.040 1.000
.832 .
30 30
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
PEENC1
PEENC2
PEENC1 PEENC2


c)
Correlations
1.000 .465**
. .000
120 120
.465** 1.000
.000 .
120 120
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
TALLA
PESO
TALLA PESO
Correlation is significant at the 0.01 level
(2-tailed).
**.


14 El numero de pelotas encestadas por 3 grupos de atletas de alto rendimiento
se realiza por tiempo determinando la cantidad que realiza cada grupo, donde el
tamo de cada uno es de 10 sujetos determina:
a) La dcima que debe aplicarse.
b) Obtenga las salida correspondiente y determine las diferencias entre los
grupos. Realice un anlisis.

15 Se conoce en un trabajo anterior que la media para nios de 10 aos en el
salto de longitud es de 1.5 metros. Se tomo una muestra aleatoria de 25 nios de
esa edad y se obtuvo una media de 1.48 metros y una desviacin tpica de 0.1 m.
Determine el grado de significacin entre la media de la poblacin y el valor de
1.5m.

16 Las siguientes salidas muestran los resultados alcanzados por una muestra de
10 sujetos a los cuales se les aplico las Pruebas de Eficiencia Fsica en pruebas
de velocidad en tres momentos con un tiempo entre ellas de tres meses.
a) Que dcima debe aplicar.
b) Analice el grado de significacin entre las pruebas. Haga un breve resumen.

A.-
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
15430.792 1 15430.792 11150.664 .000
53.970 39 1.384
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.

A.-
Correlations
1.000 .649**
. .000
40 40
.649** 1.000
.000 .
40 40
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
RES1
RES2
RES1 RES2
Correlation is significant at the 0.01 level
(2-tailed).
**.

B.-
Ranks
30
a
18.35 550.50
8
b
23.81 190.50
2
c
40
Negative Ranks
Positive Ranks
Ties
Total
RES2 - RES1
N Mean Rank Sum of Ranks
RES2 < RES1 a.
RES2 > RES1 b.
RES1 = RES2 c.

Test Statistics
b
-2.611
a
.009
Z
Asymp. Sig. (2-tailed)
RES2 - RES1
Based on positive ranks. a.
Wilcoxon Signed Ranks Test b.


C.
Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average
4268.880 1 4268.880 1477.069 .000
286.120 99 2.890
Source
Intercept
Error
Type III Sum
of Squares df Mean Square F Sig.


D.-
Correlations
1.000 .537*
. .015
20 20
.537* 1.000
.015 .
20 20
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
ABD1
ABD2
Spearman's rho
ABD1 ABD2
Correlation is significant at the .05 level (2-tailed). *.


E.-
Ranks
8
a
6.94 55.50
7
b
9.21 64.50
5
c
20
Negative Ranks
Positive Ranks
Ties
Total
ABD2 - ABD1
N Mean Rank Sum of Ranks
ABD2 < ABD1 a.
ABD2 > ABD1 b.
ABD1 = ABD2 c.


Test Statistics
b
-.268
a
.788
Z
Asymp. Sig. (2-tailed)
ABD2 - ABD1
Based on negative ranks. a.
Wilcoxon Signed Ranks Test b.


F.-

Ranks
20 21.45
20 19.55
40
EQUIPO
orientales
occidentales
Total
VELO1
N Mean Rank


Test Statistics
a,b
.265
1
.607
Chi-Square
df
Asymp. Sig.
VELO1
Kruskal Wallis Test a.
Grouping Variable: EQUIPO b.


G.-

Correlations
1.000 .994**
. .000
20 20
.994** 1.000
.000 .
20 20
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
VELO1A
VELO1B
Spearman's rho
VELO1A VELO1B
Correlation is significant at the .01 level (2-tailed). **.

H.-
Ranks
20 21.45 429.00
20 19.55 391.00
40
20 23.27 465.50
20 17.73 354.50
40
EQUIPO
orientales
occidentales
Total
orientales
occidentales
Total
VELO1
VELO2
N Mean Rank Sum of Ranks


Test Statistics
b
181.000 144.500
391.000 354.500
-.515 -1.507
.607 .132
.620
a
.134
a
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailed
Sig.)]
VELO1 VELO2
Not corrected for ties. a.
Grouping Variable: EQUIPO b.