Académique Documents
Professionnel Documents
Culture Documents
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:24:04.
Queda rigurosamente prohibida sin la autorización escrita de los titulares del Copyright,
bajo las sanciones establecidas en las leyes, la reproducción total o parcial de esta obra
por cualquier medio o procedimiento, comprendidos la reprografía y el tratamiento
informático, y la distribución de ejemplares de ella mediante alquiler o préstamo
público.
ISBN: 978-84-7491-992-9
Copyright © 2010. Editorial Complutense. All rights reserved.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:24:04.
Carlos de la Puente Viedma 41
6 Introducción a la Estadística
6.1 Estadística, preguntas y variables
Entendemos por Estadística “la disciplina científica que trata de la recolección,
análisis, y presentación de datos” (ver nota 3).38 Por el interés de la obra, la Estadística se
divide en Estadística Descriptiva (Tabulación) y Estadística Inferencial (Análisis o contraste
de hipótesis). Otro grupo sería la Estadística Multivariable, que no es objeto de este tratado.
Los datos se consideran de tres tipos: Tipo I, Tipo II y Tipo III. Los datos de Tipo I
son los datos brutos, “raw data” o microdatos. Se dispone de los datos o valores que se tiene
para todos y cada uno de los casos. En los datos Tipo II, se muestra la frecuencia, el número
de casos que hay en cada categoría o valor distinto o el número de veces que se repite o
aparece cada valor o categoría distinta (tabla de frecuencias). En los datos Tipo III, también se
muestra la frecuencia o el número de casos, pero por intervalos (Tabla de frecuencias por
intervalos). Los ejemplos se muestran en la Tabla 11.
Li 1 Li 1 En donde:
X i' Li-1: Límite inferior del intervalo
2
Li+1: Límite superior del intervalo
18 21
X 1' 19,5 X i' : Marca de clase del intervalo
2
i-ésimo.
21 24
X 2'
Copyright © 2010. Editorial Complutense. All rights reserved.
22,5
2
27 30
X 4' 28,5
2
La aplicación de los estadísticos se hace sobre los datos de Tipo I y Tipo II. Con los
datos Tipo III se procede pasándolos a datos Tipo II, representando cada intervalo, estrato o
categoría por el valor medio o marca de clase del intervalo. En este caso, a la variable se la
38
"statistics" A Dictionary of Genetics. Robert C. King, William D. Stansfield and Pamela K. Mulligan. Oxford
University Press, 2007. Oxford Reference Online. Oxford University Press. Universidad Complutense de Madrid. 16 July
2008 http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t224.e6186.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
42 Estadística descriptiva e inferencial y una introducción al método científico
Respuesta:
x RAE: “Satisfacción a una pregunta, duda o dificultad”.
x BDCD: “Algo dicho o escrito en respuesta a una pregunta”
Ejemplos:
En las tres preguntas anteriores, la respuesta es marcar en la casilla correspondiente la
respuesta dada a cada una. En la P-1, indicar cual es el sexo; en la P-2 el estado civil, y en
cada una de las preguntas de la P-3, indicar el peso, la estatura y la edad, por este orden.
Copyright © 2010. Editorial Complutense. All rights reserved.
Categoría:
x DMM: “Cada grupo de cosas o personas de la misma especie de los que resultan al ser
clasificadas por su importancia, grado o jerarquía”.
x BDCD: “Una de las clases distintas y fundamentales a la que pertenece una entidad o
concepto”. “Una división dentro de un sistema de clasificación”.
Ejemplos:
De las tres preguntas anteriores, las categorías de la P-1 son: varón y mujer. En la P-2,
las categorías son: soltero/a, casado/a, pareja, separado/a, divorciado/a y viudo/a. En la P-3,
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
Carlos de la Puente Viedma 43
Variable:
x OROP:39 “En las ciencias sociales, el término se refiere a atributos que son fijos para
cada persona u otra entidad social, el cual es observado a los diferentes niveles o
cantidades de las muestras y otros grupos de agregados. Las variables miden una
estructura social (como la clase social, edad, o tipo de albergue) y en cierto modo
permite el análisis numérico. Así que el rasgo importante de una variable es que es
capaz de reflejar la variación dentro de una población, y no es una constante”.40
x RAE: “Que varía o puede variar”.
x BDCD: “Capaz o apto para variar: sujeto a variación o cambio”.
Ejemplos:
En el ejemplo considerado, las variables se corresponden con las preguntas y así, las
variables serían: sexo, estado civil, peso, estatura y edad.
Espacio muestral:
x OROP: “Un conjunto completo de todos los posibles resultados de un experimento o
procedimiento de observación. El concepto fue introducido por von Mises en 1931. El
espacio muestral normalmente se representa por :, S o E.41
x DSTTMH:42 “Un concepto o término en teoría de probabilidades que considera todos
los posibles resultados de un experimento, juego o similar, como puntos en un
espacio”.
Ejemplos:
En la pregunta o variable sexo, el espacio muestral es: varón y mujer. En estado civil
el espacio muestral está definido por: soltero/a, casado/a, pareja, separado/a, divorciado/a y
viudo/a. Y en peso, estatura y edad, los espacios muestrales están definidos por todos los
posibles valores de cada una de las preguntas o variables y que son finitos y conocidos. En el
caso del peso y la estatura son los valores posibles de la población objetivo y la edad es la
Copyright © 2010. Editorial Complutense. All rights reserved.
Suceso elemental:
x OROP: “Un suceso elemental es uno de los resultados posibles del espacio
39
Oxford Reference Online Premium.
40
"variable" A Dictionary of Sociology. John Scott and Gordon Marshall. Oxford University Press 2005. Oxford
Reference Online. Oxford University Press. Universidad Complutense de Madrid. 8 December 2008
http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t88.e2451.
41
"sample space" A Dictionary of Statistics. Graham Upton and Ian Cook. Oxford University Press, 2008.Oxford
Reference Online. Oxford University Press. Universidad Complutense de Madrid. 8 December 2008
http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t106.e1433.
42
Diccionario de Términos Científicos y Técnicos. McGraw-Hill.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
44 Estadística descriptiva e inferencial y una introducción al método científico
muestral”.43
x DSTTMH: “Cada uno de los posibles resultados de un experimento aleatorio, es decir
cada uno de los elementos del espacio muestral”.
Ejemplos:
En la pregunta o variable sexo, los sucesos elementales del espacio muestral son:
varón y mujer. En estado civil los sucesos elementales son: soltero/a, casado/a, pareja,
separado/a, divorciado/a y viudo/a. Y en peso, estatura y edad, los sucesos elementales son
todos los posibles valores de cada una de las preguntas o variables y que son finitos y
conocidos. En el caso del peso y la estatura son los valores posibles de la población objetivo y
de la edad los sucesos elementales están definidos por los criterios de delimitación de la
población.
43
"sample space" A Dictionary of Statistics. Graham Upton and Ian Cook. Oxford University Press, 2008.Oxford
Reference Online. Oxford University Press. Universidad Complutense de Madrid. 8 December 2008
http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t106.e1433.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
Carlos de la Puente Viedma 45
de orden, lo que le asigna la característica de las variables ordinales. Existe distancia entre sus
valores, lo que le asigna la característica de las variables intervalares. La característica que las
diferencia es que el cero significa “ausencia de” “valor nulo”. A los valores de estas variables
se les puede aplicar operaciones aritméticas, criterios de ordenación, operadores lógicos y
operaciones de clasificación.
Son ejemplos de medidas de RAZON: edad, peso, estatura, número de hijos, cantidad
de productos comprados, salario.
No obstante esta clasificación, en la etapa de tabulación y análisis, la consideración
del nivel de medida de las variables puede ajustarse en función de ciertas necesidades y
consideraciones, todas ellas argumentadas, como es el caso de variables dicotómicas, binarias
y ordinales.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
46 Estadística descriptiva e inferencial y una introducción al método científico
La característica de ausencia de valor del cero, significa que se pueden comparar las
magnitudes. Por ejemplo, es correcto decir que un adulto que mida 1,84 m. mide el doble que
un niño de 0,92 m. o que una carrera de 300 m. es tres veces más larga que una de 100 m.
Pero no es correcto decir que 40º C es el doble de calor que 20º C, sí se puede decir que 40º C
es el doble del valor 20º C en la escala centígrada, en la que el 0º C es por convenio y es la
posición en la que el agua se solidifica. Para que la temperatura se pueda comparar es
necesario que esté referida a la escala de temperatura termodinámica o Kelvin en la que el
cero tiene valor absoluto y se corresponde con los -273,16º C. El Gráfico 2 muestra que el
segmento a con el valor 40 es el doble que el segmento b con el valor 20, según la escala
Centígrada. Pero el segmento c no es el doble de calor que el segmento d, tomando como
referencia el cero absoluto (0 K) que se corresponde con -273,16º C.
44
Una discusión detallada sobre el tema se puede ver en De la Puente (2007 b).
45
"classify verb" The Oxford Dictionary of English (revised edition). Ed. Catherine Soanes and Angus Stevenson. Oxford
University Press, 2005. Oxford Reference Online. Oxford University Press. Universidad Complutense de Madrid. 14 July
2008 <http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t140.e14265>
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
Carlos de la Puente Viedma 47
cigarro al mes, etc. Por lo tanto, este instrumento de obtención de datos no sería ni fiable ni
válido. Otra forma posible es hacer la pregunta de tipo categórica pero ordinal:
Pero plantea los mismos problemas que la anterior. Se puede optar por una pregunta
de tipo escalar o intervalar: Escala de Intensidad de la siguiente manera:
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
48 Estadística descriptiva e inferencial y una introducción al método científico
En este tipo de pregunta se dan los mismos problemas que en las anteriores, además
del problema indicado en las escalas termométricas. El criterio de subjetividad sería
paradójico. Supongamos dos individuos A y B, siendo A que fuma 40 cigarrillos/día pero está
en un grupo en el que cada individuo fuma 80 cigarrillos/día y el individuo B con 20
cigarrillos/día pero está en un grupo en el que cada individuo fuma 10 cigarrillos/día. En esta
hipotética situación, el B podría situarse en la escala en el valor 8 mientras que el A podría
situarse en el 4. Siendo que el A fuma el doble que el B, la escala mostraría que el B tiene el
doble del valor de A. Probablemente este hecho no se producirá, pero si fuese así, no se
podría controlar.
Por último, la pregunta de tipo de razón sería:
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
Carlos de la Puente Viedma 49
que sus valores pertenecen a los números reales que se definen de manera axiomática como el
conjunto de números que se encuentran en correspondencia biunívoca con los puntos de una
recta infinita (continuum): la recta numérica. Ejemplos: salario, edad, estatura, peso.
Una variable discreta sería la que entre cualesquiera dos valores contiguos no existen
posiciones intermedias y se corresponderían con los números enteros, siendo que los números
enteros se representan gráficamente en la recta de números enteros como puntos a un mismo
espacio entre sí, desde menos infinito, ..., -3 , -2, -1, 0, 1, 2, 3,... hasta más infinito. Ejemplos:
número de hijos, número de cigarros fumados, veces que se ha ido al cine, número de días
trabajados, edad.
En Sociología sería más apropiado hablar de números naturales, puesto que las
variables utilizadas no pueden tener valores negativos. No se puede tener peso negativo,
número de hijos negativo, etc. La excepción son las escalas construidas que pueden estar en el
ámbito de los números enteros negativos.
A veces las variables tienen la doble consideración. Por ejemplo, la edad se trata
siempre como variable discreta cuando se dice los años cumplidos, aunque en realidad es una
variable continua. Sean consideradas continuas o discretas las variables, cuando se aplican
funciones estadísticas (media [ X ], varianza [ S 2 ], desviación típica [ S ], etc.) éstas se
consideran valores continuos y se presentarán con decimales.
LAS VARIABLES SEGUN SU RELACIÓN
En los procesos de análisis las variables se consideran según la relación entre ellas.
Genéricamente se consideran variables dependientes o independientes.
El concepto de dependencia de una variable tiene varias definiciones. “En un estudio,
análisis o modelo, una variable dependiente es el elemento social cuyas características o
variaciones serán explicadas por la referencia a la influencia de otra, anterior, llamada
variable independiente”46 (ver nota 3).
En los métodos de investigación y estadísticos, “es una variable que potencialmente
puede ser influida por una o más variables independientes. El propósito de un experimento es
típicamente determinar si una o más variables independientes influyen en una o más variables
dependientes de alguna manera”47 (ver nota 3).
“En la regresión múltiple, un grupo de variables independientes o predictoras se
combinan en un modelo lineal para proporcionar la mejor predicción de una variable
dependiente que a veces se llama la variable criterio”48 (ver nota 3).
Matemáticamente “si y es una función de x (y = f(x)), esto es, si la función asigna un
solo valor a y por cada valor de x, entonces y es la variable dependiente” (McGraw-Hill, op.
Copyright © 2010. Editorial Complutense. All rights reserved.
46
"dependent variable" A Dictionary of Sociology. John Scott and Gordon Marshall. Oxford University Press 2005.
Oxford Reference Online. Oxford University Press. Universidad Complutense de Madrid. 11 July 2008
http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t88.e551.
47
"dependent variable n." A Dictionary of Psychology. Andrew M. Colman. Oxford University Press, 2006. Oxford
Reference Online. Oxford University Press. Universidad Complutense de Madrid. 11 July 2008
http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t87.e2193.
48
Ibíd.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
50 Estadística descriptiva e inferencial y una introducción al método científico
El que una variable sea tratada como dependiente o independiente esta determinado por el
marco teórico y el enfoque del estudio, pero las variables independientes deben preceder a la
variable dependiente, y debe ser la causa”49 (ver nota 3).
En un diseño experimental la variable independiente es “una variable que es
controlada/manipulada por el experimentador, independientemente de las variables extrañas,
para examinar sus efectos en la variable dependiente”50 (ver nota 3).
Matemáticamente la variable independiente es “en una ecuación y = f(x), la variable de
entrada x. También conocido como el argumento”51 (ver nota 3).
Definir la variable dependiente (variable no controlada), asume la definición de la
variable independiente (variable controlada). Los nombres que pueden recibir según los
procedimientos estadísticos que se utilizan se muestran en la Tabla 13.
49
"independent variable" A Dictionary of Sociology. John Scott and Gordon Marshall. Oxford University Press 2005.
Oxford Reference Online. Oxford University Press. Universidad Complutense de Madrid. 11 July 2008
http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t88.e1083.
50
"independent variable n." A Dictionary of Psychology. Andrew M. Colman. Oxford University Press, 2006. Oxford
Reference Online. Oxford University Press. Universidad Complutense de Madrid. 11 July 2008
http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t87.e4110.
51
McGraw-Hill (2003). Dictionary of Scientific and Technical Terms.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
Carlos de la Puente Viedma 51
Una columna o variable es el conjunto de datos que se tiene para todos los casos, y
deben ser de la misma unidad de medida y de la misma característica.52 De todos los datos de
una variable, al menos uno, debe tener un valor distinto a los demás, porque si no, se
denomina constante. Una fila es el conjunto de datos que se tiene para cada caso en todas las
variables. Los valores de los datos serán del tipo y unidad de medida de la variable
correspondiente.
Una variable (Ver Epígrafe 6.1) “es la característica medida u observada cuando se
realiza un experimento o una observación. Las variables pueden ser no-numéricas
52
Si la variabl es el peso de las unidades de observación, la variable “peso” debe contener el peso de todas las unidades
de observación y en la misma unidad de medida: kg, g, etc. No se puede, por ejemplo, grabar la estatura o el salario en la
variable “peso”.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
52 Estadística descriptiva e inferencial y una introducción al método científico
Ejemplo 1:
El espacio muestral de tirar un dado de seis caras tiene seis elementos o sucesos elementales:
E = (1, 2, 3, 4, 5, 6)
Los si de este E se consideran exhaustivos y excluyentes. Exhaustivos porque son todos los resultados posibles
y son conocidos y excluyentes porque en cada ocasión sólo se puede obtener uno de los resultados posibles.
Ejemplo 2:
E = (s1, s2)
E = (Varón, Mujer)
Los si de este E se consideran exhaustivos y excluyentes. Exhaustivos porque son todos los resultados posibles
y son conocidos, y excluyentes porque en cada ocasión sólo se puede obtener uno de los resultados posibles.
Ejemplo 3:
De tal manera que el s1 = Soltero; el s2 = Casado; s3 = Pareja; s4 = Separado; s5 = Divorciado, y s6 = Viudo. Así
que el E de estado civil es:
Copyright © 2010. Editorial Complutense. All rights reserved.
Los si de este E se consideran exhaustivos y excluyentes. Exhaustivos porque son todos los resultados posibles
y son conocidos y excluyentes porque en cada ocasión sólo se puede obtener uno de los resultados posibles.
53
"variable" A Dictionary of Statistics. Graham Upton and Ian Cook. Oxford University Press, 2006. Oxford Reference
Online. Oxford University Press. Universidad Complutense de Madrid. 17 July 2008
http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t106.e1703.
54
"sample space" A Dictionary of Statistics. Graham Upton and Ian Cook. Oxford University Press, 2006. Oxford
Reference Online. Oxford University Press. Universidad Complutense de Madrid. 17 July 2008
http://www.oxfordreference.com/views/ENTRY.html?subview=Main&entry=t106.e1433.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
Carlos de la Puente Viedma 53
6.2.1 La codificación
Se denomina codificación, a la asignación de valores o códigos numéricos a las
categorías, características o atributos de las variables categóricas (nominales y ordinales) y a
las escalares o de intervalo. Esta asignación como no tiene ningún significado, es arbitraria y
aleatoria. En las variables ordinales que indican orden, y en las escalares que indican orden y
distancia, una vez establecido el origen, los códigos deben mantener un orden y en las
escalares, además, distancia.
Ejemplo 1:
Ejemplo 2:
La variable “estado civil” tiene seis características o atributos: Soltero, Casado, Pareja, Separado, Divorciado y Viudo.
La asignación de códigos puede ser: Soltero = 1, Casado = 2, Pareja = 3, Separado = 4, Divorciado = 5 y Viudo = 6.
Al grabar o escribir en la matriz de datos, los datos que se ponen en cada celda son las
características, atributos o valores de las variables que se corresponden con las respuestas a
las preguntas. Con la codificación, todos los datos son estrictamente valores numéricos o
códigos.
En la Tabla 15 se presenta un modelo de cuestionario, aplicado a un grupo de jóvenes,
que servirá de ejemplo para la aplicación de los estadísticos posteriores. Este grupo se utiliza
a modo de ejemplo y no tiene ninguna representatividad.
Tabla 15 Cuestionario.
Copyright © 2010. Editorial Complutense. All rights reserved.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
54 Estadística descriptiva e inferencial y una introducción al método científico
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.
Carlos de la Puente Viedma 55
Mujer: = 14,58. Aunque esta asignación puede ser válida, no cumple algunas de las reglas de
la codificación. Para cumplir las reglas y de forma razonable, ya que es aleatorio y arbitrario,
se codifica: Varón = 1 y Mujer = 2 ó Varón = 0 y Mujer = 1 ó Varón = 1 y Mujer = 3 ó Varón
= 2 y Mujer = 4.
Las reglas que presenta la codificación son en parte obligatorias y en parte
convencionales por opcionales, pero se van a tratar todas como obligatorias. Estas reglas se
muestran en la Tabla 18.
Puente, V. C. D. L. (2010). Estadística descriptiva e inferencial y una introducción al método científico. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecafuaasp on 2017-12-15 07:23:24.