Vous êtes sur la page 1sur 9

1

Tema 56. USOS DE LA ESTADÍSTICA: Estadística descriptiva y Estadística inferencial. Elementos


básicos y métodos estadísticos. Aplicaciones al estudio de situaciones y toma de decisiones.
Estudio histórico de la Estadística.

1. CONTEXTO SOCIAL [3]

El desarrollo y el nivel de aplicación de la Estadística como herramienta útil y rigurosa en el


campo de la investigación en todas las Ciencias han sido espectaculares en los últimos años. Este
progreso ha venido estrechamente vinculado al que ha experimentado el área de la computación,
que nos ha llevado a una sociedad absolutamente informatizada. Un segundo factor asociado a este
progreso del conocimiento en el ámbito estadístico, ha sido el cambio de actitud experimentado por
todos los profesionales. Hoy día es casi imposible que cualquier medio de difusión, periódico,
radio, televisión, etc. no nos aborde diariamente con cualquier tipo de información estadística.
En general, a lo largo de nuestra formación académica, estudiamos las asignaturas científicas
de una manera lineal y aséptica, como un cuerpo doctrinal fuera de cualquier contexto histórico,
desligado de la vida de personas reales que contribuyeron a su desarrollo, así como de las
circunstancias históricas y sociales que propiciaron la aparición de nuevas teorías y conocimientos;
lo cual contrasta de forma sorprendente con el auge y éxito de ventas de las novelas históricas, de
las biografías, ensayos sobre la historia de la Ciencia y libros en los que se mezclan la Matemática y
la ficción.
El principal objetivo de los docentes de esta materia se centra en generar, en los alumnos,
una actitud crítica ante cualquier lectura y conocer a priori los pasos y los elementos
imprescindibles en cualquier investigación empírica que se apoye en el manejo de volúmenes
grandes de datos y cuyo propósito final sea condensar dicha información para que pueda ser
transmitida o extrapolar las conclusiones a las poblaciones de las que fueron tomadas las medidas.
De una sociedad en la que los roles y el desempeño de toda una gama de profesiones estaban
ajustados a la mera aplicación de los conocimientos adquiridos, hemos evolucionado a una sociedad
científica donde la investigación ha pasado a formar parte esencial de su labor diaria. El interés por
descubrir nuevos procedimientos a través de la experiencia acumulada, ha sido determinante en la
necesidad de que todos los profesionales se vean inmersos en la formación y aprendizaje de técnicas
básicas de metodología de la investigación y de algunas más concretas como el análisis de datos.
Este cambio en la dimensión del ejercicio profesional, determina que los planes de estudio
de todas las licenciaturas incluyan la Estadística, como materia troncal con entidad propia y de
auténtica necesidad. Se pretende, con ello, que un profesional de cualquier Ciencia, que se apoye en
la cuantificación y en el estudio empírico de lo que observa a diario, entienda y conozca los
conceptos básicos de la Ciencia que le va a permitir, abandonando conductas pragmáticas,
profundizar y comprender el fundamento científico de su área de trabajo.

2. RESUMEN

Cuando coloquialmente se habla de Estadística, se suele pensar en una relación de datos


numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto
popular que existe sobre el término y que cada vez está más extendido debido a la influencia de
nuestro entorno. Sin embargo, la Estadística constituye una poderosa herramienta para generar
conocimiento y ha experimentado un vigoroso desarrollo a lo largo de los últimos años cuyo fruto
han sido diferentes instrumentos que permiten poner en relación los datos recogidos con algún
modelo ideal de probabilidad, ayudando a descubrir en la evidencia empírica algún tipo de
regularidad estocástica. Actualmente se aplica en casi todas las áreas del saber y, de manera muy

Borrador del temario de Oposiciones para profesor de Secundaria de la especialidad de Matemáticas 2011.
2

determinante en las Ciencias Sociales. Ahora, bien, puede llegar a ser utilizada de manera incorrecta
para la defensa de argumentos particulares.
La Estadística tiene su propio lenguage con vocabulario independiente del resto de las
matemáticas. Un rasgo característico derivado de su estrecha relación con las ciencias sociales es
que este vocabulario está muy extendido y se ha hecho familiar. Lo que podría parecer una ventaja
se convierte en un problema para los alumnos que tienen unas ideas preconcebidas que en muchos
casos son equivocadas y difíciles de cambiar. Por eso debemos ser muy claros en el desarrollo de
estos contenidos y utilizar ejemplos cercanos además de con aplicaciones prácticas.

3. INTRODUCCIÓN HISTÓRICA

La imposibilidad de encontrar una causa o conjunto de causas que permitieran predecir el


resultado, por ejemplo, al tirar un dado, hizo que las culturas antiguas atribuyeran los resultados de
fenómenos aleatorios a la voluntad divina. No es hasta el Renacimiento cuando, con un nuevo
enfoque, se abandonan las interpretaciones teológicas del azar y se produce una reconsideración de
los fenómenos aleatorios, haciendo que los matemáticos italianos de principios del siglo XVI
comenzaran a interpretar los resultados de experimentos aleatorios simples.
Destacan las contribuciones de matemáticos notables como Kepler (1571-1630) y Galileo
(1564-1642) que habían esbozado unas primeras formalizaciones de algunos esquemas aleatorios.
En concreto, en 1526, Cardano establece, bajo condiciones de simetría, la equiprobabilidad de
aparición de las caras de un dado a largo plazo, y Galileo, respondiendo a un jugador que le
preguntó por qué es más difícil obtener un 9 tirando 3 dados que obtener un 10, razonó que de las
216 combinaciones posibles, 25 conducen a 9 y 27 conducen a 10.
Sin embargo el origen del cálculo de probabilidades se suele situar en el siglo XVII, con las
aportaciones de los matemáticos franceses B. Pascal (1623-1662) y P. Fermat (1601-1665) sobre
problemas clásicos de los juegos de azar, junto con el holandés C. Huygens (1629-1695), quien
generaliza la media aritmética introduciendo el concepto de esperanza matemática. Esta nueva
Ciencia fue tomando cuerpo a lo largo de los siglos XVIII, XIX, y comienzos del XX, merced a los
logros de figuras tan notables como T. Bayes (1702-1761), Pierre Simon, Marqués de Laplace
(1749-1827) y K.F. Gauss (1777-1855), entre otros muchos. Thomas Bayes establece el célebre
teorema de Bayes, introduciendo los conceptos de probabilidad “a priori” y “a posteriori”. Estas
innovaciones, desarrolladas por el Marqués de Laplace, desembocan en la denominada Inferencia
Bayesiana. Laplace establece por primera vez una definición explícita de probabilidad de un suceso,
como el cociente entre el número de casos favorables y el de casos posibles, siempre que todos los
resultados tengan igual probabilidad. Además, Gauss estudió, junto con Laplace, las aplicaciones de
la Teoría de Probabilidades al análisis numérico de los errores de medida en las observaciones
físicas y astronómicas, dando lugar a la Teoría de errores.
Históricamente la Estadística comenzó siendo esencialmente descriptiva, pero ha sido
necesario acumular información, analizarla y sintetizarla de manera que, gracias al cálculo de
probabilidades, la Estadística ha pasado a ser explicativa, proporcionando potentes herramientas
para la toma de decisiones. Una contribución importante en 1846 a dicha síntesis se debió a A.
Quetelet (1796-1874), que sostuvo la importancia del cálculo de probabilidades para el estudio de
datos humanos y demostró que la estatura de los reclutas de un reemplazo seguía una distribución
normal, e introdujo el concepto de “hombre medio”.
La unión entre el cálculo de probabilidades y la estadística se consuma a finales de s. XIX,
favorecida por los problemas teóricos y metodológicos que suscita el contraste empírico de la teoría
de Darwin.
F. Galton, primo de Darwin, estudia exhaustivamente la distribución normal y define el

Borrador del temario de Oposiciones para profesor de Secundaria de la especialidad de Matemáticas 2011.
3

concepto de regresión para comparar la estatura de padres e hijos. Junto con K. Pearson y W.
Weldon funda la revista ''Biometrika'' que aún es una de las revistas más prestigiosas en estadística.
A principios del siglo XX el laboratorio de K. Pearson se convierte en un polo de atracción
para las personas interesadas en el análisis empírico de datos. Allí acude, entre otros, W.S. Gosset,
que trabaja para la fábrica de cervezas Guinness en Dublín. Gosset investiga los efectos sobre la
cerveza según la materia prima utilizada y observa un problema con los métodos de K. Pearson para
muestras pequeñas. Esto le lleva a proponer una nueva distribución, la distribución t, que publica
con el pseudónimo Student, ya que Guinness no permitía divulgar las investigaciones de sus
empleados.
Los fundamentos de la estadística actual se deben a A. Fisher (1890-1962). J. Neyman
(1891-1981) intentó dar métodos que mejoraran los propuestos por Fisher sobre la teoría de los
contrastes de hipótesis ayudando a clarificar la metodología estadística. Neyman tambien trabajó en
la elaboración de la teoría de los intervalos de confianza en colaboración con el hijo de K. Pearson.
Se puede considerar el año 1950 como inicio de una nueva etapa en el desarrollo de la
estadística propiciada por el uso generalizado de los ordenadores que permiten el tratamiento de
grandes volúmenes de datos.

4. INTRODUCCIÓN TEÓRICA

La Estadística es la ciencia que se encarga de recoger, ordenar, analizar, inferir y representar


información sobre ciertas características de una población denominadas variables estadísticas.
Llamamos individuos o elementos a las personas o cosas que componen una población.
El tamaño de una población es el número de elementos que componen una población. Puede
ser finito o infinito.
Una vez seleccionados los caracteres que vamos a someter a nuestra investigación
estadística, se procede a observarlos en los elementos de la población
Uno de los pilares sobre los que se asienta esta ciencia son los parámetros estadísticos que
resumen el comportamiento de las variables estadísticas, es decir, su distribución.
A grandes rasgos hay dos tipos de parámetros estadísticos. Los que informan sobre los
valores al rededor de los cuales se distribuye las variables se denominan parámetros de
centralización(media, mediana, ...) y los que informan sobre como varían estas características
parámetros de dispersión(varianza, desviación típica, ...). Por tanto los parámetros estadísticos son,
en origen, explicativos. Sin embargo, su importancia va mucho más allá pues también son
protagonistas de la Estadística Inferencial.
Toman un número finito
Se describen DISCRETAS: o infinito numerable de
numéricamente. valores.
CUANTITATIVOS
Una variable Pueden tomar cualquier
O VARIABLES:
toma distintos valor en un intervalo o
CARACTERES VALORES. CONTINUAS:
conjunto de intervalos de
números reales.
Se describen mediante palabras. Por ejemplo "partido
CUALITATIVOS
político favorito". Un atributo toma distintas
O ATRIBUTOS:
MODALIDADES.
Tabla 1. Tipos de caracteres. Variables y Atributos.

Borrador del temario de Oposiciones para profesor de Secundaria de la especialidad de Matemáticas 2011.
4

5. TEORÍA DE PROBABILIDADES

La estabilidad de las frecuencias de un suceso en las series de pruebas relativas a un


experimento aleatorio, junto con las propiedades de las frecuencias, nos llevan a la siguiente
Definición de Probabilidad (Definición axiomática de Cramer-Kolmogorov1):
Sea el par (E,S), donde E es el Espacio Muestral y S el σ-Álgebra de sucesos, un espacio
Probabilizable. Llamamos PROBABILIDAD a una aplicación:
P :S → ℜ (1)
que cumple los siguientes axiomas:
a) A cada suceso A∈S le corresponde un número real, P ( A)≥0 , llamado probabilidad
del suceso A.

b) Si A1 , A2 , ... son incompatibles entonces P ( ∪i=1 Ai )=∑ P ( Ai) .

i=1
c) P (E )=1.
Y decimos que (E,S,P) es un Espacio probabilístico.

6. VARIABLES ALEATORIAS CUANTITATIVAS

Consideremos un experimento aleatorio y sea E su espacio muestral asociado. Una variable


aleatoria (v.a.) es una aplicación que asocia a cada elemento del espacio muestral un número real:
X :E →ℜ (2)
La variable X puede describir un atributo o puede ser simplemente el resultado de una
codificación. Una variable aleatoria no es más que la manera de asociar un número real a cada uno
de los posibles resultados de un experimento aleatorio.
Recordemos que dos v.a. son independientes si cualquier par de sucesos definidos por ambas
resultan independientes. Si suponemos una población infinita y escogemos 2 personas al azar,
tenemos una v.a. que es la altura de la primera y otra que es la altura de la segunda, las
probabilidades de los sucesos compuestos son iguales al producto de las probabilidades de cada
suceso (independientes) así que las 2 v.a. son independientes.

6.1. Variables discretas


El número de cincos que obtenemos al lanzar 100 veces un dado es una variable aleatoria
discreta ya que toma un número finito de posibles resultados pero la definición es más general. Una
variable aleatoria discreta es la que toma un número finito o infinito numerable de posibles
resultados.
La función de masa de probabilidad de una v.a. discreta X es una función,
pX : ℜ → ℜ (3)
que asocia a cada valor, x i , que toma la v.a. su probabilidad p i .
La función de distribución de una v.a. discreta se define mediante:
F :ℜ→ℜ
(4)
x → F ( x)= P ( X ≤ x)
que asocia a cada número real la probabilidad acumulada hasta este valor. En las figuras 1 y 2
vemos, respectivamente, las funciones de masa y de distribución para el ejemplo de el número de
5's obtenidos con el dado.

1 En Matemáticas, un axioma es una afirmación que se acepta sin demostración.

Borrador del temario de Oposiciones para profesor de Secundaria de la especialidad de Matemáticas 2011.
5

Figura 1. Función de masa de probabilidad de la v.a. de nuestro ejemplo.

Figura 2. Función de distribución de la v.a. de nuestra ejemplo.

La esperanza matemática ( o media) de X se define como


n
E ( X )=μ=∑i=1 x i p i (5)
La varianza de una v.a. discreta viene dada por
n
Var ( X )=σ 2=∑i=1 ( x i −μ)2 p i (6)
es decir la varianza es simplemente E [ (x−μ)2 ] , que es la media de los cuadrados de las
desviaciones de la variable con respecto a su media y desarrollando el cuadrado de un binomio se
convierte en
Var ( X ) = ∑ ( x 2i −2xi μ+ μ2 ) p i =
=∑ x 2i p i − 2μ ∑ x i p i + μ2 ∑ p i = (7)
= E ( X 2)−2μ2+ μ 2 = E( X 2 )−μ2
La desviación típica es la raíz cuadrada positiva de la varianza.

Borrador del temario de Oposiciones para profesor de Secundaria de la especialidad de Matemáticas 2011.
6

6.2. Variables continuas


Una v.a. continua es aquella que toma valores en un conjunto continuo (toda la recta real, un
intervalo, o la unión de varios intervalos). Ejemplos de v.a. continuas son ''el peso de una persona'',
''el tiempo de duración de un viaje'', etc. Debe tenerse en cuenta que en la práctica no es posible
conocer el valor exacto de una v.a. continua ya que, al medirla, lo que se hace es clasificarla dentro
de un intervalo de longitud mayor o menor. Estos intervalos se denominan clases, por ejemplo,
cuando decimos que alguien mide 174 cm nos referimos a que su estatura exacta se encuentra entre
174 y 175 cm.
Llamamos función de densidad, f, asociada a la v.a. continua X, al límite de los histogramas
construidos con un número de observaciones que tiende a infinito, utilizando clases de igual
longitud y que tienda a cero. Así definida la función de densidad tiene las siguientes propiedades:
i. f ( x )≥0, ∀x ∈ℜ
ii. El área total bajo la curva es 1:
+∞
∫−∞ f ( x)dx=1 (8)
iii. La probabilidad de que la v.a. continua X tome valores en un intervalo viene dada por el
área bajo la gráfica de f(x) en ese intervalo. Así:
b
P (a≤ X ≤b) = ∫a f ( x)dx (9)
a
P ( X ≤a) = ∫−∞ f ( x)dx (10)

Ejemplo: La función de densidad uniforme en el intervalo (a,b) se define como:


1
si x ∈(a , b)
f ( x) = b−a (11)
0 si x ∉(a , b)

Y es sencillo comprobar que cumple las propiedades.

Figura 3. Función de densidad Uniforme (0,1) con R.

Definimos la función de distribución de una v.a. continua, X, como la función


F :ℜ→ℜ
+∞ (12)
x → F ( x) = P ( X ≤ x) = ∫−∞ f (t)dt
Por el Teorema Fundamental del Cálculo Integral, F ' ( x)= f ( x) en los puntos donde F es
derivable. Donde F no es derivable se toma f(x)=0 por convenio.

Borrador del temario de Oposiciones para profesor de Secundaria de la especialidad de Matemáticas 2011.
7

En la distribución uniforme:
0 si x ≤a
x x−a
F (x) = ∫−∞ f (t)dt =
x−b
si a< x < b (13)

1 si x ≥b

Figura 4. Función de distribución Uniforme (0,1) con R.

La esperanza matemática (o media) de X se define como:


+∞
E(X ) = μ = ∫−∞ x f ( x )dx (14)
La varianza toma la siguiente expresión:
+∞
Var ( X ) = σ 2 = ∫−∞ ( x−μ)2 f ( x) dx (15)
Puede observarse que la varianza es simplemente E [( X −μ)2 ] , es decir, la media de los
cuadrados de las desviaciones de la variable con respecto a su media. Desarrollando el cuadrado de
un binomio se convierte en:
+∞
Var ( X ) = E ( X 2)−μ 2 = ∫−∞ x 2 f (x )dx − μ (16)
La desviación típica es la raíz cuadrada de la varianza.
En muchos experimentos nos pueden interesar las relaciones que existen entre dos o mas
caractersticas por lo que necesitaremos estudiarlas de manera conjunta. Un vector aleatorio o
variable aleatoria multidimensional es la herramienta que nos permite tal estudio (generalizacion a
dimension n de las variables aleatorias). En este tema vamos a considerar unicamente vectores
aleatorios de dimension dos:
2
( X 1 , X 2) :Ω → ℜ (17)
s → ( X 1 (s) , X 2 (s))
donde cada coordenada es una variable aleatoria.
Dado A∈ℜ2 se define la probabilidad de A como:
P ( A) = P (( X 1 , X 2 )∈ A) = P( s∈Ω:( X 1 (s) , X 2( s))∈A) (18)
Y la función de distribución del vector aleatorio o función de distribución conjunta queda:
F (x 1 , x 2 ) = P (s∈Ω : X 1(s)≤ x 1 , X 2 (s)≤ x 2 ) (19)

7. ESTADÍSTICA DESCRIPTIVA

Es la Ciencia dedicada a descubrir las regularidades o características existentes en un

Borrador del temario de Oposiciones para profesor de Secundaria de la especialidad de Matemáticas 2011.
8

conjunto de datos.

8. TEORÍA DEL MUESTREO

Como casi siempre resulta imposible observar todos los individuos de una población
(entendida como los elementos objeto de estudio) es conveniente centrarse sólo en unos cuantos. Se
llama muestra a un subconjunto de la población y el tamaño muestral es el número de individuos
que componen la muestra.
Además del problema del tamaño poblacional hay algunos otros que se pueden resolver
tomando muestras:
• Las características de la población varian si el estudio se prolonga demasiado tiempo
• El proceso de estudio es destructivo o es necesario consumir un artículo para extraer los
datos (vida media de una bombilla, carga soportada por una cuerda, precisión de un
proyectil, ...)
Resulta deseable que una muestra sea lo más representativa posible de la población de la
cual proviene. Es evidente que cuanto mayor sea el tamaño muestral más representativa será la
muestra. Sin embargo, para un tamaño muestral fijo, hay otros aspectos que condicionan la mayor o
menor representatividad de la muestra.
El método de muestreo es el procedimiento usado para obtener la muestra. Las diferencias
entre los distintos métodos de muestreo normalmente vienen dadas por las formas de especificar la
probabilidad que tiene cada muestra potencial de salir elegida. A continuación se describen los más
frecuentes.

9. ESTADÍSTICA INDUCTIVA O INFERENCIA ESTADÍSTICA

La inferencia estadística puede definirse como el conjunto de técnicas dirigidas a extraer


información de una población y a utilizarla con el objeto de estimar los parámetros de que depende
la población, contrastar hipótesis sobre ella o hacer predicciones acerca de valores futuros. El
problema de la inferencia estadística se suele enfocar de dos maneras distintas:

9.1. Teoría de la Estimación


El objetivo de la estimación puntual es obtener un valor numérico para cierto parámetro de
la población a estudio. Así, si hacemos una encuesta y estamos interesados en conocer el apoyo a un
candidato a la alcaldía, debemos estimar la proporción de votos que obtendrá dicho candidato. Si lo
que pretendemos es averiguar cúal es el número medio de usuarios diarios de un determinado
servicio, el parámetro que debemos estimar será la media poblacional.
Dado un parámetro, θ, de una población y una muestra obtenida de la misma, un estimador
es una expresión, θ̂ , que se calcula con dicha muestra y que está destinada a obtener un valor
próximo al del parámetro desconocido.
La distribución en el muestreo de un estimador θ̂ es la distribución de probabilidad que
tiene, como variable aleatoria que es. Dado que la muestra se obtuvo (en general) de forma
aleatoria, el valor del estimador también es aleatorio y, por tanto, tiene sentido hablar de su
distribución de probabilidad. De todas las funciones de la muestra, que sirven para estimar un
determinado parámetro, habrá que ver cuáles son mejores.
La estimación por intervalos de confianza busca un intervalo de números donde sea muy
probable que se encuentre el parámetro a estimar. La intención es dar un intervalo lo más pequeño
posible.

Borrador del temario de Oposiciones para profesor de Secundaria de la especialidad de Matemáticas 2011.
9

9.2. Contraste de Hipótesis


El contraste de hipótesis consiste en formular una conjetura sobre la característica o
características de interés y a partir de los datos obtenidos concluir cúal es la fiabilidad de la
hipótesis formulada. Su uso en los controles de calidad y sondeos de sociedad es constante. Cuando
hay dos opciones se denomina contraste de hipótesis bilateral, donde la hipótesis que se quiere
evaluar se denomina hipótesis nula y la otra hipótesis alternativa.

10. FUENTES

[1] Charles M. Grinstead and J. Laurie Snell. ''Introduction to Probability''.


Published by AMS.

[2] Varios Autores. ''Métodos estadísticos e numéricos''. BAÍA EDICIÓNS. 2001. A Coruña.
2º Bacharelato.

[3] Raquel Caro Carretero y Fernando García Jiménez. 'Historias de Matemáticas'. Revista de
Investigación ''Pensamiento Matemático'' nº0. 1 de abril de 2011.

[4] Software estadístico R de distribución libre. R fué escrito inicialmente por Robert
Gentleman y Ross Ihaka de el Departamento de Estadística de la Universidad de Auckland.

Borrador del temario de Oposiciones para profesor de Secundaria de la especialidad de Matemáticas 2011.

Vous aimerez peut-être aussi