Vous êtes sur la page 1sur 24

Estadstica I

Tema 1: Introduccion

Tema 1: Introduccion

Contenido
I

Que es la Estadstica? - Definici


on.

Palabras clave: poblaci


on, parametro, muestra, estadstico, tama
no
poblacional, tama
no muestral, individuos, objetos.

Tipos de variables: categ


orica (ordinal, nominal) y numerica
(discreta, continua).

Por que una muestra? Definici


on de muestra aleatoria simple.

Frecuencias y distribuci
on/tabla de frecuencias: absoluta, absoluta
acumulada, relativa, relativa acumulada. Propiedades.

Tema 1: Introduccion

Lecturas recomendadas
I

Pe
na, D., Romo, J. Introducci
on a la Estadstica para las Ciencias
Sociales (1997).
I

Captulos 1, 2 y 3.

Newbold, P. Estadstica para los Negocios y la Economa (2009).


I
I

Captulo 1
Apartados 2.1 y 2.4.

Definicion de Estadstica
Definici
on. La Estadstica es la ciencia que trata de:
I

recoger, organizar, resumir, presentar, interpretar y procesar datos


para convertir los datos en informaci
on
Estadstica Descriptiva

predicciones, pron
osticos, estimaci
on
Inferencia Estadstica

En que ocasiones escuchaste/viste la palabra estadstica?


Res
umenes de partidos de f
utbol/tenis
Tasas de desempleo, n
umero de heridos en accidentes de coche
La estadstica es mucho m
as que porcentajes y n
umeros!

Palabras clave, conceptos y notacion


I

Una poblaci
on es la colecci
on completa de todos los
tems/individuos/objetos/sujetos de interes bajo investigacion.
no poblacional
N representa el tama

Una muestra es un subconjunto de la poblaci


on, elegida
habitualmente para investigar las propiedades de la poblacion
subyacente.
no muestral
n representa el tama

Un par
ametro es una caracterstica especfica de una poblacion (fijo
y generalmente desconocido).

Un estadstico es una caracterstica especfica de una muestra (su


valor vara de muestra en muestra).

Una variable es una caracterstica observable (o medible) en un


individuo.

Ejemplos
I

Pob todos los estudiantes de la UC3M. Variable: altura (0, )


Param: Altura media de todos los estudiantes. Estadstico: Altura
media de los estudiantes muestreados.

Pob: todos los peces de un lago. Variable: tama


no {G , M, P}
Param: N
umero de peces peque
nos en todo el lago. Estadstico:
N
umero de peces peque
nos capturados.

Pob: todos los pacientes del Hospital de Getafe. Variable: grupo


sanguneo {A, B, AB, O}
Param: Porcentaje de grupo sanguneo AB entre todos los pacientes.
Estadstico: porcentaje de grupo sanguneo AB entre los pacientes
muestreados.

Pob: todas las bombillas de la marca Acme. Variable: tiempo de vida


en das {0, 1, 2, . . .}.
Param: Variaci
on en el tiempo de vida de todas las bombillas.
Estadstico: Variaci
on en el tiempo de vida de las bombillas muestreadas.

Tipos de datos (Variables)


Datos (Variables)
.

&

Categ
oricos (Cualitativos)

Numericos (Cuantitativos)

.
Ordinales
clases ordenables
Ejemplo
Talla de ropa:
G>M>P

&
Nominales
sin orden natural
Ejemplo
Grupo sanguneo:
A,B,AB,O

.
Discretos
entero
Ejemplo
no de hijos:
0,1,2,. . .

&
Continuos
no entero
Ejemplo
Altura:
1.55cm, 1.71cm

Notaci
on: Se usan en general las letras X , Y , Z . Ejemplo:
X = altura en cm (letras may
usculas en definici
on)
x = 1.55 (letras min
usculas para valores especficos)
x1 = 1.55, x2 = 1.71 (con mas de uno, se a
naden subndices)

Por que se usa una muestra?

En la practica no estudiamos la poblaci


on porque:
I

Podemos destruir la poblaci


on (ej. tiempo de vida de una bombilla).

La poblaci
on puede existir como concepto pero no en la realidad (ej.
poblaci
on de tems defectuosos).

Imposible de realizar (ej. poblaci


on de todos los peces del mar).

Demasiado caro.

Tiempo de ejecuci
on excesivo.

Definicion de muestra aleatoria simple (m.a.s.)


Definici
on. Una muestra aleatoria simple es una parte de la poblacion
obtenida de forma que,
I

cada miembro de la poblaci


on se elige estrictamente al azar,

cada miembro tiene la misma opci


on de ser elegido, y

cada posible muestra de n objetos es igualmente probable de ser


elegida.

Notaci
on: Una muestra de tama
no n de una variable X significa que:
I

Tenemos n individuos seleccionados aleatoriamente de una


poblaci
on.

Para cada uno de los individuos conocemos el valor de la variable X .

Si X es categ
orica ordinal o cuantitativa discreta, es conveniente
escribir los diferentes valores muestrales que toma X como
x1 , x2 , . . . , xk , k n (ordenados desde el menor al mayor).

Frecuencias y distribuciones de frecuencias

Definici
on. Una distribuci
on de frecuencias es
I

una lista o una tabla que contiene agrupaciones de clases (valores


numericos, valores no numericos o categoras, intervalos de valores
numericos) junto con las correspondientes frecuencias.

Frecuencias:
I

La frecuencia absoluta de un valor xi es el n


umero de veces que el
valor xi aparece en la muestra.

La frecuencia relativa de un valor xi es la proporcion del valor xi en


la muestra.

Por que usar distribuciones de frecuencias?

Una distribuci
on de frecuencias es una forma de resumir los datos.

La distribuci
on condensa los datos primarios en una forma mas u
til
...

y permite una interpretaci


on visual rapida de los datos.

Agrupacion simple de los datos: datos categoricos y


discretos

Clase, xi
x1
x2
..
.

Frec.
Absol., ni
n1
n2
..
.

Frec.
Relat., fi
f1 = nn1
f2 = nn2
..
.

xk
Total

nk
n

fk =
1

nk
n

Frec.
Absol.
Acumul., Ni
N1 = n1
N 2 = N 1 + n2
..
.

Frec.
Relat.
Acumul., Fi
F1 = f 1
F2 = F1 + f2
..
.

Nk = n

Fk = 1

Nota:
I

x1 < x2 < . . . < xk

ni = n
umero de xi en la muestra, fi =

Ni = Ni1 + ni , Fi = Fi1 + fi

0 fi , Fi 1

Fi y Ni no tienen sentido para variables categ


oricas nominales

ni
n

Agrupacion simple de los datos


Ejemplo 1: Los datos siguientes corresponden al grupo sanguneo de 40
individuos de una muestra.
AB, A, B, O, A, A, A, B, O, AB,
B, O, B, B, B, A, A, A, AB, B,
O, A, A, A, AB, AB, O, B, B, AB,
O, B, O, O, A, A, O, B, AB, AB
I

Que tipo de variable es grupo sanguneo? Obten la distribucion de


frecuencias de los datos.

Que porcentaje de la gente de la muestra pertenece al grupo


sanguneo A?

Que porcentaje de la gente de la muestra pertenece a un grupo


sanguneo diferente de O?

Agrupacion simple de los datos


Ejemplo 1 cont.:
I

Categ
orica, nominal con 4 clases diferentes. La distribucion de
frecuencias es:

Clase
A
B
AB
O
Total
I

30 %

100 % 22.5 % = 77.5 %

Frecuencia
Absoluta
12
11
8
9
40

Frecuencia
Relativa
0.300
0.275
0.200
0.225
1

Agrupacion simple de los datos


Ejemplo 2: La tabla siguiente contiene informaci
on sobre el grado
satisfacci
on en el trabajo (MI=muy insatisfecho, I=insatisfecho,
S=satisfecho, MS=muy satisfecho) de 901 empleados.
Clase
MI
I
S
MS
Total

Frecuencia
Absoluta
62
108
319
412
901

Que tipo de variable se esta estudiando? Obten la distribucion de


frecuencias de los datos.

Que porcentaje de la gente muestreada esta satisfecha?

Cuantos individuos estan insatisfechos o peor? En %?

Cuantos individuos estan al menos satisfechos? En %?

Agrupacion simple de los datos


Ejemplo 2 cont.:
I

Categ
orica, ordinal con 4 clases diferentes. La distribucion de
frecuencias es:
Frecuencia Frecuencia
Frecuencia Frecuencia
Absoluta
Relativa
Clase
Absoluta
Relativa Acumulada Acumulada
MI
62
0.07
62
0.07
I
108
0.12
170
0.19
S
319
0.35
489
0.54
MS
412
0.46
901
1
Total
901
1

35 %

170, 19 %

319 + 412 = 731


o 901 170 = 731, 35 % + 46 % = 81 %
100 % 19 % = 81 %
o

Agrupacion simple de los datos


Ejemplo 3: De entre las plantas que han sido tratadas con un nuevo
pesticida, se seleccionaron 50 para evaluar el comportamiento del nuevo
pesticida. En cada una de las plantas muestreadas se conto el n
umero de
hojas atacadas por un hongo. El resultado se muestra a continuacion.
xi
0
1
2
3
4
5
6
8
10
Total

Frecuencia
Absoluta
6
10
12
8
5
4
3
1
1
50

Agrupacion simple de los datos


Ejemplo 3 cont.:
I

Que puedes decir acerca de la variable en estudio? Obten su


distribuci
on de frecuencias.

Que porcentaje de las plantas muestreadas tuvo solo 3 hojas


atacadas?

Cuantas plantas muestreadas tuvieron no mas de 3 hojas atacadas?

Cuantas plantas muestreadas tuvieron al menos 6 hojas atacadas?

Que porcentaje de las plantas muestreadas tuvo entre 3 y 5 hojas


atacadas?

Que porcentaje de las plantas muestreadas tuvo al menos 8 hojas


atacadas?

Que porcentaje de las plantas muestreadas tuvo a lo sumo 2 hojas


atacadas?

Agrupacion simple de los datos


Ejemplo 3 cont.:
I

Numerica, discreta con 9 valores diferentes. La distribucion de


frecuencias es:
Frecuencia Frecuencia
Frecuencia Frecuencia
Absoluta
Relativa
xi
Absoluta
Relativa Acumulada Acumulada
0
6
0.12
6
0.12
1
10
0.20
16
0.32
2
12
0.24
28
0.56
3
8
0.16
36
0.72
4
5
0.10
41
0.82
5
4
0.08
45
0.90
6
3
0.06
48
0.96
8
1
0.02
49
0.98
10
1
0.02
50
1
Total
50
1

Agrupacion simple de los datos

Ejemplo 3 cont.:
I

16 %

36

3+1+1
o 50 45 = 5

16 % + 10 % + 8 % = 34 %
o (8 + 5 + 4)/50 = 34 %

2% + 2% = 4%
o 100 % 96 % = 4 %

56 %

Agrupacion en intervalos de clase: datos continuos (o


discretos)
Intervalo
[li1 , li )
[l0 , l1 )
[l1 , l2 )
..
.

Marca de clase
xi = li +l2i1
x1
x2
..
.

[lk1 , lk ]
Total

xk

ni
n1
n2
..
.

fi
f1
f2
..
.

Ni
N1
N2
..
.

Fi
F1
F2
..
.

nk
n

fk
1

Nota:
I

Se incluye el extremo izquierdo, pero se excluye el extremo derecho


(convenci
on tpica).

Es posible aplicar la convenci


on en sentido opuesto - verifica su
definici
on en el software.

para tabular datos discretos si X toma muchos valores


Util
diferentes.

Agrupacion en intervalos de clase


I

Muy frecuentemente los intervalos tomados como clases poseen la


misma amplitud.

Determinar la amplitud a para cada intervalo mediante


a=

n
umero mayor - n
umero menor
n
umero de intervalos deseados

Cuantos intervalos? Aproximadamente entre 5 y 20. Mas


concretamente:

n si n es peque
no.

k 1 + 3.22 log(n) si n es grande.

Los intervalos nunca se solapan.

Redondea la amplitud del intervalo para obtener los extremos de los


intervalos deseados.

Agrupacion en intervalos de clase


Ejemplo 4: Un fabricante de aislantes selecciona al azar 20 das de
invierno y anota la temperatura mas elevada del da (en grados
Fahrenheit)
24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27
Obtener la distribuci
on de frecuencias de los datos.
I

Se ordenan los datos primarios en orden ascendente: 12, 13, 17, 21,
24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Se obtiene el rango (valor mayor valor menor): 58 12 = 46

Se calcula el n
umero de intervalos: k = 20 = 4.47 5

Se calcula la amplitud de los intervalos: 46/5 = 9.2 10.

Se determinan los extremos (empezando antes del primer dato y


terminando despues del u
ltimo): [10, 20), [20, 30), . . . , [50, 60]

Se cuentan las observaciones que caen dentro de cada intervalo


(frecuencias absolutas).

Agrupacion en intervalos de clase


Ejemplo 4 cont.:
Intervalo
[10, 20)
[20, 30)
[30, 40)
[40, 50)
[50, 60]
Total
I

Marca de clase
15
25
35
45
55

ni
3
6
5
4
2
20

fi
0.15
0.30
0.25
0.20
0.10
1

Ni
3
9
14
18
20

Fi
0.15
0.45
0.70
0.90
1

En cuantos das la temperatura estuvo por debajo de 30o F? En %?


(3 + 6 = 9, que es el 45 %)
En cuantos das la temperatura fue de al menos 45o F? En %?
4540
(2 + 4 5040
= 4, que es el 20 %)
En cuantos das la temperatura fue superior a 32o F, pero inferior a
47o F?

Vous aimerez peut-être aussi