Vous êtes sur la page 1sur 39

UNIVERSIDAD NACIONAL JORGE

BASADRE GROHMANN
FACULTAD DE CIENCIAS

ESTADISTICA Y PROBABILIDAD

TEMA: VARIABLES ,GRAFICOS Y MEDIDAS


ESTADISTICAS

Dr. PELAYO DELGADO TELLO


DEFINICION DE ESTADISTICA
Es la ciencia aplicada que nos proporciona un conjunto de
mtodos , tcnicas o procedimientos para:

- recopilar
-organizar ( clasificar o agrupar)
-presentar y
- analizar
Datos con el fin de describirlos o de realizar
generalizaciones validas que permita la toma de decisiones.
DDGGDDDDDDDDDDDIVISSSSSJJJDDDDDDJDDDDDDDION
SS
DIVISION:
ESTADISTICA DESCRIPTIVA.- Es el conjunto de mtodos
estadsticos que se encarga de la recoleccin, clasificacin
y la descripcin de datos , para su interpretacin anlisis y
toma de decisiones.
INFERENCIA ESTADISTICA .- Es el conjunto de mtodos y tcnicas que
permiten inducir, a partir de la informacin emprica proporcionada por
una muestra, el comportamiento de una poblacin con un riesgo de error
medible en trminos de probabilidad.

I.1.- DATO
I.- INFORMACION ESTADISTICA
Es toda informacin cualitativa o cuantitativa acerca de una
caracterstica de un conjunto de entes materiales o
inmateriales.
La fuente de obtencin de datos:
Las Estadsticas Vitales de los Pases (Registro Civil).
Boletines de los distintos Ministerios de los Pases.
Institutos Nacionales de Estadsticas.
Encuestas - Entrevistas.
Registro de importacin y exportacin de productos alimenticios
Reservas nacionales , balanza de pagos
Investigaciones diseadas con un propsito especfico.
Todas las posibilidades de bsqueda ofrecida hoy por
internet, etc.
FORMAS DE OBTENER INFORMACION:
a) mediante una urna
b) mediante una tmbola
c) mediante nmeros aleatorios
1.2.- POBLACIN
Conjunto de datos, observaciones o medidas
en un determinado universo del cual se desea
estudiar una caracterstica en particular y se
denota por N . El nmero de elementos de
la poblacin.
Ejem.
El rendimiento acadmico de los estudiantes de la UCV
La estatura de los trabajadores de la Zona de
Educacin
El nmero de votantes a favor de un candidato.
etc.
1.3.- MUESTRA
Cualquier subconjunto representativo
de la poblacin, requiere que las
unidades o elementos sean
seleccionados al azar.
se denotar por n el nmero de
elementos de la muestra
1.4.- ESTIMADOR
Es una estadstica que se obtiene a
partir de los datos muestrales
,describe alguna caracterstica de la
muestra, constituye una estimacin
de un parmetro, y se representa por
letras minsculas.
1.5.- PARMETRO
Es un nmero que describe alguna
caracterstica de toda la poblacin y para
determinar su valor es necesario utilizar la
informacin poblacional completa se
representa por letras griegas o letras
maysculas del idioma espaol. , P, ,
2 , S, S2 etc.
Poblacin
, , 2

inferencia Anlisis
Relacional

Muestra
x-,med,mod
ESTRUCTURA Y TIPOS DE DATOS ESTADISTICOS

DATOS CUALITATIVOS O ATRIBUTOS


Son aquellos susceptibles de ser
expresados por una cualidad o atributo.
Ejemplos:
El lugar de procedencia de un
estudiante
El estado civil de una persona
Alumnos aprobados y no aprobados
DATOS CUANTITATIVO

Son aquellos susceptibles de ser expresados por


una
cantidad (variables), los cuales a su vez pueden
ser
DISCRETOS Y CONTINUOS.

Ejemplos:
El puntaje obtenido en un examen ( )
Nmero de aulas de un colegio ( )
Cantidad de alumnos aprobados en un examen ( )
Cantidad de libros defectuosos en una biblioteca.(
)
El tiempo que dura una prueba de examen ( )
Peso o estatura de un estudiante ( )
Temperatura ambiental promedio etc. ( )
Sin embargo existen variables que el valor
observado expresa un cierto orden o
jerarqua. Se le denomina Variable
Ordinal. Tiene la caracterstica de que el
valor obtenido indica un orden o jerarqua,
permitiendo indicar una posicin relativa de
los distintos elementos clasificados.
Rendimiento acadmico de un estudiante :
Bueno, Regular, Malo.
Grado de dificultad de una examen: fcil o
difcil .
Orden de meritos de un docente en la
Universidad
Grado de desarrollo de un Centro
Educativo
Etc.
PRACTICA CALIFICADA
NOMBRES Y APELLIDOS
1.- Clasifique las variables que aparecen a continuacin identifique el tipo que
segn la forma de expresar sus valores y la escala en que originalmente clasifi
unidades de observacin.
1. Numero de Hijos
2. Gestin Publica
3. Nivel de ingresos
4. Concentracin de un contaminante
5. Gnero
6. Estatura del recin nacido
7. Porcentaje de das trabajados
8. Ciclos de la maestra
9. Velocidad de un vehculo
10. Dificultad de un examen
11. Peso del oxigeno
12. Gravedad de un accidente
13. Clasificacin de las Regiones
14. Temperatura ambiental
15. Niveles de ansiedad
16. Edad en su ltimo cumpleaos
17. Profesin de una persona
18. Temperaturas registradas en un observatorio cada hora

19. Cotizacin de las acciones de FedEx

20. Tiempo de descarga de un archivo.

DESARROLLO
MATRIZ DE LOS DATOS
Cuando se realiza un estudio sobre un
conjunto finito n sujetos, objetos, cosas,
individuos, entidades etc., normalmente existe
una variada gama de caractersticas y que se
expresan en los trminos vistos anteriores,
digamos entonces de manera genrica, que
determinan p variables.
Lo anterior permite construir lo que se llama
Base de Datos, que de manera muy general
podemos decir que es un arreglo tipo matricial
que tiene n filas y p columnas.
Individuos Var.X1 Var.X2 Var.X3 Var.X4 . Var.xp

.
1
2
3
4
.
.
.
.
n
El propsito de la matriz de datos es
presentar los datos de la manera ms
depurada posible para proceder al
procesamiento de los datos y obtener
informacin.
La primera preocupacin es entonces
aprender a estructurar una base de datos,
utilizando un software para su posterior
procesamiento.
Utilizaremos un software estadstico llamado
SPSS. Es una versin para ambiente
Windows 98 2000 y XP. SIM
Los datos se ingresan en una planilla, muy
similar a la denominada planilla EXCEL.
Construiremos una pequea base de datos,
con antecedentes de persona.
CONSTRUCCION DE UNA BASE
DEDATOS
Considere una planilla de sueldos de
una institucin publica :
Cdigo
Nombres y apellidos
Remuneracin
Edad
Mes
SEXO
GRAFICO : NUBE DE PUNTOS
TEMPERATURA SEMANAL

20

15
TEMPERATURA

10

0
1 2 3 4 5 6 7
DIAS
GRAFICO: LINEAL

TEMPERATURA SEMANAL
16
14
TEMPERATURA

12
10
8
6
4
0 2 4 6 8
DIAS
GRAFICO DE BARRAS
VERTICALES

TEMPERATURA SEMANAL
16

12
TEMPERATURA

0
1 3 5 7
2 4
DIAS
6
GRAFICO DE BARRAS
HORIZONTALES

TEMPERATURA SEMANAL

1
2
3
DIAS

4
5
6
7

0 4 8 12 16
TEMPERATURA
GRAFICO DE PARTES COMPONENTES
GRAFICO CIRCULAR

RENDIMIENTO ACADEMICO

17.18%
71.78% APRO
11.04% RET
17.18% DESAP
11.04%

71.78%
CAUSAS DEL BAJO RENDIMEINTO
ACADEMICO

CAUSAS CANTIDAD
Econmicas 180
Bibliografa 40
Conocimiento 50
Docente 30
Sicolgicas 12
Drogas 6
Otros 2
TOTAL 32 0
GRAFICO DE PARETO

RENDIMIENTO ACDEMICO

400

300
frequency

200

100

0
eco doc bibl conc Other
GRAFICO DE PARETO

RENDIMIENTO ACADEMICO 2002

400
99.38 100.00
93.75 97.50
300 84.38
71.88
CANTIDAD

200 56.25

100

0
eco bibl sic otros
doc conc dro
II. PROCESAMIENTO ESTADISTICO DE DATOS

2.1.1 MEDIDAS DE TENDENCIACENTRAL


Son aquellos estimadores cuyos valores tienden a ubicarse
en la PARTE CENTRAL del recorrido o rango de una variable,
es decir ms o menos la mitad
del intervalo definido entre el valor mnimo y el valor mximo .
n1 n2 n3 nk
2.1.2. MEDIA O PROMEDIO ARITMTICO
Es una estadstica que localiza el centro de la distribucin en base a su
centro de gravedad y se obtiene a partir de la siguientes frmulas :

PARA DATOS ORIGINALES.- Sean x1 , x 2 , x 3 Xn las variables


matemticas que representen los datos muestrales
n
xi
x
i 1 n
PROPIEDADAES:
N
1.
(X
I 1
i x) 0

2. Si yi a b xi = a b X
= y

2.1.3. MEDIA PONDERADA : sean p1 , P2 , P 2 ......P k


Los pesos asociados a las variables x1 , x 2 , ......., xk , respectivamente. Entonces:
k

x i pi
w i 1
k

p
i 1
i
Ejemplo 2 :
Se desea determinar el promedio ponderado de los estudiantes del primer ciclo de la
Escuela de Ing. Civil teniendo en cuenta los cursos y crditos

TEORIA PRACTICA CREDITOS NOTA


ASIGNATURA
Matemticas 3 2 4 14
Fsica 2 2 3 16
Estadstica 3 2 4 18
Dibujo Tcnico 3 2 4 12

SOLUCION
Xi = Nota pi = Creditos

x i pi
w i 1
k
= 228/15 = 15.2

p
i 1
i
2.1.4 MEDIA GEOMTRICA .- Esta media corresponde al valor que tomara la
variable si se calculase la media aritmtica de los logaritmos de los datos
en lugar de los valores directos .
n

LogX
g Inv i
g= n x1 x 2 ........x n
i 1 o
=

n
Log
Este estadgrafo se utiliza principalmente en estudios
tales como distribucin de ingresos, clculo de ndice de p
de inters ,en estudios de crecimiento de poblacin . En
generales donde los valores de las variables representan
porcentajes de variacin relativos al comportamiento de
exponencial.
Ejemplo

Las tasas de inters de tres bonos son 5%, 7% y 4%.


La media geomtrica es = 5.192.
Por ejemplo, la media geomtrica de la serie de nmeros 34, 27, 45, 55,22, 34
(seis valores) es

MEDIA O PROMEDIO ARMONICO


n
Ma n 1
( )
i 1 xi
EJEMPLO Calcular la media armnica de la tasa de inters de 3 bonos del
ejemplo anterior :
3
Ma 5.06
1/ 5 1/ 7 1/ 4
2.1.6 MEDIA GLOBAL : S una muestra de tamao n se particiona
en k submuestras y x x x 1
,
, .. 2 n

son las medias de las k submuestras de tamaos n1 , n2 ..n


respectivamente Entonces:

k
ni xi
X = i 1
n
Se denomina media global de la muestra particionada.

Ejemplo1.
Si a una seccin de estudiantes se divide en tres grupos de practica A,B,C de 10,16,14
estudiantes, si su rendimiento acadmico de cada grupo es 15,14 y 12 respectivamente .
Cul ser el rendimiento global de toda la seccin.
SOLUCION

k
ni xi 15 10 14 16 12 14 542
i 1 = 13,55
n 40 40
1.1.7 MEDIANA: Es una medida de tendencia central que divide a la informacin en dos partes
iguales 50% a cada lado. Sean x1 , x 2 , x 3 Xn una muestra en orden creciente o
decreciente de magnitud. Entonces la mediana se define de la siguiente manera:

x n 1 /2 impar

med =
x n
2
2 1
x n
par

2

En el caso que la cantidad de datos sea un nmero impar , la mediana se obtiene ubicando
el valor que esta en el centro.
En el caso de que la cantidad de datos sea un nmero par, la mediana se obtiene como el
promedio de los dos valores centrales.
Ejemplo 3:
Las notas de 5 maestrantes fueron 11, 15, 17, 14, 13. Encontrar la la mediana de dichas
notas:

SOLUCIN
Como la cantidad de datos es impar entonces la mediana ser el valor central una vez
ordenado los datos: 11, 13, 14, 15,17 luego la med=14
1.1..8 MODA : Esta medida se conoce
tambin con el nombre de Promedio
Industrial. Est
representado por el valor o cantidad
que ms se repite o tiene una mayor
frecuencia
La distribucin de datos puede ser
modal
bimodal o multimodal
1.2 MEDIDAS DE VARIABILIDAD :

Estas medidas estn orientadas a cuantificar el grado o magnitud de cmo los datos se
dispersan entorno a una medida de tendencia central . Generalmente en torno a la media
aritmtica . Mucha dispersin es seal de poca uniformidad u homogeneidad en los datos.
Por el contrario poca dispersin , es seal de homogeneidad en los datos.

1.2.1 RANGO: Es una mediada de variabilidad que se obtiene de la diferencia entre el mayor
valor de la variable y el menor valor.
R = X mximo - X mnimo

1.2.3 VARIANZA: Es el promedio aritmtico de los desvos cuadrticos de los valores de la


variable
n
respecto del promedio aritmtico
( xi x )2 N
s=2
i 1
; =
2 ( xi x)2
n 1 i 1
N
1.2.3 DESVIACION ESTANDAR: Es la raz cuadrada de la varianza

tiene una gran importancia pues es la cuantificacin de la precisin de la


de la medicin de la variable.

2
Se utiliza, entre otras aplicaciones para construir intervalos de confiabilidad
en torno a los cuales ocilar un parmentro de una poblacin en estudio Si
la forma de la curva es una campana entonces el 68,27% de las veces la
medicin estar en el intervalo es decir :

y con las caracterstica de la curva tipo campana, el intervalo

x 2

Contendr el 95% de los valores de la variable


1.2.4 ERROR ESTANDAR . Es la desviacin estndar dividida por la
raz cuadrada del nmero de datos.

e.e
n

1.2.5.DESVIACION MEDIA . Es una mediad de variabilidad que no est


incorporado en las rutinas de clculo de Statgraphics. Su algoritmo de
calculo es :
n
xi x
DM = i 1
n

Podemos definirla como el promedio aritmtico de los valores absolutos


de las desviaciones de los valores de la variable respecto del promedio
aritmtico .
2.1.7 COEFICIENTE DE VARIACIN .-
Es la dispersin relativa de una variable, en relacin con su promedio
aritmtico. Tiene la propiedad de ser adimensional. Por lo tanto sirve para
comparar el menor o mayor grado de homogeneidad de una variable
respecto a otra.

CV = 100
X
VARIANZA GLOBAL:
Si una muestra de tamao n se particiona en K submuestras de
tamao s n , n , n.nk tales que
k
ni n
i 1
x1 , x 2 , x3 ,........x k son las medias ,

s12 , s 2 2 ,..............s 2 son las varianzas de las k submuestras respectivamente. entonces :

2
k k
ni (S i 2 X 2 i ) i
ni X 1

S x 2 i 1 1
n n


CAPITULO II