Académique Documents
Professionnel Documents
Culture Documents
FACULTAD DE INGENIERA Y
ARQUITECTURA
ESCUELA DE INGENIERA DE SISTEM
ESTADSTICA GENERAL
Grfica de distribucin
Normal, Media=0, Desv.Est.=1
0.4
0.3
Densidad
0.28
0.2
0.1
0.0
-1.645 -0.4399 0
X
Facilitadores:
Dr. SORIA QUIJAITE JUAN JESS
EMAIL: jesussoria@upeu.edu.pe
EMAIL: prosoria@gmail.com
Tema:
INTRODUCCIN A LA ESTADSTICA
Dr. Soria Quijaite Juan Jess 1
SOFTWARE A TRABAJAR EN EL CURSO
2
QU ES LA ESTADSTICA?
Importancia de la estadstica
5
VENTAJAS DE LA ESTADSTICA
7
DEFINICIONES BSICAS
8
TIPOS DE ESTADSTICA
9
VARIABLES CUALITATIVAS Y CUANTITATIVAS
Escalas
Ordinales Etapas
Cualitativas
(Cualidades ,
Colores
categoras o
atributos) Nominales Lugares
Profesiones
Variables Discretas Nmero de hijos
(Unidades Pginas de un libro
Cuantitati vas completas )
(Aquellas
medibles Edad
numricamente) Continuas Peso
(Cualquier Talla
valor en un Tiempo
rango)
10
TIPOS DE VARIABLES CUALITATIVAS
12
ESCALAS DE MEDICIN DE LAS VARIABLES
ESCALAS DE MEDICIN DE LAS VARIABLES
TALLER 01:
Identifique el tipo de variable de acuerdo a su naturaleza (cuantitativa:
discreta/continua, o cualitativa: nominal/ordinal).
Los niveles de colesterol LDL de los alumnos de maestra de la UPeU medida en una
escala de: bajo, normal, alto, en riesgo...
Situacin ocupacional a la que pertenecen los padres de los alumnos de la Escuela
de Ingeniera de sistemas en un da determinado...........................
Porcentaje de pacientes satisfechos con el servicio de atencin de la enfermera en
un da ...................
Nmero de accidentes registrados en el centro de salud de la UPeU ...
Gnero de los trabajadores de la empresa FIGUERI ....
Nmero de computadoras en los laboratorios de la escuela de ingeniera de
sistemas de la UPeU
Lima............................................................................................................
Nivel de estudios alcanzados de las enfermeras de la facultad de ciencias de la salud
de la UPeU Lima.
Nmero de clientes en el supermercado Plaza
Vea ............................................................
Grado de instruccin de los trabajadores de la UPeU.................
La concentracin de glucosa en sangre en individuos no diabticos, medida en
mg/dl,
PRESENTACIN ESTADSTICA Y REPRESENTACIONES GRFICAS
Tablas:
Forma sencilla y clara de agrupar la informacin
Pueden ser sencillas o complejas segn la cantidad de datos
Es importante el manejo lgico de la disposicin
Grficos:
Permiten visualizar la informacin y sus relaciones
Es una forma ilustrativa y clara de los datos
Es una forma creativa y artstica de presentacin
15
VARIABLES: REPRESENTACIN TABULAR
16
VARIABLES CUALITATIVAS: REPRESENTACIN GRFICA
17
VARIABLES CUANTITATIVAS: REPRESENTACIN GRFICA
18
DIFERENTES TIPOS DE MEDIDAS
20
MEDIA ARITMTICA
x 1 x 2 ... x n
x
i 1
i
X
n n
21
CARACTERSTICAS DE LA MEDIA
Ventajas :
Fcil de calcular e interpretar.
En su clculo intervienen todos los
datos disponibles.
Su valor es nico para una serie de
datos.
Es el punto de equilibrio de la
informacin.
Desventajas :
No es representativa con pocos datos
Se ve afectada por el grado de
dispersin
Es poco til con datos muy
heterogneos 22
MEDIANA
23
CARACTERSTICAS DE LA MEDIANA
Ventajas :
Valor nico que no se ve afectado por los
extremos por ser equidistante de ellos.
Se localiza a la mitad de los datos , dejando el 50
% por arriba y el 50 % por debajo de su valor.
Es menos sensible a las variaciones de los datos.
No se ve afectada por la dispersin de los datos.
Desventajas :
No se emplea para hacer clculos
Utiliza muy poca informacin de los datos
Cuanto ms grande es la serie de datos , ms
complicado se vuelve su determinacin.
24
LA MODA
La moda de un conjunto de
observaciones es el valor que ms se
repite, aquel cuya frecuencia
absoluta es mxima.
Puede ser nica, que haya ms de
una, o que no exista.
Cuando hay ms de una , la
distribucin de los datos se
denomina acorde : bimodal ,
trimodal, polimodal, etc.
25
USO DE: MEDIA, MEDIANA Y MODA
26
RELACIN ENTRE: MEDIA, MEDIANA Y MODA
27
MEDIDAS DE DISPERSIN
28
RANGO
Ventajas :
Fcil de determinar e interpretar.
Nos indica los lmites de nuestra
informacin.
Nos permite visualizar la amplitud de
dispersin de los valores de forma
sencilla.
Desventajas :
Ignora toda la informacin de la
muestra
No mide el grado de dispersin , solo
su ancho
No nos da una idea detallada de la
informacin de las observaciones.
30
VARIANZA
(x x)
i
2
s
2 i 1
n
31
CARACTERSTICAS DE LA VARIANZA
Ventajas :
Fcil de calcular mediante su frmula.
Indica el grado y forma de dispersin
de los datos con respecto a la media.
Depende de todas las mediciones.
Desventajas :
Es imprctica por ser un trmino
cuadrtico de poco sentido en la
realidad.
Es un nmero muy grande de
referencia matemtica , pero sin valor
concreto y de difcil manejo
comparativo.
32
DESVIACIN ESTNDAR
i 1
n
33
CARACTERSTICAS DE LA DESVIACIN ESTNDAR
Ventajas :
Fcil de calcular mediante su frmula y
particularmente en hojas de clculo como Excel
que lo hacen de forma automtica.
Indica el grado y forma de dispersin de los
datos con respecto a la media.
Depende de todas las mediciones.
Muy prctica por usar los mismos valores de las
unidades que se analizan.
Un valor grande indica que los datos se alejan
mucho de la media y un valor pequeo indica
que se acercan a la media.
Desventajas :
Si hacemos el clculo manual , es complicado.
34
UTILIDAD DE LAS MEDIDAS DE DISPERSIN
g1 i 1
3
s
37
SIMETRA Y ASIMETRA
g1 < 0 (distribucin
asimtrica negativa;
existe mayor
concentracin de valores
a la izquierda de la
media que a su derecha)
g1 = 0 (distribucin
simtrica; existe la
misma concentracin de
valores a la derecha y a
la izquierda de la media)
g1 > 0 (distribucin
asimtrica positiva;
existe mayor 38
CURTOSIS
El Coeficiente de Curtosis
analiza el grado de
concentracin que presentan los
valores alrededor n de la zona
/ n )( i
central de la distribucin.
(1 ( x x ) 4
g2 i 1
4
3
s
40
TIPOS DE CURTOSIS
42
EJEMPLO PRCTICO
Mediana : 54 45 NOVIEMBRE
Moda : 45 50 MARZO
50 SEPTIEMBRE
Rango : 30 120 58 ABRIL
Varianza : 809.33 60 OCTUBRE
Desviacin Estndar : 28.45 65 MAYO
Simetra : 0.98 100 JULIO
Curtosis : -0.32 110 JUNIO
120 AGOSTO
768 TOTAL
43
EJEMPLO PRCTICO
Interpretacin :
Cada husped consume $ 64 en promedio por mes.
Los datos NO son simtricos , se desplazan
ligeramente hacia la derecha con un sesgo positivo ,
solo con ver que la mediana es inferior a la media.
Aunque la frmula solo indica un dato de moda,
tenemos dos nmeros que se repiten dos veces : 45
y 50 , por lo que la distribucin es de tipo
bimodal.
El rango de consumo es de 90 unidades , entre el
lmite inferior de 30 y el superior de 120
La desviacin estndar no es grande
comparativamente , lo que indica que los datos
no se alejan tanto de la media.
El valor de simetra g1 > 0 , nos indica una
distribucin asimtrica positiva porque existe
mayor concentracin de valores a la derecha de la
media que a su izquierda.
En cuanto a la curtosis con valor de -0.32 (g2 < 0 )
nos confirma una distribucin platicrtica
44 porque
presenta un
EJEMPLO GRFICO
Desviaci
Rang
Media
Mediana
n
o
Moda
45
Dr. Soria Quijaite Juan Jess 46