Vous êtes sur la page 1sur 44

EL ANLISIS DE

LOS DATOS
Juan Carlos Vargas Camacho
Yoel Diomedez Romero Almonte
Yessica Condori Condori

OBJETIVOS
Comprender el concepto de pruebas de estadstica.
Comprender que no se aplican las pruebas estadsticas

simplemente por aplicarlas sino que se aplican con un


sentido y justificaciones.
Conocer las principales pruebas estadsticas desarrolladas as

como sus aplicaciones, situaciones en las que se utiliza cada


una y formas de interpretarlas.
Comprender los procedimientos para analizar los datos.
Analizar la interpretacin entre distintas pruebas estadsticas.
Aprender diferenciar entre estadstica paramtricas y

estadstica no paramtrica.

QU PROCEDIMIENTOS SE
SIGUE PARA ANALIZAR LOS
DATOS?
Una vez que los datos se han codificado,

transferido a una matriz, guardado en un


archivo y "limpiado" de errores, el
investigador procede a analizarlos.

En la actualidad, el anlisis cuantitativo de

los datos se lleva a cabo par computadora u


ordenador.

Ya nadie lo hace de forma manual.

Fase 1
Seleccionar un
programa
estadstico en
computadora para
analizar los datos.

Fase 2
Ejecutar le
programa
escogido, por
ejemplo SPSS

Fase 3
Explorar datos:
-Anlisis
descriptivo por
variable.
-Visualizndolos
por variable.

Fase 5

Fase 6
Realizar
adicionales

Analizar
mediante
pruebas
estadsticas las
hiptesis
planteadas.

Fase 7
Repasar los
resultados para
su presentacin.

Fase 4
Evaluar la
confiabilidad y
validez logradas
por el
instrumento de
medicin.

QU ANLISIS DE DATOS
PUEDEN EFECTUARSE?
Estadstica descriptiva para las variables,
Medida que indica la direccin
tomadas individualmente.

Puntuaciones Z.
Razones y tasas.

y el grado en que un valor


individual se aleja de la media,
en una escala de unidades de
desviacin estndar.

Clculos y razonamientos de estadstica

inferencial.

Pruebas paramtricas.
Pruebas no paramtricas.
Anlisis multivariados.

Los anlisis que vayamos a practicar a

los datos dependen de tres factores:


1. Elnivel de medicinde las variables.

2. La manera como se hayan formulado las

hiptesis.
3. Elinters del investigador.
Por ejemplo, no es lo mismo los anlisis

que se le realizan a una variable nominal


que a una por intervalos. Se sugiere al
lector que recuerde los niveles de
medicin vistos en el captulo anterior.

QU ES UNA
DISTRIBUCIN DE
FRECUENCIAS?

La distribucin de frecuencias de

conjunto de puntuaciones ordenadas en


sus respectivas categoras.

Colectivo: 20 familias. N = 20
Variable X: ingresos anuales expresados en

miles de euros. Valores observados: 18, 20, 22,


19, 18, 20, 18, 19, 21, 20 20, 21, 18, 20, 21, 19,
20, 21, 18, 20

Colectivo: 60 cilindros fabricados por una mquina. N =

60

Variable X: longitud en centmetros


Valores observados:
239, 254, 255, 248, 246, 249, 242, 250, 249, 244, 253,

248,
247,
251,
251,
243,

250,
250,
249,
238,
250,

258,
248,
252,
236,
249,

252,
250,
250,
259,
242,

251,
259,
247,
249,
238

250,
249,
251,
257,

253,
249,
259,
249,

247,
250,
250,
247,

243,
251,
246,
251,

245,
253,
252,
246,

251,
241,
238,
245,

Colectivo: 1000 empresas de un sector. N = 1000

Variable X: ventas mensuales en miles de Soles.


Valores observados: se han agrupado en intervalos.

QU OTROS ELEMENTOS TIENE


UNA DISTRIBUCIN DE
FRECUENCIAS?
Las distribuciones de frecuencias pueden

completarse agregando los porcentajes


de casos en cada categora, los
porcentajes vlidos (excluyendo los
valores perdidos), y los porcentajes
acumulados (porcentaje de lo que se va
acumulando en cada categora, desde la
ms baja hasta la ms alta).

DE QU OTRA MANERA PUEDEN


PRESENTARSE LAS
DISTRIBUCIONES DE FRECUENCIA?
Histogramas.
Grficas Circulares.

QU SON LOS POLGONOS


DE FRECUENCIA?
Polgonos de frecuencias son aquellos que

Relacionan las puntuaciones con sus


respectivas frecuencias, por medio de
grficas tiles para describir los datos.

Los polgonos de frecuencias representan

curvas tiles para describir los datos. Nos


indican hacia donde se concentran los
casos (personas, organizaciones,
segmentos de contenido, mediciones de
polucin, etc.) en la escala de la variable.

Di stri buci n Y pol gonos de Frecuenci a


35

40.00

30

35.00
30.00

25

25.00
20
20.00
15
15.00
10

10.00

5.00

0.00

CULES SON LAS MEDIDAS


DE TENDENCIA CENTRAL?
Las medidas de tendencia central son valores
medios o centrales de una distribucin que sirven
para ubicarla dentro de la escala de medicin.
Moda. Es una categora o puntuacin que se

presenta con mayor frecuencia.

Media. Es el promedio aritmtico de una

distribucin y es la medida de tendencia central


mas utilizada.

Mediana. Es el valor que divide la distribucin por

la mitad.Me=

MEDIDAS DE TENDENCIA
CENTRAL EJEMPLOS
Por ejemplo, el nmero de personas en distintos

vehculos en una carretera: 5-7-4-6-9-5-6-1-5-37. El nmero que ms se repite es 5, entonces


la moda es 5.

Nio

Nota

6,0

5,4

3,1

7,0

6,1

Primero, se suman las notas:


6,0+5,4+3,1+7,0+6,1 = 27,6
Luego el total se divide entre la cantidad de
alumnos: 27,6/5=5,52

La media aritmtica en este ejemplo es 5,52

MEDIDAS DE TENDENCIA
CENTRAL
EJEMPLOS
Por ejemplo, la mediana del nmero de hijos de un conjunto
de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1,
1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los
datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la
posicin central es 2:

En caso de un nmero par de datos, la mediana no

correspondera a ningn valor de la variable, por lo que se


conviene en tomar como mediana el valor intermedio entre
los dos valores centrales. Por ejemplo, en el caso de doce
datos como los siguientes:

CMO SE REALIZA EL CLCULO


DE LA MEDIA PROMEDIO?
Al ser un promedio aritmtico de una

distribucin, esta es la suma de todos los


valores divididos entre el nmero de
casos. Slo aplicable a mediciones por
intervalos o de razn. No en casos
nominales.

QU INDICAN LAS
MEDIDAS DE VARIABILIDAD?
Medidas de la variabilidad son intervalos que

indican la dispersin de los datos en la escala


de medicin.

dnde estn diseminadas las puntuaciones o

los valores obtenidos?

Las medidas de tendencia central son valores

en una distribucin y las medidas de la


variabilidad son intervalos que designan
distancias 0 un numero de unidades en la
escala de medicin.

QU ES EL RANGO Y QU
ES LA DESVIACIN
ESTNDAR?

El rango, tambin llamado recorrido, es la


diferencia entre la puntuacin mayor y la
puntuacin menor, e indica el numero de
unidades en la escala de medicin que se
necesitan para incluir los valores mximo y
mnimo.

Rango indica la extensin total de los datos en

la escala.

Desviacin estndar o tpica es el

promedio de desviacin de las puntuaciones


con respecto a la media que se expresa en las
unidades originales de medicin de la
distribucin.

Cuanto mayor sea la dispersin de los datos

alrededor de la media, mayor ser la desviacin


estndar.

CUL ES EL
PROCEDIMIENTO PARA
CALCULAR LA DESVIACIN
ESTNDAR?
La desviacin de cada puntuacin respecto a la

media se eleva al cuadrado, se suman todas las


desviaciones cuadradas, se divide entre el
numero total de puntuaciones, y a esta divisin
se le saca la raz cuadrada.

Es decir, la raz cuadrada de la media de los

cuadrados de las puntuaciones de desviacin.


Ladesviacin estndarse representa por.

Desviacin estndar para datos no agrupados.

Desviacin estndar para datos agrupados.

QU ES LA VARIANZA?
La varianza es a desviacin estndar

elevada al cuadrada y se simboliza


como:

Se utiliza en anlisis diferenciales.

13.-CMO SE INTERPRETAN LAS


MEDIDAS DE TENDENCIA
CENTRAL Y DE LA VARIABILIDAD ?
Las medidas de tendencia central y de la

variabilidad son interpretados en conjunto no


aisladamente.

Tomamos en cuenta a todos las medidas para

interpretarlas lo primero que hacemos es tomar


en cuenta el rango potencial de la escala.

HAY ALGUNA OTRA


ESTADSTICA DESCRIPTIVA?
S

La asimetra: Que es una medida estadstica


que se usa para conocer cunto se parece una
distribucin terica llamada curva normal y que
constituye un indicador del lado de la curva en
el que las frecuencias se agrupan ms.
Curtosis: que es un indicador de lo plana o
picuda que es una curva. Cuando esta es cero
(0), significa que se puede tratar de una curva
normal. Si es positiva, se dice que es picuda o
elevada. Si es negativa, entonces la curva es
plana.

QU ES LA ASIMETRA?
Es una estadstica necesaria para

conocer que tanto muestra distribucin


se parece a una distribucin terica
llamada curva normal.

QU ES UNA RAZN Y QUE


ES UNA TASA?
Una razn es la relacin entre dos

categoras.

Una tasa es la relacin entre el numero

de casos, frecuencias o eventos de una


categora y el numero total de
observaciones, multiplicada por un
mltiple de 10, generalmente 100 o 100
la formula es:

PARA QUE ES TIL LA


ESTADSTICA INFERENCIAL?
La estadstica inferencial puede ser til
para dos procedimientos
Probar hiptesis.
Estimar paramentos.

25.- QU ES EL
COEFICIENTE DE
CORRELACIN DE
PEARSON?
Es una prueba estadstica para analizar la

relacin entre dos variables medidas en un


nivel por intervalos o de razn.

Se simboliza: r.
Se calcula a partir de las puntuaciones

obtenidas en una muestra en dos variables. Se


relacionan las puntuaciones recolectadas de
una variable con las puntuaciones obtenidas de
la otra, con los mismos participantes o casos.

Nivel de medicin de las variables: intervalos o


razn.
Interpretacin: el coeficiente r de Pearson puede variar
de 1.00 a +1.00, donde:
1.00 = correlacin negativa perfecta.
0.90 = Correlacin negativa muy fuerte.
0.75 = Correlacin negativa considerable.
0.50 = Correlacin negativa media.
0.25 = Correlacin negativa dbil.
0.10 = Correlacin negativa muy dbil.
0.00 = No existe correlacin alguna entre las variables.
+0.10 = Correlacin positiva muy dbil.
+0.25 = Correlacin positiva dbil.
+0.50 = Correlacin positiva media.
+0.75 = Correlacin positiva considerable.
+0.90 = Correlacin positiva muy fuerte.

26.- QU ES LA
REGRESIN LINEAL?
Es un modelo estadstico para estimar el efecto de una

variable sobre otra.

Est asociado con el coeficiente r de Pearson.


Brinda la oportunidad de predecir las puntuaciones de

una variable tomando las puntuaciones de la otra


variable. Entre mayor sea la correlacin entre las
variables, mayor capacidad de prediccin.

Se determina con base en el diagrama de dispersin.

ste consiste en una grfica donde se relacionan las


puntuaciones de una muestra en dos variables.

VEMOSLO CON UN
EJEMPLO DE OCHO CASOS.
Sujeto
s

Filosofia
(X)

Estadisticas
(Y)

10

10

27.-QU ES EL ANLISIS
FACTORIAL DE VARIANZA?
(ANOVA)
Es una prueba estadstica para analizar si ms

de dos grupos difieren significativamente entre


s en cuanto a sus medias y varianzas.

La prueba t se usa para dos grupos y el anlisis

de varianza se usa para tres, cuatro o ms


grupos. Aunque con dos grupos se puede
utilizar tambin.

Produce un valor conocido como F o razn F,

basada en una distribucin muestral conocida


como distribucin F.

La razn F compara las variaciones en las

puntuaciones debidas a dos diferentes fuentes:

28.- QU ES LA JI
CUADRADA O CHI
CUADRADA Y CUL ES SU
PROCEDIMIENTO?
Es una prueba estadstica para evaluar
hiptesis acerca de la relacin entre dos
variables categricas.

Se simboliza: 2.
No considera relaciones causales.
Nivel de medicin de las variables: nominal u

ordinal (o intervalos o razn reducidos a


ordinales).

PROCEDIMIENTO
Se calcula por medio de una tabla de

contingencia o tabulacin cruzada, que es un


cuadro de dos dimensiones, y cada dimensin
contiene una variable. A su vez, cada variable
se subdivide en dos o ms categoras.

EJEMPLO DE TABLA DE
CONTINGENCIA

TABLA DE CONTINGENCIA
DE 3X2

Vous aimerez peut-être aussi