Vous êtes sur la page 1sur 27

Anlisis de datos

Consiste en determinar qu resultados de las


variables
se presentaron y qu relacin entre las variables se
necesita para dar respuesta al problema
planteado.

En la actualidad esto se realiza mediante programas de


computadora. Por ello es ms importante la interpretacin
de los mtodos de anlisis cuantitativos que aprender los
procedimientos de clculo.
El anlisis que se proponga debe ser coherente con los
objetivos e hiptesis de estudio. No solo se deben emplear
las tcnicas estadsticas sino tambin se debe justificar por
qu se estn usando.
Anlisis de datos
Hacer el plan de anlisis significa exponer el plan que
se va seguir para el tratamiento o anlisis estadstico
de
la informacin obtenida.
El anlisis depende de: El nivel de medicin de las

variables; la manera cmo se formularon las hiptesis


y
el inters del investigador.
El investigador describe sus datos y efecta anlisis

estadsticos para relacionar sus variables. Primero se


realizan anlisis de estadstica descriptiva para cada
una de las variables y luego se describe la relacin
entre stas.
Principales anlisis
Estadstica descriptiva para las variables(tomadas
individualmente).

Puntuaciones Z

Razones y tasas

Clculos y razonamientos de estadsticainferencial.

Pruebas paramtricas
Pruebas no paramtricas
Anlisis multivariados
Estadstica descriptiva para cada
variable
Lo primero es describir los datos, valores o
puntuaciones obtenidas para cada
variable.
Los datos obtenidos van a ser descritos en una
distribucin de puntuaciones ofrecuencias.

Distribucin de frecuencias:
Conjunto de puntuaciones ordenadas en sus
respectivas categoras.
A veces las categoras de las distribuciones de las
frecuencias son tantas que necesitan ser
resumidas.
Distribucin de frecuencias
Las distribuciones de frecuencias pueden completarse

agregando las frecuencias relativas y las frecuencias


acumuladas.
Las frecuencias relativas son los porcentajes de casos en
cada categora. Las frecuencias acumuladas son lo que se
va
acumulando en cada categora, desde la ms baja hasta la
en cada categora. En la ltima categora siempre se
mas alta. el total.
acumula
Las frecuencias acumuladas constituyen lo que se acumula
Las frecuencias acumuladas tambin pueden expresarse en
porcentajes.
Distribucin de frecuencias
Frecuencia Frec. Porcentaje Frec. Frec. Porc.
Categora Cd. absoluta relativa (%) acum. rel. ac. ac.
(f ) (fr) (f ) (fr) (%)
De acuerdo 1 90 0,75 75% 90 0,75 75%
En desacuerdo 2 5 0,042 4.17% 95 0,792 79.17%
No sabe/ No opina 3 25 0,208 20.83% 120 1,00 100%

TOTAL 120 1,00 100%

Las frecuencias relativas y porcentajes se calculan as:

Frecuencia relativa = # casos Porcentaje= # casos x 100


# total # total

*Al presentar los resultados, una distribucin solo presentar los elementos ms
informativos para el lector, pudiendo llevar un comentario adjunto.
Tabulacin de los datos
Es la presentacin de los datos estadsticos en forma de tablas o
cuadros.
Partes de una tabla:
Ttulo, preciso y conciso.

Contenido: Encabezamientos o ttulos de las columnas; columna


matriz y columnas de
parmetros.
Notas explicativas (opcional)

Para tabular una variable cualitativa se debe obtener las frecuencias y


porcentajes. Recordar que en las variables ordinales siempre se debe
respetar el orden lgico.
Para tabular variables cuantitativas, los datos se agruparn segn la
frecuencia de los valores. Si son pocos se realiza una tabla similar a las
realizadas en variables cualitativas; si son muchos, se agrupan en clases
o intervalos de valores sucesivos.
Tabulacin de datos
Las distribuciones de frecuencias, especialmente cuando se
utilizan frecuencias relativas, pueden presentarse en forma
de grfica de diversos tipos.
Frec. acum. (f )
Porcentaje (%)
140

120
120
100
4.17% 20.83% De acuerdo 80 90 95

60
En desacuerdo
40
20
No sabe/No
75.00% opina 0
De acuerdo En No sabe/No
desacuerdo opina
Tabulacin de datos
Las distribuciones de frecuencias tambin pueden graficarse como
polgonos de frecuencias.
Los polgonos de frecuencias relacionan las puntuaciones con sus
respectivas frecuencias.
Es propio de un nivel de medicin por intervalos.

Frecuencias absolutas
45
Categoras/Intervalos Frecuencias absolutas
20 - 25 15 40

25 - 30 25 35

30 - 35 39 30
25
35 - 40 35
20
40 - 45 40
15
45 - 50 30
10
50 - 55 10
5
55 - 60 6
0
Total 200 20 - 25 25 - 30 30 - 35 35 - 40 40 - 45 45 - 50 50 - 55 55 - 60
Medidas de tendencia central
Son puntos en una distribucin y nos ayudan a ubicarla dentro de una
escala de medicin.
Las principales medidas de tendencia central son: Moda, mediana y
media.
Moda:
Categora o puntuacin que ocurre con mayor frecuencia. Se utiliza
con
cualquier nivel de medicin.
Mediana:
Es el valor que divide a la distribucin por la mitad. La mitad de los
casos caen por debajo de la mediana y la otra mitad est por encima de
ella.
Es propia de los niveles de medicin ordinal, por intervalos y de razn.
No se usa con variables nominales ya que en ellas no hay jerarquas.
Se halla mediante la frmula:
Mediana = N + 1
2
*Donde N es el nmero de
casos.
Media o promedio
Es la medida de tendencia central ms utilizada.
Puede definirse como el promedio aritmtico de una distribucin. Se
obtiene mediante la siguiente frmula:
b d
Media (X) = X 1 + X 2 + X 3 + +
Xn n

Si los datos estn agrupados en intervalos, primero se debe calcular el


punto medio de cada intervalo y luego se multiplica cada punto medio
por las frecuencias queDle corresponden.
d A estos resultados se les saca
el promedio, la frmula es: X = fx / N

*Siendo fx, la sumatoria de los productos de cada punto medio y su


respectiva frecuencia.
Medidas de la variabilidad
Indican la dispersin de los datos en la escala de medicin. Son
intervalos, designan distancias o un nmero de unidades en la escala
de
medicin.
Las
Rango:medidas de la variabilidad ms utilizadas son: Rango, desviacin
estndar y varianza.
Tambin se conoce como Recorrido.
Es la diferencia entre la puntuacin mayor y la puntuacin menor. Se
halla mediante la frmula:

Rango = X X
M m

*Cuanto mas grande sea el rango, mayor ser la dispersin de los datos
de
una distribucin.
Desviacin estndar
Es el promedio de la desviacin de las puntuaciones con
respecto a la media. Se halla mediante la siguiente frmula:
X x.
Desviacin estndar (s o ) = ( (X - X)2 / N)

Cuando los datos estn agrupados en una distribucin de


frecuencias, se hace lo siguiente:
Obtener el punto medio de cada intervalo y determinar la
media de la distribucin (para datos agrupados).
Elevar la media al cuadrado, se obtiene X2.
Multiplicar la columna fx por los puntos medios y obtener
una columna nueva (fx2).
Obtener la sumatoria de la nueva columna.
Desviacin estndar
Aplicar la siguiente frmula:
x
x
s = ( ( fx2 / N) X2 )

*La desviacin estndar solo se utiliza en variables medidas por


intervalos
Varianza:
o de razn.
Es la desviacin estndar elevada al cuadrado y se simboliza por s2.
Es un concepto estadstico muy importante, ya que muchas de las
pruebas cuantitativas se fundamentan en ella.

*Diversos mtodos estadsticos parten de la descomposicin de la


varianza. Sin embargo, con fines descriptivos se utiliza
preferentemente la desviacin
estndar.
Puntuaciones Z
Son transformaciones que se pueden hacer a los valores o
puntuaciones obtenidas, con el propsito de analizar su distancia
respecto a la media.

Nos indica la direccin y el grado en que un valor individual obtenido


se aleja de la media, en una escala de unidades de desviacin estndar.
Es el mtodo mas comn para estandarizar la escala de una variable
medida por un nivel de intervalos. Su
X frmula
x es:
Z=X
X s
*Donde X es la puntuacin o valor a
transformar.

Estandarizar los valores permite comparar puntuaciones de dos


distribuciones diferentes. Tambin nos sirven para comparar
mediciones de distintas pruebas o escalas aplicadas a los mismos
sujetos.
Puntuaciones Z
Razones y tasas
Razn:
Relacin entre dos categoras. Su frmula es:

Razn = Frecuencia 1
Frecuencia 2

Tasa:
Relacin entre el nmero de casos, frecuencias o eventos de una
categora y el nmero total de observaciones, multiplicada por
un mltiplo de 10 (generalmente 100 o 1000). Su frmula es:
Tasa = # eventos durante un periodo x 100 (o 1000)
# total de eventos posibles
Estadstica inferencial
Se busca generalizar los resultados obtenidos en la

muestra hacia la poblacin o


universo.
Los datos recolectados de una muestra se conocen

como estadgrafos, mientras que las estadsticas de la


poblacin se conocen como parmetros.
parmetros
Los van a ser inferidos de los estadgrafos.

La estadstica inferencial va ser utilizada para probar


hiptesis y estimar parmetros.
Prueba de hiptesis
Lo que se busca es determinar si la hiptesis planteada es
la muestra. Si lo es se
congruente con los datos obtenidos en
acepta, sino se rechaza.

Distribucin muestral:
Conjunto de valores sobre una estadstica calculada de todas las
muestras posibles de determinado tamao.
Las distribuciones muestrales de medias son las ms conocidas.
Muy rara vez se obtiene la distribucin muestral. Es mas bien un
concepto terico definido por la estadstica de los
investigadores.
Lo que comnmente se hace es extraer una sola muestra.
Prueba de hiptesis
Nivel de significancia ():
Nivel de probabilidad de equivocarse; se fija antes de probar las
hiptesis inferenciales. Se toma como un rea bajo la distribucin
muestral.
Se utilizan dos niveles de significancia: Nivel de significancia de 0.05
(95% de seguridad) y nivel de significancia de 0.01 (99% de seguridad).
Procedimiento:
Establecer una hiptesis acerca del parmetro poblacional.
Definir el nivel de significancia.
Recolectar los datos de una muestra representativa.
Estimar la desviacin estndar de la distribucin muestral de la
media,
X x
utilizando la siguiente frmula:
SX = s .
n
Prueba de hiptesis
Transformar la media de la muestra en una puntuacin Z, en el
contexto de la distribucin muestral. Vamos a aplicar una
X x
variante de la frmula paraZobtener
= X puntuaciones Z:
X SX

Prueba de hiptesis
Intervalo de confianza:
Se trata de una probabilidad definida de que un parmetro
se va ubicar en un determinado intervalo.
Aqu tambin se consideran los niveles de confianza de
0.05 y 0.01; adems estos niveles de confianza se expresan
en unidades de desviacin estndar (acudiendo a los
valores de las puntuaciones Z).
Se aplica la siguiente frmula:

Intervalo de confianza = Estadgrafo + (Puntuacin Z del)(Desv. Est. de


la) nivel de confianza Dist. Muestral

.
Anlisis paramtricos
Para realizar un anlisis paramtrico se debe considerar que:
La distribucin poblacional de la variable dependiente es normal.

El nivel de medicin de la variable dependiente es por intervalos o


razn.
Cuando dos o mas poblaciones son estudiadas, tienen una varianza
homognea.
Las pruebas estadsticas paramtricas ms utilizadas son:
Coeficiente de correlacin de Pearson (r)
Regresin lineal
Prueba t (distribucin t de Student)
Prueba de contraste de la diferencia de proporciones
Anlisis de varianza unidireccional (ANOVA oneway)
Anlisis de varianza factorial (ANOVA)
Anlisis de covarianza (ANCOVA)
Anlisis no paramtricos
Para realizar anlisis no paramtricos se debe considerar que:
La mayora de estos anlisis no requieren de presupuestos acerca de
la forma de la distribucin poblacional. Aceptan distribuciones no
normales.
Las
por variables noonecesariamente
intervalos deben
de razn, pueden estar medidas
analizar datos en un nivel u
nominales
ordinales.

Las pruebas no paramtricas ms utilizadas son:


Ji cuadrado o X2
Coeficientes de correlacin e independencia para tabulaciones
cruzadas.
Coeficientes de correlacin por rangos ordenados de Spearman y
Kendall.
Anlisis multivariado
En estos mtodos se analiza la relacin entre varias
variables independientes y al menos una dependiente.
Son mtodos ms complejos que requieren del uso de
computadoras para efectuar los clculos necesarios y
normalmente se ensean a nivel de
postgrado.
Los principales mtodos de anlisis multivariado son:
Regresin mltiple
Anlisis lineal de patrones (path analysis)
Anlisis de factores
Anlisis multivariado de varianza (MANOVA)
Anlisis estadsticos
Actualmente los anlisis estadsticos se llevan acabo en
programas para computadora, utilizando paquetes estadsticos.
Estos paquetes son sistemas integrados de programas diseados

para el anlisis de datos.


Cada paquete tiene su propio formato, instrucciones,
procedimientos y caractersticas. Para conocer un paquete es
El procedimiento para analizar los datos es crear o desarrollar un
necesario consultar el manual respectivo.
programa basndonos en el manual. Este programa incluye la
matriz de datos y las pruebas estadsticas seleccionadas; despus
se corre el programa y se obtienen los resultados, los cuales se
Los principales paquetes estadsticos conocidos hoy en da son el
interpretan.
SPSS y el Minitab; ambos disponibles en diferentes versiones.

Vous aimerez peut-être aussi