Vous êtes sur la page 1sur 5

Metodología de la investigación

Estudiante: Kerwin Rojas 4-807-320

Variables Cualitativas
Comunidad de Nacimiento#1
Communidad autónoma de nacimiento Numero de alumnos (fi) Fi hi Hi pi Pi
Andalucía 19 19 0,633333 0,633333 63% 63%
Castilla-La Mancha 7 26 0,233333 0,866667 23% 87%
Cataluña 2 28 0,066667 0,933333 7% 30%
País Vasco 1 29 0,033333 0,966667 3% 10%
Galicia 1 30 0,033333 1 3% 7%
30 60 1

Numero de alumnos (fi) Fi hi Hi pi Pi


19 19 0,633333 0,633333 63% 63%
7 26 0,233333 0,866667 23% 87%
2 28 0,066667 0,933333 7% 30%
1 29 0,033333 0,966667 3% 10%
1 30 0,033333 1 3% 7%
30 60 1
Numero de Hijos
Hijos fi Fi hi Hi pi Pi
0 31 31 0,258333 0,258333 26% 26%
1 54 85 0,45 0,708333 45% 71%
2 27 112 0,225 0,933333 23% 93%
3 5 117 0,041667 0,975 4% 98%
4 2 119 0,016667 0,991667 2% 99%
5 1 120 0,008333 1 1% 100%
120

En la primera columna se introducen los datos cualitativos ( variables que no tienen relación
numérica entre sí). Para el caso de la figura 1 serían los números de alumnos y para la figura 2 son
los hijos. La fi o frecuencia absoluta es la cantidad de veces que se repite ese numero un ejemplo
en estos casos particulares para la tabla #1 en primer dato de la columna fi indica la cantidad de
alumnos que existe en Andalucía(19 alumnos) en la tabla #2 en primer dato de la columna fi indica
la cantidad de familias que tienen 0 hijos (31 familias).

La Fi es la suma algebraica de todas las frecuencias absolutas.

La frecuencia relativa es el valor de cada frecuencia absoluta (cantidad de veces que se repite mi
variable) entre la cantidad de datos. Esta frecuencia relativa indica que cantidad ocupa mi variable
con respecto al total de datos.

Y pi seria el porcentaje de la frecuencia relativa (multiplicado por 100) en la tabla #1 la primera


variable Andalucía conforma el 63% del total de estudiantes que conforman esa población.
Comunidad de Nacimiento#1
3% 3%

7%

23%

64%

Andalucía Castilla-La Mancha Cataluña País Vasco Galicia

En esta grafica de pastel se representan de una manera mas ordena y visual los datos de la tabla
#1. Se puede observar rápidamente que Andalucía es el lugar donde mas estudiantes existe ya
que su porcentaje es mayor.

Numero de Hijos#2
60 54

50

40
31
30 27

20

10 5
2 1
0
0 1 2 3 4 5

cantidad de hijos

Esta es la grafica de barra de la tabla#2 se aprecia rápidamente que la mayor cantidad de familias
tienen un solo hijo esta seria la barra mas alta y la de menor valor seria la barra más pequeña que
muestra que una familia tiene cinco hijos.
Variables Cuantitativas

Peso de los estudiantes de 4° de ESO


[a,b) a b xi fi Fi hi Hi pi Pi
[41,47) 41 47 44 4 4 0,16 0,16 16% 16%
[47,53) 47 53 50 7 11 0,28 0,44 28% 44%
[53,59) 53 59 56 4 15 0,16 0,6 16% 60%
[59,65) 59 65 62 3 18 0,12 0,72 12% 72%
[65,71) 65 71 68 4 22 0,16 0,88 16% 88%
[71,77] 71 77 74 3 25 0,12 1 12% 100%
25 1 100%

Para las variables cuantitativas las columnas representan lo mismo que en el de variables
cualitativas. La diferencia significativa se encuentra en que entre las variables existe una relación
numérica entre ellas y por lo tanto la manera de representarlas gráficamente cambia. Se puede
representar por medio de un histograma o polígono de frecuencia.

Además xi representa los puntos medios por donde pasara el polígono como se observa en la
gráfica. Otra parte importante es obtener el intervalo de clase que es con la formula 2𝑘 con este
se puede construir las clases(variables).

Peso de los estudiantes de 4° de ESO


8

6
Frequency

2 Frequency

0
0 25 47 53 59 65 71 77 More
Bin
Regresión Lineal
y x
Magnitud Respuesta
1 2,54 4632
2 5,09 9082
3 7,63 13373
4 10,17 17946
5 12,72 22028
6 15,26 27280
7 17,8 30899
8 20,35 36284
9 22,89 39916
10 25,43 43602

En una regresión lineal se muestra muchos datos lo primordial es identificar (x) independiente y
dependiente (y). Para este ejemplo la independiente son las respuesta y la dependiente son las
magnitudes.

Los datos mas importante de cualquiera relación lineal son el coeficiente de correlación (Multiple
R) que representa la relación que existe entre la variable independiente y la dependiente en otras
palabras explica que si su valor esta entre -1 y 1 la relación que existe entre nuestras variables es
una recta. Para este caso es de 0,9995 por lo tanto el objeto de estudio si se puede representar
por una recta.

Otro dato importante es el coeficiente de determinación R2 (R square) este numero indica la


confiabilidad del modelo matemático que se obtuvo. En este caso es del 0,9990 en otras palabras
nuestras predicción ellas a partir del modelo que se obtuvo tendrá un acierto del 99.90%.
Por ultimo para obtener el modelo matemático que describe este fenómeno (una recta) se
obtienen los coeficientes(coefficients). Y=ax+b donde a=0.000578 y b=-0.17688 esta ecuación me
permitiría pronosticar la magnitud a partir de las respuestas

Medidas de dispersión

Hijos de los trabajadores de una fábrica


xi fi Fi hi Hi xi*fi
0 31 31 0,26 0,26 0
1 54 85 0,45 0,71 54
2 27 112 0,23 0,93 54
3 5 117 0,04 0,98 15
4 2 119 0,02 0,99 8
5 1 120 0,01 1 5
120 1 136
Moda 1
Mediana 1
Media 1,133333

En este último ejemplo se muestra algunas medidas de dispersión. La moda es el numero que se
repite con mayor frecuencia, en este caso es el 1 porque su frecuencia absoluta es la mayor de
todas 54. La media seria la suma aritmética de todas la variables 136 entre la cantidad de datos
120, para este caso es de 1,1333. Por ultimo la mediana es el número que hay en el medio de toda
una tabla con todas las variables ordenadas de mayor a menor.

Vous aimerez peut-être aussi