Vous êtes sur la page 1sur 17

Escuela de Ciencias Básicas, Tecnología e Ingeniería

100105 – Estadística Descriptiva


Paso 4 - Descripción de la información

Presentado por:
Heverson Andrey Hernández Rueda

Presentado a
Nahury Yamile Castellanos
Tutora

Grupo
100105_61
Curso
100105A_613

Universidad Nacional Abierta y a Distancia UNAD


Escuela de Ciencias Básicas, Tecnología e Ingeniería ECBTI
Programa: Ingeniería en Sistemas
Agosto 2019
Actividad 1. Mapa mental.
Actividad 2. Definición de Conceptos

2.1 Diagrama de dispersión:


Este método es una representación gráfica de la variación conjunta de dos
variables cuantitativas. Además, intenta establecer una causalidad entre
ambas, aunque no puede probarla.
Los datos se muestran como un conjunto de puntos, cada uno con el valor
de una variable que determina la posición en el eje horizontal y el valor de la
otra variable determinado por la posición en el eje vertical. Además, un
diagrama de dispersión se puede llamar también gráfico de dispersión.

2.2 Correlación lineal simple:


El concepto de relación o correlación se refiere al grado de variación conjunto
que existe entre dos o más variables. En este apartado nos vamos a centrar
en el estudio de un tipo particular de relación llamada lineal y nos vamos a
limitar a considerar únicamente dos variables simples.

2.3 Coeficiente de determinación R2:


El coeficiente de determinación que se conoce también como R2, es un
término utilizado en estadística, que tiene como función principal predecir el
resultado de hipótesis. Esto es fundamental en cualquier estudio con
fundamentos científicos y sus aplicaciones pueden tener un amplio, rango
como en la economía, el estudio de los mercados o para determinar el éxito
de algún producto.

2.4 Correlación positiva y correlación negativa


2.4.1 Correlación positiva:
Se habla de una correlación positiva cuando una relación entre una variable
y otra es lineal y directa, de manera que un cambio en una variable predice
el cambio en la otra variable. En ese caso, se dice que la correlación es
positiva perfecta, es decir, ambas variables varían al mismo tiempo. Este tipo
de correlación es directamente proporcional. Hay correlación positiva cuando
las dos variables se correlacionan en sentido directo. Por lo que, a valores
altos de una le corresponden valores altos de la otra e igualmente con los
valores bajos.

2.4.2 Correlación negativa:


Se habla de una correlación negativa cuando la relación entre una variable y
otra es opuesta o inversa, es decir, cuando una variable cambia, la otra se
modifica hacia lo contrario. Entonces, cuando una posee variable valores
altos, la otra posee valores bajos y mientras este valor esté más cerca de -
1, más evidente será esta variación.
Se dice que hay correlación negativa perfecta cuando r = -1. Este tipo de
correlación es inversamente proporcional. Entonces, hay correlación negativa
cuando las dos variables se correlacionan en sentido inverso.

2.5 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a


medir?
En estadística, el coeficiente de correlación es una medida lineal entre
dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las
variables.
De manera menos formal, podemos definir el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de relación
de dos variables siempre y cuando ambas sean cuantitativas y continuas.
Actividad 3. Realizar el laboratorio de regresión y correlación lineal

3.1 CH-Pureza. El rendimiento del producto de un proceso químico está


relacionado con la temperatura de operación del proceso. Se desea
establecer la relación que existe entre la pureza (y) del oxígeno
producido y el porcentaje de hidrocarburo (x) que está presente en el
condensador principal en un proceso de destilación, de acuerdo con los
siguientes datos:

X
(% de Y
Hidro (Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
a. Realice el diagrama de dispersión y determine el tipo de
asociación entre las variables.

Grafico 1. Diagrama de Dispersión, Hidrocarburos Vs Pureza (30 Julio 2019)


“Elaboración propia” Andrey Hernández.

b. Encuentre el modelo matemático que permite predecir el efecto de


una variable sobre la otra. ¿Es confiable?
Respuesta: El R2, coeficiente de determinación es confiable porque se
encuentra en 87,7%, es decir, que en el modelo matemático podemos
concluir que la variable efectivamente si es confiable.

c. Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.
Respuesta: Determinado el grado de correlación entre las variables pureza
e hidrocarburos es sumamente excelente, ya que su resultado se concluye
en 93,66%.

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del


oxígeno es igual a 91,3?
Y= 14,947(X) + 74,283 x = (91,3 – 74,283) / 14,947 = 1,139
Respuesta: Haciendo uso del modelo matemático determino que el
porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3 esta
equivale a 1,139
3.2 Tem-Vapor. El número de libras de vapor (y) consumidas
mensualmente por una planta química, se relaciona con la temperatura
ambiental promedio (en o F). Para el año 2014, se registraron los
siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y


consumos de vapor.

Temperatura Consumo de
Mes
(F) vapor (Lb)

Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables.

Gráfico 2. Diagrama de Dispersión, Consumo de Vapor Vs Mes (30 Julio 2019)


“Elaboración propia” Andrey Hernández.
Gráfico 3. Diagrama de Dispersión, Temperatura Vs Mes (30 Julio 2019)
“Elaboración propia” Andrey Hernández.

b. Ajuste un modelo matemático que permita predecir el efecto de


una variable sobre la otra. ¿Es confiable?

y: 5,6379 +-4,1312x1 +0,4573x2


Respuesta: Haciendo uso del modelo matemático, concluyo que esta no es
confiable, ya que el 0.2065 está muy distante al 1.

c. Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Respuesta: Determino que la correlación entre las variables es regular ya


que se presenta un 67,41% de coeficiente.

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

Y: 0,0088x+2,7776
X: 70
Y: 0,0088 (70) + 2,7776
X: 3, 3936
3.3 %-Umbral. Los investgadores están estudiando la correlación entre la
obesidad y la respuesta individual al dolor. La obesidad se mide como
porcentaje sobre el peso ideal (x). La respuesta al dolor se mide
utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una
medida de sensación de punzada. Obsérvese que ambas, X e Y, son
variables aleatorias

y (umbral de reflejo
% Sobrepeso.
de flexión nociceptiva)

89 2,00
90 3,00
75 4,00
30 4,50
51 5,50
75 7,00
62 9,00
45 13,00
90 15,00
20 14,00

a. Realice el diagrama de dispersión y determine el tipo de


asociación entre las variables.

Gráfico 4. Diagrama de dispersión, % de sobrepeso Vs Mes (30 Julio 2019)


“Elaboración propia” Andrey Hernández.
Respuesta: El tipo de asociación que se puede identificar en la gráfica es
de tipo inversa, se muestra como una nube de punto descendiente,
mientras que en una variable aumenta, en la otra disminuye.

b. Ajuste un modelo matemático que permita predecir el efecto de


una variable sobre la otra. ¿Es confiable?

Y: 0,0629x 11,642
R cuadrado = 0,1115 0,1115*100 = 11,15

Respuesta: Haciendo uso del modelo matemático doy como


determinada que la relación no es confiable, se da en un 11,15%, se
considera que la correlación es débil entre las variables.

c. Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Respuesta: En este caso se determina que existe una correlación mínima


dentro de las 2 variables, y esta se presenta con 33.39%

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay


un porcentaje de sobrepeso, de 40?

Y: -0,0629x 11,642

0,0629(40)+11,642 =14,158

Respuesta: Cuando hay un porcentaje de sobrepeso el umbral del reflejo


de flexión nociceptiva es de 14, 158
Actividad 4. Regresión y correlación Lineal Simple.

Las variables elegidas son las siguientes:


 Peso (Kg)
 Estatura (M)

4.2 Realizar el diagrama de dispersión de dichas variables y


determinar el tipo de relación entre las variables.

Gráfico 1. Diagrama de dispersión, Peso Vs Estatura (30 Julio 2019)


“Elaboración propia” Andrey Hernández.

Respuesta: El tipo de asociación que se observa en la gráfica es lineal


positiva.

4.3 Encuentre el modelo matemático que permite predecir el efecto


de una variable sobre la otra. ¿Es confiable?
El modelo matemático es: Y = a - bx
Y= 0,0136x + 0,7524
R2= 0,8645
Respuesta: De acuerdo a lo anterior se puede concluir que el modelo es
confiable, debido que el resultado obtenido en R2 se acerca a 1.
4.4 Determine el grado de correlación de las dos variables.

Respuesta: La relación de las dos variables es aceptable ya que se


representa un 92,97% de confiabilidad de la información.

4.5 Análisis de correlación lineal simple de las dos variables


cuantitativas.
Observamos la información se puede concluir al respecto al bajo rendimiento
académico en 105 estudiantes de básica primaria en instituciones educativas
de Ibagué Tolima (Colombia) hay una relación aceptable de 92,97% de su
estatura y de la edad.

INFORME DESCRIPTIVO:
Observamos la información se puede concluir al respecto al bajo rendimiento
académico en 105 estudiantes de básica primaria en instituciones educativas
de Ibagué Tolima (Colombia) hay una relación aceptable de 92,97% de su
estatura y de la edad.
Así como se demostró la relación entre las variables mencionadas
anteriormente, las cuales fueron seleccionadas de la base de datos
compartida5en el inicio del curso, se puede no todas las variables
cuantitativas contenidas en dicha base correlación lineal, pues al validar las
diferentes asociaciones realizadas, se evidencia que entre el número de
estudiantes y el peso no existe una relación clara entre ellas, pues el
porcentaje de relación es del 13% resultado que esta distante al 1. No siendo
así, con las variables de peso y estatura de los estudiantes, donde se
evidencia que existe una clara correlación entre dichas variables, debido a
que el grado de relación es de 86% asimismo, con los resultados obtenidos
entre las variables estudiantes y el bajo rendimiento académico donde existe
una mayor relación aunque las mencionadas anteriormente, la cual es de
93%, por último, se comparan las variables número de estudiantes y edad,
las cuales son las de menor relación, pues su grado de relación apenas llega
al 1%, por lo que se puede decir, que en estas variables la relación es
completamente nula.
5. Regresión y correlación lineal múltiple.

5.1 Identificar una variable cuantitativa dependiente y varias


variables independientes del estudio de investigación.

 Variables dependientes: Peso y estatura


 Variables independientes: Estudiantes

5.2 Realizar el diagrama de dispersión de dichas variables.

Gráfico 1. Diagrama de dispersión, Estudiantes Vs Peso (30 Julio 2019)


“Elaboración propia” Andrey Hernández.
Gráfico 2. Diagrama de dispersión, Estudiantes Vs Estatura (30 Julio 2019)
“Elaboración propia” Andrey Hernández.

5.3 Calcular la recta de regresión y coeficiente de correlación para


probar estadísticamente su relación.

y = - 6,8160 + 0,5174 + 7,8500 * 2


R2 = 0,3765: 37,65%. El modelo matemático es poco confiable ya que se
presenta en 37,65% de valides de la información.
r = 0,7833: 78,33%. La correlación entre las variables es regular, ya que
su valor de coeficiente es de 78,33.
5.4 Relaciona la información obtenida con el problema.
Los resultados anteriores de las variables Estudiantes, edad y estatura se
encuentran relacionadas a través de un modelo matemático de regresión
múltiple y = - 6,8160 + 0,5174 + 7,8500 * 2, este modelo explica 37,65%
de poca confiabilidad. Esto debido a que dichas variables se encuentran en
una correlación regular de 78,33%.
Observando lo anterior concluyo que el bajo rendimiento académico en 105
estudiantes de básica primaria en instituciones educativas de Ibagué Tolima
(Colombia), la relación entre estudiantes, edad y estatura es muy regular.
REFERENCIAS BIBLIOGRAFICAS

Bibliotecavirtual.unad.edu.co. (01 de 08 de 2019). Obtenido de


http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&s
w=w&asid=e558184ed89e57d11ede116134cfce41

Bibliotecavirtual.unad.edu.co. (01 de 08 de 2019). Obtenido de


http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&s
w=w&asid=99feba20c3312cbea60961107ffc27a0

Bibliotecavirtual.unad.edu.co. (01 de 08 de 2019). Obtenido de


http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&s
w=w&asid=b82c81e98fcc1361e1929abe203c8219

Coeficiente de correlacion . (01 de 08 de 2019). Obtenido de


https://www.uv.es/ceaces/base/descriptiva/coefcorre.htm

Coeficiente de determinacion R2. (01 de 08 de 2019). Obtenido de


https://www.webyempresas.com/coeficiente-de-determinacion-r2/

Correlacion lineal simple. (01 de 08 de 2019). Obtenido de


http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/GuiaSPSS/17corlin.pdf

Diagrama de Dispersion. (01 de 08 de 2019). Obtenido de https://www.aec.es/web/guest/centro-


conocimiento/diagrama-de-dispersion

Vous aimerez peut-être aussi