Vous êtes sur la page 1sur 15

Paso 4- Descripción de la información

Estadística Descriptiva

Presentado Por:
Sergio Andrés Muñoz Lizarazo

COD: 1095924065

Grupo: 100105_47

Presentado a:
Edgar Gabriel Diaz

Ingeniería Electrónica

Universidad Nacional Abierta y a Distancia


2019
INTRODUCCION

Por medio de la realización de este trabajo identificaremos conceptos básicos en


el análisis de la información para abordar una temática como son las medidas de
regresión y correlación lineal que se sustentara por medio de un laboratorio
JUSTIFICACION

La presente actividad busca que nos apropiemos del conocimiento estadístico


para resolver los diferentes problemas de la vida cotidiana y implementando
estrategias acordes a la temática planteado desde el inicio del curso, dando
solución a los diferentes ejercicios y actividades propuestas en este paso
OBJETIVOS

 Dar respuesta a los diferentes conceptos de relación y correlación lineal del


paso 4
 Trabajar en el laboratorio de relación y correlación lineal
 Entender los diferentes tipos de asociación de las variables
 Hallar los modelos matemáticos de los ejercicios plateados y variables
cuantitativas
Mapa mental
Descripción de la Actividad Individual:

Definir brevemente los conceptos básicos asociados a Regresión y Correlación


como:

-Diagrama de dispersión
El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos
asociados de datos que aparecen en pares (por ejemplo, (x,y), uno de cada
conjunto). El diagrama muestra estos pares como una nube de puntos.

-Correlación lineal simple


Bajo el concepto de correlación se recogen varios procedimientos e indicadores
estadísticos utilizados para determinar el grado de asociación entre
dos variables; el más sencillo de ellos es el de correlación lineal que está basado
en la comparación de la varianza asociada de dos variables (covarianza) y las
desviaciones estándar de cada uno a través del cálculo del coeficiente r de
Pearson.

-Coeficiente de determinación R2
El coeficiente de determinación que se conoce también como r2, es un término
utilizado en estadística, que tiene como función principal predecir el resultado de
hipótesis

-Correlación positiva y correlación negativa


La correlación negativa cuando las dos variables se correlacionan en sentido
inverso. En la correlación positiva la relación entre variables es lineal y recta. En
la correlación negativa la relación entre variables es opuesta. En la correlación
positiva el cambio de una variable predice el cambio de la otra.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?


La correlación, también conocida como coeficiente de correlación lineal (de
Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal
que el conjunto de puntos representados se aproxima a una recta.
Laboratorio Regresión y Correlación Lineal: Desarrollar en el paso 4.

Actividades a desarrollar

Opció Ejercicio 1 Ejercicio 2 Ejercicio 3 Estudiante


n
1 1.1. Sal-Tensión 1.4. X - Y 1.9. Sobrepeso-R Sergio muñoz
2 1.2. CH-Pureza. 1.4. X - Y 1.7. PIB-Ventas
3 1.1. Sal-Tensión 1.5. Tem-Vapor 1.7. PIB-Ventas
4 1.3. Peso-Altura. 1.6. Estatura-Peso 1.8. %-Umbral
5 1.2. CH-Pureza. 1.5. Tem-Vapor 1.8. %-Umbral

1.1. Sal-Tensión. Se quiere estudiar la asociación entre consumo de sal y tensión


arterial. A una serie de voluntarios se les administra distintas dosis de sal en
su dieta y se mide su tensión arterial un tiempo después.

X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables

Diagrama de dispersion
140

120

100
Tension

80

60

40

20

0
0 1 2 3 4 5 6
Sal

El tipo de asociación del diagrama de dispersión es lineal

b. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?
El modelo matemático que permite predecir el efecto de una variable sobre la otra
es: y= 4.371x + 94.2R² = 0.979
Se puede asegurar que la ecuación de la recta es confiable porque el R² está
cercano a 1 y tiene un grado alto de confiabilidad.

c. Determine el grado de relación de las dos variables.


El R² afirma además que el modelo explica el 97.9% de la información y el valor de
r coeficiente de correlación lineal es bueno porque el 0.979 está muy cercano al
extremo1 positivo que es la correlación perfecta positiva

d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión


arterial esperada? Para hallar el valor de la tensión arterial esperada para una
dosis de sal de 6.5 debemos reemplazar este valor en la formula hallada.
Y= (4.371*6.5) + 94.2= 122.61
El valor de la tensión esperada es: 122.61
1.2. X-Y. En un nuevo proceso artesanal de fabricación de cierto artículo que está
implantado, se ha considerado que era importante ir anotando
periódicamente el tiempo medio (medido en minutos) que se utiliza para
realizar una pieza y el número de días desde que empezó dicho proceso de
fabricación. Con ello, se pretende analizar como los operarios van
adaptándose al nuevo proceso mejorando paulatinamente su proceso de
producción.

Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables

Diagrama de dispersion
50
45
40
35
30
25
X

20
15
10
5
0
0 10 20 30 40 50 60 70 80
Y

La variable independiente es el número de días que lleva la persona en la


fabricación del artículo, y la variable dependiente es el número de minutos
que tarda en realizar dicho proceso
El tipo de asociación del diagrama de dispersión es LINEAL. Son variables
inversamente proporcionales.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

Y=-0.356x+42.56
R² = 0.796
Se puede asegurar que la ecuación de la recta tiene un grado de confianza mediana
porque el R² está un poco alejado a 1, teniendo entonces un grado medio alto de
confiabilidad.
c. Determine el grado de correlación de las dos variables.
El R² afirma además que el modelo explica el 79.6% de la información y el valor de
r coeficiente de correlación lineal es sobresaliente porque el 0.796 está un poco
alejado al extremo 1 positivo que es la correlación perfecta positiva.

d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 90 días?


Para hallar el valor del tiempo de 100 días debemos reemplazar este valor en la
formula hallada.
𝑌 = (−0.356 ∗ 90) + 42.56= 10.52 minutos
Para realizar una pieza el obrero se demora 10.52 minutos.
1.3. Sobrepeso-R. Los investigadores están estudiando la correlación entre la
obesidad y la respuesta individual al dolor. La obesidad se mide como
porcentaje sobre el peso ideal (x). La respuesta al dolor se mide utilizando el
umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación
de punzada. Obsérvese que ambas, X e Y, son variables aleatorias

%
Umbral de Reflejo.
Sobrepeso.

99 2,0
90 3,0
20 4,0
75 9,5
30 11,5
62 9,0
75 9,0
90 12,5
45 8,0
50 19,0
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

Diagrama de dispersion
20
18
16
Umbral de reflejo

14
12
10
8
6
4
2
0
0 20 40 60 80 100 120
% de sobrepeso

La asociación de las variables no existe, esto se puede observar con el coeficiente


de determinación R2 que es 11.35%.

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. ¿Es confiable?

El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente
y = -0.0629x + 11.642= 11.35
El modelo no es muy confiable porque el coeficiente de determinación R 2 está
muy lejos de 1

c.Determine el porcentaje de explicación del modelo y el grado de relación de las


dos variables.

Esta ecuación no hace una buena estimación entre las variables debido a que el
coeficiente de determinación R2 explica el 11.35% de la información y el valor del
coeficiente de correlación R confirma el grado de relación de las variables, que es
el 33.39%.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de


sobrepeso, de 34?

Reemplazamos

y = -0.0629*34+ 11.642
y = 9.50
Cuando el porcentaje de sobrepeso sea 34, el umbral de reflejo de flexión
nociceptiva será 9.50

Actividad 4. Regresión y correlación Lineal.


Descripción de la Actividad Individual:

A partir de la base de datos suministrada “Encuesta_ Instituciones_ Educativas


2019 (16-2)”, cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente.
Numero de materia con desempeño bajo: dependiente
Materias aprobadas: independiente
El número de materias con desempeño bajo depende de las materias aprobadas,
entre mayor sea las materias aprobadas menor va a ser el número de materias
con desempeño bajo
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de
relación entre las variables.

Diagrama de dispersion
6
Numero de materias con desempeño

y = -x + 10
5 R² = 1

3
bajo

0
0 2 4 6 8 10 12
Materias aprobadas
- Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?
El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente
y = -x + 10
El modelo es confiable porque el coeficiente de determinación R2 es igual a 1.

- Determine el grado de correlación de las dos variables.


Esta ecuación hace una buena estimación entre las variables debido a que el
coeficiente de determinación R2 explica el 100% de la información y el valor del
coeficiente de correlación R confirma el grado de relación de las variables, que es
el 100%.

- Relacionar la información obtenida con el problema.


Como se puede observar los datos de numero de materias con desempeño bajo es
inversamente proporcional al número de materias aprobadas, a mayor número de
materias aprobadas el desempeño con materias bajo va a ser menor
CONCLUSIONES

Por medio de la reliazacion de este trabajo se pudo entender y comprender mejor


conceptos bsicos propios de la estadisitica que nos permitiran en un futuro
determinar y analizar informacion para que sea mas concreta y eficaz en el estudio
de la misma, de ste modo el estudio y el analisis de la informacion de las
diferentes problematicas exixtente en nuestro entorno seran resueltas mas rapido
y de manera confiable
REFERENCIAS BIBLIOGRAFICAS

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.


Paginas. 151 – 158.
 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México
City: Cengage Learning. Páginas 675 – 686
 Ortegón Pava, M. (2017). Ova_Medidas_Univariantes.Colombia.Recuperado
de http://hdl.handle.net/10596/11579
 Matus, R., Hernández, Martha, and García, E (2010). Estadística. México,
D.F., MX: Instituto Politécnico Nacional, (2010). ProQuest ebrary. (pp 95-
109). Recuperado
de http://site.ebrary.com/lib/unadsp/reader.action?ppg=12&docID=10365616&
tm=1471981556569
 Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y
estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria. (pp 99-109)
Recuperado
de http://site.ebrary.com/lib/unadsp/reader.action?ppg=6&docID=11230886&t
m=1471982022168

Vous aimerez peut-être aussi