Vous êtes sur la page 1sur 17

TRABAJO

Unidad 3: Paso 4. Descripción de la información

Estudiante
ROSA ANGELICA FUENTES GELVIS
Código: 1091534721

Grupo del curso


204040_74

Presentado a
JUAN PABLO RODRIGUEZ

Fecha
Mayo 2019
INTRODUCCION

La estadística se puede definir como un método para describir numéricamente conjuntos


numerosos. Por tratarse de un método de descripción numérica, utiliza el número como medio
para describir un conjunto, que debe ser numeroso, ya que las permanencias estadísticas no se
dan en los casos raros.
La finalidad de la estadística descriptiva es resumir la información de conjuntos más o menos
numerosos de datos.
JUSTIFICACION

La estadística es una ciencia que facilita la toma de decisiones mediante la presentación ordenada
de los datos observados en tablas y gráficos estadísticos, reduciendo los datos observados a un
pequeño número de medidas estadísticas que permitirán la comparación entre diferentes series de
datos y estimando la probabilidad de éxito que tiene cada una de las decisiones posibles. El
principal objetivo de la estadística es hacer inferencias acerca de una población, con base en la
información contenida en una muestra.
OBJETIVOS

GENERAL

 Facilitar la toma de decisiones mediante la presentación ordenada de los datos observados


en tablas y gráficos estadísticos.

ESPECIFICOS

 Extraer conclusiones mediante el análisis de datos.


 Relacionar variables de la problemática utilizando medidas bivariante.
MAPA MENTAL

link: https://www.goconqr.com/es-ES/p/17822546-MEDIDAS-ESTAD-STICAS-
BIVARIANTES-DE-REGRESI-N-mind_maps
DEFINICIÓN DE CONCEPTOS

Diagrama de dispersión.
Los diagramas de dispersión son una forma fenomenal de expresar datos de dos variables, y hacer
predicciones basadas en los datos. Al contrario de los histogramas y los diagramas de caja, los de
dispersión muestran valores de datos individuales.

Correlación lineal simple.


Para estudiar la relación lineal existente entre dos variables continuas es necesario disponer de
parámetros que permitan cuantificar dicha relación. Uno de estos parámetros es la covarianza,
que indica el grado de variación conjunta de dos variables aleatorias. La covarianza depende de
las escalas en que se miden las variables estudiadas, por lo tanto, no es comparable entre distintos
pares de variables. Para poder hacer comparaciones se estandariza la covarianza, generando lo
que se conoce como coeficientes de correlación.

Coeficiente de determinación R2.


El R Cuadrado se define como la proporción de la varianza total de la variable explicada por la
regresión. El R Cuadrado, también llamado coeficiente de determinación, refleja la bondad del
ajuste de un modelo a la variable que pretender explicar.

Es importante saber que el resultado del R Cuadrado oscila entre 0 y 1. Cuanto más cerca de 1 se
sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De
forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos
fiable será.

Correlación positiva y correlación negativa.


Correlación positiva. Relación entre dos variables que muestra que ambas aumentan o
disminuyen simultáneamente. Para poder contar con un indicador que nos permita, por un lado,
establecer la covariación conjunta de dos variables, y por otro, que tenga la universalidad
suficiente para poder establecer comparaciones entre distintos casos, se utiliza el coeficiente de
correlación (lineal, de Pearson). La correlación es, pues una medida de covariación conjunta que
nos informa del sentido de esta y de su relevancia, que está acotada y permite la comparación
entre distintos casos.
¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

En estadística, el coeficiente de correlación de Pearson es una medida lineal entre dos variables
aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente
de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un
índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando
ambas sean cuantitativas y continuas.
REGRESION Y CORRELACION LINEAL SIMPLE
Variables seleccionadas:
Variable Y: Pobreza extrema en Colombia
Variable X: Persona sin empleo

0,6227 Aceptable
Tipo de asociación de las variables
y = 383330x+763727
Modelo matemático R² = 0,3878

R2 0,3878
R 0,6227
Confiabilidad 38,78
% de explicación 38,78%
Grado de relación Baja

Diagrama de dispersión:

Diagrama de Dispersión
9,000,000
8,000,000
7,000,000 f(x) = 383329.72x + 763726.79
6,000,000 R² = 0.39
5,000,000
4,000,000
3,000,000
2,000,000
1,000,000
-
6.00 8.00 10.00 12.00 14.00 16.00 18.00

Análisis e interpretación de resultados

 No es confiable ya que la ecuación de la recta indica una baja relación entre las
variables tasa de desempleo y personas sin empleo.
 El porcentaje de explicación es de 38,78%
 El grado de la relación es baja

REGRESION Y CORRELACION LINEAL MULTIPLE


Variables seleccionadas:
Variable Y: Tasa de pobreza extrema
Variable X1: Personas con empleo
Variable X2: Personas sin empleo

Diagrama de dispersión:

Diagrama de dispersión
35,000,000
30,000,000
f(x) = - 1071201.73x + 36971510.03
25,000,000 R² = 0.57
20,000,000
15,000,000
10,000,000
5,000,000 f(x) = 383329.72x + 763726.79
R² = 0.39
-
6.00 8.00 10.00 12.00 14.00 16.00 18.00
Pers onas con Empleo Li nea r (Pers onas con Empl eo )
Pers onas Si nEmpl eo Li nea r (Pers onas Si nEmpl eo)

Tipo de asociación de las variables 38,78 % baja


y = 383330x + 763727
Modelo matemático
R² = 0,3878
R2 0,3878
R 62.27
Confiabilidad 38,78
% de explicación 38,78 %
Grado de relación moderada

Análisis e interpretación de resultados

Se puede asegurar que la variable tasa de desempleo indica una relación moderada con
respecto a la variable personas con empleo y una relación baja con la variable personas sin
empleo
ANEXO
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL

1. El rendimiento del producto de un proceso químico está relacionado con la temperatura de


operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del
oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el condensador
principal en un proceso de destilación, de acuerdo con los siguientes datos:

X Y
(% de Hidro (Pureza)
0,99 90,01 .
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45 a) Realice el diagrama de dispersión y
0,87 87,59 determine el tipo de asociación entre las
1,23 91,77 variables.
1,55 99,42
1,4 93,65 El porcentaje de hidrocarburos es directamente
1,19 93,54 proporcional a la pureza, esto quiere decir que entre
1,15 92,52 mayor es el porcentaje de hidrocarburos mayor va a
0,98 90,56 ser la pureza.
1,01 89,54 La asociación de las variables es fuerte porque una
1,11 89,85 variable depende de la otra, en este caso la pureza
1,2 90,39 depende del porcentaje de hidrocarburos, esto se
1,26 93,25 puede observar con el coeficiente de
determinación R2 que es 87.74%.
1,32 93,41
1,43 94,98 b. Encuentre el modelo matemático que
0,95 87,33 permite predecir el efecto de una variable sobre la
otra. Es confiable?
El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente
y = 14.947x + 74.283
El modelo es confiable porque el coeficiente de determinación R2 es cercano a 1.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.
Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de
determinación R2 explica el 87.74% de la información y el valor del coeficiente de correlación R
confirma el grado de relación de la variables, que es el 93.67%.

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?


y = 14.947x + 74.283
x=(y-74.283)/14.947
x=(91.3-74.283)/14.947
x=1.14

Cuando la pureza del oxigeno sea 91.3, el porcentaje de hidrocarburos será 1.14.

2. El número de libras de vapor (y) consumidas mensualmente por una planta química, se
relaciona con la temperatura ambiental promedio (en oF). Para el año 2014, se registraron los
siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y consumos de vapor.

Mes Temperatura (oF) Consumo de


vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


La temperatura es directamente proporcional al consumo de vapor, esto quiere decir que entre
mayor es la temperatura mayor va a ser el consumo de vapor.
La asociación de las variables es fuerte porque una variable depende de la otra, en este caso el
consumo de vapor depende de la temperatura, esto se puede observar con el coeficiente de
determinación R2 que es 99.99%.

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es
confiable?
El mejor modelo que describe el sistema es la función lineal
y = 9.2087x - 6.3184
El modelo es muy confiable porque el coeficiente de determinación R2 es aproximadamente 1.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.
Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de
determinación R2 explica el 99.99% de la información y el valor del coeficiente de correlación R
confirma el grado de relación de la variables, que es el 99.99%.

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?


y = 9.2087*70 - 6.3184
y=638.29lb
Cuando la temperatura sea 70 oF, el consumo de vapor será 638.29lb.
2.3 Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual
al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se
mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación
de punzada. Obsérvese que ambas, X e Y, son variables aleatorias

x (porcentaje y (umbral de
de reflejo de
sobrepeso) flexión
nociceptiva)

89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


La asociación de las variables no existe, esto se puede observar con el coeficiente de
determinación R2 que es 11.15%.
b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?
El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente
y = -0.0629x + 11.642
El modelo no es muy confiable porque el coeficiente de determinación R2 está muy lejos de 1.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.
Esta ecuación no hace una buena estimación entre las variables debido a que el coeficiente de
determinación R2 explica el 11.15% de la información y el valor del coeficiente de correlación R
confirma el grado de relación de la variables, que es el 33.39%.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de sobrepeso,


de 40?
y = -0.0629*40 + 11.642
y = 9.13

Cuando el porcentaje de sobrepeso sea 40, el umbral de reflejo de flexión nociceptiva será 9.13.
CONCLUSIONES

 Se realizó el análisis referente a las gráficas y a la información sobre la pobreza extrema


en Colombia.
 Se interpretó la problemática utilizando las medidas bivariantes.
 Es importante tener en cuenta que la estadística es muy significativa en la vida social y
laboral.
REFERENCIAS BIBLIOGRAFICAS

 Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo.


Paginas. 130 – 172. Recuperado de: http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361
e1929abe203c8219

 Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. Mexico City:


Cengage Learning. Páginas 675 – 686 Recuperado de:http://go.galegroup.com/ps/i.do?
id=GALE
%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e558184ed89e57d1
1ede116134cfce41

 Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de mercados.


Mexico City: Cengage Learning. Páginas 686 – 695. Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900234&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=49575112db86a0eb
46dae86bbaf74cb9
 Montero, J.M. (2007).Regresión y Correlación Múltiple. Madrid: Paraninfo.
Páginas 191 – 225. Recuperado de:http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100012&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=47eaa8f46c19ad13a
f26a0a74e510de

Vous aimerez peut-être aussi