Académique Documents
Professionnel Documents
Culture Documents
Estudiante
ROSA ANGELICA FUENTES GELVIS
Código: 1091534721
Presentado a
JUAN PABLO RODRIGUEZ
Fecha
Mayo 2019
INTRODUCCION
La estadística es una ciencia que facilita la toma de decisiones mediante la presentación ordenada
de los datos observados en tablas y gráficos estadísticos, reduciendo los datos observados a un
pequeño número de medidas estadísticas que permitirán la comparación entre diferentes series de
datos y estimando la probabilidad de éxito que tiene cada una de las decisiones posibles. El
principal objetivo de la estadística es hacer inferencias acerca de una población, con base en la
información contenida en una muestra.
OBJETIVOS
GENERAL
ESPECIFICOS
link: https://www.goconqr.com/es-ES/p/17822546-MEDIDAS-ESTAD-STICAS-
BIVARIANTES-DE-REGRESI-N-mind_maps
DEFINICIÓN DE CONCEPTOS
Diagrama de dispersión.
Los diagramas de dispersión son una forma fenomenal de expresar datos de dos variables, y hacer
predicciones basadas en los datos. Al contrario de los histogramas y los diagramas de caja, los de
dispersión muestran valores de datos individuales.
Es importante saber que el resultado del R Cuadrado oscila entre 0 y 1. Cuanto más cerca de 1 se
sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De
forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos
fiable será.
En estadística, el coeficiente de correlación de Pearson es una medida lineal entre dos variables
aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente
de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un
índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando
ambas sean cuantitativas y continuas.
REGRESION Y CORRELACION LINEAL SIMPLE
Variables seleccionadas:
Variable Y: Pobreza extrema en Colombia
Variable X: Persona sin empleo
0,6227 Aceptable
Tipo de asociación de las variables
y = 383330x+763727
Modelo matemático R² = 0,3878
R2 0,3878
R 0,6227
Confiabilidad 38,78
% de explicación 38,78%
Grado de relación Baja
Diagrama de dispersión:
Diagrama de Dispersión
9,000,000
8,000,000
7,000,000 f(x) = 383329.72x + 763726.79
6,000,000 R² = 0.39
5,000,000
4,000,000
3,000,000
2,000,000
1,000,000
-
6.00 8.00 10.00 12.00 14.00 16.00 18.00
No es confiable ya que la ecuación de la recta indica una baja relación entre las
variables tasa de desempleo y personas sin empleo.
El porcentaje de explicación es de 38,78%
El grado de la relación es baja
Diagrama de dispersión:
Diagrama de dispersión
35,000,000
30,000,000
f(x) = - 1071201.73x + 36971510.03
25,000,000 R² = 0.57
20,000,000
15,000,000
10,000,000
5,000,000 f(x) = 383329.72x + 763726.79
R² = 0.39
-
6.00 8.00 10.00 12.00 14.00 16.00 18.00
Pers onas con Empleo Li nea r (Pers onas con Empl eo )
Pers onas Si nEmpl eo Li nea r (Pers onas Si nEmpl eo)
Se puede asegurar que la variable tasa de desempleo indica una relación moderada con
respecto a la variable personas con empleo y una relación baja con la variable personas sin
empleo
ANEXO
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL
X Y
(% de Hidro (Pureza)
0,99 90,01 .
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45 a) Realice el diagrama de dispersión y
0,87 87,59 determine el tipo de asociación entre las
1,23 91,77 variables.
1,55 99,42
1,4 93,65 El porcentaje de hidrocarburos es directamente
1,19 93,54 proporcional a la pureza, esto quiere decir que entre
1,15 92,52 mayor es el porcentaje de hidrocarburos mayor va a
0,98 90,56 ser la pureza.
1,01 89,54 La asociación de las variables es fuerte porque una
1,11 89,85 variable depende de la otra, en este caso la pureza
1,2 90,39 depende del porcentaje de hidrocarburos, esto se
1,26 93,25 puede observar con el coeficiente de
determinación R2 que es 87.74%.
1,32 93,41
1,43 94,98 b. Encuentre el modelo matemático que
0,95 87,33 permite predecir el efecto de una variable sobre la
otra. Es confiable?
El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente
y = 14.947x + 74.283
El modelo es confiable porque el coeficiente de determinación R2 es cercano a 1.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.
Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de
determinación R2 explica el 87.74% de la información y el valor del coeficiente de correlación R
confirma el grado de relación de la variables, que es el 93.67%.
Cuando la pureza del oxigeno sea 91.3, el porcentaje de hidrocarburos será 1.14.
2. El número de libras de vapor (y) consumidas mensualmente por una planta química, se
relaciona con la temperatura ambiental promedio (en oF). Para el año 2014, se registraron los
siguientes valores de temperatura y consumo anual.
b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es
confiable?
El mejor modelo que describe el sistema es la función lineal
y = 9.2087x - 6.3184
El modelo es muy confiable porque el coeficiente de determinación R2 es aproximadamente 1.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.
Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de
determinación R2 explica el 99.99% de la información y el valor del coeficiente de correlación R
confirma el grado de relación de la variables, que es el 99.99%.
x (porcentaje y (umbral de
de reflejo de
sobrepeso) flexión
nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
Cuando el porcentaje de sobrepeso sea 40, el umbral de reflejo de flexión nociceptiva será 9.13.
CONCLUSIONES