Vous êtes sur la page 1sur 33

ESTADISTICA DESCRIPTIVA

CÓDIGO 100105_18

Trabajo Colaborativo 3

Momento 3

Laboratorio

Medidas de regresión y correlación lineal

Simple y Múltiple

Presenta

Nayibe Bula Gianmaria – Cód. 32684589

Tutor

Félix Orlando Amaya

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA-UNAD

CEAD Zona Centro - Bogotá

Mayo de 2016.
INTRODUCCION:

El siguiente trabajo a presentar tiene como propósito el desarrollo de ejercicios, los


cuales se fundamentan en el reconocimiento y profundización de la temática estudiada
en la unidad 2 para el desarrollo de esta actividad fue necesario poner en práctica
conceptos de gran importancia tales como: Regresión y correlación simple y regresión y
correlación múltiple

Desde que aprendimos contar, con dedos temblorosos, tratando de establecer,


probablemente, cuántos punticos luminosos se podían observar en una noche sin Luna,
estamos haciendo estadística.

Los seres humanos crecimos como especie aprendiendo a usar nuestra herramienta
básica adaptativa: el cerebro. Pero el desarrollo de esta herramienta no hubiera sido
posible si no fuera por la interacción social entre los miembros de la especie, para poder
compartir y ponernos de acuerdo en simbologías similares (el número, entre otras) para
poder transmitir mensajes comprensibles para todos, que permitieran prever peligros,
organizar defensas contra ataques de otras especies, explorar nuevos lugares en la
Tierra, para que otros pudieran anticiparse a los peligros allí existentes, a través de
informaciones cada vez más precisas, transmitidas de unos a otros.

Nuestra adaptación al medio circundante y su posterior modificación, se deben,


principalmente, al hecho de que somos capaces de prever los fenómenos de la
naturaleza, estableciendo regularidades de ocurrencia a través de signos establecidos y
organizados en escalas, bajo unas normas interpretativas precisas. Es así como pudimos
saber cuándo comenzaba el invierno, cuando el verano, su duración, sus tormentas; es
así como pudimos preparar nuestro vestido y nuestra casa para las condiciones más
adversas; es así como hemos podido viajar hacia las estrellas.

Pero tales cosas no serían posibles sin el uso de las matemáticas y sin el uso de la
estadística. Tales cosas no hubieran sido posibles si no hubiésemos aprendido a contar
las estrellas, a calcular el tiempo, a predecir las fases lunares. He aquí la importancia
capital de la recolección de datos y de su interpretación certera; he aquí a la humanidad
contando historias y contando números y pensando que el futuro, en efecto, es posible,
porque así lo indican las estadísticas que poseemos desde que aprendimos a contar
estrellas.
JUSTIFICACION:

Con el desarrollo de los ejercicios correspondientes al trabajo colaborativo lograremos


comprender con más precisión los temas que hemos abordado durante el estudio de las
Regresiones y correlaciones, tanto simple como múltiples y la realización de los
diagrama de dispersión.

La estadística es el medio necesario para poder entender las distintas variables que
conforman nuestro complejo tejido social. Dentro de este mismo tejido conviven
culturas diversas con diferentes costumbres, cosmogonías y filosofías de vida. Para
poder entender semejante universo, se hace del todo necesario apelar a los medios de
que nos provee la estadística, en especial cuando se trata de comprender en su
complejidad los veloces cambios de la sociedad moderna.

Si bien se valen de los distintos métodos estadísticos las ciencias en general, en


particular las ciencias sociales derivan de ellos su fuente básica de recopilación de datos
medibles (fácticos), con miras a comprender de manera profunda los distintos
fenómenos suscitados en medio de nuestras interrelaciones sociales.

Pero, para aproximarnos a cualquier fenómeno que hayamos establecido como el objeto
de nuestra búsqueda, es indispensable, antes de cualquier otro paso experimental que se
desee dar, conocer en sus detalles más íntimos esa realidad prometedora. Aparece
entonces la ESTADÍSTICA DESCRIPTIVA como la primera herramienta de
aproximación.

En su proceso deductivo, la ESTADÍSTICA DESCRIPTIVA nos permite un primer


acercamiento con lupa a esa realidad sobre la que queremos averiguar ciertos
pormenores. Es así que comenzamos no sólo a describir un fenómeno en términos
medibles, sino que además comenzamos a hallar ciertas correlaciones de ocurrencia
entre variables distintas. Estas correlaciones, inicialmente deducidas a través de la
medición del comportamiento de algunas variables, nos permiten iniciar nuevos
estudios con la intención de dar una explicación científica al fenómeno estudiado.

Pero más allá del evidente y necesario uso de las herramientas estadísticas en pro del
conocimiento científico, está el hecho ineludible de que la estadística está en cada lugar
por el que transcurre la vida cotidiana de la humanidad, lo que la hace materia de uso
común y de necesario conocimiento.

Nos ha sido dada la tarea de entender el mundo, ya no únicamente desde una


perspectiva experiencial; debemos entenderlo desde una perspectiva científica,
aparentemente de uso corriente por estos días, para que podamos generar nuestros
propios juicios críticos y evitar, de paso, el oscurantismo de la manipulación de las
cifras, en medio de una “nebulosa ignorante”.

El mundo ha cambiado. Saber se hace necesario, para poder interpretar lo más


claramente posible, todo aquello que se nos da como una “verdad probada”.
OBJETIVOS:

OBJETIVO GENERAL

* Analizar, interpretar y desarrollar problemas relacionados medidas de regresión y


correlación lineal y múltiple.

OBJETIVOS ESPECIFICOS

1. Conocer los distintos conceptos técnicos que encierra la estadística.


2. Conocer el uso de las herramientas que integran la estadística descriptiva, sus
alcances, su metodología y sus posibles interpretaciones.
3. A través de los ejemplos prácticos, aprender el uso de las técnicas de recolección
de datos y del análisis de los resultados.
4. Aprender el uso y la adecuada descripción de los resultados estadísticos
presentados a través de gráficas
5. Fortalecer las argumentaciones que permitan generar juicios críticos frente al
uso generalizado de la estadística en los diversos campos de la realidad social de
nuestro país.
Descripción de la actividad

Paso 1. Laboratorio regresión y correlación

Solución del laboratorio de regresión y correlación lineal.

Ejercicio 1:

1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que existe entre la
pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente
en el condensador principal en un proceso de destilación, de acuerdo con los siguientes
datos:

a-Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

b-Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?

c-Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

d-¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?

Ejercicio 2

2. El número de libras de vapor (y) consumidas mensualmente por una planta


química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014,
se registraron los siguientes valores de temperatura y consumo anual.

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. Es confiable?

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

Ejercicio 3

3- Los investigadores están estudiando la correlación entre la obesidad y la respuesta


individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La
respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y)
que es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables
aleatorias
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. Es confiable?

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de


sobrepeso, de 40?

Paso 2.

Regresión y Correlación lineal Simple

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas.

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


asociación entre las variables.

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?

- Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

- Relacionar la información obtenida con el problema.

Paso 3.

Regresión y Correlación Lineal Múltiple:

_ Identificar una variable cuantitativa dependiente y varias variables independientes del


estudio de investigación.

- Realizar el diagrama de dispersión de dichas variables.

- calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

- Relacionar la información obtenida con el problema.

Paso 4:

Auto-Co - Evaluación Paso 4: Auto-Co - Evaluación


Desarrollo de la actividad

Paso 1. Laboratorio regresión y correlación

Solución del laboratorio de regresión y correlación lineal.

Ejercicio 1

1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que existe entre la
pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente
en el condensador principal en un proceso de destilación, de acuerdo con los siguientes
datos:

a-Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Rendimiento de un proceso quimico


102

100

98 y = 14.947x + 74.283
R² = 0.8774
96
PUREZA

94

92

90

88

86
0 0.5 1 1.5 2
% HIDROCARBUROS

b-Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra.

14,947x+74,283

Es confiable?

Para saber si es confiable debemos escoger el coeficiente de determinación el cual nos


determina que tan confiable es, para esto escogemos la relación o sea R^2 que es igual a
0,8774 y lo multiplicamos por 100 esto nos da como resultado 87,70%, el cual nos
indica que si es confiable.
c-Determine el porcentaje de explicación del modelo y el grado de relación de las
dos variables.

Para resolver esta explicación del modelo y el grado de relación, volvemos a escoger la
relación o sea R^2, que es igual a 0,8774 y le sacamos la raíz cuadrada, quedando como
resultado 0,9366963 y si con este resultado, nos vamos a la tabla de interpretación de
valores, nos damos cuenta que la relación entre las dos variables es excelente, ya que se
encuentra entre el rango de 0,90 < r < 1.

d-¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a


91,3?

x= % Hidrocarburos = no lo conocemos
y= Pureza = 91,3

Entonces hacemos la siguiente operación: 91,3-74,283=14,947x


91,3-74,283=14,947x
91,3-74,283=x
14,947
17,017 = 1,13848933
14.947
Resultado: 1,13

X (% DE
HIDROCARBUROS)
Y (PUREZA) X*Y 𝑋𝑋 𝑌2
0,99 90,01 89,1099 0,9801 8101,8001
1,02 89,05 90,831 1,0404 7929,9025
1,15 91,43 105,1445 1,3225 8359,4449
1,29 93,74 120,9246 1,6641 8787,1876
1,46 96,73 141,2258 2,1316 9356,6929
1,36 94,45 128,452 1,8496 8920,8025
0,87 87,59 76,2033 0,7569 7672,0081
1,23 91,77 112,8771 1,5129 8421,7329
1,55 99,42 154,101 2,4025 9884,3364
1,4 93,65 131,11 1,96 8770,3225
1,19 93,54 111,3126 1,4161 8749,7316
1,15 92,52 106,398 1,3225 8559,9504
0,98 90,56 88,7488 0,9604 8201,1136
1,01 89,54 90,4354 1,0201 8017,4116
1,11 89,85 99,7335 1,2321 8073,0225
1,2 90,39 108,468 1,44 8170,3521
1,26 93,25 117,495 1,5876 8695,5625
1,32 93,41 123,3012 1,7424 8725,4281
1,43 94,98 135,8214 2,0449 9021,2004
0,95 87,33 82,9635 0,9025 7626,5289
23,92 1843,21 2214,6566 29,2892 170044,532
X Y X*Y 𝑋𝑋 𝑌2
Método de mínimos cuadrados
Ecuación de regresión
Y= a+bx
lineal
Formulas:

Resolvemos aplicando la fórmula:

b= 20(2214.6566)-23.92(1843.21)=
20(29.2892)-(23.92)²
Despejamos paréntesis:
20*2214,6566 = 44293,132
23,92*1843,21= 44089,5832
20*29,2892= 585,784
23,92*23,92= 572,1664
Resolvemos:
b= 44293.132 – 44089.5832=
585.784-572.1664
b= 203,5488 = 14,94747973
13,6176
b= 14,94747973
Resolvemos aplicando la fórmula:

a= 1843.21- 14.94747973(23.92)
20

Despejamos paréntesis:

a= 1843.21- 357,543715 =

20

a= 1485,666285 = 74.28331424

20

a= 74,28331424

Ecuación de regresión lineal

Y= a+bx

Ya conocemos a= 74,28331424 y b= 14,94747973, desconocemos x

14,94747973x + 74,28331424

Y=89,23079398
Y utilizaremos los valores de y, b, y ,a

Y= 89,23
b= 14,94747973
a= 74,28331424

√170044,53−74,283314(1843,21)−14,94748∗2214,6566
Se=
20−2

√170044,53−136919,75−33103,535
Se=
18

√21,250265
Se=
18

Se=√1,1805703
=RCUAD(1,1805703)

Se= 1,08654052, Este sería el error estándar del estimado

Para hallar el coeficiente de determinación, primero hallamos la varianza de las variables


separables

𝛴𝑦 2
𝑆 2 𝑦= − 𝑦2
𝑛
Reemplazando:
170044,352
𝑆2𝑦 = − (1843,21)2
20

170044,532
𝑆2𝑦 = − (1843,21)2
20

𝑆 2 𝑦 8502,22661 − 3397423,104

𝑆 2 𝑦 8502,22661 − 3397423,104
Ahora vamos con el de correlación

Formula

𝑆𝑒 2
𝑅 22= 1- 2
𝑆𝑦²ͺ
S𝑒 =(1,086540519) = 1.1805703
Se= 1,086540519
𝑺𝟐 𝒚 = −𝟑𝟑𝟖𝟖𝟗𝟐𝟎, 𝟖𝟖

1,1805703
𝑅 2= 1-
3397423,1

𝑹𝟐 ==1.00000035

Como podemos observar en el resultado de R, notamos que existe una correlación


perfecta entre las variables, es decir que el rendimiento del proceso químico depende de
la temperatura.

Ejercicio 2

2. El número de libras de vapor (y) consumidas mensualmente por una planta


química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014,
se registraron los siguientes valores de temperatura y consumo anual.

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Libras de vapor en planta quimica


800
Consumo de vapor

600 y = 9.2087x - 6.3184


R² = 0.9999
400
200
0
0 10 20 30 40 50 60 70 80
Temperatura

Hay una tendencia positiva, ya que hay una relación directa entre el consumo de vapor
y la temperatura es decir a medida que aumenta el temperatura, aumenta también el
consumo de vapor.

b. Ajuste un modelo matemático que permita predecir el efecto de una variable


sobre la otra.

y = 9,2087x - 6,3184

Es confiable?
Es confiable? Para saber si es confiable debemos escoger el coeficiente de
determinación el cual nos determina que tan confiable es, para esto escogemos la
relación o sea R^2 que es igual a 0,999 y lo multiplicamos por 100 esto nos da como
resultado 99,99%, el cual nos indica que si es confiable

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

Para resolver esta explicación del modelo y el grado de relación, volvemos a escoger la
relación o sea R^2 que es igual a 0,9999 y le sacamos la raíz cuadrada, quedando como
resultado 0,99995 y si con este resultado nos vamos a la tabla de interpretación de
valores, nos damos cuenta que la relación entre las dos variables es excelente, ya que se
encuentra entre el rango de 0,90<r<1

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70° F?

x= Vapor = no lo conocemos

y= Temperatura =70° F

Entonces hacemos la siguiente operación: 70-6,3184=9,2087x

70-6,3184=9,2087x

70-6,3184= x 63,6816 6,915373505

9,2087 9,2087

Y tenemos como resultado: 6,91537351. del consumo de vapor cuando la temperatura


es de 70° F.

Consumo
Temperat
Mes de vapor X*Y
ura (oF)
(Lb)

Ene. 21 185,79 3901,59 441 34517,9241


Feb. 24 214,47 5147,28 576 45997,3809

Mar. 32 288,03 9216,96


1024 82961,2809
Abr. 47 424,84 19967,48 2209 180489,026
May. 50 455 22750 2500 207025
Jun. 59 539 31801 3481 290521
Jul. 68 621,55 42265,4 4624 386324,403
Ago. 74 675,06 49954,44 5476 455706,004
Sep. 62 562,03 34845,86 3844 315877,721
Oct. 50 452,93 22646,5 2500 205145,585
Nov. 41 369,95 15167,95 1681 136863,003
Dic. 30 273,98 8219,4 900 75065,0404
558 5062,63 265883,86 29256 2416493,37
X Y X*Y
Método de mínimos cuadrados

Y= a+bx Ecuación de regresión lineal

Formulas:

Resolvemos b, aplicando la formula:

b= 12(265883,86)-(558)(5062,63 =
12(29256)-(558)²
Despejamos paréntesis 12*265883= 3190596 558*5062,63=2824947,5
12*29256= 351072 558*558= 311364
b= 3190596-2824947,5 = 365648,46
351072-311364 39708

b= 365648,46 = 9,20843306
39708
b=9,2084331

Resolvemos a, aplicando la

Formula:

a= 5062,63-(9,2084331)(558) Despejamos 5062,63 5138,30567 -75,67567


12
a= -75,6757 = -6,30630582
12

a=-6,3063058
Ecuación de regresión lineal
Y= a+bx Ya conocemos a= -6,306358 y b= 9,2084331, desconocemos x
Y= -6,30630582 + 9,20843306= 2,90212724
Y= 2,90212724

Ahora hallaremos el coeficiente de correlación, pero para poder hallarlo debemos primero
hallar el error estándar del estimado, que se calcula a través de esta ecuación:
Y utilizaremos los valores de y, b, y ,a

Y= 2,90212724

b= 9,20843306 -

a= -6,30630582

2416493,4
√2416493,4−(−6,3063058)(5062,63)−9,2084331(265883,86) -31926,4929
Se= 2448373,74
12−2
10

2416493,4+31926,493−2448373,7
Se=√ 2416493,4
10
31926,493
2448373,7
4896793,6 4896793,59
Se=√ 10
10
489679,359
699,77093
Se=√489679,36
Se= 699,7709

Para hallar el coeficiente de determinación, primero hallamos la varianza de las


variables separables
𝛴𝑦 2
𝑆 2 𝑦= − 𝑦2
𝑛

𝛴𝑦 2
𝑆 2 𝑦= − 𝑦2
𝑛

Resolviendo
Para hallar el coeficiente de determinación, primero hallamos la varianza de las
variables separables
𝛴𝑦 2
𝑆 2 𝑦= − 𝑦2
𝑛

Reemplazando:
2416493,4
𝑆2𝑦 = − (5062,63)2
12
Resolviendo

- -
2416493,4 2
2
𝑆 𝑦 = − (5062,63) 201374 25630222
25428848,
12 2416493,4 = ,45 ,5= 07
12
𝑆2𝑦 = 201374,45 − 25630223

𝑆2𝑦 = −25428848,1

Formula Se= 699,7709


489679,3
S𝑒 2 =(699,7709)2 = 12
-
𝑆𝑒 2 25428848
𝑅 2= 1- 𝑺𝟐 𝒚 = −𝟐𝟓𝟒𝟐𝟖𝟖𝟒𝟖, 𝟏
𝑆𝑦²ͺ ,1

Resolvemos:
489679,31
𝑅 2= 1-
−25428848,1
(-
1 0,0192568 1,01925
- 4)= 684

𝑹𝟐 = 1,01925684
Como podemos observar en el resultado de R, notamos que existe una
correlación perfecta entre las variables

Ejercicio 3

3- Los investigadores están estudiando la correlación entre la obesidad y la respuesta


individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La
respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y)
que es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables
aleatorias

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Umbral de reflejo
100
Umbral de reflejo

80 y = 0,1191x + 0,4177
60
R² = 0,9168
40
20
0
0 100 200 300 400 500 600 700
% Sobrepeso
Hay una tendencia positiva, ya que hay una relación directa entre la obesidad
y el umbral del dolor es decir a medida que aumenta la obesidad, aumenta también
el dolor sobre todo en las articulaciones.
b. Ajuste un modelo matemático que permita predecir el efecto de una variable
sobre la otra.

y = 0,1191x + 0,4177

Es confiable? Para saber si es confiable debemos escoger el coeficiente de


determinación el cual nos determina que tan confiable es, para esto escogemos la
relación o sea R^2 que es igual a 0,9168y lo multiplicamos por 100 esto nos da como
resultado 91,68%, el cual nos indica que si es confiable

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

Para resolver esta explicación del modelo y el grado de relación, volvemos a escoger la
relación o sea R^2 que es igual a 0,9168y le sacamos la raíz cuadrada, quedando como
resultado 0,957496736 y si con este resultado nos vamos a la tabla de interpretación de
valores, nos damos cuenta que la relación entre las dos variables es excelente, ya que se
encuentra entre el rango de 0,90<r<1.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje


de sobrepeso, de 40?

x= umbral de reflejo de flexión = no lo conocemos


y= sobrepeso =40
Entonces hacemos la siguiente operación: 40-0,4177=0,1191x
Y tenemos como resultado: 332,3450882. del consumo del umbral de reflejo de flexion cuando
el sobrepeso es de 40
40-0,4177=0,1191x
40-0,4177=x 39,5823
332,3450882
0,1191 0,1191

y (umbral de
x (porcentaje
reflejo de X*Y 𝑋𝑋
de sobrepeso) 𝑌2
flexión
89 2 178 7921 4
90 3 270 8100 9
75 4 300 5625 16
30 4,5 135 900 20,25
51 5,5 280,5 2601 30,25
75 7 525 5625 49
62 9 558 3844 81
45 13 585 2025 169
90 15 1350 8100 225
20 14 280 400 196
627 77 4461,5 45141 799,5
X Y X*Y
Método de mínimos cuadrados

Y= a+bx ecuación de regresión lineal

Formulas:

Despejamos paréntesis
b= 10(4461,5)-(627)(77) = 10*4461,5=44615 627*77=48279
10(45141)-(627)² 10*45141=451410 627*627=393129

b= 44615-48279 = -3664
451410-393129 58281

b= -3664 = -0,06286783
58281
b=-0,06286783

Resolvemos a, aplicando la fórmula:

a= 77-(-0,06286783)(627) Despejamos77-39,41812941=116.418129
10
a= 116,418129 = 11,64181294
10
a= 11,6418129

ecuación de regresión lineal


Y= a+bx Ya conocemos a= 11.6418129 y b= 0.06286783, desconocemos x

Y= 11,64181294 + -0,06286783= 11,57894511


Y= 11,57894511

Ahora hallaremos el coeficiente de correlación, pero para poder hallarlo


debemos primero hallar el error estándar del estimado, que se calcula a través de esta
ecuación:

Y utilizaremos los valores de y, b, y ,a


Y= 11,57894511
b= -0,06286783
a= 11,64181294

799,5
√799,5−11,6418129(77)−(−0,06286783)(4461,5) 896,4195933
Se= -280,3509785
10−2
8

799,5
896,4195933
√799,5−896,419593+280,350979
Se= 280,350979
8
1976,270572
8

√1976,27057 =247,033822
Se=
8
= 15,71731
Se=√247,033822

Se= 15,7173096

Para hallar el coeficiente de determinación, primero hallamos la varianza de las


variables separables
Reemplazando:
Resolviendo

𝛴𝑦 2
𝑆 2 𝑦= − 𝑦2
𝑛
799,5
Resolviendo 𝑆2𝑦 = − (77)2
10

799,5
𝑆2𝑦 = − (77)2 799,5= 79,95-5929= -5849,05
10
10

𝑆2𝑦 = 79,95 − (−5849,05) = 5929

𝑆2𝑦 = 5929

Formula Se= 15,71730963


𝑆𝑒 2 S𝑒 =(15,7173096)2 = 247,033822
2
2
𝑅 = 1-
𝑆𝑦²ͺ
𝑺𝟐 𝒚 = 𝟓𝟗𝟐𝟗
Resolvemos:
489679,31
𝑅 2= 1- 1 - 82,59054014= -81,59054014
5929
𝑅 2= -81.59054014

Como podemos observar en el resultado de R, notamos que existe una correlación


mínima entre las variables.

Paso 2

Regresión y Correlación lineal Simple

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas.

VELOCIDAD GRADOS DE ALCOHOL

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


asociación entre las variables.

Grados de
X.Y X² y²
Velocidad alcohol

66 1,2 79,2 1,44 4356

111 3,0 333 9 12321

66 0,0 0 0 4356

80 0,6 48 0,36 6400

75 0,0 0 0 5625

66 0,0 0 0 4356

45 3,0 135 9 2025

88 1,4 123,2 1,96 7744

55 2,1 115,5 4,41 3025

70 0,0 0 0 4900

105 1,6 168 2,56 11025

88 2,2 193,6 4,84 7744

69 3,0 207 9 4761

48 1,1 52,8 1,21 2304

70 2,4 168 5,76 4900


83 0,6 49,8 0,36 6889

138 1,6 220,8 2,56 19044

68 0,0 0 0 4624

77 0,0 0 0 5929

81 2,1 170,1 4,41 6561

50 1,4 70 1,96 2500

88 2,6 228,8 6,76 7744

71 3,0 213 9 5041

55 2,7 148,5 7,29 3025

78 0,6 46,8 0,36 6084

80 0,0 0 0 6400

68 2,9 197,2 8,41 4624

74 0,6 44,4 0,36 5476

75 1,8 135 3,24 5625

83 0,0 0 0 6889

65 1,1 71,5 1,21 4225

60 2,4 144 5,76 3600

83 0,6 49,8 0,36 6889

95 0,0 0 0 9025

86 2,9 249,4 8,41 7396

68 1,3 88,4 1,69 4624

55 1,4 77 1,96 3025

88 2,1 184,8 4,41 7744

63 0,8 50,4 0,64 3969

70 0,0 0 0 4900

78 1,2 93,6 1,44 6084


83 3,0 249 9 6889

138 0,0 0 0 19044

55 0,6 33 0,36 3025

66 1,9 125,4 3,61 4356

108 2,7 291,6 7,29 11664

69 1,1 75,9 1,21 4761

72 2,4 172,8 5,76 5184

74 0,6 44,4 0,36 5476

69 1,6 110,4 2,56 4761

79 0,0 0 0 6241

65 1,4 91 1,96 4225

74 2,1 155,4 4,41 5476

77 0,8 61,6 0,64 5929

51 1,1 56,1 1,21 2601

75 2,4 180 5,76 5625

72 0,0 0 0 5184

77 1,6 123,2 2,56 5929

67 1,2 80,4 1,44 4489

55 3,0 165 9 3025

40 2,7 108 7,29 1600

73 0,6 43,8 0,36 5329

69 0,0 0 0 4761

70 3,0 210 9 4900

75 1,1 82,5 1,21 5625

55 2,4 132 5,76 3025

69 0,0 0 0 4761
50 1,6 80 2,56 2500

73 0,0 0 0 5329

38 0,8 30,4 0,64 1444

60 0,3 18 0,09 3600

50 1,1 55 1,21 2500

100 2,4 240 5,76 10000

75 0,6 45 0,36 5625

80 0,0 0 0 6400

95 1,2 114 1,44 9025

70 3,0 210 9 4900

66 2,7 178,2 7,29 4356

69 0,6 41,4 0,36 4761

67 1,9 127,3 3,61 4489

83 1,1 91,3 1,21 6889

70 0,0 0 0 4900

150 0,6 90 0,36 22500

55 1,6 88 2,56 3025

66 2,1 138,6 4,41 4356

68 0,8 54,4 0,64 4624

79 0,5 39,5 0,25 6241

79 2,7 213,3 7,29 6241

60 1,1 66 1,21 3600

33 2,4 79,2 5,76 1089

85 0,6 51 0,36 7225

80 1,6 128 2,56 6400

81 1,4 113,4 1,96 6561


62 2,1 130,2 4,41 3844

79 0,0 0 0 6241

76 3,0 228 9 5776

80 0,0 0 0 6400

70 0,6 42 0,36 4900

80 1,9 152 3,61 6400

83 1,4 116,2 1,96 6889

68 0,0 0 0 4624

79 2,7 213,3 7,29 6241

79 0,6 47,4 0,36 6241

80 1,9 152 3,61 6400

75 2,5 187,5 6,25 5625

66 3,0 198 9 4356

45 0,6 27 0,36 2025

77 0,0 0 0 5929

81 2,7 218,7 7,29 6561

50 1,3 65 1,69 2500

88 2,1 184,8 4,41 7744

71 0,0 0 0 5041

55 2,6 143 6,76 3025

78 3,0 234 9 6084

67 2,7 180,9 7,29 4489

55 0,6 33 0,36 3025

40 1,9 76 3,61 1600

73 3,0 219 9 5329

69 1,1 75,9 1,21 4761


70 2,4 168 5,76 4900

8737,0 133,0 12132,0 364,4 673193,0

- Realizar el diagrama de dispersión de dichas variables y


determinar el tipo de asociación entre las variables.

Velocidad vs Grados de alcohol


160 y = -0,0648x + 76,727
140 R² = 0,0163
120
Grados de alcohol

100
80
60
40
20
0
0 20 40 60 80 100 120 140
Velocidad

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra.

y = -0,0648x + 76,727

Es confiable?
Para saber si es confiable debemos escoger el coeficiente de determinación el cual nos
determina que tan confiable es, para esto escogemos la relación o sea R^2 que es igual a
0,0163 y lo multiplicamos por 100, esto nos da como resultado 1.63%, el cual nos
indica que si es confiable

Podemos asegurar que la ecuación de la recta es confiable porque R² está en 1y tiene un


grado alto de confiabilidad.

- Determine el porcentaje de explicación del modelo y el grado de relación de las


dos variables.
Para resolver esta explicación del modelo y el grado de relación, volvemos a escoger la
relación o sea R^2 que es igual a 0,0163 y le sacamos la raíz cuadrada, quedando como
resultado 0,1276715 y si con este resultado nos vamos a la tabla de interpretación de
valores, nos damos cuenta que no hay correlación, ya que se encuentra entre el rango de
0<r<0.30.

- Relacionar la información obtenida con el problema.


A primera vista podemos pensar que la velocidad se encuentra correlacionada con los
grados de alcohol, ya que lo probamos estadísticamente y encontramos que hay
correlación entre esas variable, porque el coeficiente de correlación nos dio 1.63, por lo
tanto podemos afirmar que esos accidentes presentados en la ciudad de Medellín, que
los grados de alcohol están correlacionados con la velocidad.

Quedo probado estadísticamente que los grados de alcohol si dependen e la velocidad.


Metodo de minimos cuadrados
Y= a+bx Ecuacion de regresion lineal

Formulas:

Resolvemos aplicando la formula:

Despejamos
b 120*(12132)-(8737)*(133) 120*12132= 1455840 8737*133= 1162021
parentesis:
120(364,4)- (8737)² 120*364 43723,2 8737*8737= 76335169

b 1455840-1162021 Resolvemos
43720-76335169

b 293819 -0,00385127
-76291449

b= -0,00385127

Resolvemos aplicando la formula:

Despejamos
133-(-0,00385127)(8737) 133 -33,6485496 166,64855
a parentesis:
120

a 166,64855 1,38873791
120
a= 1,38873791
Ecuacion de regresion lineal
Y= a+bx Ya conocemos a= 1,38873791 y b= -0,00385127, desconocemos x

Y= 0,00385127x + 1,38873791

Y= 1,38488664

Ahora hallaremos el coeficiente de correlación; pero, para poder hallarlo debemos


primero hallar el error estándar del estimado, el cual se calcula a través de esta
ecuación:

Y utilizaremos los valores de y, b, y ,a

Y= 8738,4

b= -0,00385127

a= 1,388737913

(184,702142) -46,7239716

√673193−1,38873791(133)−(−0,0038513)∗12132
Se=
120−2

118

672961.57
√673193−184,70214+46,723972
Se=
118
118

√672961,57 5703,06419
Se=
118

Se=√5703,0642
118 75,5186348
Este sería el error estándar del
Se= 75,5186348 estimado

Para hallar el coeficiente de determinación, primero hallamos la varianza de las


variables separables

𝛴𝑦 2
𝑆 2 𝑦= − 𝑦2
𝑛

Reemplazando:
673193
𝑆2𝑦 = − (133)2
120

Resolviendo

673193
𝑆2𝑦 = − (133)2
120 5609,941667 17689

𝑆2𝑦 = 5609,941667 − 17689 = -12079.0583


𝑆2𝑦 = −12079,058
Se= 75,51863479
S𝑒 =(75,51863479)2 =
2

5703,0642

Ahora vamos con el de correlación

Formula

𝑆𝑒 2
𝑅 2= 1-
𝑆𝑦²ͺ

Resolvemos:

5703.0642 1- (-0,4721448)= 1.4721448


𝑅 2= 1-
−12079.058ͺ

𝑹𝟐 = 1.4721448
Paso 3.

Regresión y Correlación Lineal Múltiple:

_ Identificar una variable cuantitativa dependiente y varias


variables independientes del estudio de investigación.

NUMERO DE
VELOCIDAD GRADOS DE ALCOHOL
MUERTOS
(X₁) (X₂)
(Y)

- Realizar el diagrama de dispersión de dichas variables.

RELACION:VELOCIDAD VS NUMERO DE
MUERTOS
160 y = -1.2271x + 73.862
140 R² = 0.0035
NUMERO DE MUERTOS

120
100
80
60
40
20
0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
VELOCIDAD

Relacion: Grados de alcohol vs


Numero de muertos y = 0.0836x + 1.0366
3.5 R² = 0.0056

3.0
NUMERO DE MUERTOS

2.5
2.0
1.5
1.0
0.5
0.0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
GRADOS DE ALCOHOL
- Relacionar la información obtenida con el problema

Una vez que hemos calculado la recta de regresión y el ajuste que hemos conseguido
con el modelo de regresión lineal, el siguiente paso consiste en analizar si la regresión
en efecto es válida y la podemos utilizar para predecir. Para ello debemos contrastar si
la correlación entre ambas variables es distinta de cero o si el modelo de regresión es
válido en el sentido de contrastar si el análisis de nuestra variable endógena (Y). es
válido a través de la influencia de la variable explicativa (X).
Supongamos por un lado que el coeficiente de correlación lineal r, está próximo a +1 o a
–1,y por tanto parece indicar la existencia de una correlación lineal entre los valores de
la muestra. Pero este valor del coeficiente de correlación lineal muestral entre ambas
variables no garantiza que también estén correlacionadas en la población.
NUMERO
DE Grados de
Velocidad
MUERTOS alcohol
(X₁) X₁Y X₂Y X₁,X₂ X₁² X₂² Y²
(Y) (X₂)

0 66 1,2 0,0 0,0 79,2 4356,0 1,4 0,0


1 111 3,0 111,0 3,0 333,0 12321,0 9,0 1,0
1 66 0,0 66,0 0,0 0,0 4356,0 0,0 1,0
0 80 0,6 0,0 0,0 48,0 6400,0 0,4 0,0
0 75 0,0 0,0 0,0 0,0 5625,0 0,0 0,0
2 66 0,0 132,0 0,0 0,0 4356,0 0,0 4,0
1 45 3,0 45,0 3,0 135,0 2025,0 9,0 1,0
2 88 1,4 176,0 2,8 123,2 7744,0 2,0 4,0
0 55 2,1 0,0 0,0 115,5 3025,0 4,4 0,0
1 70 0,0 70,0 0,0 0,0 4900,0 0,0 1,0
0 105 1,6 0,0 0,0 168,0 11025,0 2,6 0,0
3 88 2,2 264,0 6,6 193,6 7744,0 4,8 9,0
1 69 3,0 69,0 3,0 207,0 4761,0 9,0 1,0
2 48 1,1 96,0 2,2 52,8 2304,0 1,2 4,0
1 70 2,4 70,0 2,4 168,0 4900,0 5,8 1,0
0 83 0,6 0,0 0,0 49,8 6889,0 0,4 0,0
0 138 1,6 0,0 0,0 220,8 19044,0 2,6 0,0
1 68 0,0 68,0 0,0 0,0 4624,0 0,0 1,0
1 77 0,0 77,0 0,0 0,0 5929,0 0,0 1,0
1 81 2,1 81,0 2,1 170,1 6561,0 4,4 1,0
0 50 1,4 0,0 0,0 70,0 2500,0 2,0 0,0
2 88 2,6 176,0 5,2 228,8 7744,0 6,8 4,0
1 71 3,0 71,0 3,0 213,0 5041,0 9,0 1,0
3 55 2,7 165,0 8,1 148,5 3025,0 7,3 9,0
1 78 0,6 78,0 0,6 46,8 6084,0 0,4 1,0
0 80 0,0 0,0 0,0 0,0 6400,0 0,0 0,0
1 68 2,9 68,0 2,9 197,2 4624,0 8,4 1,0
0 74 0,6 0,0 0,0 44,4 5476,0 0,4 0,0
1 75 1,8 75,0 1,8 135,0 5625,0 3,2 1,0
2 83 0,0 166,0 0,0 0,0 6889,0 0,0 4,0
2 65 1,1 130,0 2,2 71,5 4225,0 1,2 4,0
2 60 2,4 120,0 4,8 144,0 3600,0 5,8 4,0
1 83 0,6 83,0 0,6 49,8 6889,0 0,4 1,0
0 95 0,0 0,0 0,0 0,0 9025,0 0,0 0,0
0 86 2,9 0,0 0,0 249,4 7396,0 8,4 0,0
2 68 1,3 136,0 2,6 88,4 4624,0 1,7 4,0
1 55 1,4 55,0 1,4 77,0 3025,0 2,0 1,0
4 88 2,1 352,0 8,4 184,8 7744,0 4,4 16,0
0 63 0,8 0,0 0,0 50,4 3969,0 0,6 0,0
2 70 0,0 140,0 0,0 0,0 4900,0 0,0 4,0
0 78 1,2 0,0 0,0 93,6 6084,0 1,4 0,0
2 83 3,0 166,0 6,0 249,0 6889,0 9,0 4,0
2 138 0,0 276,0 0,0 0,0 19044,0 0,0 4,0
1 55 0,6 55,0 0,6 33,0 3025,0 0,4 1,0
0 66 1,9 0,0 0,0 125,4 4356,0 3,6 0,0
1 108 2,7 108,0 2,7 291,6 11664,0 7,3 1,0
0 69 1,1 0,0 0,0 75,9 4761,0 1,2 0,0
1 72 2,4 72,0 2,4 172,8 5184,0 5,8 1,0
0 74 0,6 0,0 0,0 44,4 5476,0 0,4 0,0
0 69 1,6 0,0 0,0 110,4 4761,0 2,6 0,0
1 79 0,0 79,0 0,0 0,0 6241,0 0,0 1,0
1 65 1,4 65,0 1,4 91,0 4225,0 2,0 1,0
0 74 2,1 0,0 0,0 155,4 5476,0 4,4 0,0
1 77 0,8 77,0 0,8 61,6 5929,0 0,6 1,0
1 51 1,1 51,0 1,1 56,1 2601,0 1,2 1,0
0 75 2,4 0,0 0,0 180,0 5625,0 5,8 0,0
0 72 0,0 0,0 0,0 0,0 5184,0 0,0 0,0
1 77 1,6 77,0 1,6 123,2 5929,0 2,6 1,0
0 67 1,2 0,0 0,0 80,4 4489,0 1,4 0,0
1 55 3,0 55,0 3,0 165,0 3025,0 9,0 1,0
0 40 2,7 0,0 0,0 108,0 1600,0 7,3 0,0
1 73 0,6 73,0 0,6 43,8 5329,0 0,4 1,0
0 69 0,0 0,0 0,0 0,0 4761,0 0,0 0,0
2 70 3,0 140,0 6,0 210,0 4900,0 9,0 4,0
1 75 1,1 75,0 1,1 82,5 5625,0 1,2 1,0
1 55 2,4 55,0 2,4 132,0 3025,0 5,8 1,0
1 69 0,0 69,0 0,0 0,0 4761,0 0,0 1,0
0 50 1,6 0,0 0,0 80,0 2500,0 2,6 0,0
0 73 0,0 0,0 0,0 0,0 5329,0 0,0 0,0
1 38 0,8 38,0 0,8 30,4 1444,0 0,6 1,0
0 60 0,3 0,0 0,0 18,0 3600,0 0,1 0,0
2 50 1,1 100,0 2,2 55,0 2500,0 1,2 4,0
1 100 2,4 100,0 2,4 240,0 10000,0 5,8 1,0
1 75 0,6 75,0 0,6 45,0 5625,0 0,4 1,0
0 80 0,0 0,0 0,0 0,0 6400,0 0,0 0,0
0 95 1,2 0,0 0,0 114,0 9025,0 1,4 0,0
2 70 3,0 140,0 6,0 210,0 4900,0 9,0 4,0
0 66 2,7 0,0 0,0 178,2 4356,0 7,3 0,0
1 69 0,6 69,0 0,6 41,4 4761,0 0,4 1,0
0 67 1,9 0,0 0,0 127,3 4489,0 3,6 0,0
1 83 1,1 83,0 1,1 91,3 6889,0 1,2 1,0
0 70 0,0 0,0 0,0 0,0 4900,0 0,0 0,0
0 150 0,6 0,0 0,0 90,0 22500,0 0,4 0,0
2 55 1,6 110,0 3,2 88,0 3025,0 2,6 4,0
3 66 2,1 198,0 6,3 138,6 4356,0 4,4 9,0
1 68 0,8 68,0 0,8 54,4 4624,0 0,6 1,0
0 79 0,5 0,0 0,0 39,5 6241,0 0,3 0,0
0 79 2,7 0,0 0,0 213,3 6241,0 7,3 0,0
1 60 1,1 60,0 1,1 66,0 3600,0 1,2 1,0
2 33 2,4 66,0 4,8 79,2 1089,0 5,8 4,0
0 85 0,6 0,0 0,0 51,0 7225,0 0,4 0,0
1 80 1,6 80,0 1,6 128,0 6400,0 2,6 1,0
2 81 1,4 162,0 2,8 113,4 6561,0 2,0 4,0
0 62 2,1 0,0 0,0 130,2 3844,0 4,4 0,0
1 79 0,0 79,0 0,0 0,0 6241,0 0,0 1,0
2 76 3,0 152,0 6,0 228,0 5776,0 9,0 4,0
0 80 0,0 0,0 0,0 0,0 6400,0 0,0 0,0
1 70 0,6 70,0 0,6 42,0 4900,0 0,4 1,0
0 80 1,9 0,0 0,0 152,0 6400,0 3,6 0,0
0 83 1,4 0,0 0,0 116,2 6889,0 2,0 0,0
1 68 0,0 68,0 0,0 0,0 4624,0 0,0 1,0
1 79 2,7 79,0 2,7 213,3 6241,0 7,3 1,0
0 79 0,6 0,0 0,0 47,4 6241,0 0,4 0,0
0 80 1,9 0,0 0,0 152,0 6400,0 3,6 0,0
2 75 2,5 150,0 5,0 187,5 5625,0 6,3 4,0
1 66 3,0 66,0 3,0 198,0 4356,0 9,0 1,0
0 45 0,6 0,0 0,0 27,0 2025,0 0,4 0,0
0 77 0,0 0,0 0,0 0,0 5929,0 0,0 0,0
1 81 2,7 81,0 2,7 218,7 6561,0 7,3 1,0
1 50 1,3 50,0 1,3 65,0 2500,0 1,7 1,0
1 88 2,1 88,0 2,1 184,8 7744,0 4,4 1,0
0 71 0,0 0,0 0,0 0,0 5041,0 0,0 0,0
2 55 2,6 110,0 5,2 143,0 3025,0 6,8 4,0
1 78 3,0 78,0 3,0 234,0 6084,0 9,0 1,0
0 67 2,7 0,0 0,0 180,9 4489,0 7,3 0,0
1 55 0,6 55,0 0,6 33,0 3025,0 0,4 1,0
0 40 1,9 0,0 0,0 76,0 1600,0 3,6 0,0
2 73 3,0 146,0 6,0 219,0 5329,0 9,0 4,0
1 69 1,1 69,0 1,1 75,9 4761,0 1,2 1,0
1 70 2,4 70,0 2,4 168,0 4900,0 5,8 1,0
103 8737,0 133,0 7393,0 172,4 12132,0 673193,0 364,4 175,0
Metodo de minimos cuadrados
Y= a+b₁X₁+b₂X₂
Yˆ : Variable dependiente.
a : Intercepto de la variable Y.

X₁,X₂, Valores de las dos variables independientes.


b₁,b₂, Pendientes asociadas con cada variable independiente, respectivamente.
Los valores de las tres constantes numéricas se obtienen resolviendo el
siguiente sistema de ecuaciones:

𝑌= b₁∑X₁ + b₂∑X₂
∑X₁y= a∑X₁ + b₁∑X₁² + b₂∑X₁,X₂
∑X₂Y= a∑X₂ + b₂∑X₁,X₂ + b₂∑X₂²
Resolvemos aplicando la formula:
Y= b₁∑X₁ + b₂∑X₂

x2n 44,1666667
1 159 6a 265b1 85b2
7022,5 265 11704,1667 3754,16667

Ecuación (1) multiplicada por 133/120 y restada por la ecuación (3):


1,10833333
Ecuacion 1 103 120a 8737b1 133b2
114,158333 120 9683,50833 147,408333
172 120 12132 3644
-57,8416667 0 -2448,49167 -3496,59167 ´(4)
Se despeja la variable b1 de la ecuación (4):
b1 -57,8416667 -3496,59167
-2448,49167

Ecuación (1) multiplicada por 8737/120 y restada por ecuación (2):

72,8083333
Ecuacion 1 103 120a 8737b1 133b2
7499,25833 120 636126,408 9683,50833
7393 120 673193 12132
106,258333 0 -37066,5917 -2448,49167 ´(5)

Variable b1 reemplazada en la ecuación (5):

106,26=37066,59 −57,84 − 3496,59


2448,49 37172,85 -59,2697261
−2448,49
CONCLUSIONES.

1. El proceso estadístico para analizar los fenómenos sociales y, en general, los


fenómenos de la naturaleza, es la herramienta básica para cualquier estudio
científico.
2. Conocer las diferentes partes que integran un estudio estadístico, su lenguaje
técnico y definiciones, facilita la orientación y posterior recolección de
información para la realización de una investigación.
3. El análisis descriptivo y sus posibilidades de hallar correlaciones entre variables,
son la base para la realización de estudios a profundidad, posteriores, que
permitan realizar inferencias con probabilidades bajas de error.
4. El uso de la estadística es la base para el montaje de nuevos negocios.
5. El uso de la estadística, desde una perspectiva ética, debe ser un reflejo, lo más
ceñido posible, a la realidad estudiada, al margen de los prejuicios o preferencias
del investigador.
Referencias Bibliográficas

Santa Escobar Mónica, Modulo Estadística Descriptiva, Universidad Nacional Abierta y


a Distancia UNAD, Colombia (2005)

ORTEGON PAVA MILTON FERNANDO, CABRERA FRANCISCO (IBAGUÉ JULIO 2010)


Módulo 100105 – ESTADÍSTICA DESCRIPTIVA

Blog del curso de estadística descriptiva, recuperado e la web:


http://estadisticadescriptivaunad100105.blogspot.com/
https://www.youtube.com/watch?v=LgFYGbH1NJk.

Vous aimerez peut-être aussi