Vous êtes sur la page 1sur 3

Análisis de Datos utilizando Regresión

Lineal
Miguel Álvarez. Estudiante, Natalia Chacón. Estudiante, Sonia Medina. Estudiante, and Chrystian
Mendoza. Estudiante. Universidad Pontificia Bolivariana, Medellín. 2018.
Resumen: En el siguiente artículo se encuentra regresión lineal simple es una técnica estadística
un análisis de datos estadísticos, donde se utiliza para indagar y modelar la relación entre variables.
el análisis de varianza, la inferencia estadística,
estadísticos de prueba para encontrar la La regresión lineal se puede utilizar en diferentes
relación que existe entre dos variables y ámbitos como la química, la física, economía, Una
determinar la regresión lineal del problema. de las numerosas razones para buscar una ecuación
de regresión es hacer predicciones. Por ejemplo, si
Palabras Clave: Estadística, Regresión, un profesional de ciencias políticas o
Varianza, Inferencia, Análisis. administración pública hace un estudio sobre el
índice de pobreza realizado con los datos de las
1. INTRODUCCIÓN principales ciudades del país y dependiendo del
En el presente trabajo se busca realizar un análisis resultado podría buscar estrategias, así mismo un
de datos estadísticos tomando como tema de administrador o economista puede realizar el
estudio concreto la relación lineal que existe entre análisis sobre la relación de dependencia entre el
el promedio de yardas obtenidas por intento de pase gasto en publicidad y el volumen de ventas.
y puntaje de clasificación de los mariscales de Aun así, en estos casos es común hacerse la
campo de la NFL (National Football League) en la pregunta. ¿Cuán efectivo es el análisis realizado?,
temporada 2008. es allí donde las investigaciones hechas por Karl
Los datos recolectados para este experimento Pearson en el campo de la regresión lineal son
fueron tomados bajo el método de observación relevantes y es el coeficiente de correlación de
directa, usando equipos similares a los TAL con el Pearson el valor adimensional que nos permite
fin de saber la posición de los jugadores y por saber un valor con el que se sabrá cuan efectiva es
medio de esta hacer un cálculo preciso sobre la la regresión lineal usada en el análisis estadístico.
ubicación de estos en el campo y su cantidad de Habiendo ya aclarado los aspectos básicos de la
yardas obtenidas al realizarse un pase regresión lineal y para tener una vista clara sobre el
exitosamente. problema plateado, se es necesario explicar que es
Para tener una vista completa del panorama es la NFL, así como sus orígenes. La Nationa Football
necesario dar un paso atrás y definir League (NFL) por sus siglas en inglés, es la más
superficialmente dos aspectos claves del análisis importante competición de fútbol americano de los
estadístico realizado en este trabajo, la regresión Estados Unidos de América en donde se
lineal y la NFL. congregan los 32 mejores equipos de la temporada,
fue fundada el 11 de agosto de 1920 por once
El termino regresión fue introducido por Galton en equipos bajo el nombre de American professional
su libro “Natural inheritance” (1889) refiriéndose a football association, la cual pasaría a llamarse
la “ley de la regresión universal”. Él estudió la American professional football league en 1921
herencia y la expresión matemática vinculada a para finalmente en 1922 llevar su nombre actual, el
ella, pero sus trabajos más importantes campeonato consta de un calendario de 17
relacionados con la regresión lineal fue la de los semanas donde cada equipo descansa una,
mínimos cuadrados que fue utilizado para redecir consistiendo en seis partidos contra rivales de la
la posición del “pequeño planeta” Ceres, misma División, así como varios duelos Inter
descubierto por el astrónomo italiano Giuseppe divisionales e Inter conferénciales. Comienza la
Piazzi el 1 de enero de 1801. El estudio de noche del jueves de la primera semana completa de
septiembre y prosigue hasta principios de enero. Al
finalizar, seis equipos -los cuatro campeones de Resumen Puntaje de calificación mariscal (Puntaje)
división y dos Wild Cards de cada Conferencia
Total Datos (n) 32
disputan los play offs de donde los dos equipos Media muestral 84,816
vencedores se encuentran en el super bowl. Desviación estándar muestral (s) 8,961
Mínimo 67
Habiendo ya explicado brevemente la regresión 1er cuartil (Q1) 80
2do cuartil, mediana (Q2) 86
lineal y sus aplicaciones, así como una breve 3er cuartil (Q3) 91
historia de la NFL es posible divisar el panorama Máximo 106
completo del problema en cuestión, así como el Error de estimación muestral (SE(X)) 1,584
funcionamiento de los mecanismos del torneo Tabla 2 Resumen Puntaje de calificación mariscal (Puntaje)
analizado permitiendo así una óptima lectura de los
Entre los cálculos obtenidos se halló la correlación
datos del problema a resolver.
de Pearson la cual fue, 0,8306. Con esta se puede
2. CALCULOS Y DIAGRAMAS analizar el tipo de relación lineal entre dos
variables aleatorias cuantitativas.
En el trabajo a realizar se tomaron varios datos del
promedio de yardas obtenidas por intento de pase y En la tabla (3) se encontraron los valores de otros
puntaje de clasificación de los mariscales de campo estadísticos de regresión que ayudan para el
de la NFL estos datos fueron utilizados para análisis de la relación entre las dos variables del
realizar un diagrama de dispersión el cual se problema.
encuentra en la fig. (1).
Estadísticas de la regresión

Diagrama De Dispersion Coeficiente de correlación múltiple 0,83055106


Coeficiente de determinación R^2 0,68981507
110
Puntajede Calificación Mariscal

R^2 ajustado 0,67947557


100 Error típico 5,07350068
Observaciones 32
90
(Puntaje)

Tabla 3. Estadísticos de la regresión


80
Para realizar un análisis de la varianza de los
70 datos, donde este permite determinar las
60
diferencias significativas que existen en el
4 6 8 10 problema, partiendo de la regresión lineal. En
Promedio De Yardas Obtenidas Por Intento De la tabla (4) se encuentran los cálculos del
Pase (Yd) análisis de varianza en una tabla ANOVA.
Figura 1. Diagrama de Dispersión.
Promedio
cuadrado

cuadrado

crítico de
Suma de
libertad
Grados

de los

Se obtuvieron un resumen de datos, los cuales se Valor


de

F
s

registraron en las tablas (1) y (2).


Resumen Promedio de yardas obtenidas por intento de 4,0625E-
pase (Yd) Regresión 1 1717,30991 1717,30991 66,7164963 09
Total Datos (n) 32 Residuos 30 772,212275 25,7404092
Media muestral 7,014 Total 31 2489,52219
Tabla 4. Análisis de varianza (ANOVA)
Desviación estándar muestral (s) 0,764
Mínimo 5,120 En la tabla (5) se encuentra la inferencia estadística
1er cuartil (Q1) 6,420 del problema, donde se presentan los parámetros de
2do cuartil, mediana (Q2) 7,070 predicción, intervalo de predicción entre otros
3er cuartil (Q3) 7,628 datos a analizar.
Máximo 8,900
Error de estimación muestral (SE(X)) 0,135
Tabla (1) Resumen Promedio de yardas obtenidas por intento
de pase (Yd)
Probabilidad

Inferior 95%
Estadístico t
Coeficientes

Error típico

Superior

Superior
Inferior
95,0%

95,0%
95%
- -
Intercepción 16,4861747 8,41342899 1,9595072 0,05940258 0,69633962 33,6686889 0,69633962 33,6686889
Variable X 1 9,74221356 1,19272694 8,16801667 4,0625E-09 7,30634017 12,1780869 7,30634017 12,1780869

Tabla 5. Inferencia Estadística de los resultados del problema.

3. ANALISIS DE RESULTADOS

La regresión lineal en la estadística, busca


encontrar la relación que existe entre dos variables
X y Y, para este trabajo la variable X es Promedio
De Yardas Obtenidas Por Intento De Pase y la
variable Y es la calificación del mariscal de campo.

Se tiene que la relación lineal de

Vous aimerez peut-être aussi