Vous êtes sur la page 1sur 6

RICARDO OROZCO CALLE INGENIERO INFORMÁTICO

CURSO USO DE TÉCNICAS ESTADÍSTICAS PARA EL ANÁLISIS DE DATOS – SEMANA 3 –


ACTIVIDAD 2

Introducción

En este documento se presenta un caso donde se utiliza el Análisis de Correlación entre precio de
venta de una propiedad en Venice, Florida y otras variables como: número de habitaciones, tamaño
de la propiedad, existencia de piscina, distancia al centro de la ciudad, municipio, existencia de
cochera, número de baños.

Caso Práctico

D = Dependiente
Variable Significado
I = Independiente
Price Precio de venta de la propiedad D
Bedrooms Número de habitaciones en la propiedad I
Size Extensión de la casa en pies2 I
Pool Existencia de piscina en la propiedad; 1 = si, 0 = no I
Distance Distancia desde el centro de la ciudad I
Twnship Municipio donde se ubica la propiedad en Venice, Florida I
Garage Existencia de cochera en la propiedad; 1 = si, 0 = no I
Baths Número de baños en la propiedad I
Tabla 1. Descripción de las Variables

Al aplicar el modelo de predicción en espiral de IBM Cognos Analytics para la variable Price, se obtiene
el siguiente informe:

Figura 1. Modelo en Espiral con el Precio como objetivo


POLITÉCNICO COLOMBIANO JAIME ISAZA CADAVID MEDELLÍN – COLOMBIA
RICARDO OROZCO CALLE INGENIERO INFORMÁTICO

Los resultados más relevantes de la figura 1 son:


• Las variables Garage y Bedrooms presentan la correlación más fuerte (43% de capacidad de
pronóstico) con la variable Price. En la figura 2 se podrá apreciar la relación donde las casas
con cochera presentan precios superiores a las propiedades que no lo poseen. Otra de las
características observables es que el precio promedio aumenta con las siguientes
combinaciones de las variables Garaje- Bedrooms:
o Tiene Cochera – Tiene 7 Habitaciones
o Tiene Cochera – Tiene 8 Habitaciones

También se puede observar en la figura 2 que las propiedades sin cochera usualmente poseen
precios más altos cuando tienen de 3 a 5 habitaciones.

• Las variables Bedrooms y Twnship presentan una correlación del 39% de capacidad de
pronóstico para la variable Price. La figura 3 presenta una distribución del precio promedio
según el municipio y el número de habitaciones que permite visualizar un incremento notable
de precios en las propiedades con muchas habitaciones. Otra información visible en la figura 3
es que las propiedades más grandes y costosas están en el Municipio 4, no obstante existen
propiedades en este municipio, con 4 habitaciones que tienen un precio promedio más bajo que
otras propiedades en este municipio, y en esta misma categoría (4 habitaciones) en los
municipios 3 y 5.

• Otro resultado relevante de la figura 1, es que las variables Garaje y Bedrooms se encuentran
implicadas en los análisis de mayor confiabilidad.

Figura 2. Precio Promedio de la propiedad según el Número de Habitaciones y si posee o no Cochera.

POLITÉCNICO COLOMBIANO JAIME ISAZA CADAVID MEDELLÍN – COLOMBIA


RICARDO OROZCO CALLE INGENIERO INFORMÁTICO

Figura 3. Precio Promedio de la propiedad según el Número de Habitaciones y el Municipio

Algunos resultados asociados a estos datos que no son visibles desde la perspectiva de la figura 1
pero que apoyan los resultados de esta, se presentaran a través de las figuras 4 y 5. La figura 4
muestra la distribución del promedio de la distancia al centro para las propiedades de cada municipio.
Además se puede observar que las propiedades del municipio 4 son las que en promedio quedan más
cerca del centro.

Figura 4. Promedio de Distancias al Centro de la Ciudad según el Municipio

La figura 5 muestra la relación que existe entre el tamaño de la propiedad y el número de habitaciones,
además de presentar el precio promedio para propiedades de diferente número de habitaciones.

De las figuras 3, 4 y 5 podemos concluir que las propiedades más costosas, más grandes y con más
habitaciones se encuentran en promedio más cerca del centro. De este conocimiento nace la
suposición de que el Municipio 4 es un Suburbio.

POLITÉCNICO COLOMBIANO JAIME ISAZA CADAVID MEDELLÍN – COLOMBIA


RICARDO OROZCO CALLE INGENIERO INFORMÁTICO

Figura 5. Distribución del Tamaño y del Precio Promedio de las propiedades según el Número de Habitaciones

De esta gráfica, puntualmente se han de mencionar varias características, como lo son:


• El precio promedio no varía notablemente propiedades que posean de 2 a 5 habitaciones.
• El precio promedio varía notablemente en propiedades que posean de 6 a 8 habitaciones.
• El tamaño de la propiedad no es influenciado notablemente por el número de habitaciones, con
excepción de las propiedades que posean 7 u 8 habitaciones.

Distance no presenta una relación fuerte con Price. Además, si bien no es la variable con menos
relaciones (posee 3 y Twnship solo posee 2) es la última que aparece en la lista de controladores que
presentan relaciones. Cuando se analiza la relación directa con precio se encuentra que solo presenta
11% de confianza. Según IBM Cognos Analytics en la figura 6, la relación es negativa y débil, pero no
se nota claramente (lo que es entendible dado que solo tiene 11% de confiabilidad).

Figura 6. Relación entre el Precio Promedio y la Distancia al Centro de la Ciudad


POLITÉCNICO COLOMBIANO JAIME ISAZA CADAVID MEDELLÍN – COLOMBIA
RICARDO OROZCO CALLE INGENIERO INFORMÁTICO

Si se genera un modelo predictivo de espiral (figura 7) para la variable Distance, se puede apreciar
que esta variable no tiene controladores que la pronostiquen fuertemente, esto es debido a que su
combinación más confiable solo alcanza el 27% (las variables Garaje y Twnship representan esta
relación).

Figura 7. Modelo en Espiral con la Distancia al Centro de la Ciudad como objetivo

Analizando profundamente esta relación (Distance y Garaje-Twnshp), la figura 8 muestra que


realmente no existe información fácilmente observable o de importancia dentro del contexto en el que
se está analizando.

POLITÉCNICO COLOMBIANO JAIME ISAZA CADAVID MEDELLÍN – COLOMBIA


RICARDO OROZCO CALLE INGENIERO INFORMÁTICO
Figura 8. Distancia Promedio al Centro de la Ciudad de las propiedades el Municipio y si posee o no Cochera

En el contexto de la información, se podría suponer que la relación de Distance y Size-Baths debería


tener más sentido para el modelo pero según IBM Cognos Analytics, esta solo tiene 20% de capacidad
de pronóstico.

Según la pregunta “¿Es importante para el valor del precio que la casa tenga piscina o una cochera?”
la respuesta se presenta en la figura 9, donde se puede observar que sin importar si la propiedad tiene
o no piscina, el hecho de tener una cochera incrementa notablemente el valor. Ahora si la propiedad
tiene cochera, el hecho de que tenga piscina también incrementará notablemente el precio

Figura 9. Precio Promedio de las propiedades según si posee o no Cochera y Piscina

De toda la información presentada se debe aclarar, que la mejor decisión depende de los criterios de
la persona, debido a que la elección óptima depende de las necesidades de cada comprador.

POLITÉCNICO COLOMBIANO JAIME ISAZA CADAVID MEDELLÍN – COLOMBIA