Vous êtes sur la page 1sur 8

Oportunidad de aprendizaje 1

Con el objetivo de crear un modelo de elevacin digital, se le ha pedido a este grupo de


ingenieros topogrficos que se haga previamente un anlisis exploratorio de datos. Las
variables que contiene el set de datos a estudiar son: Este, Norte, Elev. Las coordenadas
Este y Norte se encuentran en proyecciones geogrficas y la elevacin en metros sobre el
nivel del mar. De acuerdo a lo anterior, el grupo resuelve algunas preguntas de inters:

[1] Construir la distribucin de frecuencias de las tres variables e


interpretar: n2, f3
y F2 .
Para comenzar se inicia con la comprensin de que es una distribucin de frecuencias,
este es un mtodo para organizar y resumir datos. Bajo este mtodo los datos que
componen una seria se clasifican y ordenan, indicndose el nmero de veces en que se
repite cada valor. Ahora, como esta distribucin de frecuencias es para un set de datos
agrupados, vamos a seguir un paso a paso, para poder realizar la distribucin de una
manera ms sencilla:
1.
2.
3.
4.
5.
6.
7.

Determinar el nmero de clase (m)


Determinar el rango de variacin (Rango)
Amplitud de intervalos de clase (C)
Construccin de cada una de las m clases
Calculo de las marcas de clase (xi)
Determinar la frecuencia asociada a cada intervalo
Construir las otras frecuencias.

Para realizacin de la tabla de frecuencias de la variable Este, se parte de una pequea


tabla la cual contiene el clculo de los 3 primeros pasos anteriormente mencionados y que
facilitan la realizacin de los pasos posteriores. A continuacin se evidencia dicha tabla.

Ilustracin 1 Calculo de Clases, N de intervalos y Amplitud para la variable Este

En la siguiente tabla, se evidencia la distribucin de frecuencias ya completa para la


variable Este.

Universidad del valle - Fundamentos Estadstica


Profesor Johan Alexis Ospina

Ilustracin 2 Distribucin de frecuencias para la variable Este.

Interpretacin de n2, f3 y F2 para la variable Este:

n2=10, en la muestra de observacin se tiene que 10 datos, en sus coordenadas


Este se encuentran entre los valores 0.20mE a 1.22mE.
f3=0.17, de acuerdo al conjunto de datos medidos, el 17 % de las coordenadas
Este se encuentran entre los valores 2.23mE a 3.25mE.
F2=0.33, en la muestra observada se encuentra que el 33% de las coordenadas
Este son menores o iguales a 2.23mE.
mE es la abreviatura para metros Este.

A continuacin, se adjuntan las tablas de Distribucin de frecuencias para las otras 2


variables restantes Norte, Elevacin. De la misma manera en que se procedi para la la
tabla de distribucin de la variable Este, se hicieron estas tablas.

Ilustracin 3 Calculo de Clases, N de intervalos y Amplitud para la variable Norte.

Ilustracin 4 Distribucin de frecuencias para la variable Norte.

Interpretacin de n2, f3 y F2 para la variable Norte:

n2=7, en la muestra de observacin se tiene que 7 datos, en las coordenadas


Norte se encuentran entre los valores 1.03mN a 2.07mN.

Universidad del valle - Fundamentos Estadstica


Profesor Johan Alexis Ospina

f3=0.10, de acuerdo al conjunto de datos medidos, el 10 % de las coordenadas

Norte se encuentran entre los valores 2.07mN a 3.10mN.


F2=0.35, en la muestra observada se encuentra que el 35% de las coordenadas
Norte son menores o iguales a 2.07mN.
mN es la abreviatura para metros Norte.

Ilustracin 5 Calculo de Clases, N de intervalos y Amplitud para la variable Elevacin.

Ilustracin 6 Distribucin de frecuencias para la variable Elevacin.

Interpretacin de n2, f3 y F2 para la variable Elevacin:

n2=7, en la muestra de observacin se tiene que 7 cotas, de la variable


Elevaciones se encuentran entre los valores 735m a 780m.
f3=0.23, de acuerdo al conjunto de datos medidos, el 23 % de las elevaciones se
encuentran entre las cotas 780m a 825m.
F2=0.23, en la muestra observada se encuentra que el 23% de las cotas son
menores o iguales a 780m
La Elevacin es medida en metros.

[2] Para la variable Elevacin construir los indicadores de tendencia


central, dispersin, posicin, asimetra y curtosis.
En las siguientes tablas se evidenciarn los indicadores de tendencia central,
dispersin, asimetra y curtosis con sus respectivas interpretaciones.

Universidad del valle - Fundamentos Estadstica


Profesor Johan Alexis Ospina

Ilustracin 7 Indicadores de tendencia central variable Elevacin.

Un anlisis al conjunto de datos es observar la tendencia central que tienen los registros,
es decir, cul es el valor o los valores que mejor me resume el conjunto de los datos,
sobre qu valor o valores se centraliza mi informacin. Para eso recurrimos a indicadores
tales como LA MODA, LA MEDIANA Y LA MEDIA.

Media = 825.87, nos muestra que la elevacin media dentro de todo el grupo de

datos recogidos en campo, se estima que tengan esa cota.


Mediana = 831.43, est indicando que la mitad del conjunto de datos observado en
campo tienen cota menor o igual a ese valor.
Moda=847.5, se entiende que alrededor de este valor, son las alturas que mas se
repiten en la zona de estudio.

Ilustracin 8 Indicadores de Dispersin variable Elevacin

Los indicadores de Tendencia Central no trabajan solos, deben apoyarse con


alguna medida de dispersin. Estos son directamente proporcionales por ende
un ndice de dispersin pequeo, indica baja variabilidad, el valor de Tendencia
Central ser ms confiable y Un ndice de dispersin grande, indica gran
variabilidad, esto implica que el indicador de Tendencia Central sea poco
confiable.

Varianza=825.8, dado a las unidades es difcil de interpretar, por eso se utiliza con

frecuencia la desviacin estndar, que se calcula como la raz cuadrada de esta.


Desviacin Estndar= 28.74, contemplamos que en promedio las elevaciones estn
variando con respecto a la media 28.74 metros.
Coeficiente de variacin=3.48, nos est indicando que 3.48% de las cotas de la
zonas de estudio est variando, lo cual indica por variacin de las alturas.

Universidad del valle - Fundamentos Estadstica


Profesor Johan Alexis Ospina

Ilustracin 9 Indicadores de Posicin variable elevacin.

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados,
en cuatro partes porcentualmente iguales.

Q1=783.75, este primer cuartil nos indica que el 25% de las elevaciones
son menores o iguales a Q1.
Q2=831.43, se tiene como caso especial, porque su valor representa la
mitad del conjunto de datos de elevaciones o lo que es igual representa
la mediana de datos. El 50% de las elevaciones son menores o iguales a
831.43m
Q3=873.75, no indica que el valor obtenido representa el 75% de la
distribucin de los datos o el 75% de las elevaciones son iguales o
menores a este valor.

Los percentiles se separan en 100 partes y se identifican en los subndices, el


primer percentil se encuentra debajo del 1% de las observaciones, y el resto
por encima de esta.

Ilustracin 10 Indicadores de Forma variable elevacin

La asimetra, es una medida de forma de una distribucin que permite


identificar y describir la manera como los datos tiende a reunirse de acuerdo
con la frecuencia con que se hallen dentro de la distribucin. Permite identificar
las caractersticas de la distribucin de datos sin necesidad de generar el
grfico.
Como podemos observar, se presenta una asimetra negativa Se da cuando en
una distribucin la minora de los datos est en la parte izquierda de la media.
Este tipo de distribucin presenta un alargamiento o sesgo hacia la izquierda,
es decir, la distribucin de los datos tiene a la izquierda una cola ms larga que
Universidad del valle - Fundamentos Estadstica
Profesor Johan Alexis Ospina

a la derecha. En resumidas palabras la minora de cotas est por debajo de


825.87m.
Curtosis, este indica el grado de apuntamiento de la distribucin, como el
coeficiente de apuntamiento es superior a 3, entonces se puede decir que, la
distribucin de la curva de las elevaciones es Platicurtica.

[3] Para las tres variables construya e interprete un box-plot, se


identifican datos atpicos?

Ilustracin 11 Diagramas de cajas variable Este

Ilustracin 12Diagramas de cajas variable Norte

Universidad del valle - Fundamentos Estadstica


Profesor Johan Alexis Ospina

Ilustracin 13 Diagrama de cajas Elevacin.

En los diagramas de caja diseados para la variables de Norte, Este y Elevacion


se puede observar una cualdiad en comn y es que en ninguno de los tres
casos se presentan comportamientos que estn por fuera del promedio comn
de los datos totales es deci, no se evidencian datos atpicos.
Como conclusin podemos aportar de que las porciones de terreno no
presentan considerables cotas, que por el contrario el terreno se encuentra en
una zona donde el cambio de cota no es brusco. para las coordenadas tenemos
que tampoco se presentan grandes cambios en las en ellas, su mayor variacin
es de 6 metros entre una cota y la siguiente.

Universidad del valle - Fundamentos Estadstica


Profesor Johan Alexis Ospina

Universidad del valle - Fundamentos Estadstica


Profesor Johan Alexis Ospina

Vous aimerez peut-être aussi