Vous êtes sur la page 1sur 15

UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS

FACULTAD DE INGENIERA CIVIL MA611 H

INTRODUCCIN

El siguiente trabajo fue realizado con la finalidad de estudiar las preferencias de los usuarios
que tienen por el transporte entre el ferrocarril y el bus. Para evaluar si la aceptacin de la
poblacin es alta ante la construccin de un ferrocarril que recorrera de Lima hacia la sierra
central.

Nos apoyamos en la estadstica descriptiva para entender mejor el comportamiento de las


preferencias de los pasajeros, para lo cual recogimos una muestra aleatoria de 53 usuarios que
utilizan buses de empresas informales o formales.

Con la ayuda de los programas; SPSS, Excel, pudimos distribuir de manera ms eficaz los datos,
as como tambin pudimos determinar los estadsticos (moda, media, mediana, varianza,
desviacin estndar, percentiles, entre otros).
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

INDICE
1. MARCO TERICO ................................................................................................ 1
1.1. MEDIDAS DE TENDENCIA CENTRAL .......................................................... 1
1.2. MEDIDAS DE DISPERSIN .......................................................................... 2
1.3. DIAGRAMA DE CAJAS .................................................................................. 3
1.4. CORRELACIN ............................................................................................. 4
2. ANLISIS DE LOS DATOS OBTENIDOS DE LAS ENCUESTAS.......................... 5
2.1. VARIABLE CUALITATIVA: ............................................................................. 5
2.2. VARIABLES CUANTITATIVAS: ...................................................................... 6
2.3. CORRELACIN ENTRE INGRESOS MENSUALES Y N VEHCULOS ...... 11
3. CONCLUSIONES ................................................................................................ 12
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

1. MARCO TERICO

1.1. MEDIDAS DE TENDENCIA CENTRAL

Denominadas tambin promedios ubican el centro de los datos como la media


aritmtica, la mediana y la moda.

1.1.1. La mediana
Es el nmero que separa a la serie de datos ordenados en dos partes de
igual nmero de datos. La mediana depende del nmero de orden de los
datos y no de los valores de estos datos por lo cual no se ven afectados por
los valores aislados.

Clculo de la mediana para datos agrupados:

1. Si los valores de una variable discreta se agrupan en una distribucin de


frecuencias de la forma dato: frecuencia el clculo de la mediana se
realiza determinando el valor medio de todos los datos que ya se
encuentran ordenados en la distribucin de frecuencias.
2. Si los valores de una variable se ubican en una distribucin de
frecuencias por intervalos, la mediana se determina aproximadamente
por interpolacin de tal forma que la mitad inferior de los datos
agrupados sean menores o iguales a la media.


= +

Donde:
: Lmite inferior del intervalo de la media.
: Frecuencia absoluta del intervalo de la media.
= 0.5 1
: Amplitud del intervalo de la media.

1.1.2. La moda
Se define como el dato que ocurre con mayor frecuencia. La moda en una
distribucin de frecuencias por intervalos se ubica en el intervalo que tiene
mayor frecuencia cabe resaltar que la moda no siempre existe y que
adems si existe no siempre es nica.

Calculo de la media para una distribucin por intervalos

1
= +
1 + 2

1
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

Donde:
1 = 1
2 = 1

Recordar que para aplicar la frmula se debe verificar que la distribucin sea
unimodal.

1.1.3. La media
Valor numrico que se obtiene dividiendo la suma total de los valores
observados de una variable entre el nmero de observaciones.

Calculo de la media para datos agrupados:

1. De variable discreta

=1
=

Donde:
: Frecuencia absoluta
: Valores que toma la variable
: Tamao de la muestra

2. Por intervalos
=1
=

Donde:
: Marca de clase de cada intervalo

Observacin: Si la distribucin de los datos tiene marcada asimetra entonces la


mediana es la medida promedio ms representativa ya que la media no es sesgada por
datos aislados grandes o pequeos.

1.2. MEDIDAS DE DISPERSIN

Son nmeros reales que miden el grado de separacin de los datos con respecto a un
valor central que generalmente es la media.

1.2.1. El rango intercuartil


Es el nmero que resulta de la diferencia entre el tercer cuartil y el primer
cuartil.

= 3 1

2
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

Donde:
3 : Tercer cuartil.
1 : Primer cuartil.

Si el RI es muy pequeo entonces describe alta uniformidad.

1.2.2. La varianza
Se define como la media de los cuadrados de las diferencias de los datos
con respecto a la media.

Clculo de la varianza para datos agrupados:

1. De variable discreta
=1 ( )2
2 =

2. Por intervalos
=1 ( )2
2 =

1.2.3. La desviacin estndar


Se define como la raz cuadrada de la varianza.

= 2

1.2.4. La curtosis
Propiedad de una distribucin de frecuencias por lo cual se compara la
dispersin de los datos observados cercanos al valor central con la
dispersin de los datos cercanos a ambos extremos de la distribucin.

1.3. DIAGRAMA DE CAJAS

Esta grfica nos permite reflejar propiedades y describir la forma como se distribuyen
los datos respecto a la mediana, los cuartiles y valores extremos.

Adems de la caja se incluye una extensin de los datos mediante segmentos o bigotes
que se extiende de la caja hacia los valores extremos.

Los datos atpicos o discordantes son aquellos que se presentan fuera del intervalo:

[P25-1.5RI; P75+1.5RI]

El grfico de cajas se obtiene la centralizacin de los datos observando la ubicacin de


la mediana. Tambin se puede observar la variabilidad de los datos mediante el rango
intercuartil (RI).

3
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

1.4. CORRELACIN
Es aquello que indicar la fuerza y la direccin lineal que se establece entre
dos variables aleatorias.
Se considera que dos variables de tipo cuantitativo presentan correlacin la una
respecto de la otra cuando los valores de una ellas varen sistemticamente con
respecto a los valores homnimos de la otra.
De todas maneras, vale aclarar que la correlacin que pueda darse entre dos
variables no implicar por si misma ningn tipo de relacin de causalidad. Los
principales elementos componentes de una correlacin de este tipo sern: la
fuerza, el sentido y la forma.

1.4.1. Coeficiente de correlacin de Pearson


Es un ndice que mide la relacin lineal entre dos variables aleatorias cuantitativas.
A diferencia de la covarianza, la correlacin de Pearson es independiente de
la escala de medida de las variables.
El coeficiente de correlacin entre dos variables aleatorias X e Y se expresa:


=

Donde:
: Covarianza
: Desviacin tpica de X
: Desviacin tpica de Y

El valor del ndice de correlacin vara en el intervalo [-1, +1]

Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total
entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la
otra tambin lo hace en proporcin constante.

Si 0 < r < 1, existe una correlacin positiva.

Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todava relaciones no lineales entre las dos
variables.

4
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

Si -1 < r < 0, existe una correlacin negativa.

Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia
total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la
otra disminuye en proporcin constante.

2. ANLISIS DE LOS DATOS OBTENIDOS DE LAS ENCUESTAS

En el siguiente trabajo se presenta el anlisis de una muestra de 53 usuarios con destino a


Hunuco que se tomaron en distintas empresas de transporte tanto formal como informal,
para ello se presentaran variables que pueden ser cualitativas o cuantitativas:

2.1. VARIABLE CUALITATIVA:

Motivo de viaje

Motivo de viaje Frecuencia Frecuencia Frecuencia


absoluta porcentual porcentual
acumulada
Trabajo 9 17.0 17.0
Estudio 5 9.4 26.4
Turismo/Recreacin 7 13.2 39.6
Visita 24 45.3 84.9
Salud 6 11.3 96.2
Otros 2 3.8 100.0
Total 53 100.0

Grafica de barras separadas por motivo de


viaje a Hunuco
30
Motivo de viaje
25

20

15

10

5
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

Se puede apreciar del grafico que los usuarios viajan a Hunuco con mayor
frecuencia por motivo de visita.

2.2. VARIABLES CUANTITATIVAS:

Costo de viaje

Para realizar la distribucin de frecuencias de esta variable solamente se


consider 51 usuarios debido a que 2 usuarios no saban el costo de su pasaje.

Intervalo Marca Frecuencia Frecuencia Frecuencia


de absoluta porcentual porcentual
clase acumulada
[15,30> 22.5 4 7.8 7.8
[30,45> 37.5 13 25.5 33.3
[45,60> 52.5 13 25.5 58.8
[60,75> 67.5 13 25.5 84.3
[75,90> 82.5 7 13.7 98.0
[90,105> 97.5 0 0 98.0
[105,120] 112.5 1 2.0 100.0
Total 51 100.0

Histograma del costo de viaje a Hunuco


30

25

20

15

10

0
Frecuencia porcentual

[15,30> [30,45> [45,60> [60,75> [75,90> [90,105> [105,120]

Mediana = 54.81
Media = 55.44
Desviacin estndar = 19.26

6
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

Ingreso personal

Para los usuarios que viajan en empresas formales

Intervalos Xi fi Fi hi Hi
[0-1000> 500 9 9 0.333333333 0.333333
[1000 2000> 1500 11 20 0.407407407 0.740741
[2000 -3000> 2500 4 24 0.148148148 0.888889
[3000-4000> 3500 2 26 0.074074074 0.962963
[4000-5000> 4500 0 26 0 0.962963
[5000-6000> 5500 1 27 0.037037037 1
27

Estadsticos de la variable

Percentil 25 Mediana Percentil 75 Rango intercuartil


750 1409.09 2062.5 1312.5

-1218.75 4031.25

750 1409.09 2062.5

Un solo
valor

Omitiendo el valor atpico encontrado por el diagrama de cajas nos queda:

Media = 1461.538 Moda=1222.22

Del diagrama de cajas se puede determinar:

1409.09 750 = 659.09 2062.50 1409.09 = 653.41

Por lo cual se puede afirmar que los datos se encuentran centralizados con respecto a la
mediana de valor 1409.09.

7
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

Para los usuarios que viajan en empresas informales

Intervalos Xi fi Fi hi Hi
[0-1000> 500 14 14 0.7 0.7
[10002000> 1500 3 17 0.85 1.55
[2001-3000> 2500 2 19 0.95 2.5
[3000-4000> 3500 1 20 1 3.5
[4000-5000> 4500 0 20 1 4.5
[5000-6000> 5500 0 20 1 5.5
20

Estadsticos de la variable

Percentil 25 Mediana Percentil 75 Rango intercuartil


357.14 714.29 1333.33 976.19

-1218.75 2797.61

357.14 714.29 1333.33

Un solo
valor

Omitiendo el valor atpico encontrado por el diagrama de cajas nos queda:

Media = 868.42 Moda= 280

Del diagrama de cajas se puede determinar:

714.29 357.14 = 357.15 1333.33-714.29 = 619.04

Por lo cual se puede afirmar que los datos no se encuentran centralizados con respecto a la
mediana.

Ahora analizaremos sobre las preferencias que tienen los usuarios para viajar a su destino
siendo las posibilidades bus o ferrocarril en diversos escenarios que se diferencian por el
precio del pasaje, el tiempo de demora y la comodidad.

Comenzaremos analizando las preferencias de las empresas formales e informales por


separado:

8
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

Empresa informal:

escenario Ferrocarril Bus


1 14 11
2 9 16
3 22 3
4 22 3
5 21 4
6 13 12
7 9 16
8 10 15
9 12 13

Grafica de barras agrupadas de las preferenciasde


los usuarios en las empresas informales
25

20

15

10

0
1 2 3 4 5 6 7 8 9

Ferrocarril Bus

En el caso de los escenarios 3, 4, 5 se presenta la situacin que tanto el bus


como el ferrocarril tienen el mismo costo de pasaje y la misma comodidad
diferencindose as en el tiempo de viaje.
Se puede observar que la preferencia de ir en ferrocarril es demasiado alta
esto es debido al bajo tiempo que demora el ferrocarril, sin embargo existe
una pequea parte que a pesar de lo dicho no desea viajar en ferrocarril esto
puede ser debido a la falta de conocimiento de este medio de transporte, al
temor de la excesiva velocidad entre otros.
En la mayora de casos que la preferencia de bus es mayor es debido a la
diferencia de precios.

9
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

Empresa formal:

Formal Ferrocarril Bus


1 14 14
2 16 12
3 25 3
4 25 3
5 24 4
6 18 10
7 7 21
8 13 15
9 19 9

Grafica de barras agrupadas de las preferencias


de los usuarios en la empresas formales
30

25

20

15 Ferrocarril
Bus
10

0
1 2 3 4 5 6 7 8 9

Se puede observar que para las empresas formales hay una mejor aceptacin
de preferencias del uso del ferrocarril con respecto al de las empresas
informales.
De los grficos anteriores se puede concluir que si se pusiera en
funcionamiento el ferrocarril los usuarios preferiran viajar en ferrocarril si las
diferencias de precios no fueran demasiado grandes y si las diferencias de
precios es moderadamente grande el mayor uso del ferrocarril seria debido a
los usuarios que viajan en empresas formales.

10
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

2.3. CORRELACIN ENTRE INGRESOS MENSUALES Y N VEHCULOS

Sabemos que la correlacin nos determina la dependencia que existe entre dos variables
que intervienen en una distribucin bidimensional. Tambin sabemos que el coeficiente de
correlacin es un nmero, por ende algunos de nuestros datos obtenidos debemos de
cambiarle de notacin.

Notacin
N 0 1 2 >2
Inicial
VEHCULOS
Notacin final
0 1 2 3

Notacin 0a 1001 a 2001 a 3001 a 4001 a 5001 a


> 6000
INGRESOS Inicial 1000 2000 3000 4000 5000 6000
MENSUALES
Notacin Final 500 1500 2500 3500 4500 5500 6500

Con nuestros datos, siendo la variable X, los ingresos y la variable Y el N de vehculos:

=0.367564

Grfica de los ingresos mensuales de cada


pasajero
7000

6000

5000

4000

3000

2000

1000

0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53

Se observa que la mayora de los usuarios encuestados tiene un sueldo que est entre
[0; 2000].

11
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

Grfica de los N de vehculos de cada pasajero


3.5

2.5

1.5

0.5

0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53

Se observa que la mayora de los usuarios encuestados no poseen ningn vehculo o


solo poseen uno.

3. CONCLUSIONES

12
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H

4. RECOMENDACIONES

- Un mejor anlisis se lograra con la obtencin de ms encuestados, en nuestro


caso solo fueron 53, pero para la mejora del trabajo sera recomendable unos
1000.

- Saber manejar muchos programas ayuda con la eficacia del trabajo, por
ejemplo; nuestro diagrama de caja se tuvo que realizar a mano, pero si
supiramos ejecutar programas que nos d el diagrama, hubiera sido ms
rpido calcularlo.

- Haber estudiado los temas de estadstica facilit el trabajo, por ello,


recomendamos aprendernos lo terico para despus aplicarlos.

13

Vous aimerez peut-être aussi