Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCIN
El siguiente trabajo fue realizado con la finalidad de estudiar las preferencias de los usuarios
que tienen por el transporte entre el ferrocarril y el bus. Para evaluar si la aceptacin de la
poblacin es alta ante la construccin de un ferrocarril que recorrera de Lima hacia la sierra
central.
Con la ayuda de los programas; SPSS, Excel, pudimos distribuir de manera ms eficaz los datos,
as como tambin pudimos determinar los estadsticos (moda, media, mediana, varianza,
desviacin estndar, percentiles, entre otros).
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
INDICE
1. MARCO TERICO ................................................................................................ 1
1.1. MEDIDAS DE TENDENCIA CENTRAL .......................................................... 1
1.2. MEDIDAS DE DISPERSIN .......................................................................... 2
1.3. DIAGRAMA DE CAJAS .................................................................................. 3
1.4. CORRELACIN ............................................................................................. 4
2. ANLISIS DE LOS DATOS OBTENIDOS DE LAS ENCUESTAS.......................... 5
2.1. VARIABLE CUALITATIVA: ............................................................................. 5
2.2. VARIABLES CUANTITATIVAS: ...................................................................... 6
2.3. CORRELACIN ENTRE INGRESOS MENSUALES Y N VEHCULOS ...... 11
3. CONCLUSIONES ................................................................................................ 12
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
1. MARCO TERICO
1.1.1. La mediana
Es el nmero que separa a la serie de datos ordenados en dos partes de
igual nmero de datos. La mediana depende del nmero de orden de los
datos y no de los valores de estos datos por lo cual no se ven afectados por
los valores aislados.
= +
Donde:
: Lmite inferior del intervalo de la media.
: Frecuencia absoluta del intervalo de la media.
= 0.5 1
: Amplitud del intervalo de la media.
1.1.2. La moda
Se define como el dato que ocurre con mayor frecuencia. La moda en una
distribucin de frecuencias por intervalos se ubica en el intervalo que tiene
mayor frecuencia cabe resaltar que la moda no siempre existe y que
adems si existe no siempre es nica.
1
= +
1 + 2
1
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
Donde:
1 = 1
2 = 1
Recordar que para aplicar la frmula se debe verificar que la distribucin sea
unimodal.
1.1.3. La media
Valor numrico que se obtiene dividiendo la suma total de los valores
observados de una variable entre el nmero de observaciones.
1. De variable discreta
=1
=
Donde:
: Frecuencia absoluta
: Valores que toma la variable
: Tamao de la muestra
2. Por intervalos
=1
=
Donde:
: Marca de clase de cada intervalo
Son nmeros reales que miden el grado de separacin de los datos con respecto a un
valor central que generalmente es la media.
= 3 1
2
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
Donde:
3 : Tercer cuartil.
1 : Primer cuartil.
1.2.2. La varianza
Se define como la media de los cuadrados de las diferencias de los datos
con respecto a la media.
1. De variable discreta
=1 ( )2
2 =
2. Por intervalos
=1 ( )2
2 =
= 2
1.2.4. La curtosis
Propiedad de una distribucin de frecuencias por lo cual se compara la
dispersin de los datos observados cercanos al valor central con la
dispersin de los datos cercanos a ambos extremos de la distribucin.
Esta grfica nos permite reflejar propiedades y describir la forma como se distribuyen
los datos respecto a la mediana, los cuartiles y valores extremos.
Adems de la caja se incluye una extensin de los datos mediante segmentos o bigotes
que se extiende de la caja hacia los valores extremos.
Los datos atpicos o discordantes son aquellos que se presentan fuera del intervalo:
[P25-1.5RI; P75+1.5RI]
3
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
1.4. CORRELACIN
Es aquello que indicar la fuerza y la direccin lineal que se establece entre
dos variables aleatorias.
Se considera que dos variables de tipo cuantitativo presentan correlacin la una
respecto de la otra cuando los valores de una ellas varen sistemticamente con
respecto a los valores homnimos de la otra.
De todas maneras, vale aclarar que la correlacin que pueda darse entre dos
variables no implicar por si misma ningn tipo de relacin de causalidad. Los
principales elementos componentes de una correlacin de este tipo sern: la
fuerza, el sentido y la forma.
=
Donde:
: Covarianza
: Desviacin tpica de X
: Desviacin tpica de Y
Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total
entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la
otra tambin lo hace en proporcin constante.
Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todava relaciones no lineales entre las dos
variables.
4
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia
total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la
otra disminuye en proporcin constante.
Motivo de viaje
20
15
10
5
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
Se puede apreciar del grafico que los usuarios viajan a Hunuco con mayor
frecuencia por motivo de visita.
Costo de viaje
25
20
15
10
0
Frecuencia porcentual
Mediana = 54.81
Media = 55.44
Desviacin estndar = 19.26
6
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
Ingreso personal
Intervalos Xi fi Fi hi Hi
[0-1000> 500 9 9 0.333333333 0.333333
[1000 2000> 1500 11 20 0.407407407 0.740741
[2000 -3000> 2500 4 24 0.148148148 0.888889
[3000-4000> 3500 2 26 0.074074074 0.962963
[4000-5000> 4500 0 26 0 0.962963
[5000-6000> 5500 1 27 0.037037037 1
27
Estadsticos de la variable
-1218.75 4031.25
Un solo
valor
Por lo cual se puede afirmar que los datos se encuentran centralizados con respecto a la
mediana de valor 1409.09.
7
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
Intervalos Xi fi Fi hi Hi
[0-1000> 500 14 14 0.7 0.7
[10002000> 1500 3 17 0.85 1.55
[2001-3000> 2500 2 19 0.95 2.5
[3000-4000> 3500 1 20 1 3.5
[4000-5000> 4500 0 20 1 4.5
[5000-6000> 5500 0 20 1 5.5
20
Estadsticos de la variable
-1218.75 2797.61
Un solo
valor
Por lo cual se puede afirmar que los datos no se encuentran centralizados con respecto a la
mediana.
Ahora analizaremos sobre las preferencias que tienen los usuarios para viajar a su destino
siendo las posibilidades bus o ferrocarril en diversos escenarios que se diferencian por el
precio del pasaje, el tiempo de demora y la comodidad.
8
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
Empresa informal:
20
15
10
0
1 2 3 4 5 6 7 8 9
Ferrocarril Bus
9
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
Empresa formal:
25
20
15 Ferrocarril
Bus
10
0
1 2 3 4 5 6 7 8 9
Se puede observar que para las empresas formales hay una mejor aceptacin
de preferencias del uso del ferrocarril con respecto al de las empresas
informales.
De los grficos anteriores se puede concluir que si se pusiera en
funcionamiento el ferrocarril los usuarios preferiran viajar en ferrocarril si las
diferencias de precios no fueran demasiado grandes y si las diferencias de
precios es moderadamente grande el mayor uso del ferrocarril seria debido a
los usuarios que viajan en empresas formales.
10
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
Sabemos que la correlacin nos determina la dependencia que existe entre dos variables
que intervienen en una distribucin bidimensional. Tambin sabemos que el coeficiente de
correlacin es un nmero, por ende algunos de nuestros datos obtenidos debemos de
cambiarle de notacin.
Notacin
N 0 1 2 >2
Inicial
VEHCULOS
Notacin final
0 1 2 3
=0.367564
6000
5000
4000
3000
2000
1000
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53
Se observa que la mayora de los usuarios encuestados tiene un sueldo que est entre
[0; 2000].
11
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
2.5
1.5
0.5
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53
3. CONCLUSIONES
12
UNIVERSIDAD NACIONAL DE INGENIERA DEPARTAMENTO DE CIENCIAS BSICAS
FACULTAD DE INGENIERA CIVIL MA611 H
4. RECOMENDACIONES
- Saber manejar muchos programas ayuda con la eficacia del trabajo, por
ejemplo; nuestro diagrama de caja se tuvo que realizar a mano, pero si
supiramos ejecutar programas que nos d el diagrama, hubiera sido ms
rpido calcularlo.
13