Académique Documents
Professionnel Documents
Culture Documents
ESTADISTICA I
INTEGRANTES :
SANDRA AZURIN SOLIS
BERELIZ CASTILLO USCA
CINTHIA MOSCOSO OQUENDO
CUSCO – PERÚ
2016
1
PRESENTACION DE DATOS
La presentación de datos estadísticos constituye en sus diferentes modalidades uno de
los aspectos de más uso en la estadística descriptiva. A partir podemos visualizar a
través de los diferentes medios escritos y televisivos de comunicación masiva la
presentación de los datos estadísticos sobre el comportamiento de las
principales variables económicas y sociales, nacionales e internacionales.
3.-Título: Es la parte más importante del cuadro y sirve para describir todo él
contenido de este.
Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de
cada columna.
Columna matriz: Es la columna principal del cuadro.
Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la
tabla.
Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.
Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que
aparecen en la tabla o cuadro y que no han sido explicados en otras partes.
2
6.-Gráfica de barras: Es un conjunto de rectángulos o barras separadas una de la
otra, en razón de que se usa para representar variables discretas; las barras deben ser
de igual base o ancho y separadas a igual distancia. Pueden disponerse en forma
vertical y horizontal.
7.-Gráfica lineal: Son usadas principalmente para representar datos clasificados por
cantidad o tiempo; o sea, se usan para representar series de tiempo o cronológicas.
Gráfica de barra 100% y gráfica circular: se usan especialmente para representar las
partes en que se divide una cantidad total.
La ojiva: Esta grafica consiste en la representación de las frecuencias acumuladas de
una distribución de frecuencias. Puede construirse de dos maneras diferentes; sobre la
base "menor que" o sobre la base "o más". Puede determinar el valor de la mediana de
la distribución.
En estadística denominamos gráficos a aquellas imágenes que, combinando la
utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y
un sistema De referencia (coordenadas), permiten presentar información cuantitativa.
La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a las
tablas, sino que también constituyen por sí mismos una poderosa herramienta para
el análisis De los datos, siendo en ocasiones el medio más efectivo no sólo para
describir y resumir la información, sino también para analizarla.
En este trabajo solo nos vamos a centrar únicamente en los gráficos como vehículo de
presentación de datos, sin abordar su otra faceta como herramienta de análisis.
DISTRIBUCIÓN DE FRECUENCIA
GRÁFICOS ESTADÍSTICOS
Los gráficos son medios popularizados y a menudo los más convenientes para
presentar datos, se emplean para tener una representación visual de la totalidad de la
información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal
modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros.
3
GRÁFICOS DE BARRAS HORIZONTALES
Representan valores discretos a base de trazos horizontales, aislados unos de otros.
Se utilizan cuando los textos correspondientes a cada categoría son muy extensos.
para una serie
para dos o más series
4
GRÁFICOS DE BARRAS: Se usan para mostrar las relaciones entre dos o más series
con el total. Las barras pueden ser: verticales horizontales
GRÁFICOS DE LÍNEAS
En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos
ortogonales entre sí. Se pueden usar para representar: una serie dos o más series
Una presentación adecuada y clara de los resultados de
un trabajo de investigación además de ser fundamental para contribuir a la difusión de
los mismos, puede incluso ser imprescindible para lograr que se acepte su publicación.
En la actualidad la exigencia de las revistas y de los revisores ha contribuido a que el
nivel de calidad en la presentación de datos sea bastante bueno, por lo que es
conveniente tener algunas ideas muy claras para evitar errores o situaciones que hoy
ya no son admisibles, lo que no solo nos preparará para la publicación de nuestros
trabajos sino también para una lectura crítica de los de otros. Precisamente un buen
punto de partida para obtener información, no sólo sobre cómo presentar nuestros
resultados sino también sobre cómo preparar todo el conjunto del artículo, lo
constituyen las propias guías suministradas por las revistas.
5
Un artículo bien concebido debe transmitir la mayor parte de la información con sólo
leer el Abstract y los Resultados, siendo para ello vital que los datos, con las tablas y
figuras correspondientes, estén bien presentados y organizados. En general no debiera
ser necesario acudir al texto para entender una tabla o una figura; otro caso es para
interpretarla, lo que ya corresponde al apartado de Discusión o Conclusiones.
La manera de presentar los datos es diferente según el tipo de los mismos. De forma
rápida podemos hacer dos grandes grupos: datos cuantitativos y datos cualitativos. En
el grupo de datos cuantitativos tenemos aquellos cuyo resultado puede variar de forma
continua, como puede ser el peso, la edad, etc. y los que sólo pueden tomar valores
enteros como por ejemplo el número de hijos, el número de ingresados en la Unidad
de Quemados un día concreto, etc. A su vez en las variables cualitativas
distinguiremos las nominales, que constituyen una simple etiqueta -como puede ser
el sexo, el grupo sanguíneo, etc.- de las ordinales, en las que se da una relación de
orden entre las respuestas, como por ejemplo en el resultado de una
patología/tratamiento (fallece, empeora, sin cambios, mejora, curación) o el nivel
educacional. Cada tipo variable tiene requerimientos propios en cuanto a presentación
y en cuanto a las pruebas que se utilizan para contrastar los valores entre diferentes
grupos.
Observados en ella serán válidos aproximadamente para esa población, y
los procedimientos estadísticos nos permiten cuantificar la magnitud del término
"aproximadamente", lo que dependerá del tamaño y representatividad de
la muestra (error de muestreo), la variación debida a las técnicas de medida
empleadas (error de medida), y la propia variabilidad del proceso estudiado (error
aleatorio).
La precisión de la estimación efectuada a partir de los datos del estudio se refleja en el
intervalo de confianza. El intervalo de confianza de un parámetro viene dado por
dos límites, inferior y superior, en el que, de acuerdo con nuestros datos, esperamos
que se encuentre el valor verdadero del parámetro de la población (desconocido), con
un nivel de seguridad determinado y que se suele fijar en el 95%.
El intervalo de confianza es mucho más informativo que indicar solo si un resultado ha
sido estadísticamente significativo, incluso aunque se dé el valor de la probabilidad
Representaciones gráficas pueden alcanzar en el proceso de análisis de datos. La
mayoría de los textos estadísticos y epidemiológicos4 hacen hincapié en los distintos
tipos de gráficos que se pueden crear, como una herramienta imprescindible en la
presentación de resultados y el proceso de análisis estadístico. No obstante, es difícil
precisar cuándo es más apropiado utilizar un gráfico que una tabla. Más bien
podremos considerarlos dos modos distintos pero complementarios de visualizar los
mismos datos. La creciente utilización de distintos programas informáticos hace
especialmente sencillo la obtención de las mismas. La mayoría de los paquetes
estadísticos (SPSS, STATGRAPHICS, S-PLUS, EGRET,...) ofrecen grandes
posibilidades en este sentido. Además de los gráficos vistos, es posible elaborar otros
6
gráficos, incluso tridimensionales, permitiendo grandes cambios en su apariencia y
facilidad de exportación a otros programa
Figura 1. Ejemplo de gráfico
de sectores. Distribución de
una muestra de pacientes
según el hábito de fumar.
7
Figura 3.Ejemplo de un histograma correspondiente a los
datos de la Tabla I.
8
Figura 7. Diagrama de barras agrupadas. Relación entre la presencia de
alguna enfermedad coronaria y los antecedentes cardiacos familiares en una
muestra.
9
Figura 9. Gráfico de líneas. Número de pacientes
trasplantados renales en el Complexo Hospitalario "Juan
Canalejo" durante el periodo 1981-1997.
10
Figura 11. Dos diagramas de líneas superpuestos. Variación en el peso
medio de una muestra de recién nacidos según el control ginecológico
del embarazo y el hábito de fumar de la madre.
11
Figura 13. Curva ROC para el porcentaje de protrombina en la
predicción de cirrosis.
12
En estadística denominamos gráficos a aquellas imágenes que, combinando la
utilización de sombreado, colores, puntos, líneas, símbolos, números, texto y
un sistema de referencia (coordenadas), permiten presentar información cuantitativa.
La utilidad de los gráficos es doble, ya que pueden servir no sólo como sustituto a las
tablas, sino que también constituyen por sí mismos una poderosa herramienta para el
análisis de los datos, siendo en ocasiones el medio más efectivo no sólo para describir
y resumir la información, sino también para analizarla.
13
El propósito de un gráfico no es entonces muy diferente del de cualquier otra
herramienta estadística: ayudar a la comprensión y comunicación de la evidencia
aportada por los datos respecto a una hipótesis en estudio. Un gráfico científico debe
servir por tanto para representar la realidad, no para generar nuevas realidades
inexistentes fuera de la propia imagen. La llegada de los ordenadores y de programas
para la generación de gráficos y presentaciones ha puesto en manos del usuario
común una herramienta poderosa, antes de que disponga de los conocimientos o la
mentalidad adecuada para usarla, y de esa forma nos vemos invadidos, cierto que con
honrosas excepciones, por una insensata proliferación de gráficos mercantilistas que
parece que tienen como único objetivo hacernos ver la capacidad
del programa utilizado: llenos de una variada gama de colores, todo tipo de fuentes de
letras imaginables, casi tantos como palabras, y por supuesto representación al menos
en tres dimensiones. Todo lo contrario de lo que un buen gráfico científico debe ser, en
el que su calidad radica precisamente en la simplicidad de la presentación para permitir
visualizar unos datos complejos.
En este artículo nos vamos a centrar únicamente en los gráficos como vehículo de
presentación de datos, sin abordar su otra faceta como herramienta de análisis.
La calidad de un gráfico estadístico consiste en comunicar ideas complejas con
precisión, claridad y eficiencia, de tal manera que:
14
MEDIDAS DE RESUMEN
8 14 17 21 2 9 11 12 14
4 9 11 12 14
8 15 17 22
4 9 11 12
9 15 18 23 7 9 11 12
10 15 18 23 7 9 12 12
12 16 18 23 8 9 12 12
8 9 12 13
12 16 19 24 8 9 12 13
13 16 19 25 8 9 12 14
14 17 19 27 8 10 12 14
14 17 20
Muestra
14 2.
17Pesos
20de bultos Muestra 3. Escolaridad de los
habitantes transportados por un correo (kg).Adultos de un
condominio (años).
15
A continuación se presentan tablas de frecuencia por intervalos e histogramas de
los tres conjuntos de datos. Se puede observar que el primer conjunto tiene sesgo
(la cola) hacia la derecha; el segundo es
Bastante simétrico; y el tercero tiene sesgo hacia la izquierda.
Fre Frec
Frecuen c relativ
Clase cia. a
1a 8 acumu
8 %
17.
100 l. 8
18 26
101 a 9 35 40.
200 5 40 0
201 a 4 44 20.
300
total 45 -- 0
10
Figura 1 Ingresos
1. 45 de empleados. Tabla de frecuencias e histograma.
301 a 0
11.
400 1
401 a Fre 8.9
Frec
500 Frecuen c relativ
2.2
Clase
501 a c. a
600
7a 3 acumu
3 %
7.9
9 l.
3 6 7.9
10 a 8 14 21.
12 11 25 0
13 a 6 31 28.
15 9
5 36
total
16 a 38 -- 10
15.
2 2. Pesos
Figura 38 de bultos. Tabla de frecuencias e histograma.
18 0
8
19 a 13.
21 Fre Frec
2
22 a Frecuen c relativ
5.3
Clase c. a
24
1 aa
25 1 acumu
1 %
2.4
2
27 l.
2 3 4.7
3a 0 3 0
4 7 10 16.
5a 10 20 7
6 23.
16 36
total
7a 42 -- 10
8
6 3. Escolaridad.
Figura 42 0Tabla de frecuencias e histograma.
8 38.
9 a 10 1
11 a 14.
12 3
13 a
14
16
MEDIDAS DE CENTRO
Son medidas que pretenden indicar dónde está lo que se podría considerar como
el centro de la masa de datos. Promedio o media. Es la suma de todas las
observaciones, dividida por el número de ellas. Las más conocidas son las
siguientes:
PROMEDIO O MEDIA.
Es igual a la suma de todas las observaciones, dividida por el número de
observaciones. Se usa el símbolo x para representar la media.
n
∑ xi
El promedio está dado por la x = i =1
fórmula n
El promedio es una medida muy influenciada por valores extremos. Por lo
tanto, si los datos presentan mucha asimetría, el promedio resulta
distorsionado.
17
Ejemplo 2. Cálculo de la mediana:
Muestra 1 Muestra 2 Muestra 3
Número de n= 38 42
datos
Ubicación 45
La mediana La mediana es el La mediana es el
de la es la promedio de las promedio de las
media
Median observación
Mn = 185 M$ observaciones
Mn = (17+17)/2 19= observaciones
Mn = (11+11)/2 21
=
a
na de orden 23 y1720kilos y1122años
MEDIDAS DE POSICIÓN
Señalan otras posiciones, aparte del centro, dentro de la masa de datos. Por
ejemplo, a partir de qué valores está el 10% mayor. Las medidas de centro son
casos especiales de medidas de posición.
19
1 - Al menos q% de las observaciones son menores o iguales que él.
2 - Al menos (100-q)% de las observaciones son mayores o iguales que él.
20
Ejemplo 7. Cálculo del cuartil 3.
Muestra 1 Muestra 2 Muestra 3
75*n/10 33.7 28. 31.
0
ubicación 5 3 es la
El cuartil 5 3 es la
El cuartil El cuartil5 3 es la
del observación de observación de observación de
cuartil
Cuartil orden
290 orden
20 orden
12 años
Q
Q33 M$
34 kilos
29 32
MEDIDAS DE DISPERSIÓN
Rango.
Es la diferencia entre el mayor valor y el menor.
Depende sólo de dos observaciones, y justamente de las
más extremas, por lo que, en general es una muy mala
medida de dispersión.
R=x
n-xi
Desviación Media.
Es el promedio de las desviaciones absolutas (en valor absoluto) respecto de la
media. Se mide en las mismas unidades que las observaciones originales.
n
∑ xi − x
DMd = i =1 x es la media o promedio
n
21
Ejemplo 9. Cálculo desviación media.
Muestra Muestra Muestra
1 2 3
Número de 45 38 42
datosMedi (Ingreso (Pesos (Escolarid
225. 17. 10.
a
desviacio 175.1,1175.1,
s) 9.0,09.0,
) ad) 1 6.1,
8.1, 6.1,
145.1, 8.0,... ...
nes
Sum ..,4645.
274.9, ..,135.
8.0, 94.
3.9,
absoluta
a 8
284.9 1
10.0 8
3.9
promedio 4645.7/45=103.2 135.1/38=3.6 kg 94.8/42=2.3
M$ años
Desviación Mediana.
Es parecida a la desviación media. Se define como el promedio de las
desviaciones absolutas (en valor absoluto) respecto de la mediana. También se
mide en las mismas unidades que las observaciones
Originales. Tiene la característica de ser poco sensible a observaciones extremas.
n
∑ xi − Mn
DMn = i =1 en que Mn es la mediana
n
Varianza.
Es un promedio de los cuadrados de las desviaciones respecto de la media,
excepto que en lugar de dividir por n (el número de observaciones), se suele dividir
por n-1. Se usa el símbolo s2 o bien var para representar la varianza.
22
n
∑( x i − x ) 2
s 2 = var = i =1
n −1
Su unidad de medida es el cuadrado de unidades en que se midieron las
observaciones originales. Hay una forma alternativa de calcularla, que da el
mismo resultado:
n 2
∑x i − n ⋅ x
2
s 2 = var = i =1
n −1
23
Tanto la desviación media como la varianza y la desviación estándar se
encuentran muy influidas por valores extremos. Por lo tanto, cuando la muestra
presenta mucha asimetría, estos no son buenos indicadores de la dispersión, pues
están sobrevalorados.
COEFICIENTE DE VARIACIÓN.
Es similar a la desviación estándar, pero dividido por la media. Con esto se
logra que sea independiente de la unidad de medida con que se midieron las
observaciones. El coeficiente de variación no tiene unidad de medida.
CV= S/X
Tiene una limitación, y es que sólo puede utilizarse cuando los datos se midieron
en una escala que sólo admite valores positivos.
DIC = Q3-Q1
MEDIDAS DE FORMA.
Coeficiente de simetría.
Cuantifica el grado de asimetría que presenta la muestra. Se define como el
promedio de los cubos de las desviaciones en torno a la media, dividido por la
desviación standard elevada también al cubo. La
fórmula es
n
1 ∑ ( xi
n − x)3
cs = i =1
s3
25
Si los datos presentan una cola larga hacia la derecha, el coeficiente de
simetría es positivo. Si presentan una cola larga hacia la hacia la izquierda, el
coeficiente de simetría es negativo. Si hay simetría, el coeficiente es cercano a
cero.
COEFICIENTE DE CURTOSIS.
Cuantifica el hecho que la masa de datos presenta una forma de campana
(mesocúrtica), una forma más bien puntiaguda en la parte central (leptocúrtica) o
muy plana (platicúrtica). El coeficiente de curtosis se define como el promedio de
las desviaciones elevadas a la cuarta potencia, respecto de la media, dividido por
la desviación standard elevado a la cuarta. A todo esto se le resta el número 3. La
Fórmula es
1 (x 4
n ∑ i − x)
k= i =1 −3
s
4
Los datos con forma de campana (mesocúrticos) tienen un coeficiente de curtosis
cercano a cero. Si son leptocúrticos o con forma puntiaguda, el coeficiente es
negativo. Si son planos o platicúrticos, su coeficiente de curtosis es positivo.
26
Ejemplo 16. Coeficiente de curtosis.
Muestra 1 Muestra 2 Muestra 3
Promedio de
las 586243699.0 1131. 205.982
1
desviaciones
ds a la cuarta 239000668.81 452.394 59.55
aCurtosis
la cuartak - - 5
0.4
0.55 0.50 6
Los primeros dos conjuntos aparecen con forma lepticúrtica (puntiagudos), mientras
el de la muestra
3 aparece con forma platicúrtica (más plano). Eso se puede apreciar por el hecho
que las tres barras más grandes, en el histograma correspondiente a este tercer
conjunto, tienen alturas similares. Si se comparan con los histogramas de los
primeros dos conjuntos, hay más diferencia entre la barra más alta y las que le
siguen.
DIAGRAMAS DE CAJÓN
Se construye dibujando una línea horizontal que con una escala que representa
el rango de las observaciones. Se representa la mediana mediante un pequeño
trazo vertical. A los lados se dibujan dos trazos iguales, que representan los
cuartiles. Dos trazos horizontales cierran el rectángulo, denominado cajón, que
tiene los cuartiles por lados, y contiene la mediana en el interior.
27
Luego se calcula la desviación intercuartil DIC = Q3 – Q1 = 290 – 150 = 140
Se dibujan dos trazos verticales, denominadas rejas, en forma
provisoria, a distancias r1 = Q1 – 1.5*DIC = 150 –1.5*140 =
150 – 210 = -60
Se dibujan dos líneas horizontales hacia ambos lados del cajón, hasta las
respectivas observaciones adyacentes. Estas líneas se denominan bigotes. La
figura siguiente representa el cajón con sus bigotes.
28
PARQUE AUTOMOTRIZ EN CUSCO.
ORIGEN Y DESTINO
Son varios los factores que contribuyen a este problema: las inadecuadas dimensiones
de las calles incas en el Centro Histórico, el excesivo número de unidades y el
crecimiento urbano desordenado que ha experimentado la ciudad en los últimos dos
decenios. Así lo determina el Estudio Origen y Destino elaborado por la Corporación
Peruana de Ingenieros en Transporte S.A., a pedido de la Municipalidad Provincial de
Cusco.
Dentro del estudio se hizo una encuesta para recoger las quejas y sugerencias de los
usuarios. En base a ello se elabora la nueva forma de gestión, planificación y expansión
del sistema de transporte urbano.
PARQUE AUTOMOTOR
Al 2010 en Cusco existían inscritos 42 mil 175 vehículos, entre unidades de transporte
urbano, turístico, particular, de carga y taxis. Para el 2012 la cifra habría aumentado a
más de 45 mil, según el Estudio Origen y Destino elaborado a pedido de la
Municipalidad de Cusco por la Corporación Peruana de Ingenieros en Transporte S.A.
TRANSPORTE PÚBLICO
Son 41 las empresas de transporte público urbano las que están organizadas en 42
rutas y usan dos tipos de vehículos: camionetas rurales (combis) de baja capacidad y
microbuses de mediana capacidad. En total, 5 mil unidades conforman la flota vehicular
de transporte urbano y solo se necesita mil.
29
Apenas el 32% de estas tiene concesión vigente y el 68% restante cuenta con una
autorización excepcional. Las concesiones y permisos excepcionales están vencidas desde
julio de 2011, debido a que la comuna provincial no ha licitado las rutas. “Se estaba a la
espera del estudio Origen y Destino que ahora ya se tiene”, aclaró el regidor Ismael Suta.
Un tema que las megas tendencias actuales, como la globalización y la masificación han
puesto dentro de las prioridades humanas, es la cuestión ambiental, aspecto que viene
generando posiciones antagónicas en unos temas y unanimidad en su tratamiento en
otros.
El problema ambiental surge cuando se toma conciencia de los efectos negativos que
produce el parque automotor en la ciudad capital. Sin embargo solo se genera una
movilización destinada a cambiar dicha situación cuando se toma conciencia de la
posibilidad de resolverla.
PARQUE AUTOMOTOR
COMO UN FACTOR CONTAMINANTE
La contaminación ambiental producido por el parque automotor en la Ciudad de Cusco es
un fenómeno que se presenta sobre todo por la acumulación de gases tóxicos producidos
por los automóviles y que por consiguiente contaminan el aire el cual a su vez al ser
absorbido por la respiración de las personas producen enfermedades como el asma por
ejemplo que a veces pueden llevar a la muerte. También se presentan enfermedades en la
piel, así como el consiguiente daño al sistema ecológico natural.
30
CONSECUENCIAS DEL PROBLEMA
Es cierto que el benceno inhalado durante largo tiempo produce leucemia (linfocítica y
especialmente mielocítica), como lo demostraron experimentalmente los doctores Maltoni y
C. Scarnato en 1977 en la unidad experimental Bentivoglio del Instituto de Oncología de
Boloña, Italia.
Los principales contaminantes del aire emitidos por los escapes de los vehículos son el
monóxido de carbono, los óxidos de nitrógeno, bióxido de azufre y los temibles
hidrocarburos policíclicos condensados (HPC). Dentro de estos últimos debemos
mencionar al metilcolantreno descubierto por H. Wieland y Dane en Alemania en 1933 y
demostrado por J.C. Cook en 1934 en Inglaterra, que es la sustancia química más
cancerígena.
ALTERNATIVAS DE SOLUCION
31
BIBLIOGRAFIA
1.- MINISTERIO DE SALUD. Problemas Ambientales y Comunidad.
3.- http://larepublica.pe/01-09-2012/estudio-de-origen-y-destino-revela-
sobrepoblacion-del-parque-automotor
4.- http://perueconomico.com/ediciones/46/articulos/689
5.- https://www.inei.gob.pe/estadisticas/indice-tematico/sector-statistics/
6.http://www.snieg.mx/contenidos/espanol/normatividad/doctos_genbasica/cuadros_grafi
cas.pdf
7.-www.geocities.ws/ymarte/trab/estpredat.html
8.-www.jorgegalbiati.cl/enero_07/MedidasResumen.pdf
9.-www.fca.proed.unc.edu.ar/mod/book/view.php?id=3270&chapterid=151
32