Académique Documents
Professionnel Documents
Culture Documents
En este trabajo de nuestro objetivo es lograr descifrar de manera amplia todas las ramas de
la estadística, demostrar distintas teorías en base a ejemplos y gráficos, mostrar sus
comienzos y los matemáticos que formaron la estadística con variados aportes a lo largo de
la historia.
También como objetivo nos planteamos explicar que es la estadística y como utilizarla
mediante ejemplos y demostrar gracias a estos mismos ejemplos la utilidad en la vida diaria
de la estadística y que tan necesaria es para la sociedad actual. Y esto se debe a la pregunta
inicial que nos formulamos desde un comienzo ¿Es útil la estadística para el diario vivir de
una persona común?, entendiendo por ‘’persona común’’ alguien que no ocupe la
estadística para su trabajo regularmente, como por ejemplo los políticos.
Explicaremos las distintas formas de ver la estadística con sus distintas variables y sus
distintas formas de cálculo.
La estadística es la ciencia y el método científico que se ocupa de la recogida y obtención
de datos, de su tratamiento para expresarlos numéricamente y de su análisis para extraer
conclusiones a partir de ellos.
Recolectar, organizar, resumir, presentar, y analizar datos son algunas de sus principales
funciones. Esta disciplinar estudia cuantitativamente los fenómenos de masa o colectivos, o
sea, aquellos fenómenos cuyo estudio sólo puede efectuarse a través de una colección de
observaciones.
Ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones.
Según la RAE la definición de estadística es ‘’Estudio de los datos cuantitativos de la
población, de los recursos naturales e industriales, del tráfico o de cualquier otra
manifestación de las sociedades humanas’’ o ‘’ Rama de la matemática que utiliza grandes
conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de
probabilidades’’.
La estadística, forma femenina del alemán Statistik y este derivado del italiano statista
‘’hombre de estado’’
La palabra "estadística" suele utilizarse bajo dos significados distintos:
1. Como colección de datos numéricos.
Esto es el significado más vulgar de la palabra estadística. Se deduce que dichos datos
numéricos han de estar presentados de manera ordenada y sistemática. Una información
numérica cualquiera puede no constituir una estadística, para serlo, los datos han de
constituir un conjunto coherente, establecido de forma sistemática y siguiendo un
criterio de ordenación.
2. Como ciencia.
En este significado, la estadística estudia el comportamiento de los fenómenos de
masas. Como todas las ciencias, busca las características generales de un colectivo y
prescinde de las particulares de cada elemento.
El objetivo de la estadística es hallar las regularidades que se encuentran en los fenómenos
de masa.
Reseña histórica:
Desde los comienzos de la civilización han existido formas sencillas de estadística, ya que
se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y
paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año
3000 a.C. los babilonios igual ocupaban tablillas de arcilla para recopilar datos en tablas
sobre la producción agrícola y de los géneros vendidos.
Los egipcios analizaban los datos de la población y la renta del país mucho antes de
construir las pirámides en el siglo XXXI a.C al igual que los libros bíblicos de números y
crónicas que incluyen datos. El primero contiene dos censos de la población de Israel y el
segundo describe el bienestar material de las diversas tribus judías. En China existían
registros numéricos similares con anterioridad y al igual que los griegos clásicos realizaban
censos cuya información se utilizaba hacia el 594 a.C. para cobrar impuestos.
El imperio romano fue uno de los primeros gobiernos que recopilo gran cantidad de
información acerca de muchas cosas que ocurrían en su población. Durante la edad media
sólo se realizaron algunos censos exhaustivos en Europa. Después de la conquista
normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo. La
información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday
Book.
El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI,
y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations
on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres).
Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, que
fue utilizado como base para la primera tabla de mortalidad.
En el siglo XIX, con la generalización del método científico para estudiar todos los
fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de
reducir la información a valores numéricos para evitar la ambigüedad de las descripciones
verbales.
En el campo moderno de la estadística se emergió a los principios del siglo XX dirigida por
la obra de Francis Galton y Karl Pearson ,quienes transformaron la estadística en
convertirse en una disciplina matemática rigurosa usada por análisis , no solamente en las
ciencia sino en la manufactura y la política. Nacieron conceptos como desviación típica,
correlación, análisis de la regresión y la aplicación de estos métodos al estudio de la
variedad de características (la altura, el peso, entre otras).
En 1918 Ronald Fisher publico The Correlation between Relatives on the Supposition of
Mendelian Inheritance, donde se ve por primera vez utilizado el termino estadístico de
varianza.
En nuestros días, la estadística se ha convertido en un método efectivo para describir con
exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y
físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del
experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el
proceso de interpretación de esa información.
Hoy en día, la estadística es utilizada mucho más allá que solo para el estado como en sus
orígenes, para entender datos y tomar decisiones en ciencias naturales y sociales, negocios,
medicina, etc.
La estadística por lo general no es clasificada como una sub-área de la matemática, sino
como una ciencia diferente aliada a esta.
El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de
la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud,
utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden
utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad
de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un
determinado estudio estadístico.
Biografías:
Pierre de Fermat
Nació el 17 de Agosto de 1601, en Beaumont de Lomagne, Francia, y murió el 12 de Enero
de 1665, en Castres, Francia. Fue uno de los fundadores de la Geometría analítica que
describió en Ad locus planos et solidos isagoge. Junto a Blaise Pascal ambos fueron
cofundadores de la Teoría de la Probabilidad. Es mas conocido por sus aportaciones a la
teoría de los números, en especial por el ultimo teorema de Fermat.
El enunciado del teorema dice que la ecuación no tiene soluciones enteras para
n>2. Fermat afirma que tenía una demostración, pero se exime de darla
argumentado que el margen es demasiado estrecho como para dárnosla.
Consideramos a Gauss como un personaje relevante de la estadística por sus aportes a esta
destacando el método de estimación de mínimos cuadrados, considerando también sus
aportes en algebra, números, física y astronomía.
Karl Pearson
Nació el 27 de Marzo de 1857 en Islington, Reino Unido, y murió el 27 de Abril de 1936 en
Capel, Reino Unido. Es considerado uno de los padres de la estadística moderna. En sus
artículos Mathematical contributions to the theory of evolution, contribuyó en el análisis de
regresión, el coeficiente de correlación y el test de la x2 para determinar la significancia
estadística. Acuño el término de desviación estándar. Estableció la disciplina de la
estadística matemática, también desarrollo una investigación estadística en la biología, con
respecto a la herencia genética, fue el fundador de la bioestadística. Implemento la familia
de distribuciones asimétricas. También se consideran sus aportes en antropología,
biométrica, genética, método científico y teoría estadística.
Consideramos a Galton como un personaje relevante de la estadística por sus aportes tanto
en estadística y los aportes que realizo en otras áreas, gracias a él y su interés por medir los
conocimientos humanos se crearon los primeros test de inteligencia, y fue de gran
importancia la incorporación de métodos estadísticos a la psicología.
Glosario:
Ejemplo: ‘’El municipio de una ciudad está interesada en conocer la cantidad aproximada
de personas de dicha ciudad que practica algún deporte, para ello se realiza una encuesta
a 500 personas de diferentes sectores y edades, entre las cuales 262 personas dijeron que
practicaban solo un deporte y 78 personas más de uno’’.
Población: Es el conjunto de elementos de los que nos interesa obtener información o
tomar decisiones.
Ejemplo: En el párrafo de ejemplo se puede identificar al total de habitantes de la ciudad
como la población.
Muestra: Se llama muestra a una parte de la población a estudiar que sirve para
representarla.
Ejemplo: Basados en el ejemplo se puede afirmar que la muestra en ese caso serían las 500
personas encuestadas.
Elemento: Son las entidades acerca de las que se reúnen datos y que tienen alguna
característica común que es estudiada.
Ejemplo: En el ejemplo se identifica a cada uno de los habitantes de la ciudad como un
elemento.
Variable estadística: que admite distintos valores para la caracterización o clasificación de
un elemento de un Concepto conjunto.
Ejemplo: En el ejemplo se denota ‘’hacer deporte’’ como la característica común entre los
elementos que está siendo estudiada.
Variable cuantitativa: Es aquella característica de la población o de la muestra que es
posible representar numéricamente. Estas pueden ser continuas y discretas.
Ejemplo: En el ejemplo la variable cuantitativa es la característica que puede ser
representada mediante números, en este caso es la cantidad de personas que hace algún
deporte.
Variable discreta: Es una variable cuantitativa. Es la característica de la población, cuyos
valores están representados mediante el conjunto de los números naturales.
Ejemplo: En el ejemplo serían las 262 personas que practican un deporte y las 78 que
practican más de uno.
Variable continua: Es una variable cuantitativa. Es la característica de la población, cuyos
valores están representados mediante el conjunto de los números reales. Puede tomar
cualquier valor real dentro de un intervalo.
Ejemplo: La velocidad de un vehículo puede ser 80,3 Km/hr y después 94 Km/hr.
Variable cualitativa: Es aquella que representa cualidades, atributos o características no
numéricas, y estas pueden ser nominales y ordinales.
Ejemplo: Un ejemplo de esto sería que la encuesta del párrafo de ejemplo se hubiese
preguntado además que deporte se practica y clasificarlos según deporte.
Dato: Conocido también como información, es el valor de la variable asociada a un
elemento de una población o una muestra.
Ejemplo: Datos dentro del ejemplo son las 500 personas encuestadas, así como las 262
personas que hacen algún deporte y las 78 que practican más de un deporte.
Dato cuantitativo: Es aquel dato numérico que representa aspectos de una muestra o una
población que es medible o que se puede contar.
Ejemplo: Dentro del párrafo de ejemplo se encuentran la cantidad de personas encuestadas,
las personas que practican un deporte y las que practican más de uno como un dato
cuantificable.
Análisis de factibilidad: Es el conjunto de actividades que permite determinar si es posible
la captación de datos, con base en la revisión de experiencias previas y la realización de
pruebas.
Categoría: Conjunto objeto de cuantificación y caracterización
Ejemplo: Un ejemplo de categoría sería que en la encuesta hubiesen preguntado que
deporte practicaban dándoles a escoger diferentes tipos de deportes y hacerlos entrar en una
categoría como el futbol, básquetbol, vóleibol, etc.
Censo: Método de generación de información estadística, mediante la obtención de datos
que cada uno de los elementos que conforman el conjunto objeto de estudio. En
determinados contextos puede determinarse inventario.
Tablas de frecuencia: La distribución de frecuencias o tabla de frecuencias es una
ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia
correspondiente.
Ejemplo: Utilizando los datos del párrafo de ejemplo podemos crear una tabla
Practica de deportes fi Fi ni
Ninguno 160 160 0,32
Solo uno 262 422 0,524
Más de uno 78 500 0,156
Ejemplo: Es la parte representada como fi en la tabla anterior y muestra las sumas de los
datos que se repiten para cada categoría, siendo 160 la suma de personas no practica un
deporte, 262 la suma de personas que solo practica uno y 78 la suma de personas que
practica más de un deporte.
Frecuencia absoluta acumulada: Es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado.
Ejemplo: Está representada por el símbolo Fi en la tabla siendo 500 el valor máximo, pues
es el total de personas encuestadas.
Frecuencia relativa: La frecuencia relativa es el cociente entre la frecuencia absoluta de
un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
Clase: Cada una de las modalidades nominales o de intervalos numéricos admitidos por
una variable, a cada una se le asigna su frecuencia correspondiente, cada clase debe ser
excluyente y exhaustiva, es decir, cada elemento debe pertenecer a una clase y todo
elemento debe pertenecer a una clase. Cada clase está delimitada por el límite inferior de la
clase y el límite superior de la clase.
Ejemplo: En la tabla anterior se presentan 5 intervalos o clases distintas que van desde la
clase 1 [10,20[, hasta la clase 5 [50,60[.
Marca de clase: La marca de clase es el punto medio de cada intervalo. Se representa por
ci o xi.
Ejemplo: En la tabla anterior, la marca de clase sería de 15, 25, 35, 45 y 55 para cada
intervalo respectivamente.
Tabla de frecuencia de datos agrupados: La tabla de frecuencia de datos agrupados es
aquella distribución en la que los datos están ordenados en clases y con la frecuencia de
cada clase, los datos originales de varios valores adyacentes del conjunto se combinan para
formar un intervalo de clase. Es empleada generalmente si las variables toman un número
grande de valores o si la variable es continua.
Para construir una tabla de frecuencia de datos agrupados se debe conocer los intervalos y
así determinar la frecuencia absoluta de cada intervalo, luego se calculan las frecuencias
relativas y acumuladas si es pertinente.
Si no se conocen los intervalos, se determina el rango a través del valor máximo y el valor
mínimo, luego se divide el rango en la cantidad de intervalos que se deseen, obteniendo la
amplitud o tamaño de cada intervalo. Comenzando por el mínimo valor de la variable (que
será el extremo inferior del primer intervalo), se suma a este valor la amplitud para obtener
el extremo superior y así sucesivamente determinar los intervalos.
Otra forma de calcular la cantidad de intervalos es aplicando el Método Sturges:
k = 1 + 3,332 log n
k= Numero de clases / n= Tamaño muestral.
Estadígrafos de central: Se utilizan para encontrar un valor que represente a todos los
datos. Las más importantes son: la media aritmética, la moda y la mediana.
Media aritmética: La media aritmética también se llama “media” o “promedio aritmético”.
La media aritmética se calcula dependiendo de cómo vengan los datos, pero en general es la
suma de los datos dividida por el número de datos.
Ejemplo: ‘’Un alumno tiene 3 notas en Física, un 5,2; un 5,5 y un 6,7. Este alumno
presenta un promedio de notas actualmente de 5,8’’.
Media para datos agrupados: Se calcula sumando todos los productos de marca clase con
la frecuencia absoluta respectiva y su resultado dividirlo por el número total de datos:
La mediana es la media aritmética de los dos datos que se encuentran a la mitad de la lista.
Para calcular su posición si la cantidad de datos es par se aplica la siguiente ecuación:
Ejemplo: Utilizando el ejemplo anterior del dado, poniéndonos en el supuesto de que solo
hubiesen sido 6 lanzamientos, entonces si los ordenamos en orden creciente sería de la
siguiente forma 1,2,3,4,4,6. Los datos centrales son ahora el 3 y 4, y su promedio viene
siendo 3,5, por lo tanto la mediana en este caso es de 3,5.
Moda: La moda es la medida que se relaciona con la frecuencia con que se presenta el dato
o los datos con mayor incidencia, con lo que se considera la posibilidad de que exista más
de una moda para un conjunto de datos. Esta medida se puede aparecer tanto para datos
cualitativos como cuantitativos. Se dice que cuando un conjunto de datos tiene una moda la
muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene más
de un dato repetido se dice que es multimodal y un último caso es cuando ningún dato tiene
una frecuencia, en dicho caso se dice que la muestra es amodal.
Ejemplo: Para el ejemplo anterior del dado la moda sería bimodal, siendo las caras con el 3
y 4 las modas.
Moda para datos agrupados: Es el valor que representa la mayor frecuencia absoluta. En
tablas de frecuencias con datos agrupados, hablaremos de intervalo modal.
La moda se representa por Mo.
Mo= Li + {( fi - fi-1) / ( fi - fi-1) + ( fi - fi+1)} x ti
Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).
fi Frecuencia absoluta del intervalo modal.
fi-1 Frecuencia absoluta del intervalo anterior al modal.
fi+1 Frecuencia absoluta del intervalo posterior al modal.
ti Amplitud de los intervalos.
Ejemplo: El intervalo modal en la tabla de ejemplo vendría siendo el primer intervalo, con
una frecuencia de 220, y la moda según la fórmula es de 17,38 o 17 aproximadamente.
10 + {(220 – 0) / [(220-0) + (220-142)]} x 10 = 17,38
Moda para datos no agrupados: Para determinar la moda se busca el valor más frecuente
o el que más se repite de todos los datos.
Ejemplo: ‘’En un curso de 10 alumnos, en una prueba de historia hubo las siguientes
notas: 3,7 – 4,4 – 4,7 – 5,0 – 5,0 – 5,0 – 5,7 – 6,1 – 6,3 – 6,9’’. Siendo claramente la moda
5,0, ya que es el dato que más se repite.
Estadígrafos de posición: Llamados también cuantiles, son medidas de posición que se
determinan mediante un método que determina la ubicación de los valores que dividen un
conjunto de observaciones en partes iguales.
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en
intervalos que comprenden el mismo número de valores. Cuando la distribución contiene
un número alto de intervalos o de marcas y se requiere obtener un promedio de una parte de
ella, se puede dividir la distribución en cuatro, en cinco, en diez o en cien partes.
Ejemplo: ‘’Se escogen 200 personas al azar de una ciudad con diferentes ingresos
económicos para un estudio y se ordenan por orden creciente según sus ingresos, a las
personas que pertenezcan al primer cuartil (25% de la muestra) se les considera pobres,
sin embargo a solo se le considerará ricos a las personas pertenecientes al quinto quintil
(20% de la muestra) ’’.
Podemos identificar claramente el uso de cuantiles para la agrupación de los datos.
Deciles: Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales, son también un caso particular de los percentiles. Los
deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Ejemplo: Utilizando el ejemplo anterior, se puede interpretar que la gente perteneciente a
los últimos 2 deciles conforman las personas más ricas de la encuesta.
Deciles para datos agrupados: Para datos agrupados los deciles se calculan mediante la
fórmula.
Cuando n es par:
A x n /10
Cuando n es impar:
A (n+1) / 10
Siendo A el número del decil.
Ejemplo: En base al ejemplo utilizado en los cuantiles, si calculamos el noveno decil, sería
de la siguiente forma:
9 x 200/10 = 180
Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la
mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto
(25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual
o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de
datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una
tabla de frecuencia.
Ejemplo: En el ejemplo de los cuantiles, se puede apreciar que a la gente considerada pobre
pertenece al primer cuartil, Q1.
Cuartiles para datos agrupados: Para datos agrupados los cuartiles se calculan mediante
la fórmula.
QK= LK + {[k(n/4) - Fk ] / fk } x c
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Para determinar Q1:
Q1 = Li + [(P – Fa-1)/ fi] x lc ; P= n/4
Para determinar Q2:
Q1 = Li + [(P – Fa-1)/ fi] x lc ; P= 2n/4
Para determinar Q3:
Q1 = Li + [(P – Fa-1)/ fi] x lc ; P= 3n/4
Dónde:
Li = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
Fi = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Ejemplo: Basados en la tabla de ejemplo de datos agrupados, calcularemos el tercer cuartil
30 + [(375 – 362)/100] x 10 = 31,3
Cuartiles para datos no agrupados: Si se tienen una serie de valores X1, X2, X3... Xn, se
localiza mediante las siguientes fórmulas:
Cuando n es par:
A x n/4
Cuando n es impar:
A (n+1)/4
Siendo A el número del cuartil.
Ejemplo: En base al ejemplo utilizado en los cuantiles, si calculamos el tercer cuartil, sería
de la siguiente forma:
X3= 3x200 /4= 150
Quintiles: Un quintil es la quinta parte de una población estadística ordenada de menor a
mayor en alguna característica de esta. Corresponde a dos deciles, o a veinte percentiles.
Ejemplo: En el ejemplo de los cuantiles, se puede apreciar que a la gente considerada rica
pertenece al último quintil, Q5.
Quintiles para datos agrupados: Para datos agrupados los quintiles se calculan mediante
la fórmula.
k= 1, 2,3, 4
Dónde:
Lk = Límite real inferior de la clase del quintil k
n = Número de datos
Fk-1 = Frecuencia acumulada de la clase que antecede a la clase del quintil k.
fk = Frecuencia de la clase del quintil k
c = Longitud del intervalo de la clase del quintil k
Ejemplo: Basados en la tabla de ejemplo de datos agrupados, calcularemos el segundo
quintil:
10+ {[2(500/5)-0]/220} x10= 19,09
Quintiles para datos no agrupados: Si se tienen una serie de valores X1, X2, X3, X4, se
localiza mediante las siguientes fórmulas:
Para los quintiles, cuando n es par:
(A*n) /5
Cuando n es impar:
(A*(n+1)) /5
Siendo A el número del quintil.
Ejemplo: En base al ejemplo utilizado en los cuantiles, si calculamos el cuarto quintil, sería
de la siguiente forma:
4x200/5 = 160
Centiles o percentiles: Los percentiles son, tal vez, las medidas más utilizadas para
propósitos de ubicación o clasificación de las personas cuando atienden características tales
como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien
partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales
el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,...,
percentil 99.
Ejemplo: En el ejemplo de los cuantiles, se puede apreciar que a la gente considerada clase
media pertenece desde el percentil 26 hasta el percentil 79.
Percentiles para datos agrupados: Cuando los datos están agrupados en una tabla de
frecuencias, se calculan mediante la fórmula:
k= 1, 2, 3,... 99
Dónde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Ejemplo: Basados en la tabla de ejemplo de datos agrupados, calcularemos el percentil 39:
10+ {[39(500/100)-0]/220} x10= 18,86
Percentiles para datos no agrupados: Si se tienen una serie de valores X1, X2, X3,... Xn,
se localiza mediante las siguientes fórmulas:
Para los percentiles, cuando n es par:
A x n/ 100
A (n+1)/100Cuando n es impar:
Siendo A, el número del percentil.
Ejemplo: En base al ejemplo utilizado en los cuantiles, si calculamos el percentil 79, sería
de la siguiente forma:
79x200/100 = 158
Estadígrafos de dispersión: Las medidas de dispersión nos informan sobre cuánto se
alejan del centro los valores de la distribución.
Desviación media para datos no agrupados: La desviación respecto a la media es
la diferencia entre cada valor de la variable estadística y la media aritmética. La desviación
media es la media aritmética de los valores absolutos de las desviaciones respecto a la
media. Se representa por DX. Se calcula de la siguiente forma:
x n Marca de clase
x Media de los datos
N Número de datos
Ejemplo: Basados en el ejemplo del dado en la media para datos no agrupados, la varianza
es de 2,2
[(3-3,285)2+(6-3,285)2+(4-3,285)2+(4-3,285)2+(1-3,285)2+(2-3,285)2+(3-3,285)2]/7= 2,2
Varianza para datos agrupados: La varianza para datos agrupados se calcula de la
f (x x)2 f2 (x 2 x)2 ... fn (x n x)2
siguiente forma 2 1 1 , o también con la
f1 f2 ... fn
sumatoria de la marca de clase al cuadrado dividido en la frecuencia acumulada total menos
la media al cuadrado.
Ejemplo: Basados en la tabla de ejemplo de datos agrupados, calcularemos la varianza:
[(152x220)+(252x142)+(352x100)+(452x35)+(552x3)]/500-24,182= 87,7276
Desviación estándar para datos no agrupados: Corresponde a la medida del grado de
dispersión de los datos con respecto al valor promedio (entre mayor es la desviación, más
disperso es el conjunto). Se calcula como la raíz cuadrada de la varianza del conjunto. Se
representa por . Se calcula de la siguiente forma:
250
200
Ningun deporte
150
Un deporte
Más de un deporte
100
50
0
Personas
Gráfico de líneas: Es un gráfico que usa puntos conectados por líneas para mostrar cómo
cambia el valor de algo.
Ejemplo: ‘’Un automóvil que va a 80 km/hr divisa una vaca en la carretera por lo que baja
su velocidad a 30 Km/hr en 10 segundos, 30 segundos después, al pasar a la vaca el
automóvil acelera hasta alcanzar los 90 km/hr y luego avanza a esa velocidad’’.
Velocidad (Km/hr)
100
80
60
40 Velocidad (Km/hr)
20
0
0 seg 10 seg 20 seg 30 seg 40 seg 50 seg
1
2
3
4
5
6
Ejemplo: En base al ejemplo utilizado en los cuantiles se grafican los cuartiles según el
diagrama de cajas
0 200
50 100 150
Encuesta:
Para comprobar todos los estadígrafos y fórmulas explicadas en el glosario realizamos una
encuesta a las personas acerca de ‘’El sistema de salud en Chile’’ con el fin de obtener
datos que poder utilizar y tabular, la encuesta fue respondida por 128 personas de diferentes
rangos etarios, pero con una mayor tendencia a la gente joven.
Resultados
Sí No A veces Ns/Nr
Respuesta fi Fi ni
Si 2 2 0,015
No 72 74 0,5625
A veces 52 126 0,4
Ns/Nr 2 128 0,015
Media: 128/4 =32 La media en respuestas debería ser de 32.
Mediana: (64+65)/2 = 64,5 La mediana se ubica entre las personas que dijeron que no.
Moda: La moda se encuentra con las personas que dijeron que no.
Tabla de frecuencias para las personas que respondieron ‘’Si’’.
Edad fi Fi ni
[14,18[ 1 1 0,5
[18,22[ 0 1 0
[22,26[ 1 2 0,5
[26,30] 0 2 0
No
58%
Si No Ns/Nr
l
Opciones de respuesta Respuestas
Si 28,13%
36
No 57,81%
74
Ns/Nr 14,06%
18
Total 128
Respuesta fi Fi ni
Si 36 36 0,28
No 74 110 0,578
Ns/Nr 18 128 0,14
Media: 128/3 =42,67 La media en respuestas debería ser de 42,67.
Mediana: (64+65)/2 = 64,5 La mediana se ubica entre las personas que dijeron que no.
Moda: La moda se encuentra con las personas que dijeron que no.
Tabla de frecuencias para las personas que respondieron ‘’Si’’.
Edad fi Fi ni
[14,18[ 7 7 0,194
[18,22[ 9 16 0,25
[22,26[ 17 33 0,47
[26,30] 3 36 0,083
Respuesta fi Fi ni
Si 62 62 0.4844
No 44 106 0.3438
Ns/Nr 14 120 0.11
¿Muy graves? Si 8 128 0.0625
Media: 128/4 = 32 La media en respuestas debería ser de 32.
Mediana: (64+65)/2 = 64,5 La mediana se ubica entre las personas que dijeron que no.
Respuesta fi Fi ni
Isapre 54 54 0.421
Fonasa 66 120 0.515
Ninguno 6 126 0.0468
Otro 2 128 0.0156
Media: 128/4 = 32 La media en respuestas debería ser de 32.
Mediana: (64+65)/2 = 64,5 La mediana se ubica entre las personas que dijeron que no.
Moda: la moda se encuentra entre las personas que dijeron Fonasa.
Tabla de frecuencias para las personas que respondieron ‘’Isapre’’.
Edad fi Fi ni
[14,18[ 22 22 0.407
[18,22[ 15 37 0.277
[22,26[ 13 50 0.2407
[26,30] 4 54 0.074
Si No Ns/Nr
Respuesta fi Fi ni
Si 14 14 0,109
No 96 110 0,75
Ns/Nr 18 128 0,14
Media: 128/3 =42,67 La media en respuestas debería ser de 42,67.
Mediana: (64+65)/2 = 64,5 La mediana se ubica entre las personas que dijeron que no.
Moda: La moda se encuentra con las personas que dijeron que no.
Tabla de frecuencias para las personas que respondieron ‘’Si’’.
Edad fi Fi ni
[14,18[ 7 7 0,5
[18,22[ 5 12 0,416
[22,26[ 2 14 0,166
[26,30] 0 14 0
Respuesta fi Fi ni
Si 24 24 0,1875
No 16 40 0,125
Podría se mejor 78 118 0,609
Ns/Nr 10 128 0,078
Media: 128/4 =32 La media en respuestas debería ser de 32.
Mediana: (64+65)/2 = 64,5 La mediana se ubica entre las personas que dijeron que no.
Moda: La moda se encuentra con las personas que dijeron que podría ser mejor
Tabla de frecuencias para las personas que respondieron ‘’Si’’.
Edad fi Fi ni
[14,18[ 0 0 0
[18,22[ 4 4 0,166
[22,26[ 17 21 0,375
[26,30] 3 24 0,458
Respuesta fi Fi ni
Si 100 100 0,7813
No 18 118 0,1406
Ns/Nr 10 128 0,0781
Conclusión: Como conclusión de esta pregunta, en base a los datos obtenidos por medio de
la encuesta, podemos inferir que la gran mayoría de los encuestados está de acuerdo con
respecto a la cantidad de especialistas en el área de la salud en Chile, considerando que la
mayoría de los encuestados son menores de edad, cabe considerar que casi el 15%
considera que la cantidad de especialistas es la adecuada.
¿Considera la atención médica de calidad un derecho básico que debe proporcionar el
estado?
Respondidas: 128
Omitidas: 0
Respuestas
Respuesta fi Fi ni
Si 114 114 0,89
No 2 116 0,015
A veces 10 126 0,078
Ns/Nr 2 128 0,015
Media: 128/4 =32 La media en respuestas debería ser de 32.
Mediana: (64+65)/2 = 64,5 La mediana se ubica entre las personas que dijeron que no.
Moda: La moda se encuentra con las personas que dijeron que si.
Tabla de frecuencias para las personas que respondieron ‘’Si’’.
Edad fi Fi ni
[14,18[ 43 43 0,377
[18,22[ 33 76 0,289
[22,26[ 32 108 0,28
[26,30] 6 114 0,052
Media: (16x10)/ 10= 16 La media de edad de personas que respondieron ‘’A veces’’ es de
16.
Mediana: 14+ [(5-0)/10] x4= 16 La mediana en orden creciente de edad de personas que
respondieron ‘’A veces’’ es de 16 y se ubica en el intervalo [14,18[.
Moda: 14+ [(10-0)/(10-0)+ (10-0)] x4= 16 La moda en edad de personas que respondieron
‘’A veces’’ es de 16 y se encuentra en el intervalo [14,18[.
Varianza: (162x10)/ 10+ {(16x10)/ 10}2= 512 La varianza es de 512
Desviación estándar: √ {(162x10)/ 10+ {(16x10)/ 10}2}= 22,62 La desviación estándar es
de 22,62.
Tabla de frecuencias para las personas que respondieron ‘’Ns/Nr’’.
Edad fi Fi ni
[14,18[ 2 2 1
[18,22[ 0 2 0
[22,26[ 0 2 0
[26,30] 0 2 0
Respuesta fi Fi ni
Estado 113 113 0,889
Privados 14 127 0,11
Media: 127/2 =63,5 La media en respuestas debería ser de 63,5.
Mediana: 64 La mediana se ubica entre las personas que dijeron estado.
Moda: La moda se encuentra con las personas que dijeron que estado.
Tabla de frecuencias para las personas que respondieron ‘’Estado’’.
Edad fi Fi ni
[14,18[ 42 42 0,37
[18,22[ 33 75 0,29
[22,26[ 32 107 0,28
[26,30] 6 113 0,05
Edad fi Fi ni
[14,18[ 14 14 1
[18,22[ 0 14 0
[22,26[ 0 14 0
[26,30] 0 14 0