Vous êtes sur la page 1sur 41

1

INSTITUTO TECNOLGICO
DE CAMPECHE

CARRERA:
INGENIERA EN ADMINISTRACIN
MATERIA:
ESTADISTICA I
ACREDITADA A LA UNIDAD NMERO: 1
TEMA DE INVESTIGACION:
ESTADSTICA DESCRIPTIVA
ALUMNA:
CAHUICH NOH SHEYLA AURORA
MAESTRO:
RAMON AGUSTIN BOCOS PATRON
GRADO:
3 SEMESTRE
GRUPO:
VD3
FECHA DE ENTREGA:
2 DE SEPTIEMBRE 2015

2
NDICE

que es un ensayo?...................................................................3
qu es la estadstica moderna?.................................................4
por qu estudiar estadstica?....................................................5
partes en que se divide la estadstica moderna para su estudio ...6
el mtodo cientfico en la estadstica..........................................6
mtodos para la obtencin de datos, principio "bebs". ................7
cmo recolectar datos?............................................................7
tipos de datos estadsticos.........................................................8
propiedades que describen una serie numrica de datos .............9
medidas de tendencia central para cantid. pequeas.................11
comparacin entre la media, mediana y moda...........................15
medidas de dispersin para cantidades pequeas de datos ......16
el manejo de grandes cantidades de datos................................19
medidas de tendencia central para datos agrupados.................20
medidas de posicin................................................................24
medidas de dispersin para datos agrupados...........................27
histograma, polgono de frecuencia y ojivas.............................29
importancia de la forma de los datos........................................32
grafica para datos cualitativos o categricos............................34
QU ES UN ENSAYO?

3
El ensayo es un gnero literario que se caracteriza
por permitir desarrollar un tema
determinado de una manera libre y personal. Comnmente, las personas escriben
ensayos para manifestar alguna opinin o idea, y sin tener que preocuparse de
ceirse a una estructura rgida de redaccin o documentarlo exhaustivamente.

Ensayo expositivo. Ensayo argumentativo. Ensayo crtico.


Estas tres denominaciones pueden prestarse a cierta confusin. En verdad, se
trata siempre del mismo tipo de obra. Esas expresiones se suelen usar en ciertos
contextos, especialmente en el acadmico, ya sea en la secundaria o en la
universidad. Por ejemplo, con la expresin de ensayo crtico se quiere resaltar que
es un escrito en el cual lo ms importante es lo que piense su autor, su crtica.
Todo ensayo, es una exposicin de ideas, basada en argumentos, por eso es
expositivo y argumentativo, y al mismo tiempo es crtica, ya que se est juzgando
una determinada cuestin.
CMO ESCRIBIR UN ENSAYO.
Escribir un ensayo siempre implica esa expresin personal del autor en sus ideas.
No existe un mtodo a seguir o unas reglas precisas.
Sin embargo, es posible tener en cuenta algunos consejos y sugerencias,
especialmente en los casos para aquellas personas que por primera vez desean
adentrarse al estilo ensaystico.
CARACTERISTICAS

DE

UN

ENSAYO

Aunque sea difcil describir todas las caractersticas de un ensayo por ser un
gnero literario esencialmente libre, podemos resumir sus principales caracteres
en la siguiente lista:
- Libertad temtica
- Estilo personal o amistoso en la escritura
- Puede incluir citas o referencias
- Sin una estructura definida, el autor escoge el orden en que desarrolla su
argumento

- Su extensin depende del autor

- Dirigido generalmente a un pblico amplio


QU ES LA ESTADSTICA MODERNA?
Al proporcionar herramientas metodolgicas generales para analizar la
variabilidad, determinar relaciones entre variables, disear en forma ptima
estudios y experimentos y mejorar las predicciones y toma de decisiones en
situaciones de incertidumbre. Las tcnicas estadsticas se aplican de manera
amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades;
estudios de consumidores; anlisis de resultados en deportes; administradores de
instituciones; en la educacin; organismos polticos; mdicos; y por otras personas
que intervienen en la toma de decisiones.
La estadstica es una ciencia formal y una herramienta que estudia el uso y los
anlisis provenientes de una muestra representativa de datos, busca explicar las
correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en
forma aleatoria o condicional.
Sin embargo, la estadstica es ms que eso, es decir, es la herramienta
fundamental que permite llevar a cabo el proceso relacionado de la estadstica con
la investigacin cientfica.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta
las ciencias sociales, desde la ciencia de la salud hasta el control de calidad.
Se usa para la toma
instituciones gubernamentales.

de

decisiones

en

reas

de negocios o

La estadstica se divide en dos grandes reas:


1. Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen
de datos originados a partir de los fenmenos de estudio. Los datos
pueden ser resumidos numrica o grficamente. Ejemplos bsicos de
parmetros estadsticos son: la media y la desviacin estndar. Algunos
ejemplos grficos son: histograma, pirmide poblacional, grafico circular,
entre otros.
2. Estadstica inferencial: Se dedica a la generacin de los modelos,
inferencias y predicciones asociadas a los fenmenos en cuestin teniendo
en cuenta la aleatoriedad de las observaciones. Se usa para modelar

patrones en los datos y extraer5inferencias acerca de la poblacin bajo


estudio. Estas inferencias pueden tomar la forma de respuestas a
preguntas s/no (prueba de hiptesis), estimaciones de unas caractersticas
numricas
(estimacin), pronsticos de
futuras
observaciones,
descripciones de asociacin (correlacin) o modelamiento de relaciones
entre variables (anlisis de regresin). Otras tcnicas de modelamiento
incluyen anlisis de varianza, series de tiempo y minera de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. La
estadstica inferencial, por su parte, se divide en estadstica paramtrica y
estadstica no paramtrica.
Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a las
bases tericas de la materia.
POR QU ESTUDIAR ESTADSTICA?
La primera razn es que la informacin numrica est en todas partes. Por
ejemplo en los peridicos, revistas de noticias, revistas de negocios, revistas de
inters general, revistas del hogar, revistas deportivas, revistas de coches, noticias
de televisin, radio, etc.se encuentra gran informacin numrica. Para ser
consumidores educados en esta informacin, es necesario poder leer las tablas y
grficas, as como entender el anlisis de la informacin numrica
Una segunda razn para tomar un curso de estadstica es que las tcnicas
estadsticas se utilizan para tomar decisiones que afectan nuestra vida diaria, que
afectan
nuestro
bienestar
personal.
Una tercera razn es que el conocimiento de los mtodos estadsticos ayudar a
entender cmo se toman las decisiones y a comprender de qu manera nos
afectan.
En cualquier lnea de trabajo habr que tomar decisiones en las que el
entendimiento
del
anlisis
de
datos
ser
muy
til.
La estadstica nos va a ayudar a seleccionar las conclusiones generales ms
adecuadas a partir de datos parciales y representativos. Distinguiremos los tres
campos bsicos de la Estadstica: la estadstica descriptiva, el clculo de
probabilidades
y
la
estadstica
inferencial.
La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa o
cualitativa referente a individuos, grupos, series de hechos, etc. Analizar los datos
obtenidos y deducir; a partir de este anlisis y mediante tcnicas propias,
conclusiones generales o previsiones para el futuro con cierto grado de
incertidumbre.

6 que expresan distintas cualidades,


Variables cualitativas: Son las variables
caractersticas o modalidad. Cada modalidad que se presenta se denomina
atributo o categora y la medicin consiste en una clasificacin de dichos atributos.

PARTES EN QUE SE DIVIDE LA ESTADSTICA MODERNA PARA SU ESTUDIO

La estadstica puede dividirse en dos reas: estadstica descriptiva y estadstica


inferencias.
La estadstica descriptiva, que se dedica a los mtodos de recoleccin,
descripcin, visualizacin y resumen de datos originados a partir de los fenmenos
en estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos
bsicos de descriptores numricos son la media y la desviacin estndar.
Resmenes grficos incluyen varios tipos de figuras y grficos.
La estadstica inferencia o inductiva, que se dedica a la generacin de los
modelos, inferencias y predicciones asociadas a los fenmenos en cuestin
teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para
modelar patrones en los datos y extraer inferencias acerca de la poblacin de
estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no
(prueba de hiptesis), estimaciones de caractersticas numricas (estimacin),
preclasificacin
clsica
de
la
estadstica.
EL MTODO CIENTFICO EN LA ESTADSTICA
El mtodo cientfico es un conjunto de principios y procedimientos para la
bsqueda sistemtica del conocimiento.
El mtodo cientfico est compuesto por los siguientes pasos:
1. Formula una teora (problema).
2. Recoger datos para probar la teora.
3. Analizar los datos.
4. Interpretar los resultados y tomar una decisin.
El mtodo cientfico es un procedimiento iterativo de aprendizaje. No podemos
tener certeza de la veracidad de las teoras que probemos usando el mtodo
cientfico, eso es inherente a la ciencia. La ciencia est, por lo tanto, todo el tiempo
revisando sus teoras. La Estadstica no es un conjunto de diferentes tcnicas
aisladas unas de otras, sino que la Estadstica, en conjunto con el mtodo
cientfico, nos entrega un procedimiento analtico para tomar decisiones.

Los mtodos estadsticos utilizan el mtodo cientfico, que consiste en cinco pasos
bsicos:
1. Definir cuidadosamente el problema. Asegurarse de que est claro el objeto de
un estudio o un anlisis.
2. Formular un plan para recopilar los datos necesarios.
3. Reunir los datos.
4. Analizar e interpretar los mismos.
5. Anotar las conclusiones y otros descubrimientos, de manera que sean
fcilmente comprendidos por los que utilizarn los resultados al tomar decisiones.
Datos Estadsticos Los datos estadsticos se obtienen mediante un proceso que
comprende la observacin o medicin de conceptos como: Ingresos anuales en
una comunidad.
Calificaciones de exmenes.
Cantidad de caf por taza despachada por una mquina vendedora.
Resistencia a la rotura de fibras de plstico.
Porcentaje de azcar en cereales, etc.
Tales conceptos tambin reciben el nombre de variables, ya que producen valores
que tienden a mostrar cierto grado de variabilidad, al efectuarse mediciones
Sucesivas.
MTODOS

PARA

LA

OBTENCIN

DE

DATOS,

PRINCIPIO

"BEBS".

La forma de obtener la informacin original de las unidades de anlisis que


componen el universo por investigar puede ser efectuada a travs de un censo,
una
encuesta
o
un
registro
administrativo.
Una variante reciente de GIGO lo traduce como (Entra Basura, basura Sale). Esto
describe la tendencia de la gente de aceptar el rendimiento de un sistema sin
juzgarlo crticamente. Aun si la entrada es basura, creemos en el resultado,
normalmente porque no entendemos bien cmo funciona el sistema para
producirlo. Esto se llama a veces la fe ciega. Si entra basura en el proceso de
riesgo puede haber una falta de objetivos convenidos, identificacin de riesgo
inadecuada o perezosa, o el uso de respuestas al riesgo poco apropiadas.
CMO RECOLECTAR DATOS?
La recoleccin de datos, se puede definir como: al medio a travs del cual el
investigador se relaciona con los participantes para obtener la informacin
necesaria que le permita lograr los objetivos de la investigacin.

De modo que para recolectar la informacin hay que tener presente:


1. Seleccionar un instrumento de medicin el cual debe ser vlido y confiable para
poder aceptar los resultados
2. Aplicar dicho instrumento de medicin
3. Organizar las mediciones obtenidas, para poder analizarlos
TIPOS DE DATOS ESTADSTICOS
Existen varios tipos de datos estadsticos, que se agrupan en dos clasificaciones:
datos
de
caractersticas
cuantitativas
y
cualitativas.
Los
datos
de
caractersticas
cuantitativas:
Son aquellos que se pueden expresar numricamente y se obtienen a travs de
mediciones y conteos. Un dato cuantitativo se puede encontrar en cualquier
disciplina; sicologa, contabilidad, economa, publicidad, etc.
Se

clasifican

en:

1-Variables continas: Es cuando los datos estadsticos se generan a travs de un


proceso de medicin se dice que estos son datos continuos; son aquellas que
aceptan valores en cualquier punto fraccionario de un determinado intervalo, o
sea,
que
aceptan
fraccionamiento
en
un
determinado
intervalo.
2-Variables discretas: Se generan a travs de un proceso de conteo. Son aquellas
que no aceptan valores en puntos fraccionarios dentro de un determinado
intervalo, o sea, son aquellas que no aceptan fraccionamiento dentro de un
determinado
intervalo.
Datos
de
caractersticas
cualitativas:
Los datos de caractersticas cualitativas son aquellos que no se pueden expresar
numricamente. Estos datos se deben convertir a valores numricos antes de que
se
trabaje
con
ellos.
Los

datos

de

caractersticas

cualitativas

se

clasifican

en:

1-Datos nominales: Comprenden categoras, como el sexo, carrera de estudio,


material de los pisos, calificaciones, etc. Las caractersticas mencionadas no son
numricas por su naturaleza, pero cuando se aplican, ya sea en una poblacin o

9
una muestra, es posible asignar a cada elemento
una categora y contar l nmero
que corresponde a cada elemento. De esta manera estas caractersticas se
convierten
en
numricas.

2-Datos jerarquizados: Es un tipo de datos de caractersticas cualitativas que se


refiere a las evaluaciones subjetivas cuando los conceptos se jerarquizan segn la
preferencia o logro. Las posiciones de una competencia de atletismo se
jerarquizan
en
primer
lugar,
segundo
lugar,
tercer
lugar,
etc.
Tanto los datos nominales como los jerarquizados, que por su naturaleza no son
numricas,
se
convierten
en
"datos
discretos".
Existe otro tipo de datos que por su naturaleza especial pueden ser clasificados
segn tu conveniencia, estos son los cronolgicos, por ejemplo los aos de la
historia 2005,2006, 2007 puedes usarlos como discretos (aos enteros), continuos
(aos con subdivisiones en decimales de ao), nominales (por el nombre) o
jerarquizados (ordenados), depende del uso que se le van a dar.
Variable contina
Son aquellas variables que pueden asumir cualquier valor en determinado
intervalo de valores. Caractersticas tales como altura, peso, longitud, espesor,
velocidad, temperatura, etc., quedan dentro de esta categora.
Datos continuos
Son aquellos datos que se obtienen de variables continuas.
Ejemplo:
La cantidad de caf que se vende por da, la gasolina que se expende por hora, la
velocidad del aire, etc.
PROPIEDADES QUE DESCRIBEN UNA SERIE NUMRICA DE DATOS
Propiedades
de
los
datos
numricos.
Las tres mejores propiedades que describe una serie numrica de datos son:
1.

Tendencia central

2.

Variacin

3.

Forma

Si estas mediciones se calculan a partir de una muestra, se denominan


estadsticas, si se calculan a partir de los datos de una poblacin se denominan
parmetros.

Mediciones de tendencia Central

10

La media aritmtica, es el promedio. Se calcula sumando todas las


observaciones y luego dividiendo el total entre el nmero de elementos
involucrados.
La media acta como punto de equilibrio de tal forma que las observaciones
menores compensan a las observaciones que son mayores.
La media aritmtica se ve afectada en gran medida por valores extremos.

La mediana. Es el valor medio de una secuencia ordenada de datos. Si no


hay empates, la mitad de las observaciones sern menores y la otra mitad sern
mayores. La mediana no se ve afectada por valores extremos. Para calcular la
mediana, primero se deben poner los datos en orden. Despus usamos la frmula
del punto de posicionamiento.
El clculo del valor de la media se ve afectado por el nmero de observaciones, no
por la magnitud de cualquier extremo.

La moda. Es el valor de una serie de datos que aparece con ms


frecuencia. La moda no se ve afectada por la ocurrencia de cualquier valor
extremo.

Cuartiles. Los cuartiles son mediciones descriptivas que dividen los datos
ordenados en cuatro cuartos.
Mediciones
de
la
La variacin es la cantidad de dispersin o propagacin en los datos.

Variacin

El rango: es la diferencia entre la mayor y la menor observacin en una


serie de datos. El rango mide la propagacin total en la serie de datos. La
debilidad del rango es que no logra tomar en cuenta la forma en que los datos se
distribuyen realmente entre el mayor y el menor valor. Sera impropio usar el rango
como una medicin cuando uno de o ambos componentes son observaciones
extremas.

El rango inter-cuartil: es la diferencia entre el tercer y primer cuartil. No se


ve influida por valores extremos.

La varianza y la desviacin estndar: a diferencia de las mediciones


anteriores la varianza y la desviacin estndar toman en cuenta como se
distribuyen las observaciones. La Varianza de muestra es el promedio de las
diferencias cuadradas entre cada una de las observaciones de una serie de datos
y la media. La desviacin estndar es simplemente la raz cuadrada de la
varianza. La varianza y la desviacin miden la dispersin promedio alrededor de la

11mayores fluctan por encima de sta y


media, es decir, como las observaciones
como las observaciones menores se distribuyen por debajo de sta.

El Coeficiente de Variacin: es una medida relativa de variacin. Se


expresa como porcentaje antes que en trminos de las unidades de los datos
particulares. Mide la dispersin en los datos relativa a la media.
El coeficiente de variacin es til al comparar la variabilidad de dos o ms series
de datos que se expresan en distintas unidades de medicin.

MEDIDAS DE TENDENCIA CENTRAL PARA CANTIDADES PEQUEAS DE


DATOS

Las medidas de tendencia central se utilizan con bastante frecuencia para resumir
un conjunto de cantidades o datos numricos a fin de describir los datos
cuantitativos que los forman.
Ejemplos de ello, pueden ser: la edad promedio o la estatura promedio de los
estudiantes de la universidad o el peso promedio de las bolsas de cereal que son
llenadas por una determinada mquina en un proceso de produccin o las ventas
de un negocio.
Las medidas de tendencia central son tambin frecuentemente usadas para
comparar un grupo de datos con otro, por ejemplo: el promedio de ventas obtenido
por un grupo de vendedores de una zona comparado con el promedio de ventas
otro grupo de vendedores de otra zona, el promedio de reclamos de clientes de
una sucursal, comparado con el promedio de reclamos de otra sucursal.
Otras caractersticas generales de las medidas de tendencia central son las
siguientes:
Permiten apreciar qu tanto se parecen lo grupos entre s.
Son valores que se calculan para un grupo de datos y que se utiliza para
describirlos de alguna manera.

.Normalmente se desea que el valor sea representativo de todos los valores


incluidos en el grupo.
Es el valor ms representativo o tpico de un grupo de datos, no es el valor ms
pequeo o el ms grande, sino un valor que est en algn punto intermedio del

12 al centro de todos los valores, por ello


grupo, ms exactamente, se acerca a estar
se les llama medidas de tendencia central.

Se utilizan como mecanismo para resumir una caracterstica de un grupo de


datos en particular
. Tambin para comparar un grupo de datos contra otro.
El clculo de las medidas de tendencia central se hace mediante frmulas, las
cuales cambian segn como se encuentren los datos del grupo con el que se va a
trabajar, esto es si estn como Datos no agrupados o como Datos agrupados
(Distribuciones de frecuencias).
Media aritmtica
La media aritmtica (tambin llamada promedio o simplemente media) de un
conjunto finito de nmeros es el valor caracterstico de una serie de datos
cuantitativos objeto de estudio que parte del principio de la esperanza matemtica
o valor esperado, se obtiene a partir de la suma de todos sus valores dividida
entre el nmero de sumandos. Cuando el conjunto es una muestra aleatoria recibe
el nombre de media muestral siendo uno de los principales estadsticos
mustrales.
Expresada de forma ms intuitiva, podemos decir que la media (aritmtica) es la
cantidad total de la variable distribuida a partes iguales entre cada observacin.
Por ejemplo, si en una habitacin hay tres personas, la media de dinero que tienen
en sus bolsillos sera el resultado de tomar todo el dinero de los tres y dividirlo a
partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir
la informacin de una distribucin (dinero en el bolsillo) suponiendo que cada
observacin (persona) tuviera la misma cantidad de la variable.
Tambin la media aritmtica puede ser denominada como centro de gravedad de
una distribucin, el cual no est necesariamente en la mitad.
Una de las limitaciones de la media aritmtica es que se trata de una medida muy
sensible a los valores extremos; valores muy grandes tienden a aumentarla
mientras que valores muy pequeos tienden a reducirla, lo que implica que puede
dejar de ser representativa de la poblacin.
La media aritmtica se calcula sumando todos los componentes y dividiendo el
resultado entre el nmero de componentes. El resultado entero o decimal es la
media aritmtica

Dados los n nmeros

, 13
la media aritmtica se define como:

Por ejemplo, la media aritmtica de 8, 5 y -1 es igual a:

Se utiliza la letra X con una barra horizontal sobre el smbolo para representar la
media de una muestra ( ), mientras que la letra (mu) se usa para la media
aritmtica de una poblacin, es decir, el valor esperado de una variable.
En otras palabras, es la suma de n valores de la variable y luego dividido por n:
donde n es el nmero de sumandos, o en el caso de estadstica el nmero de
datos se da el resultado.
Media ponderada
Es una medida de tendencia central, que es apropiada cuando en un conjunto de
datos cada uno de ellos tiene una importancia relativa (o peso) respecto de los
dems datos. Se obtiene multiplicando cada uno de los datos por su ponderacin
(peso) para luego sumarlos, obteniendo as una suma ponderada; despus se
divide esta entre la suma de los pesos, dando como resultado la media
ponderada.
Para una serie de datos no vaca:

a la que corresponden los pesos:

La media ponderada se calcula de la siguiente manera:

14

Mediana

Representa el valor de la variable de posicin central en un conjunto de datos


ordenados.
Existen dos mtodos para el clculo de la mediana:
1. Considerando los datos en forma individual, sin agruparlos.
2. Utilizando los datos agrupados en intervalos de clase.
A continuacin veamos cada una de ellas:
DATOS SIN AGRUPAR
Sean
los datos de una muestra ordenada en orden creciente y
designando la mediana como
, distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posicin


una vez
que los datos han sido ordenados (en orden creciente o decreciente), porque ste
es el valor central. Es decir:
.
Por ejemplo, si tenemos 5 datos, que ordenados son:
,
,
,
,
=> El valor central es el tercero:
. Este valor,
que es la mediana de ese conjunto de datos, deja dos datos por debajo ( , ) y
otros dos por encima de l ( , ).

b) Si n es par, la mediana es la media aritmtica de los dos valores centrales.


Cuando es par, los dos datos que estn en el centro de la muestra ocupan las
posiciones

. Es decir:

Por ejemplo, si tenemos 6 datos, que ordenados son:


,
,
,
.
Aqu dos valores que estn por debajo del
por

.
,

y otros dos que quedan

Encima del siguiente dato


de datos

15

. Por tanto, la mediana de este grupo

es la media aritmtica de estos dos datos:

DATOS AGRUPADOS

Al tratar con datos agrupados, si coincide con el valor de una frecuencia


acumulada, el valor de la mediana coincidir con la abscisa correspondiente. Si no
coincide con el valor de ninguna abscisa, se calcula a travs de semejanza de
tringulos en el histograma o polgono de frecuencias acumuladas, utilizando la
siguiente equivalencia:

Donde

son las frecuencias absolutas acumuladas tales que

,
y
son los extremos, interior y exterior, del intervalo
donde se alcanza la mediana y
es la abscisa a calcular, la
mediana. Se observa que
es la amplitud de los intervalos
seleccionados para el diagrama.
Moda
Es el valor con una mayor frecuencia en una distribucin de datos.
Se hablar de una distribucin bimodal de los datos adquiridos en una columna
cuando encontremos dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta mxima. Una distribucin tri-modal de los datos es en la que
encontramos tres modas. Si todas las variables tienen la misma frecuencia
diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos estn agrupados, es un punto que divide al intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:

16

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de


los intervalos anterior y posterior, respectivamente, al intervalo modal.

Para obtener la moda en datos agrupados se usa la siguiente frmula:

Dnde:
= -inferior de la clase modal.
= es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal.
= es el delta de frecuencia absoluta modal y la frecuencia absoluta postmodal.
= Amplitud del intervalo modal
COMPARACIN ENTRE LA MEDIA, MEDIANA Y MODA
Si media=moda=mediana, la distribucin es simtrica
Si media > mediana, la distribucin es asimtrica con cola a la derecha
(sesgada a la derecha).
Si media < mediana, la distribucin es asimtrica con cola a la izquierda
(sesgada a la izquierda).

Maneras de recordar la diferencia


La mejor manera de recordar la diferencia entre los tres tipos de nmeros es: la
media es el promedio de los nmeros, la mediana es el valor del medio y la moda
es el nmero que aparece con mayor frecuencia.

MEDIDAS DE DISPERSIN PARA CANTIDADES PEQUEAS DE DATOS


Tambin llamadas medidas de variabilidad, muestran la variabilidad de una
distribucin, indicando por medio de un nmero si las diferentes puntuaciones de
una variable estn muy alejadas de la media. Cuanto mayor sea ese valor, mayor

ser la variabilidad, y cuanto menor sea,17ms homognea ser a la media. As se


sabe si todos los casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan
dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (desviacin media) y otra es tomando las
desviaciones al cuadrado (varianza).
Las medidas de dispersin, variabilidad o variacin nos indican si esos datos estn
prximos entre s o s estn dispersos, es decir, nos indican cun esparcidos se
encuentran los datos. Estas medidas de dispersin nos permiten apreciar la
distancia que existe entre los datos a un cierto valor central e identificar la
concentracin de los mismos en un cierto sector de la distribucin, es decir,
permiten estimar cun dispersas estn dos o ms distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un
conjunto de datos, siendo la media aritmtica el dato central ms utilizado. Cuando
existe una dispersin pequea se dice que los datos estn dispersos o
acumulados cercanamente respecto a un valor central, en este caso el dato
central es un valor muy representativo. En el caso que la dispersin sea grande el
valor central no es muy confiable. Cuando una distribucin de datos tiene poca
dispersin toma el nombre de distribucin homognea y si su dispersin es alta se
llama heterognea.
Rango
Es un intervalo entre el acceso autorizado y el valor mnimo; por ello,
comparte unidades con lo obtener una idea de la dispersin de los datos, cuanto
mayor es los rangos, ms dispersos estn los datos de un grupo Por ejemplo, para
una serie de datos de carcter cuantitativo, como lo es la estatura medida en
centmetro tendramos:

es posible ordenar los datos como sigue:

Donde la notacin indica que se18


trata del elemento i-psimo de la serie de
datos. De este modo, el rango sera la diferencia entre el valor mximo (q)
y el mnimo; o, lo que es lo mismo:

En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30.


Varianza
En teora de probabilidad, la varianza (que suele representarse como
) de
una variable aleatoria es una medida de dispersin definida como la esperanza del
cuadrado de la desviacin de dicha variable respecto a su media.
Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable
mide una distancia en metros, la varianza se expresa en metros al cuadrado.
La desviacin estndar es la raz cuadrada de la varianza, es una medida de
dispersin alternativa expresada en las mismas unidades de los datos de la
variable objeto de estudio. La varianza tiene como valor mnimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atpicos y no se aconseja su uso cuando las distribuciones de las variables
aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras
medidas de dispersin ms robustas.
Desviacin estndar
La desviacin tpica o desviacin estndar (denotada con el smbolo o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersin para variables de razn (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raz cuadrada de la varianza de
la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer tambin la desviacin que
presentan los datos en su distribucin respecto de la media aritmtica de dicha
distribucin, con objeto de tener una visin de los mismos ms acorde con la
realidad al momento de describirlos e interpretarlos para la toma de decisiones.

19 grado de dispersin de los datos con


La desviacin tpica es una medida del
respecto al valor promedio. Dicho de otra manera, la desviacin estndar es
simplemente el "promedio" o variacin esperada con respecto a la media
aritmtica.

Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una
tiene una media de 7. Sus desviaciones estndar mustrales son 7, 5 y 1,
respectivamente. La tercera muestra tiene una desviacin mucho menor que las
otras dos porque sus valores estn ms cerca de 7.
La desviacin estndar puede ser interpretada como una medida
de incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da
la precisin de stas. Cuando se va a determinar si un grupo de medidas est de
acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital
importancia: si la media de las medidas est demasiado alejada de
la prediccin (con la distancia medida en desviaciones estndar), entonces
consideramos que las medidas contradicen la teora. Esto es coherente, ya que
las mediciones caen fuera del rango de valores en el cual sera razonable esperar
que ocurrieran si el modelo terico fuera correcto. La desviacin estndar es uno
de tres parmetros de ubicacin central; muestra la agrupacin de los datos
alrededor de un valor central (la media o promedio).
Coeficiente de variacin
En estadstica, cuando se desea hacer referencia a la relacin entre el tamao de
la media y la variabilidad de la variable, se utiliza el coeficiente de variacin.

Su frmula expresa la desviacin estndar como porcentaje de la media


aritmtica, mostrando una mejor interpretacin porcentual del grado de variabilidad
que la desviacin tpica o estndar. Por otro lado presenta problemas ya que a
diferencia de la desviacin tpica este coeficiente es variable ante cambios de
origen. Por ello es importante que todos los valores sean positivos y su media d,
por tanto, un valor positivo. A mayor valor del coeficiente de variacin mayor
heterogeneidad de los valores de la variable; y a menor C.V., mayor
homogeneidad en los valores de la variable. Suele representarse por medio de las
siglas C.V.
Se calcula:

20

Donde es la desviacin tpica, y


ciento calculando:

es la Media. Se puede dar en tanto por

EL MANEJO DE GRANDES CANTIDADES DE DATOS


En ingeniera, como en todas las ramas de la ciencia y la tecnologa, resulta
indispensable el manejo de grandes cantidades de datos. El manejo de estos
datos, se realiza por tcnicas matemticas, que se han compilado en una ciencia
denominada estadstica, que es la encargada del manejo de datos, para describir
los
fenmenos,
pero
ms
importante
an,
para
predecirlos.
En estadstica se conoce como muestreo a la tcnica para la seleccin de una
muestra
a
partir
de
una
poblacin.
Se har referencia sobre el muestreo estadstico, tcnicas, niveles y tipos
fundamentales de un muestreo; se describen conceptos bsicos que explican lo
que esto se refiere al igual se aprecia cmo y qu tipo de tcnicas se pueden
utilizar para poner en practica la realizacin de una auditoria con la finalidad de
obtener una informacin determinada para lograr un objetivo especfico.
El muestreo estadstico es un procedimiento por el que se ingresan los valores
verdaderos de una poblacin a travs de la experiencia obtenida con una muestra
El muestreo como herramienta de la investigacin cientfica arroja resultados que
se pueden utilizar para concluir un determinado estudio X de poblacin, al igual las
tcnicas selectivas que se requieren para dicho estudio de acuerdo a lo que se va
a
evaluar.
El muestreo permite una reduccin considerable de los costos materiales del
estudio, una mayor rapidez en la obtencin de la informacin y el logro de
resultados
con
mxima
calidad.
Se llama frecuencia a la cantidad de veces que se repite un determinado valor de
la variable. Se suelen representar con histogramas y con diagramas de Pareto.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

21 frecuencia es conveniente resumir la


Al describir grupos de observaciones, con
informacin con un solo nmero. Este nmero que, para tal fin, suele situarse
hacia el centro de la distribucin de datos se denomina medida o parmetro de
tendencia central o de centralizacin. Cuando se hace referencia nicamente a la
posicin de estos parmetros dentro de la distribucin, independientemente de
que sta est ms o menos centrada, se habla de estas medidas como medidas
de posicin. En este caso se incluyen tambin los cuantiles entre estas medidas.

Entre las medidas de tendencia central tenemos:


Media
Media ponderada
Media geomtrica
Media armnica
Mediana
Moda
Se debe tener en cuenta que existen variables cualitativas y variables
cuantitativas, por lo que las medidas de posicin o medidas de tendencia se usan
de acuerdo al tipo de variable que se est observando, en este caso se
observan variables cuantitativas.
MEDIA ARITMTICA
La media aritmtica es el valor obtenido por la suma de todos sus valores
dividida entre el nmero de sumadores.
Por ejemplo, las notas de 5 alumnos en una prueba:
Nio
1
2
3
4
5

nota
6,0 Primero, se suman las notas:
5,4
6,0+5,4+3,1+7,0+6,1 = 27,6
3,1 Luego el total se divide entre la cantidad de alumnos:
7,0
27,6/5=5,52
6,1

La media aritmtica en este ejemplo es 5,52


La media aritmtica es, probablemente, uno de los parmetros estadsticos ms
extendidos. Se le llama tambin promedio o, simplemente, media.

22

MEDIANA
La mediana es un valor de la variable que deja por debajo de s a la mitad de los
datos, una vez que stos estn ordenados de menor a mayor. Por ejemplo, la
mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos
hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados
los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

En caso de un nmero par de datos, la mediana no correspondera a ningn


valor de la variable, por lo que se conviene en tomar como mediana el valor
intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce
datos como los siguientes:

Se toma como mediana


Existen mtodos de clculo ms rpidos para datos ms numerosos (vase
el artculo principal dedicado a este parmetro). Del mismo modo, para
valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de
ste, se obtiene un valor concreto por interpolacin.
MODA
La moda es el dato ms repetido de la encuesta, el valor de la variable con
mayor frecuencia absoluta. En cierto sentido la definicin matemtica corresponde
con la locucin "estar de moda", esto es, ser lo que ms se lleva.
Su clculo es extremadamente sencillo, pues solo necesita un recuento. En
variables continuas, expresadas en intervalos, existe el denominado intervalo
modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se
recurre a la interpolacin.

23
Por ejemplo, el nmero de personas en distintos
vehculos en una carretera: 5-7-46-9-5-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5.

Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos


modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima.
Cuando en una distribucin de datos se encuentran tres o ms modas, entonces
es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia
diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se
ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia
absoluta.
La moda, cuando los datos estn agrupados, es un punto que divide el intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:

Siendo
la frecuencia absoluta del intervalo modal y
y
las
frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al
intervalo modal.
Las calificaciones en la asignatura de Matemticas de 39 alumnos de una
clase vienen dadas por la siguiente tabla (debajo):
Calificaciones

Nmero de alumnos

Construccin de una distribucin de frecuencia real


Distribucin de Frecuencias de pesos en Kg de 100 estudiantes.
Clase
A
B
C
D
E

Intervalo de clase
60 62
63 65
66 68
69 71
72 74

Frecuencia
5
18
42
27
8

24
Total
100
Conceptos bsicos. Clase. Es el nmero de subconjuntos en que se han agrupado
los datos. Cada clase se puede denominar mediante una letra, un nmero o
alguna caracterstica del subconjunto.

Intervalo de clase. Es un conjunto de elementos que forman a una clase,


conteniendo un lmite inferior y un lmite superior.
Tamao de clase. Es la diferencia entre dos lmites inferiores o superiores de
clases sucesivas. Frecuencia. Es el nmero de datos que pertenecen a cada
clase.
A) Recopilacin de datos.
B) Ordenamiento de los datos.
C) Determinacin del nmero de clases.
D) Clculo del tamao de clase.
E) Elaboracin de intervalos.
F) Obtencin de frecuencias.
A) Recopilacin de datos. Consiste en escribir los datos de la muestra que nos
interesa conocer, sin importar el orden.
Ejemplo: A continuacin se presentan los datos obtenidos de una muestra de
_____ estudiantes, a quienes se les pregunt su estatura, las cuales se utilizarn
para la elaboracin de la Distribucin de Frecuencias.
Datos no ordenados
1.87 -1.64- 1.57- 1.55- 1.68- 1.55- 1.57 -1.66- 1.64- 1.66- 1.65- 1.64- 1.64- 1.72
1.52- 1.58- 1.56- 1.75- 1.70- 1.70- 1.74- 1.58- 1.75- 1.81- 1.57- 1.72- 1.56- 1.64
1.64- 1.72- 1.62
B) Ordenamiento de los datos. Consiste en ordenar los datos en forma ascendente
o descendente para facilitar el conteo de datos que correspondan a cada uno de
los intervalos. Ejemplo: A continuacin se presenta la tabla de datos ordenados de
las estaturas en metros de _____ estudiantes de 6
Datos ordenados
1.52 -1.55- 1.55- 1.56- 1.56- 1.57- 1.57- 1.57- 1.58- 1.58- 1.62- 1.64- 1.64- 1.64
1.64- 1.64- 1.64- 1.65- 1.66- 1.66- 1.68- 1.70- 1.70- 1.72- 1.72- 1.72- 1.74- 1.75
1.75- 1.81- 1.87
C) Determinacin del nmero de clases. El nmero de clases en que se agrupan
los datos se determina con la raz cuadrada del nmero de datos cuando este es
menor de 200.
Nmero de clases raz de nmero de datos

25
Para muestras con 200 o ms datos el nmero
de clases se determina con la raz
cbica del nmero de datos.

Nmero de clases raz cubica de Nmeros de datos


Ejemplo: Determinar el nmero de clases de la muestra de las estaturas de los
alumnos de 6
D) Clculo del tamao de clase. Para determinar el tamao de clase es necesario
conocer el rango de la muestra, que se obtiene con la diferencia entre el dato
mayor y el dato menor de la muestra y se representa con la letra R.
R dato mayor dato menor
El tamao de clase se obtiene al dividir el rango entre el nmero de clases, y se
representa con la letra c.
Tamao de clases= rango/ Nmero de clase
C R /raz de nmero de datos
E) Elaboracin de intervalos.
El tamao de clase indica el nmero de datos que conforman a cada intervalo,
considerando los valores extremos llamados lmites. En cada intervalo aparece un
lmite inferior (LI) y un lmite superior (LS).
Cada intervalo se forma sumando al lmite inferior (LI) un nmero menos que el
tamao de clase para obtener el lmite superior (LS).
En la elaboracin de la distribucin de frecuencias se debe dejar un rengln antes
de la primera clase y otro despus de la ltima.
Si en la elaboracin de los intervalos se observa que algunos datos quedan fuera
del nmero de clases, entonces se debe agregar una clase ms al final, esto no
alterar los resultados.
F) Obtencin de Frecuencias.
La frecuencia de clase se obtiene contando, en la tabla de datos ordenados, los
que correspondan al intervalo de dicha clase.
MEDIDAS DE POSICIN
Son indicadores usados para sealar que porcentaje de datos dentro de una
distribucin de frecuencias superan estas expresiones, cuyo valor representa el
valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo
que tambin se les llama " Medidas de Tendencia Central.
Pero estas medidas de posicin de una distribucin de frecuencias han de cumplir
determinadas condiciones para que lean verdaderamente representativas de la

variable a la que resumen. Toda sntesis26de una distribucin se considerara como


operativa si intervienen en su determinacin todos y cada uno de los valores de la
distribucin, siendo nica para cada distribucin de frecuencias y siendo siempre
calculable y de fcil obtencin. A continuacin se describen las medidas de
posicin ms comunes utilizadas en estadstica, como lo son:

Cuartiles: Hay 3 cuartiles que dividen a una distribucin en 4 partes iguales:


primero, segundo y tercer cuartil.

Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al


noveno decil).

Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes


iguales: (primero al noventa y nueve percentil).
Cuartiles (Q1, Q2, Q3)
a.

Aquel valor de una serie que supera al 25% de los datos y es superado por
el
75%
restante.
Formula de Q1 para series de Datos Agrupados en Clase.

Dnde:

: Posicin de Q1, la cual se localiza en la primera frecuencia acumulada


que la contenga, siendo la clase de Q1, la correspondiente a tal frecuencia
acumulada.
Li, faa, fi, Ic: idntico a los conceptos vistos para Mediana pero referidos a la
medida de la posicin correspondiente.
b.

Primer cuartil (Q1):

c.

Segundo cuartil (Q2):

Coincide, es idntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y


es superado por el 50% de los valores de una Serie.
c) Tercer cuartil (Q3):

Aquel valor, termino o dato que supera 27


al 75% y es superado por el 25% de los
datos
restantes
de
la
Serie.
Formula de Q3 para series de Datos Agrupados en Clase.

Dnde:

: Posicin de Q3, todo idntico al clculo de la Mediana.


Deciles
(D1,
D2,
D9)
Primer
Decil
(D1),
Quinto
Decil
(D5)
y
Noveno
Decil
(D9).
El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y
es superado por las 9/10 partes restantes (respectivamente, hablando en
porcentajes, supera al 10% y es superado por el 90% restante),

El D9 (noveno decil) supera al 90% y es superado por el 10% restante.

Como se observa, son formulas parecidas a la del clculo de la Mediana,


cambiando solamente la respectivas posiciones de las medidas.
Percentiles
(P1,
P2,
P99)
Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99).
El primer percentil supera al uno por ciento de los valores y es superado por el
noventa
y
nueve
por
ciento
restante.
Frmulas de P1, P50, P99 para series de Datos Agrupados en Clase.

28

El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su


vez por el 1% restante.

Idnticas formulas al clculo de la Mediana, cambiando obviamente las


correspondientes posiciones de cada medida.
Para determinar estas medidas se aplicara el principio de la mediana; as, el
primer cuartil cereal valor por debajo del cual se encuentra el 25 por ciento de los
datos; bajo el tercer cuartil se encuentra el 75 por ciento; el 80 decil ser el valor
por encima del cual estar el 20 por ciento de los datos, etc.
Como se observa, todas estas medidas no son sino casos particulares del
percentil ya que el primer cuartil no es sino el 25 percentil, el tercer cuartil el 75
percentil, el cuarto decil el 40 percentil, etc.

MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOS


Las Medidas de Dispersin que se enlistaron en la seccin anterior, varan un
poco en la estructura de sus frmulas, por ello es necesario integrar un nuevo
formulario
que
sea til para
esta seccin.
FORMULARIO
RANGO

29

VARIANZA

Recuerde que la frmula de la Media para datos agrupados es

DESVIACIN ESTNDAR

30

o en este caso, la formula se puede expresar as

La cual se puede emplear cuando ya se tiene el valor numrico de la Varianza.


COEFICIENTE DE VARIACIN

HISTOGRAMA, POLGONO DE FRECUENCIA Y OJIVAS


Un Histograma es un tipo especial de grfica de barras que despliega la
variabilidad dentro de un proceso, tambin toma datos variables (tales como
alturas, pesos, densidades, tiempo, temperaturas, etc.) y despliega su
distribucin. Un histograma es una representacin grfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados. En el eje vertical se representan las frecuencias, y
en el eje horizontal los valores de las variables, normalmente sealando las
marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los
datos.

Tipos de histograma

31

Diagramas de barras simples

Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra


la cual es proporcional a la frecuencia simple de la categora que representa.

Diagramas de barras compuestas

Se usa para representar la informacin de una tabla de doble entrada o sea a


partir de dos variables, las cuales se representan as; la altura de la barra
representa la frecuencia simple de las modalidades o categoras de la variable y
esta altura es proporcional a la frecuencia simple de cada modalidad.

Diagramas de barras agrupadas

Se usa para representar la informacin de una tabla de doble entrada o sea a


partir de dos variables, el cual es representado mediante un conjunto de barras
como se clasifican respecto a las diferentes modalidades.

OJIVAS
La representacin grfica de un cuadro de frecuencia acumulada son curvas
llamadas ojivas. En la grfica de ojiva, el ltimo intervalo no se une con el eje
horizontal.
La ojiva apropiada para informacin que presente frecuencias mayores que el dato
que se est comparando tendr una pendiente negativa (hacia abajo y a la
derecha) y en cambio la que se asigna a valores menores, tendr una pendiente
positiva. Una grfica similar al polgono de frecuencias es la ojiva, pero sta se
obtiene de aplicar parcialmente la misma tcnica a una distribucin acumulativa y
de igual manera que stas, existen las ojivas mayores que y las ojivas menores
que.

32

POLGONO DE FRECUENCIA

El polgono de una variable cuantitativa corresponde al diagrama de lneas. Se


construye a partir del histograma de frecuencias.
Para esto, se unen los puntos medios de cada una de las barras con un segmento
recta. Para que la grfica sea un polgono, es necesario construir un segmento de
recta. Para que la grfica sea un polgono, es necesario construir un segmento de
recta que inicie en el eje horizontal y termine en el punto medio de barra. De forma
similar, se debe hacer en la ltima barra que la figura que se obtenga sea cerrada.
Para construir el polgono de frecuencia se toma la marca de clase que coincide
con el punto medio de cada rectngulo de un histograma.

33

IMPORTANCIA DE LA FORMA DE LOS DATOS


La importancia de los datos estadsticos se funda en el hecho de que sirven para
evaluar la tendencia futura de un fenmeno determinado. En efecto, luego de un
anlisis concienzudo, los datos estadsticos pueden revelar en alguna medida que
esperar a futuro en algn rea de la actividad humana. Es por ello que la forma de
recopilacin de dichos datos es fundamental, buscando en todo momento que
sean representativos de un universo ms grande. Algunas de las aplicaciones de
este procedimiento estadstico en funcin de datos recopilados pueden referir al
mbito
de
la
poltica,
de
las
finanzas,
del
mercadeo,
etc.
ASIMETRA

Es una medida de forma de una distribucin que permite identificar y describir la


manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se
hallen dentro de la distribucin. Permite identificar las caractersticas de la
distribucin de datos sin necesidad de generar el grfico.

TIPOS DE ASIMETRA
La asimetra presenta las siguientes formas:
Asimetra Negativa o a la Izquierda.- Se da cuando en una distribucin la minora
de los datos est en la parte izquierda de la media. Este tipo de distribucin
presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribucin de los
datos tiene a la izquierda una cola ms larga que a la derecha. Tambin se dice
que una distribucin es simtrica a la izquierda o tiene sesgo negativo cuando
el valor de la media aritmtica es menor que la mediana y ste valor de la mediana
a su vez es menor que la moda, en smbolos

34

Nota: Sesgo es el grado de asimetra de una distribucin, es decir, cunto se


aparta de la simetra.

SIMTRICA.- Se da cuando en una distribucin se distribuyen aproximadamente


la misma cantidad de los datos a ambos lados de la media aritmtica. No tiene
alargamiento o sesgo. Se representa por una curva normal en forma de campana
llamada campana de Gauss (matemtico Alemn 1777-1855) o tambin conocida
como de Laplace (1749-1827).Tambin se dice que una distribucin es simtrica
cuando su media aritmtica, su mediana y su moda son iguales, en smbolos
Md=Mo

Asimetra Positiva o a la Derecha.- Se da cuando en una distribucin la minora de


los datos est en la parte derecha de la media aritmtica. Este tipo de distribucin
presenta un alargamiento o sesgo hacia la derecha, es decir, la distribucin de los
datos tiene a la derecha una cola ms larga que a la izquierda.
Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo
positivo cuando el valor de la media aritmtica es mayor que la mediana y ste a
valor de la mediana a su vez es mayor que la moda, en smbolos

MEDIDAS DE ASIMETRA

Coeficiente de Karl Pearson

Dnde:

35

= media aritmtica.
Md = Mediana.
s = desviacin tpica o estndar.

CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribucin con
relacin a la distribucin normal, es decir, mide cun puntiaguda es una
distribucin.

TIPOS DE CURTOSIS
La curtosis determina el grado de concentracin que presentan los valores en la
regin central de la distribucin. As puede ser:
Leptocrtica.- Existe una gran concentracin.
Mesocrtica.- Existe una concentracin normal.
Platicrtica.- Existe una baja concentracin.

MEDIDAS DE CURTOSIS

Medida de Fisher

36
Para datos sin agrupar se emplea la siguiente
frmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Dnde: = cada uno de los valores; n = nmero de datos; = media aritmtica;


= Cudruplo de la desviacin estndar poblacional; f = frecuencia absoluta; xm =
marca de clase

GRAFICA PARA DATOS CUALITATIVOS O CATEGRICOS

Los datos cualitativos pueden ser difciles de ilustrar. El mejor mtodo para
presentar los datos, cualitativos o cuantitativos, es a travs del uso de grficas.
Muchos mtodos de grficas pueden ilustrar los datos cualitativos y cuantitativos.
Una representacin visual de los datos reunidos te puede ayudar a describir
rpidamente que el dato se est ilustrando sin tener que entrar en una explicacin
profunda, que tal vez no sea fcilmente entendida sin las grficas de todas formas.
Una grfica es una forma rpida y eficiente de captar la atencin y describir
una idea sin utilizar mucho tiempo o muchas palabras.
GRFICAS ESTADSTICAS

Las grficas estadsticas nos permiten familiarizarnos con los datos que se
han recopilado y resumido. Se considera como una tcnica inicial de ANLISIS
EXPLORATORIO DE DATOS que produce una representacin visual. Las
grficas resultantes revelan un patrn de comportamiento de la variable en
estudio. Se ofrecen muchos tipos de grficos para describir el conjunto de datos.
Dependiendo del tipo de datos y lo que se quiera representar, se har uso del
mtodo grfico ms adecuado.

37

ELEMENTOS DE UNA GRAFICA:

En general se deben tener en cuenta los siguientes elementos:


1. Titulo
2. Tabla o Distribucin de Frecuencias
3. Escala
4. Cuerpo de la grfica
5. Convenciones
6. Notas aclaratorias
7. Numeracin.

GRAFICA DE BARRAS

Un grfico de barras, tambin conocido como grfico de columnas, es una forma


de representar grficamente un conjunto de datos o valores, y est conformado
por barras rectangulares de longitudes proporcionales a los valores representados.
Los grficos de barras son usados para comparar dos o ms valores. Las barras
pueden orientarse verticalmente u horizontalmente.
Ejemplo:
Este diagrama de ejemplo est basado en los resultados de la Eleccin del
Parlamento Europeo en el 2004 y en el de 1999. La tabla siguiente lista el nmero
de asientos asignadas a cada partido. Los resultados de 1999 han sido
multiplicados por 1.16933, para compensar el cambio en el nmero de asientos
entre estos aos.
Grup
o

Asientos
(2004)

EURO 33

EFA

33

Asientos (1999) a escala


33
33
33

33
3
3

ED
D

3
3

3
3

3
3

ELD
R

6
7

6
0

EPP

276

272

UEN

27

36

Otros

66

29

38

Un grfico de barras que represente los resultados anteriores de la eleccin


del 2004 se
vera
as:
(Si todos los datos fuesen ordenados en orden descendiente, este tipo de grfico
de barras sera llamado un diagrama de Pareto.)

Este grfico de barras muestra ambos resultados (2004 y 1999):

GRAFICA DE PASTEL
Una grfica circular, tambin llamada grfico de pastel, grfico de torta o grfica
de
360
grados,
es
un
recurso estadstico que
se
utiliza
para

representar porcentajes y proporciones. 39


El nmero de elementos comparados
dentro de un grfico circular puede ser de ms de 4.
Al igual que en la grfica de barras, el empleo de tonalidades o colores facilita la
diferenciacin de los porcentajes o proporciones. A diferencia de otros tipos de
grficos, el circular no tiene ejes x o y.
Se utilizan en aquellos casos donde interesa no slo mostrar el nmero de veces
que se da una caracterstica o atributo de manera tabular sino ms bien de
manera grfica, de tal manera que se pueda visualizar mejor la proporcin en que
aparece esa caracterstica respecto del total.
A pesar de su popularidad, se trata de un tipo de grfico poco recomendable
debido a que nuestra capacidad perceptual para estimar relaciones de proporcin
o diferencias entre reas de sectores circulares es mucho menor que, por ejemplo,
entre longitudes o posiciones, tal y como sucede en otras grficas.

DIAGRAMA CIRCULAR

Es de especial utilidad para mostrar proporciones (porcentajes) relativas de


una variable. Se crea marcando una porcin del crculo correspondiente a cada
categora de la variable.

40

ENSAYO

Aplicacin de la estadstica en salud pblica

rea
aplicacin

de Comentario

Ejemplo

Estudios
variacin

de La
variacin
de
una
caracterstica se produce
cuando su valor cambia de
un sujeto a otro, o de un
momento a otro en el mismo
sujeto

Edad, peso, estatura, presin


sangunea,
niveles
de
colesterol, albmina srica,
recuento de plaquetas.

Diagnstico de
enfermedades y
de la salud de la
comunidad

Proceso mediante el cual se


identifican el estado de salud
de un individuo, o de un
grupo, y los factores que lo
producen

Valoracin de los sntomas


declarados o recabados en
los individuos para realizar
un diagnstico de salud

Prediccin
del Es
la
evaluacin
del
resultado
resultado de un programa de
probable de un intervencin
en
una
programa
de comunidad
o
de
una
intervencin
enfermedad
en
los
pacientes, a la luz de los
sntomas,
signos
y

Programa de intervencin
nutricional para determinar el
impacto de la aplicacin de
un suplemento alimenticio

41

circunstancias existentes

Eleccin
Se basa en la experiencia Evaluacin de la eficacia de
apropiada
de anterior con pacientes o un
frmaco
y/u
otros
intervencin en comunidades de anlogas mtodos de tratamiento
paciente
o caractersticas que haban
comunidad
sufrido una intervencin

Administracin Refiere al empleo de los


sanitaria
y datos
relativos
a
la
planificacin
enfermedad en la poblacin
a fin de hacer un diagnstico
en la comunidad

Determinar el perfil sanitario


de la poblacin en trminos
de
distribucin
de
la
enfermedad y la utilizacin
de los recursos de salud

Realizacin
y Contempla otorgar la validez Probabilidad de cncer de
anlisis en la a investigaciones analticas o prstata en individuos con
investigacin en de encuestas descriptivas.
edad mayor a 60 aos
salud pblica

Vous aimerez peut-être aussi